热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

如何从字符串中删除所有没有可打印的字符+表情符号?

如何解决《如何从字符串中删除所有没有可打印的字符+表情符号?》经验,为你挑选了1个好方法。



1> Andreas..:

\\p{C}正则表达式采取所有非打印字符的照顾。请注意,这包括选项卡和换行符。

至于表情符号字符,则有点复杂。您可以用Unicode匹配较新的Emoji字符,即Unicode块“ Emoticons”(U + 1F600到U + 1F64F),但这并不是所有Emoji字符,例如?“重黑心”(U + 2764)不在该范围内。

如果查看那些Emoji字符,例如'GRINNING FACE'(U + 1F600),您会发现它属于Unicode类别“ Symbol,Other [So] ”,由5855个字符组成。如果您可以删除所有这些内容,那肯定是最简单的解决方案。

您的文本包含一个红色的心(??),而不是一个黑色的心(?),这可以通过在Unicode之后通过在黑色的心之后添加变体选择器来实现,例如,在此文本中使用'VARIATION SELECTOR-16'(U + FE0F)案件。有256个变体选择器,它们都在Mark,Nonspacing [Mn]类别中,但是您可能不想删除所有的1763个变体选择器,因此需要删除2个范围的变体选择器,即U + FE00到U + FE0F(选择器1-16)和U + E0100至U + E01EF(选择器17-256)。

之后,您可能会或可能不想将连续的空格减少到一个空格。

str = str.replaceAll("[\\p{C}\\p{So}\uFE00-\uFE0F\\x{E0100}-\\x{E01EF}]+", "")
         .replaceAll(" {2,}", " ");


推荐阅读
  • 用了2周,把jquery2.1.1版本的源码读了一遍,像得了感冒,头疼、恶心、没精神。。。涉及javaScript基本知识点: ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 本文介绍了绕过WAF的XSS检测机制的方法,包括确定payload结构、测试和混淆。同时提出了一种构建XSS payload的方法,该payload与安全机制使用的正则表达式不匹配。通过清理用户输入、转义输出、使用文档对象模型(DOM)接收器和源、实施适当的跨域资源共享(CORS)策略和其他安全策略,可以有效阻止XSS漏洞。但是,WAF或自定义过滤器仍然被广泛使用来增加安全性。本文的方法可以绕过这种安全机制,构建与正则表达式不匹配的XSS payload。 ... [详细]
  • MySQL多表数据库操作方法及子查询详解
    本文详细介绍了MySQL数据库的多表操作方法,包括增删改和单表查询,同时还解释了子查询的概念和用法。文章通过示例和步骤说明了如何进行数据的插入、删除和更新操作,以及如何执行单表查询和使用聚合函数进行统计。对于需要对MySQL数据库进行操作的读者来说,本文是一个非常实用的参考资料。 ... [详细]
  • Stringpattern".*"+"a?I'm"+".*";FindIterable<Doc ... [详细]
  • Swagger2非全局、无需重复输入的Head参数(Token)配置网络上关于Swagger2的教程多如牛毛,作为关于Swagger加入全 ... [详细]
  • 摘录自Understandingplaceholderselectors.extendextend让你能够在多个选择器中通过继承的方式共享一段样式:.icon{transition ... [详细]
  • 前端开发中的重要一环:使用原生JavaScript封装jQuery库
    2019独角兽企业重金招聘Python工程师标准用原生js封装jquery的实现base.js***上官清偌*前台调用var$function(_this){return ... [详细]
  • ImtryingtoextractthetextBetClicfromthisstringpopup_siteinfo(this,clickbetclic,373 ... [详细]
  • mongodb match多条件_《MongoDB》
    1.mongodb正则查询2.mongodb聚合查询3.mongodb管道操作4.mongodb字符串操作5.mongodb算术运算6.mongodb日期处理7.Java连击Mon ... [详细]
  • 程序员学习数据库安装教程中必会MySQL使用规范手册
    一个平台或系统随着时间的推移和用户量的增多,数据库操作往往会变慢;而在Java应用开发中数据库更是尤为重要,绝大多数情况下数据库的性能决定 ... [详细]
  • 逐日 30 秒 ⏱ 字符编码排雷录
    简介字符编码、字符长度毛病、截取字符毛病、UTF8、Unicode计算机重重底层之下都是由0和1组合,然则你晓得他们是怎样一步步变成字符串的嘛?在我们实际生活中最罕见的例子能够经由 ... [详细]
  • php 反斜杠详解_Python爬虫解析神器正则表达式如何更好运用?详解(建议收藏)...
    先详细的整理一下Python中的正则表达式的相关内容。正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。一、正则表达式基础1. ... [详细]
  • 在互联网公司中,MySQL是使用最多的数据库,那么在并发量大、数据量大的互联网业务中,如何高效的使用MySQL才能保证服务的稳定呢?根据本人多年运维管理经验的总结,梳理了一些核心的 ... [详细]
author-avatar
gaoming1010_143
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有