热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python3字符处理——简繁体转换,只保留中文字母数字

requirements.txtzhconv工作过程中,偶尔需要处理中英文简繁体的转换,这时用网上的转换接口不仅有点影响效率,而且也比较

requirements.txt

zhconv

 

工作过程中,偶尔需要处理中英文简繁体的转换,这时用网上的转换接口不仅有点影响效率,而且也比较不安全。

这里推荐下zhconv来处理字符串,并且只保留中英文数字字符,以便后续操作使用。

代码如下:

import zhconv
import recop = re.compile("[^\u4e00-\u9fa5^a-z^A-Z^0-9]") # 匹配不是中文、大小写、数字的其他字符
string1 = '@ad&*jf繁體ad张132(www)。。。'
string1 = zhconv.convert(string1, 'zh-cn')
print(string1)
string1 = cop.sub('', string1) # 将string1中匹配到的字符替换成空字符
print(string1)

result:

@ad&*jf繁体ad张132(www)。。。
adjf繁体ad张132www
Process finished with exit code 0

 


推荐阅读
author-avatar
遥不V可及
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有