作者:手机用户2702936363 | 来源:互联网 | 2023-06-18 21:58
项目里面用到了分词,但是得到很多无关的分词,比如标点,各种符号之类的。后来在黑名单里面加了中文停用词,能去除绝大部分,但是还是有一些奇奇怪怪的符号去不掉。所以求一个正则:只能是 (数字,字母(不区分大
项目里面用到了分词,但是得到很多无关的分词,比如标点,各种符号之类的。
后来在黑名单里面加了中文停用词,能去除绝大部分,但是还是有一些奇奇怪怪的符号去不掉。
所以求一个正则:只能是 (数字,字母(不区分大小写),汉字)或其任意组合。
比如
- abcF
- as212
- das你好1d
- 34D4H好
- 大家
谢谢