作者:cqm-kk_246 | 来源:互联网 | 2022-12-20 10:24
例如,我需要将表情符号彼此分开
EM = 'Hey '
EM.split()
如果我们拆分它,我们将拥有
['Hey' ,'']
我希望有
['hey' , '' , '' , '']
我希望将其应用于所有表情符号。
1> Michal Chare..:
您应该可以get_emoji_regexp
从https://pypi.org/project/emoji/中使用该代码以及常用split
功能。所以像这样:
import functools
import operator
import re
import emoji
em = 'Hey '
em_split_emoji = emoji.get_emoji_regexp().split(em)
em_split_whitespace = [substr.split() for substr in em_split_emoji]
em_split = functools.reduce(operator.concat, em_split_whitespace)
print(em_split)
输出:
['Hey', '', '', '']
一个更复杂的情况,带有家族,肤色修饰符和一个标志:
em = 'Hey ???'
em_split_emoji = emoji.get_emoji_regexp().split(em)
em_split_whitespace = [substr.split() for substr in em_split_emoji]
em_split = functools.reduce(operator.concat, em_split_whitespace)
for separated in em_split:
print(separated)
输出:
Hey
???
(我认为print
与家庭表情符号一起在列表上使用会产生一些问题,因此分别打印列表的每个项目。直接使用U + 200D零宽度连接符打印家庭表情符号,而不是通过列表)