使用collections.Counter计算不同颜色的表情符号

作者：龙欣23 | 来源：互联网 | 2023-02-04 15:00

如何解决《使用collections.Counter计算不同颜色的表情符号》经验，为你挑选了1个好方法。

我想使用collections.Counter类来计算字符串中的表情符号.它通常工作正常,但是,当我引入彩色表情符号时,表情符号的颜色成分与表情符号分开,如下所示:

>>> import collections
>>> emoji_string = ""
>>> emoji_counter = collections.Counter(emoji_string)
>>> emoji_counter.most_common()
[('', 5), ('', 1), ('', 1), ('', 1), ('', 1), ('', 1)]

我怎样才能使most_common()函数返回这样的内容:

[('', 1), ('', 1), ('', 1), ('', 1), ('', 1)]

我正在使用Python 3.6

1> Martijn Piet..：

您必须将字符串拆分为单独的集群.你的每个表情符号都是两个代码点 ; 表情符号和EMOJI MODIFIER FITZPATRICK TYPE X代码点:

>>> print(emoji_string[0])

>>> print(emoji_string[1])

>>> print(emoji_string[:2])

>>> print(ascii(emoji_string[:2]))
'\U0001f44c\U0001f3fb'
>>> import unicodedata
>>> unicodedata.name(emoji_string[1])
'EMOJI MODIFIER FITZPATRICK TYPE-1-2'

您可以使用正则表达式来保留前面的表情符号:

import re

char_with_modifier = re.compile(r'(.[\U0001f3fb-\U0001f3ff]?)')
split_emoji = char_with_modifier.findall(emoji_string)

并计算结果.

演示:

>>> import re
>>> from collections import Counter
>>> emoji_string = ""
>>> char_with_modifier = re.compile(r'(.[\U0001f3fb-\U0001f3ff]?)')
>>> Counter(char_with_modifier.findall(emoji_string))
Counter({'': 1, '': 1, '': 1, '': 1, '': 1})

推荐阅读

range
python并发打开网页_python并发_线程

关于进程的复习：#管道#数据的共享Managerdictlist#进程池#cpu个数1#retmap(func,iterable)#异步自带close和join#所有 ... [详细]

蜡笔小新 2024-11-17 13:24:48
int
岭回归及其应用

本文介绍了岭回归的基本原理，并通过Python中的sklearn库实现了岭回归模型。岭回归通过在代价函数中加入L2正则项，有效解决了多重共线性问题。 ... [详细]

蜡笔小新 2024-11-16 06:54:42
int
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
ascii
Python默认字符解析：深入理解Python中的字符串处理

在Python中，字符串是编程中最基本且常用的数据类型之一。尽管许多初学者是从C语言开始接触字符串，通常通过经典的“Hello, World!”程序入门，但Python对字符串的处理方式更为灵活和强大。本文将深入探讨Python中的字符串处理机制，包括字符串的创建、操作、格式化以及编码解码等方面，帮助读者全面理解Python字符串的特性和应用。 ... [详细]

蜡笔小新 2024-11-08 05:02:14
int
Python内置模块详解：正则表达式re模块的应用与解析

正则表达式是一种强大的文本处理工具，通过特定的字符序列来定义搜索模式。本文详细介绍了Python内置的`re`模块，探讨了其在字符串匹配、验证和提取中的应用。例如，可以通过正则表达式验证电子邮件地址、电话号码、QQ号、密码、URL和IP地址等。此外，文章还深入解析了`re`模块的各种函数和方法，提供了丰富的示例代码，帮助读者更好地理解和使用这一工具。 ... [详细]

蜡笔小新 2024-11-07 17:25:01
int
解决Python 3.x中argparse无法识别含&符号的输入参数问题

在使用Python 3.x的argparse模块时，如果输入参数中包含&符号，会遇到解析错误。本文介绍了如何解决这一问题，确保输入参数能够正确解析。 ... [详细]

蜡笔小新 2024-11-17 11:11:08
int
Java 中的控制流与作用域

本文详细介绍了 Java 中的控制流语句，包括块作用域、if 语句、for 循环、while 循环、do-while 循环、switch 语句以及 break 和 continue 语句的使用方法。通过具体的代码示例，帮助读者更好地理解和应用这些控制流结构。 ... [详细]

蜡笔小新 2024-11-16 13:45:31
int
java解析json转Map

java解析json转Map前段时间在做json报文处理的时候，写了一个针对不同格式json转map的处理工具方法，总结记录如下：1、单节点单层级、单节点多层级json转mapim ... [详细]

蜡笔小新 2024-11-15 18:21:27
select
使用Tkinter构建51Ape无损音乐爬虫UI

本文介绍了如何使用Python的内置模块Tkinter来构建一个简单的用户界面，用于爬取51Ape网站上的无损音乐百度云链接。虽然Tkinter入门相对简单，但在实际开发过程中由于文档不足可能会带来一些不便。 ... [详细]

蜡笔小新 2024-11-15 10:31:11
int
Go语言中正则表达式的简易应用

本文介绍了Go语言中正则表达式的基本使用方法，并提供了一些实用的示例代码。 ... [详细]

蜡笔小新 2024-11-14 20:27:47
select
自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析

目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]

蜡笔小新 2024-11-14 18:21:21
range
python模块之正则

re模块可以读懂你写的正则表达式根据你写的表达式去执行任务用re去操作正则正则表达式使用一些规则来检测一些字符串是否符合个人要求，从一段字符串中找到符合要求的内容。在 ... [详细]

蜡笔小新 2024-11-14 15:52:38
int
剑指Offer 44. 反转字符串中的单词

题目描述：牛客网新员工Fish每天早上都会拿着一本英文杂志，在本子上写下一些句子。他的同事Cat对这些句子非常感兴趣，但发现这些句子的单词顺序被反转了。例如，“student. a am I”实际上是“I am a student.”。Cat请求你帮助他恢复这些句子的正常顺序。 ... [详细]

蜡笔小新 2024-11-13 19:40:26
int
在Python中利用序列号字符串进行模式替换的高效方法

本文探讨了在Python中使用序列号字符串进行高效模式替换的方法。具体而言，通过将HTML标签中的`&`替换为`{n}`，并生成形如`[tag, {n}]`的哈希原始字符串。示例字符串为：“这是一个字符串。这是另一部分。”该方法能够有效提升替换操作的性能和可读性。 ... [详细]

蜡笔小新 2024-11-07 19:42:59
int
如何使用Python去除字符串中的非中文字符[Python编程技巧]

在 Python 中，可以通过正则表达式来实现去除字符串中的非中文字符。具体方法是使用 `re` 模块中的 `re.sub()` 函数，配合正则表达式 `[^u4e00-u9fa5]` 来匹配并替换掉所有非中文字符，从而保留字符串中的中文部分。这种方法简洁高效，适用于多种文本处理场景。 ... [详细]

蜡笔小新 2024-11-07 15:30:50

龙欣23

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章