热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

pythonimagestiching_Python自然语言处理,词云图生成

自然语言处理本节介绍如何使用Python中的库,生成词云图,涉及自然语言处理的相关问题,自然语言处理是计算机科学领域与人工智能领域中的一个

3aef7cc141730c500ad77381fcea7008.gif

09d40d9da9baad0b80a44ae375c10cc9.gif

自然语言处理

本节介绍如何使用Python中的库,生成词云图,涉及自然语言处理的相关问题,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,自然语言处理是一门融语言学、计算机科学、数学于一体的科学。

自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。

代码示例

首先导入基本的库,这里选择jiebe分词库,对于文本进行分词处理。

import jiebaprint(list(jieba.cut("自然语言是计算机科学领域与人工智能领域中的一个重要方向。")))

代码运行结果如下,实现了将每一条语句进行分词处理。

['自然语言', '是', '计算机科学', '领域', '与', '人工智能', '领域', '中', '的', '一个', '重要', '方向', '。']接下来读入我们需要做词云的实验文本。

#读入文本with open(r"C:\Users\shangtianqiang\Desktop\实验文本.txt" ,encoding="utf-8")as file: text=file.read() print(text)这里将导入的实验文本进行分词处理,并且分隔符为空。

#文本分词wordlist_jieba=jieba.cut(text)space_wordlist=" ".join(wordlist_jieba)print(space_wordlist)

对于语句成功分词后,就可以定义分词函数,这个在后文会用到。

#文本分词def chinese_jieba(text): wordlist_jieba=jieba.cut(text) space_wordlist=" ".join(wordlist_jieba) return space_wordlistspace_wordlist紧接着导入词云库,读取文本内容后,设置词云的背景颜色,图片的大小,控制显示的词数等。

from wordcloud import WordCloud#读取文本内容with open(r"C:\Users\shangtianqiang\Desktop\实验文本.txt" ,encoding="utf-8")as file: text=file.read()#设置词云的背景颜色、宽高、字数 wordcloud=WordCloud(font_path="C:/Windows/Fonts/simfang.ttf",background_color="white",width=600,height=300,max_words=30).generate(text)#生成图片image=wordcloud.to_image()#显示图片image.show()最后,将调试的代码进行封装,一起看一下最后生成的结果。

# 将文本进行分词,并添加图片背景from wordcloud import WordCloudimport jiebaimport numpyimport PIL.Image as Image#将字符串切分def chinese_jieba(text): wordlist_jieba=jieba.cut(text) space_wordlist=" ".join(wordlist_jieba) return space_wordlist#读取文本内容with open(r"C:\Users\shangtianqiang\Desktop\实验文本.txt" ,encoding="utf-8")as file: text=file.read()text=chinese_jieba(text)#这里需要自己导入一张图片作为背景图片mask_pic=numpy.array(Image.open(r"C:\Users\shangtianqiang\Desktop\图片1.png"))#将参数mask设值为:mask_picwordcloud = WordCloud(font_path="C:/Windows/Fonts/simfang.ttf",background_color="white",width=600,height=300,max_words=30,mask=mask_pic).generate(text)#生成图片image=wordcloud.to_image()#显示图片image.show()

8b75c6e36c31c1bfde6b551ca2e084ba.png

这里所显示的词云结果并不直观,通过改变我们的背景图,以及将实验的文本词变得更加单一,多多调试几次,即可得出如下的结果。

8b862b343b8e3194a5d4179bef60a9f2.png

0593ee95d6bd8dc83ba9743d43b6a261.png

要得出一个完美的词云结果,需要我们耐心的调试,控制词数,颜色等。cdfaa1c2196ab2ee3aaa66966128cfc5.png


推荐阅读
  • Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用,涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]
  • 视觉Transformer综述
    本文综述了视觉Transformer在计算机视觉领域的应用,从原始Transformer出发,详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构,还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]
  • 自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析
    目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • 本文介绍了如何在C#中启动一个应用程序,并通过枚举窗口来获取其主窗口句柄。当使用Process类启动程序时,我们通常只能获得进程的句柄,而主窗口句柄可能为0。因此,我们需要使用API函数和回调机制来准确获取主窗口句柄。 ... [详细]
  • 本文详细解析了Python中的os和sys模块,介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]
  • 回顾与学习是进步的阶梯。再次审视卷积神经网络(CNNs),我对之前不甚明了的概念有了更深的理解。本文旨在分享这些新的见解,并探讨CNNs在图像识别和自然语言处理等领域中的实际应用。 ... [详细]
  • 京东AI创新之路:周伯文解析京东AI战略的独特之处
    2018年4月15日,京东在北京举办了人工智能创新峰会,会上首次公开了京东AI的整体布局和发展方向。此次峰会不仅展示了京东在AI领域的最新成果,还标志着京东AI团队的首次集体亮相。本文将深入探讨京东AI的发展策略及其与BAT等公司的不同之处。 ... [详细]
  • 在一个大型的应用系统中,往往需要多个进程相互协作,进程间通信(IPC,InterProcessCommunication)就显得比较重要了。在Linux系统中,有很多种IPC机制, ... [详细]
  • 本文讨论了在处理分页数据时常见的低级错误,并提供了优化后的代码示例,以减少重复代码并提高可读性和维护性。 ... [详细]
  • 本文介绍了如何利用snownlp库对微博内容进行情感分析,包括安装、基本使用以及如何自定义训练模型以提高分析准确性。 ... [详细]
  • 分层学习率衰减在NLP预训练模型中的应用
    本文探讨了如何通过分层学习率衰减技术来优化NLP预训练模型的微调过程,特别是针对BERT模型。通过调整不同层的学习率,可以有效提高模型性能。 ... [详细]
author-avatar
小遥2502881765
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有