作者:marco112977 | 来源:互联网 | 2023-09-04 18:13
转载:http:blog.sina.com.cnsblog_8f0247900102xd7o.html http:blog.sina.com.cnsblog_8f02479
转载:http://blog.sina.com.cn/s/blog_8f0247900102xd7o.html
http://blog.sina.com.cn/s/blog_8f0247900102x8s2.html :基于python爬虫的网络舆情监控和热点分析毕业设计
基于Python和Tensorflow的命名实体识别(NER)毕业设计, 采用Tensorflow进行数据集的训练,数据集为汽车类语料库,选择COAE提供的汽车类评价短语为实验语料,深入分析语料中汽车命名实体的特点,选择词、词性、指示词、情感倾向和领域本体为特征,利用条件随机场模型对语料中的品牌名、系列名和属性实体进行识别。使用Python语言针对由未登录词组成的隐含汽车实体,通过分析语料中词的依存关系,制定了一个隐含实体的提取规则,并基于该规则对隐含实体进行识别。
依赖环境:
- Tensorflow=1.2.0
- jieba=0.37
改进自:https://github.com/zjy-ucas/ChineseNER
语料库包括句子和标签两个文件组成,是ID对应的关系,如下图所示:
经过训练后产生map映射文件,识别时直接读取该文件进行匹配即可,最后的效果为输入一段包含汽车类命名实体的句子,能提取出只跟汽车相关的词语,效果如下图所示: