热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

自然语言处理中语料处理小窍门

自然语义处理造文本分类语料的小技巧1.根据句式造模板生成语料。2.里面的词语可以根据词向量计算的相似词进行替换生成新的语料。3.可以通过语料先训练一个模型,然后

自然语义处理造文本分类语料的小技巧

1.根据句式造模板生成语料。

2.里面的词语可以根据词向量计算的相似词进行替换生成新的语料。

3.可以通过语料先训练一个模型,然后再跑新的数据,然后对新的数据进行审核,进行标记。

4.新加一个类别的时候可以使用句向量计算新的类别是否跟前面的类别冲突。

5.统计各个类别语料中字和词的卡方检验找到对类别影响大的词语,可以针对性的造语料进行平衡。

6.对每一个batch进行语料平衡训练(一个batch里面语料有多个类别)

命名实体识别也可以使用前面的方法进行造语料。


推荐阅读
author-avatar
回音爱Fred
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有