热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

CRF中文分词标注器

搞了3个月,终于把CRF的中文分词标注工具做好了。算法很简单,只采用常用的B、M、E、S作为标注集,特征选择采用-1、0、1、-1&0、0&-1、-1&1六种特征。训练语料采用19

搞了3个月,终于把CRF的中文分词标注工具做好了。算法很简单,只采用常用的B、M、E、S作为标注集,特征选择采用-1、0、1、-1&0、0&-1、-1&1

六种特征。训练语料采用1998年《人民日报》1月份的公开语料。

分词见效果图:

《CRF中文分词标注器》

标注如下:

《CRF中文分词标注器》


推荐阅读
author-avatar
手机用户2502939177
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有