热门标签 | HotTags
当前位置:  开发笔记 > IOS > 正文

ngram分词,基于ngram的分词方法

二元语法与中文分词语言模型模型指的是对食物的数学抽象,语言模型指的是对语言现象的数学抽象。语言模型的构建需要语料库的支撑语料库建设并不是高不可攀的工程。手动标注微型语料库问

二元语法与中文分词 语言模型

模型指的是对食物的数学抽象,语言模型指的是对语言现象的数学抽象。
语言模型的构建需要语料库的支撑
语料库建设并不是高不可攀的工程。
手动标注微型语料库

问题:常识告诉我们,一本书中几乎没有两个完全一样的句子 并且 试验中实际遇到的句子大部分都在语料库之外
这意味着它们的概率都将被标记为0 ???
解决办法:
二元语法 或(n元语法)
平滑策略(劫富济贫的策略)

语言模型 - 训练
推荐阅读
author-avatar
Not-Only-For曾广超
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有