作者:笑意江湖 | 来源:互联网 | 2023-05-21 18:09
导读:今天编程笔记来给各位分享关于php自动分词怎么做的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览:1、求一个PHP的分词程序,比如我有一句话:我是个好学生,
导读:今天编程笔记来给各位分享关于php自动分词怎么做的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
本文目录一览:
1、求一个PHP的分词程序,比如我有一句话:我是个好学生,分词后: 我 是 一个 好 学生 谢谢
2、php 提取中文后简单分词
3、我想用PHP做一个聊天机器人,我调用别人的API实现了中文分词,我要怎样构建自己的数据库呢?
4、北大青鸟java培训:php自动提取文章关键字?
5、如何用PHP调用搜狗搜索,实现自动填充关键词
6、请教下,PHP文章标题的自动分词(Tag)是怎么做的??
求一个PHP的分词程序,比如我有一句话:我是个好学生,分词后: 我 是 一个 好 学生 谢谢
这个程序几乎是没有人能提供给你。为什么?
因为百度的翻译 其中就涉及到 语句分词,这是一个很高深的技术。而且还需要分词的词典,规则大概是包括所有汉字,分词规则,语句等等。
能做好这个技术,几千万都能卖出去。
php 提取中文后简单分词
$str = "汉字一二3四5六七八,九十六七...";
$s1 = array();//初始化储存第二步结果的数组
//preg_match_all("/[x80-xff]+/", $str, $match);//此为GBK使用
preg_match_all("/[\x{4e00}-\x{9fa5}]{2,}+/u", $str, $match);//此为UTF-8使用
foreach($match[0] as $str1)//循环遍历匹配到的汉字
{
$leng = iconv_strlen($str1, "UTF-8");//计算汉字其长度
for($i = 0; $i $leng-1; $i++)
{
$temp = mb_substr($str1, $i, 2, "UTF-8");//将汉字切割长两个字,得第一步结果
if(!in_array($temp, $s1))//去除重复,得第二步结果
$s1[] = $temp;//得到的汉字存入数组
}
}
//print_r($s1);//第一二步完成,得数组$s1,可打印查看结果
$s2 = file_get_contents("21.txt");//将文件内所有字符读取成一个字符串
$s2 = iconv("", "UTF-8", $s2);//将字符串转码,否则难免有乱码
//echo $s2;//可输出查看文件中的内容
$s = "";//初始化最终结果的变量
foreach($s1 as $j)//遍历汉字对
{
if(preg_match("/".$j."/", $s2))//判断该汉字对是否被包含于文件的文字中
$s .= ("" == $s) ? $j : "\\".$j;//将结果合在$s中
}
echo $s;//得结果,可输出查看或调用
若有疑问,可追问。
注释详细,希望能加分
我想用PHP做一个聊天机器人,我调用别人的API实现了中文分词,我要怎样构建自己的数据库呢?
可以用SimSimi API:(不需要数据库)。
根据提示进行注册(注册地址:)。
登录后访问:,
点击[Get a 7 days Trial Key],你就会获得一个Trial Key(有效期为7天),然后直接
$key = ''; // 你的 Trial Key
$lang = ''; // 语言
$msg = ''; // 用户说的话
$res = file_get_contents(''.$key.'lc='.$lang.'ft=1.0text='.$msg);
或者你要购买一个Paid Key,也可以。
在中,点击[Get Paid Key],就可以购买。
只是代码要改为(响应地址不同):
$key = ''; // 你的 Paid Key
$lang = ''; // 语言
$msg = ''; // 用户说的话
$res = file_get_contents(''.$key.'lc='.$lang.'ft=1.0text='.$msg);
就可以了。注意php.ini中,allow_url_fopen要为On:
allow_url_fopen = On
然后会返回一个JSON字符串,与下面类似:
{
"result": 100,
"response": "SimSimi的回答",
"id": 本次会话的标识符(int),
"msg": "响应描述"
}
相应描述与result的值相关。
100:OK. // 成功
400:Bad Request. // 参数错误
401:Unauthorized. // Key 不存在
404:Not found. // 页面不存在
500:Server Error. // 服务器出错
参见:SimSimi API:
谢谢!
北大青鸟java培训:php自动提取文章关键字?
现在很多web系统都用到了不少的自然语言处理技术来提高客户体验。
主要技术:1.文章关键字提取.2.相关文章(产品)推荐.最近有不少网友问道,这里以php为例子讲解下php的"关键字提取"的实现,同时这个也是实现"相关文章推荐"的前提.基本分以下几个步骤:一.对文章进行分词:php的中文分词程序还是有不少的,从前辈的scws,到用纯php实现的phpAnalysis,phpcws(phpcws)以及本人开发的robbe扩展。
这里的讲解是使用"robbe分词扩展"来进行分词,robbe兴许不是最好的,但一定是最快的。
选择的分词器需要支持停止词过滤。
二.统计词条词频并且排序:对一篇文章分词后,统计每个词条出现的次数。
然后按照词频降序排序下,你想要的结果在前面几个词中。
前提是去除了出现词频很高的停止词,要不然得到的都是一些无用的停止词。
现在,很多web系统都用到了不少的自然语言处理技术来提高客户体验.主要技术:1.文章关键字提取.2.相关文章(产品)推荐.最近有不少网友问到,这里以php为例子讲解下php的"关键字提取"的实现,同时这个也是实现"相关文章推荐"的前提。
基本分以下几个步骤: 一.对文章进行分词:php的中文分词程序还是有不少的,从前辈的scws,到用纯php实现的phpAnalysis,phpcws(phpcws)以及本人开发的robbe扩展。
这里的讲解是使用"robbe分词扩展"来进行分词,robbe兴许不是最好的,但一定是最快的。
选择的分词器需要支持停止词过滤。
二.统计词条词频并且排序:对一篇文章分词后,统计每个词条出现的次数,然后按照词频降序排序下,你想要的结果在前面几个词中。
湖南IT培训建议前提是去除了出现词频很高的停止词,要不然得到的都是一些无用的停止词。
如何用PHP调用搜狗搜索,实现自动填充关键词
php写不了这样的程序,可以直接用网页自动填表提交监控工具(PageSubmit)这类软件
请教下,PHP文章标题的自动分词(Tag)是怎么做的??
文章分词需要程序来完成给你推荐个工具,你看看是不是你需要的分词,这个是灵玖软件推出的你可以找一下。
结语:以上就是编程笔记为大家整理的关于php自动分词怎么做的相关内容解答汇总了,希望对您有所帮助!如果解决了您的问题欢迎分享给更多关注此问题的朋友喔~