2019独角兽企业重金招聘Python工程师标准>>>
久病成医,搜索引擎用多了,难免发现一些不完善的地方。比如我们在查找某些问题的答案时,经常返回一些不是我们想要的结果。解决这个问题,单纯通过关键字匹配,已经很难解决了。而外链算法又被外链买卖毁了。同时,即便返回的结果都是相关的,但是哪个是对用户来说最好的答案呢?
数据挖掘在这个时候就派上用场了
举例说明:我想找下“如何用C#压缩文件”,结果有很多,但又介绍的不详细,关键部分一笔带过,这样的结果放在第一个位置,用户体验很不好。用户在打开几个链接之后,发现内容对自己没有价值,这时基本要崩溃了。
如何把最有价值的内容放在第一位展示给用户呢?
一般情况下,用户在寻找对自己有价值的内容时,找到之后,就不会继续寻找。ok,这样就有思路了。我发现点击谷歌的搜索结果,谷歌会做一个跳转,这个跳转里,完全可以记录用户搜索了什么,然后访问了哪个网页。在某一时间段内,用户最后访问的网页,对他来说应该是最有价值的。下面就是数据挖掘的工作了,我对此不了解,就不讨论了。
谷歌为什么出自己的浏览器?为什么在浏览器中加入用户配置的云同步?就是为了收集数据,进行数据挖掘。
猜测:国内的360搜索应该也做了同样的工作,百度就不知道了,应该会有。