热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

搜索引擎如何把最有价值的内容放在第一位展示给用户?——通过对用户行为的数据挖掘,提高pagerank算法的准确性...

2019独角兽企业重金招聘Python工程师标准久病成医,搜索引擎用多了,难免发现一些不完善的地方。比如我们在查找某些问题的答案时,

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

久病成医,搜索引擎用多了,难免发现一些不完善的地方。比如我们在查找某些问题的答案时,经常返回一些不是我们想要的结果。解决这个问题,单纯通过关键字匹配,已经很难解决了。而外链算法又被外链买卖毁了。同时,即便返回的结果都是相关的,但是哪个是对用户来说最好的答案呢?

数据挖掘在这个时候就派上用场了

举例说明:我想找下“如何用C#压缩文件”,结果有很多,但又介绍的不详细,关键部分一笔带过,这样的结果放在第一个位置,用户体验很不好。用户在打开几个链接之后,发现内容对自己没有价值,这时基本要崩溃了。

如何把最有价值的内容放在第一位展示给用户呢?

一般情况下,用户在寻找对自己有价值的内容时,找到之后,就不会继续寻找。ok,这样就有思路了。我发现点击谷歌的搜索结果,谷歌会做一个跳转,这个跳转里,完全可以记录用户搜索了什么,然后访问了哪个网页。在某一时间段内,用户最后访问的网页,对他来说应该是最有价值的。下面就是数据挖掘的工作了,我对此不了解,就不讨论了。

谷歌为什么出自己的浏览器?为什么在浏览器中加入用户配置的云同步?就是为了收集数据,进行数据挖掘。

猜测:国内的360搜索应该也做了同样的工作,百度就不知道了,应该会有。


转:https://my.oschina.net/lbp0200/blog/131643



推荐阅读
  • 时序数据是指按时间顺序排列的数据集。通过时间轴上的数据点连接,可以构建多维度报表,揭示数据的趋势、规律及异常情况。 ... [详细]
  • Python安全实践:Web安全与SQL注入防御
    本文旨在介绍Web安全的基础知识,特别是如何使用Python和相关工具来识别和防止SQL注入攻击。通过实际案例分析,帮助读者理解SQL注入的危害,并掌握有效的防御策略。 ... [详细]
  • SSE图像算法优化系列三:超高速导向滤波实现过程纪要(欢迎挑战)
    自从何凯明提出导向滤波后,因为其算法的简单性和有效性,该算法得到了广泛的应用,以至于新版的matlab都将其作为标准自带的函数之一了&#x ... [详细]
  • H5技术实现经典游戏《贪吃蛇》
    本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术,我们将探讨如何构建这款游戏的两种主要玩法:积分闯关和无尽模式。 ... [详细]
  • 本文通过个人经历引出关于数学教学中的一个常见误解——被零除的结果,并深入探讨了浮点数中负零的存在及其背后的数学原理。 ... [详细]
  • 第三周课堂测试1、使用汇编语言编写指令时,用一些简单的容易记忆的符号来代替二进制指令,比机器语言更为方便,属于高级语言。(B ... [详细]
  • 利用Dlib进行高效的人脸特征提取与识别
    本文介绍了Dlib库,一个集成了多种机器学习算法的C++工具包,特别适用于需要处理复杂任务的应用场景。Dlib不仅支持机器人技术、嵌入式系统开发、移动应用及高性能计算环境,还提供了强大的人脸检测与特征提取功能。 ... [详细]
  • 本文探讨了为何在Linux系统上进行项目开发的重要性,并详细介绍了如何在Ubuntu系统上安装PyCharm这一流行的Python集成开发环境(IDE)。通过本文,您将了解在Linux环境下进行Python开发的优势及具体安装步骤。 ... [详细]
  • 本文将指导你如何通过自定义配置,使 Windows Terminal 中的 PowerShell 7 更加高效且美观。我们将移除默认的广告和提示符,设置快捷键,并添加实用的别名和功能。 ... [详细]
  • 本文介绍了一种算法,用于在一个给定的二叉树中找到一个节点,该节点的子树包含最大数量的值小于该节点的节点。如果存在多个符合条件的节点,可以选择任意一个。 ... [详细]
  • Python中调用Java代码的方法与实践
    本文探讨了如何在Python环境中集成并调用Java代码,通过具体的步骤和示例展示了这一过程的技术细节。适合对跨语言编程感兴趣的开发者阅读。 ... [详细]
  • 计算机视觉初学者指南:如何顺利入门
    本文旨在为计算机视觉领域的初学者提供一套全面的入门指南,涵盖基础知识、技术工具、学习资源等方面,帮助读者快速掌握计算机视觉的核心概念和技术。 ... [详细]
  • 多用户密码验证与加密登录系统
    本文介绍了一种基于多用户密码文件的加密登录方法,通过读取用户密码文件并使用简单的加密算法实现安全登录。文中详细描述了程序的设计思路及其实现过程。 ... [详细]
  • 深入浅出:Hadoop架构详解
    Hadoop作为大数据处理的核心技术,包含了一系列组件如HDFS(分布式文件系统)、YARN(资源管理框架)和MapReduce(并行计算模型)。本文将通过实例解析Hadoop的工作原理及其优势。 ... [详细]
  • 本文介绍了多维缩放(MDS)技术,这是一种将高维数据映射到低维空间的方法,通过保持原始数据间的关系,以便于可视化和分析。文章详细描述了MDS的原理和实现过程,并提供了Python代码示例。 ... [详细]
author-avatar
koglum
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有