热门标签 | HotTags
当前位置:  开发笔记 > 开放平台 > 正文

百度的智能纠错功能什么原理?相似度算法吗?

百度或者谷歌的搜索引擎,当我们输入错误的时候,他会提示我们是不是输入错误了,比如我输入“北近”他就会提示你是不是想找”北京“,这样的功能是怎么实现的,什么原理?小生刚参加工作半年,经验和能力都
  百度或者谷歌的搜索引擎,当我们输入错误的时候,他会提示我们是不是输入错误了,比如我输入“北近”他就会提示你是不是想找”北京“,这样的功能是怎么实现的,什么原理?
小生刚参加工作半年,经验和能力都很欠缺,希望大家多多指教谢谢!

12 个解决方案

#1


别沉默了啊,哥哥们出来跳跳啊。。。。

#2


该回复于2012-03-27 09:43:42被版主删除

#3


其实我感觉百度就是维护了一个"词热度"的实时库,当你搜索的词不再"词热度"库里面时就会在"词热度"库里面检索和你搜索最相近的词 作为提示.

#4


引用 3 楼 qq413041153 的回复:
其实我感觉百度就是维护了一个"词热度"的实时库,当你搜索的词不再"词热度"库里面时就会在"词热度"库里面检索和你搜索最相近的词 作为提示.


说得好。
我觉得其实不仅仅有个"词热度",应该还有基本的词排行,这个词排行相对于"词热度"一般是比较固定的。词排行里把所有的词都记录在案,比"词热度"量少,旦维护量大。

#5


其实都是一个词汇表,就跟输入法差不多。

#6


这样的话会涉及到一个近义词比较啊?怎么去判断他们是个近义词,需要近义词算法?是不是又个相似度算法?大家能说说这个吗?谢谢

#7


我觉得是根据拼音并且跟词的热度(同时)来判断近义词的。算法肯定是有点  不过怎么实现就不知道了

#8


可能会搜索你输入的字的拼音进行一些热门词汇判断

#9


继续回复谢谢

#10


这个跟百度输入法的方式应该是一致的,这也是为啥做搜索引擎的都会出一个输入法的副产品的原因

#11


至于输入法使用的什么原理和算法,可以去找一下专业的输入法社区,比如拼音加加

#12


再次谢谢 貌似这帖子被沉没了

推荐阅读
  • H5技术实现经典游戏《贪吃蛇》
    本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术,我们将探讨如何构建这款游戏的两种主要玩法:积分闯关和无尽模式。 ... [详细]
  • 本文回顾了作者在求职阿里和腾讯实习生过程中,从最初的迷茫到最后成功获得Offer的心路历程。文中不仅分享了个人的面试经历,还提供了宝贵的面试准备建议和技巧。 ... [详细]
  • 使用Matlab创建动态GIF动画
    动态GIF图可以有效增强数据表达的直观性和吸引力。本文将详细介绍如何利用Matlab软件生成动态GIF图,涵盖基本代码实现与高级应用技巧。 ... [详细]
  • 本文介绍了记事本的基本保存方法以及通过辅助软件实现自动保存的技术,帮助用户更好地管理和保护重要数据。 ... [详细]
  • 软件测试行业深度解析:迈向高薪的必经之路
    本文深入探讨了软件测试行业的发展现状及未来趋势,旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • MySQL InnoDB 存储引擎索引机制详解
    本文深入探讨了MySQL InnoDB存储引擎中的索引技术,包括索引的基本概念、数据结构与算法、B+树的特性及其在数据库中的应用,以及索引优化策略。 ... [详细]
  • 近期尝试从www.hub.sciverse.com网站通过编程手段获取数据时遇到问题,起初尝试使用WebBrowser控件进行数据抓取,但发现使用GET方法翻页时,返回的HTML代码始终相同。进一步探究后了解到,该网站的数据是通过Ajax异步加载的,可通过HTTP查看详细的JSON响应。 ... [详细]
  • 本文详细介绍了如何在ARM架构的目标设备上部署SSH服务端,包括必要的软件包下载、交叉编译过程以及最终的服务配置与测试。适合嵌入式开发人员和系统集成工程师参考。 ... [详细]
  • 深入理解云计算与大数据技术
    本文详细探讨了云计算与大数据技术的关键知识点,包括大数据处理平台、社会网络大数据、城市大数据、工业大数据、教育大数据、数据开放与共享的应用,以及搜索引擎与Web挖掘、推荐技术的研究及应用。文章还涵盖了云计算的基础概念、特点和服务类型分类。 ... [详细]
  • 过去我习惯使用百度空间来记录个人的生活琐事,但随着需求的增长,我发现它的功能略显不足,特别是在代码分享和图片管理方面存在诸多不便。因此,我决定寻找一个更适合技术分享的平台,最终选择了博客园。 ... [详细]
  • 尽管在WPF中工作了一段时间,但在菜单控件的样式设置上遇到了一些基础问题,特别是关于如何正确配置前景色和背景色。 ... [详细]
  • 本文深入探讨了Linux内核中进程地址空间的设计与实现,包括虚拟地址空间的概念、内存描述符`mm_struct`的作用、内核线程与用户进程的区别、进程地址空间的分配方法、虚拟内存区域(VMA)的结构以及地址空间与页表之间的映射机制。 ... [详细]
  • 漫画平台发布弹幕指南
    许多用户询问如何在漫画平台上发表弹幕。本文将详细介绍如何在漫画台发布弹幕,帮助用户更好地参与互动,提升阅读体验。 ... [详细]
  • 利用Node.js实现PSD文件的高效切图
    本文介绍了如何通过Node.js及其psd2json模块,快速实现PSD文件的自动化切图过程,以适应项目中频繁的界面更新需求。此方法不仅提高了工作效率,还简化了从设计稿到实际应用的转换流程。 ... [详细]
author-avatar
灬丶领袖
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有