LINUX环境中用PHP构建网站:搜索引擎的实现
作者:mobiledu2502929697 | 来源:互联网 | 2017-06-25 20:07
文章标题:LINUX环境中用PHP构建网站:搜索引擎的实现。Linux是中国IT实验室的一个技术频道。包含桌面应用,Linux系统管理,内核研究,嵌入式系统和开源等一些基本分类
能够拥有强大的搜索引擎是每个网站的心愿,而一个强大的搜索引擎的制作又是相当复杂和困难的,它涉及到效率,准确性和速度等诸多方面.
这里介绍的搜索引擎不会涉及到这么深的研究,只是针对特定的内容进行精确的查询.
一个功能复杂而强大的搜索引擎要用到很多的程序和数据库技巧,我们就先从简单的搜索引擎开始介绍.
搜索引擎的工作状况是怎样的呢?它接收给出的关键字,然后在给出的范围内进行搜索,然后将搜索的结果返回.
给出的关键字可能在信息内容的任何位置,引擎又是如何进行查找的呢?在这要用到如下的数据库语句:
select * from table where (name like '%".$keyword."%');
name 是查找的具体位置,一般放字段名,like '%".$keyword."%' 是模式匹配,就是在内容中查找有无 $keyword.看个例子:
在数据表 news 查找包含关键字 good 的所有标题:
select * from news where (title like '%good%');
这是个精确查找,能够在数据库内找出所有带 good 的 title 出来,还有一种模糊查找:
select * from news where (title like '%good');
这样也可查找出结果.
假设 news 里包含 title(标题),message(内容),user(用户) 等的字段,上面的查找范围就太狭窄了,因为只对 title 进行了查找,要对其它内容进行查找又不想操作太复杂该如何处理呢?
我们注意到在程序里任何变动的值都用变量来进行处理,在这这个方法一样行得通,可将想要搜索的范围作为变量进行传送,这样就有如下的数据库语法了:
mysql_query("select * from news where ($name like '%".$keyword."%'));
$name 存放的就是传送过来的字段变量的值,而这种可变的值通过 html 的 select 下拉提交表单来完成.
如果想要将搜索结果限制在一定的时间范围内又该如何实现呢?如想要查找 5 天之内的信息.还记得曾在 COOKIE 介绍中用到的数据库语法吗?
对了,该联合的语法如下:
mysql_query("select * from news where ($name like
'%".$keyword."%') and time>date_sub('$time',interval 5 day)");
其中 $time 为查找的现在时间:$time=date('Y-m-d H:i:s'); time 是数据库存储信息时间的字段.
现在将 $old 来代替 5:
mysql_query("select * from news where ($name like
'%".$keyword."%') and time>date_sub('$time',interval $old day)");
同样 $old 的值通过 select 提交表单将限定的不同时间提交过来,便完成了这个颇为强大的搜索引擎.
一些更为强大的搜索引擎需要程序技巧上的配合,读者可通过以上的原理自行扩展试验.
推荐阅读
-
本文介绍了一种利用函数实现不同进制数(二进制、八进制、十进制)之间转换的方法。包括了程序的运行效果展示、所使用的主要函数解析、以及如何验证用户输入的合法性。整个项目仅使用了两个全局变量来存储用户的选项和输入的数值。 ...
[详细]
蜡笔小新 2024-12-04 21:03:53
-
CSGOTimeLimit:40002000MS(JavaOthers)MemoryLimit:524288524288K(JavaOthers)ProblemDescriptio ...
[详细]
蜡笔小新 2024-12-04 19:06:23
-
-
本文详细介绍了C++中常见的容器(如列表、向量、双端队列等)及其迭代器的实现方式,通过具体代码示例展示了如何使用这些容器和迭代器。 ...
[详细]
蜡笔小新 2024-12-04 17:00:02
-
本文探讨了在执行SQL查询时遇到的因字符集不同而导致查询结果差异的问题,特别是涉及中文字符时。文章分析了在不同字符集设置下,SQL查询结果的变化,并提供了详细的解决方案。 ...
[详细]
蜡笔小新 2024-12-04 16:39:13
-
CGroups(Control Groups)是Linux内核提供的一个功能,旨在限制、记录和隔离进程组使用的物理资源,如CPU、内存和I/O等。它通过精细的资源管理,支持现代容器技术如Docker的资源限制需求。 ...
[详细]
蜡笔小新 2024-12-04 15:19:11
-
本文详细介绍了MySQL数据库中的各种数据类型,包括整型、浮点型、字符型、文本型和日期时间型等,每种类型都有其特定的存储需求和使用场景。 ...
[详细]
蜡笔小新 2024-12-04 12:40:28
-
本文详细介绍了如何通过Percona插件监控MySQL 5.7数据库,包括环境准备、插件安装、配置调整及数据测试等步骤,旨在为用户提供一个高效且稳定的监控解决方案。 ...
[详细]
蜡笔小新 2024-12-04 11:50:37
-
Django的数据库1.在Django_test下的view.py里面model定义模型fromdjango.dbimportmodels#Createyourmodelshere ...
[详细]
蜡笔小新 2024-12-04 11:29:56
-
本文深入探讨了SqliLabs项目中的第38至45关,重点讲解了堆叠注入(Stacked Queries)的应用技巧及防御策略。通过实际案例分析,帮助读者理解如何利用和防范此类SQL注入攻击。 ...
[详细]
蜡笔小新 2024-12-04 11:17:35
-
本文将介绍如何利用Postman工具执行基本的日志写入和数据管理操作。通过本教程,您将了解如何连接至Elasticsearch服务,创建索引,存储及检索数据。 ...
[详细]
蜡笔小新 2024-12-04 10:48:31
-
本文介绍两个实用的统计报表模板,并提供如何将这些静态模板转换为动态JSP页面的方法。同时,文中附上了详细的代码示例。 ...
[详细]
蜡笔小新 2024-12-04 10:26:05
-
本文主要介绍了KKCMS的安装过程及其基本功能,重点分析了该系统中存在的验证码重用、SQL注入及XSS等安全问题。适合初学者作为入门指南。 ...
[详细]
蜡笔小新 2024-12-04 09:30:07
-
本文详细介绍了Java中的动态代理机制,包括如何定义接口、实现类和代理处理器,并通过具体示例演示了动态代理的创建和使用过程。 ...
[详细]
蜡笔小新 2024-12-04 19:46:00
-
本文详细介绍了在PHP中如何创建新文件以及如何使自定义函数在整个项目中全局可用的方法,包括最新的实践技巧。 ...
[详细]
蜡笔小新 2024-12-04 18:48:49
-
题目描述:给定一个(n+1)×(n+1)的方格,其中包含一个(n-1)×(n-1)的空洞。使用1×2的砖块进行铺设,求解不同的铺设方案总数。 ...
[详细]
蜡笔小新 2024-12-04 09:12:39
-
mobiledu2502929697
这个家伙很懒,什么也没留下!