按照作弊的操作范围可分为“内部作弊”及“外部作弊”。
内部作弊是指通过操控网站内部因素影响页面权重及相关性的行为;而外部作弊则是指通过操控网站外部因素(外部链接)影响页面权重及相关性的行为。常见的搜索引擎优化作弊方式包括:
1. 关键字堆砌
2. 隐藏文本
3. 镜像网站
4. 门页
5. 302 重定向
6. 伪装
7.链接欺骗
其中,1-6 属于内部作弊,而 7 属于外部作弊。
1. 关键字堆砌
关 键字堆砌是指在页面上堆放大量与页面主题相关或无关的关键字,这样做是为了增加某些关键字的词频以提高页面相关性。在页面中常用于堆砌关键字的区域包括 “正文内容”、“
在页面正文内容中堆砌关键字不仅会影响页面美观及用户体验,而且还是一种欺骗搜索引擎的违规行为,搜索引擎轻易就能识别。
2. 隐藏文本
隐藏文本是最早也是最简单的搜索引擎优化作弊方式之一,通过“隐藏”页面中堆砌的关键字,达到既增加关键字词频、提高页面相关性,又不影响页面美观及用户体验的目的。
“隐藏文本”通常通过控制文本的“字号”及“颜色”属性值来实现。因此,这些“隐藏文本”对于普通用户来说是不可见的,但搜索引擎却可以识别。
(注:“隐藏文本”也是“关键字堆砌”的一种方式。)
3. 镜像网站
广义上的镜像网站是指那些复制或者抄袭其他网站内容的网站。常见的镜像网站有三种:
第一种是克隆网站,指在内容完全相同的网站 上绑定多个域名(这些内容可能在同一服务器上,也可能在不同的服务器上),例如:在相同内容的网站上同时绑定域名“www.domain.net”与“www.domain.com”。
第二种是为内容完全相同的网站制定多套不同风格的页面模版,再绑定多个域名。
第三种是数据采集网站,指网站中所有的内容都是通过采集程序采集的。
为了减少搜索结果中的重复信息,提高用户体验,搜索引擎会降低镜像网站的权重或者忽略镜像网站的内容。
4. 门页
“门 页”即“Doorway Pages”,也称为桥页、跳转页或入口页,是指针对搜索引擎而进行特别优化的页面,当用户访问门页时,会自动(或引导用户手动)跳转至另外一个内容完全 不同的页面上。 例如:“页面 1”、“页面 2”都是“网站 A”的页面,“页面 1”针对搜索引擎进行过特别的优化,而“页面 2”是一个正常的页面。当普通用户访问该网站时,会从“页面 1”自 动(或引导用户手动)跳转至“页面 2”,即“页面 1”存在的目的是引导用户进入“页面 2”;当搜索引擎访问该网站时首先得到的是“页面 1”,而“页面 2”则可能被忽略。这样,这个经过特别优化的“页面 1”就可以在搜索引擎中得到较好的表现,而普通用户在搜索结果中点击“页面 1”的链接时,也会自动(或引导用户手动)进入“页面 2”。这时,我们称“页面 1”为门页。 门页可能是针对一个搜索引擎,也可能是针对多个不同的搜索引擎。由于每个搜索引擎的算法会存在或多或少的差异,有些人为了提高网站在各个搜索引擎中的表 现,会针对不同的搜索引擎建立不同的门页,再对不同的搜索引擎蜘蛛程序返回相应的门页。
例如:如果程序监测到前来访问的是 Googlebot,则返回针对 Google 而进行过特别优化的页面;如果是百度的 BaiduSpider,则返回针对百度进行过特别优化的页面。搜索引擎轻易就能识别门页。对于使用门页的网站,搜索引擎的处罚是非常严厉的,轻者降低网 站权重,重者直接从索引中清除。
5 伪装
“伪装”即 Cloaking,是指根据用户身份返回不同页面的行为,是门页最常用的跳转方式之一。例如:面对搜索引擎及普通用户返回不同的页面,向搜索引擎返回经过 特别优化的页面,而对普通用户则返回正常的页面。不管在什么情况下,“伪装”都是欺骗搜索引擎的违规行为,因此会受到搜索引擎的惩罚。
“伪装” 实现原理:首先对前来访问的用户的头部代理信息进行判断,如果是搜索引擎蛛蜘程序则返回为搜索引擎而准备的页面,否则返回正常的页面。在进行“伪装”时你 必须知道搜索引擎蜘蛛程序的头部代理信息,这些信息我们可以在服务器日志上查看到。例如:Google 蛛蜘程序“Googlebot”,百度蛛蜘程序“baiduspider”。 下面介绍以 PHP 实现的“伪装”代码:
$trouve=strpos($_SERVER["HTTP_USER_AGENT"],"Googlebot");
if($trouve!==false){
?>
… 为 Google 准备的页面…
}
else{
?>
… 为普通用户准备的页面…
}
?>
6. 302 重定向
重定向指把对一个目录或者文件的访问请求转发至另外一个目录或文件(详细请参考“URL 优化”一章中“URL 重定向”一节)。
重 定向包括 301 重定向及 302 重定向。其中,302 重定向又称为暂时性转移(Temporarily Moved ),适用于临时更换域名或目录名称等情况。常见的 302 重定向方式包括“meta重定向”及“JS 重定向”。在使用 302 暂时性重定向时必须十分谨慎,否则很容易会陷入门页的误区而遭到搜索引擎的惩罚。
Meta 重定向是指通过设置 Meta 标签的 http-equiv 属性值及内容来实现的重定向。例如:在页面头部加上代码“”,则打开当前页面 3 秒钟后自动跳转至网站“www.pqshow.com”。在Meta重定向中,如果设定的停留时间过短(如:停留时间少于一秒),则会被搜索引擎认为是 “门页”。为了避免“门页”嫌疑,我们在使用 Meta 进行跳转时,通常会把停留时间设定在 3 秒以上。
JS 重定向,是指使用 Javascript 语言实现的重定向。代码如下所示:
window.location.href=http://www.seochat.org;
//–>
《SCRIPT》
该代码表示把访问目前页面的请求转发至“http://www.seochat.org”上。利用 JS 重定向,我们只需要把上面的代码放在需要重定向的页面上即可。
7. 链接作弊手段
链接作弊就是指利用搜索引擎对外部链接关系的重视,围绕建立外部链接而开展的一系列欺骗搜索引擎的行为。
垃 圾链接指通过非正当手段获得大量高质量或者低质量外部导入链接的行为。严格地说,垃圾链接是一种行为,而不在于导入链接所在页面质量的高低。从导入链接所 在页面质量的角度出发,垃圾链接可以分为高质量垃圾链接及低质量垃圾链接;从源页面与目标页面链接关系的角度出发,可分为单向垃圾链接及双向垃圾链接。
1.高质量垃圾链接
高质量垃圾链接是指通过非正当手段从高质量页面中获得导入链接的行为,通常会出现在 WIKI 类网站中(如:Wikipedia 及百度百科等)。
高质量垃圾链接所在的源页面有一个共同的特点就是这些页面具有可编缉性,垃圾链接制造者就是通过编缉这些页面达到发布垃圾链接信息的目的。
2.低质量导入链接
低质量导入链接是指通过非正当手段从低质量页面中获取导入链接的行为,低质量垃圾链接通常会出现在“论坛”、“留言板”、“自助链接系统”及“博客”等页面上,垃圾链接制造者通过群发信息软件实现垃圾链接信息的传播。
判断一个页面是否属于低质量页面,有两个基本条件:一是页面自身的权重(例如:我们可以通过 Google PR 值的高低作为参考指标);第二,就是该页面中导出链接的数量。
3.单向垃圾链接
单向垃圾链接是指通过非正当手段单方面获得导入链接的行为,单向垃圾链接常出现在“论坛”、“博客”、“百科”、“留言本”等页面中,垃圾链接制造者通常通过群发信息软件在这类页面上发布链接信息。
4.双向垃圾链接
双向垃圾链接是指那些既提供导出链接,同时又获得导入链接的行为(与外部导出链接数较大的低质量页面建立链接关系是最常见的双向垃圾链接)。双向垃圾链接的特征是:得到导入链接的一方,同时又是导入链接的提供者。根据这种关系,搜索引擎轻易就能识别双向垃圾链接。
5.垃圾链接识别
垃圾链接严重影响搜索结果的质量。因而,搜索引擎对垃圾链接的打击是非常严厉的,轻者降低权重,重者直接从搜索引擎索引中清除。然而,搜索引擎是如何识别垃圾链接的呢?常用的方法有以下几种:
a.人工检查,各大搜索引擎都会有 Anti spam 部门,即反垃圾网站部门;
b.用户举报,如:你的竞争对手或者普通用户都可能是举报的发起者;
c.程序跟踪,大部分搜索引擎已经建立较为智能算法,根据各种垃圾链接的特征进行监控。
6.如何避免垃圾链接
首先,要求从业人员要有良好的职业道德,对外不做垃圾链接的发布者;对内,不做垃圾链接的存放者。对于每个交换链接的网站在类别、质量及外部导出链接数上都应该有严格的要求。