到目前为止还是存在众多的原创站长无辜的被牵连受罚,目前百度判断原创文章的技术实在不敢恭维。那么至今到底让站长要执行原创还是采集的路线呢?百度的技术实在让那些原先一直走原创的路线丧失了写原创的动力。那么如今我们该如何保护原创呢?
第一、 写好文章要在第一时间内通过ping机制ping给百度
可能你的网站还不能保证你写完文章后在短时间就有蜘蛛过来爬行,那么我们是否可以通过其它途径来使我们的文章更能让百度视为原创呢?如今的ping机制在一定程度上可以间接的让百度在时间上初步的区分原创来源。所以,小网站在弄原创文章的时候切记一定要通过ping机制ping给百度。
第二、 网站一定要安装sitemap并让他时时自动生成
我们都知道蜘蛛爬行一个网站通常情况下首先爬行的robots,目的是要检测我有哪些页面可以爬行,哪些页面自己是去不了的。所以,目前的众多站长还是不知道可以在robots里面上写上你的sitemap地址,这样就可以大大的促进你sitemap被蜘蛛爬行的几率。我们都知道sitemap自动生成就相当于你一整个网站的链接都在里面,所以要让蜘蛛对爬行sitemap才能让你的页面更多的被抓取被收录。
第三、 以外链指向数目来间接的辅助百度识别
我们都知道一个人是不是坏人不是一个人说的算,要的是多数的认可,才能进一步的确定。所以,文章是否原创我们也可以通过外链指向数目的多少来辅助百度更准确的识别。那么我们该怎样做呢?下面就由小编介绍我自己以往的做法:
1)、>>将你的网站所有页面链接整理出来
我们都知道sitemap包含我们全站的所有页面链接,所以我们可以从sitemap入手。我们打开sitemap页面,然后把里面的内容全部复制到你的excel中。
通过excel功能框里面的数据筛选进行整理出每个页面的唯一链接,把不是页面链接的内容全部清理掉,做法是选择A 列,然后点击数据,再在里面筛选-自动筛选,然后点击A列右下角的小三角形,点击后选中里面的自定义,然后在自定义功能显示框下拉里面选择包含,然后相对应的右侧输入框输入你的网站域名,然后点击确定,结果如下图所示
通过上一步的操作,还是存在一些字符。那么我们接下来可以通过替换进行去除我们不要的东西,从上图我们可以看出存在的不要的字符有和。好吧,接下来的操作不做就是在excel里面通过键盘快捷键(Ctrl+h)打开替换功能框,然后在查找内容里面输入,替换内容里面为空,再点击全部替换,这样就轻松的清除当前工作表里面的全部,去掉则通过以上同样的步骤进行操作便可。最终完成图如下
然后,通过一些查收录平台进行筛选出哪些已经被百度收录哪些没有被百度收录,把没被百度收录的文章页面整理出来,然后实时的跟踪该文章是否已经被其它站长采集了,如若已经被采集了,那么我们就可以通过拿该文章到不同的平台进行投稿,然后把在底部备注原创来源。来源便是填写该文章的链接。这样的话我们就大大的增加了该文章的指向数目,这样就可以大大的辅助百度对原创文章的识别。
本文由 http://www.qiaoshuoseo.com/,原创发布,转载请注明来源