热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

互联网新闻开放协议

使用此开放协议,将会为您的网站带去更多流量!http:news.baidu.comnewsop.html《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录




使用此开放协议,将会为您的网站带去更多流量!

http://news.baidu.com/newsop.html

        《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页(独立于原有的新闻发布形式)供搜索引擎索引,将网站发布的新闻信息主动、及时地告知百度搜索引擎。

        采用了《互联网新闻开放协议》,就相当于网站的新闻被搜索引擎订阅,通过百度——全球最大的中文搜索引擎这个平台,网民将有可能在更大范围内更高频率地访问到您网站的新闻,进而为您的网站带来潜在的流量。

开放协议非常简单! 您可以在我们的帮助下轻松使用。

开放协议内容

        下图为遵照《互联网新闻开放协议》制作的XML格式的网页,网页上按照标准格式列出了网站发布的新闻的相关信息。
XML网页示例:

XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。
*<document>——标记整个XML文件内容的开始和结束。
*<webSite>——站点地址。
*<webMaster>——负责人员的Email。当有必要时&#xff0c;我们通过这个地址与您联系。
*<updatePeri>——更新周期&#xff0c;以分钟为单位。搜索引擎将遵照此周期访问该页面&#xff0c;使页面上的新闻更及时地出现在百度新闻中。
*<item>——标记每篇新闻信息的开始和结束。标记内为单篇新闻信息&#xff0c;不包括新闻专题。
*<title>——新闻标题。
*<link>——新闻url地址&#xff0c;与单篇新闻一一对应&#xff1b;若分页的新闻存在多个URL&#xff0c;相当于多篇新闻。
<description>——新闻内容简介。
*<text>——完整的新闻正文&#xff08;仅包含正文文字&#xff0c;不包含HTML语言等其它字符&#xff09;。此项的目的是使该篇新闻更多、更准地出现在搜索结果中。
*<image>——新闻正文内相关图片&#xff0c;采用绝对地址。若该篇新闻无相关图片&#xff0c;可以为空&#xff1b;若含有多张图片&#xff0c;请重复使用该标签。此项的目的是使该篇新闻的相关图片展现在搜索结果中。
<headlineImg>——为有可能成为头条的新闻制作的头条图&#xff0c;采用绝对地址 。
<keywords>——反映新闻主题内容的一个或多个关键词&#xff0c;关键词之间以空格隔开。此项仅作为参考&#xff0c;检索结果不完全依赖于此标签中的内容。
<category>——新闻分类&#xff0c; 可以遵循网站自身的分类体系&#xff0c;最好采用一级分类。
<author>——新闻作者&#xff0c;可以为机构或个人 。
<source>——新闻来源&#xff0c;即原创媒体或其它机构 。
*<pubDate>——新闻发布时间&#xff0c;与该篇新闻HTML页面上的发布时间保持一致。请精确到分钟&#xff1b;若您网站的发布时间未记录小时分钟&#xff0c;提供年月日即可。

推荐时间格式&#xff1a;年月日小时分钟秒
如&#xff1a;2005-11-09 10:37  |  2005/11/09 10:37:00  |  2005.11.09 10:37:00  |
       2005年11月09日10时37分00秒  |  Fri, 09 Nov 2005 10:37:00 GMT





使用之前&#xff0c;您需要了解以下几点&#xff1a;

  • 无论您的网站已经成为百度新闻源&#xff0c;还是尚未被百度新闻搜索收录&#xff0c;都可以使用此开放协议。
  • 您使用开放协议提供的内容应全部符合下面《新闻源收录标准》。
  • 《互联网新闻开放协议》只是原始新闻源收录方式的一种协助和有益补充&#xff0c;而不是完全取代。

新闻源收录标准&#xff1a;
        百度希望新闻源多样化&#xff0c;鼓励原创新闻内容。如果是具有大量有价值的新闻内容并能及时更新的正规、合法媒体网站&#xff0c;且网站服务器稳定、高速&#xff0c;就符合了百度收录新闻源的基本原则。
        百度新闻搜索收录的内容包括时政、娱乐、体育、财经、科教文化、社会生活等各类新闻报道及媒体评论&#xff0c;数码产品、房产、汽车等行情资讯及评 测&#xff0c;各行业的动态及行情&#xff0c;组织机构的工作动态等&#xff0c;是由专业人士撰写或编辑的中文信息&#xff0c;不包括发布的个人信息、论坛、博客、广告、幽默笑话、情感故事、情 色、写真、剧照、明星档案、食谱、下载、多媒体等其它类型、其它语言互联网信息。
        您应对提供的全部内容承担一切法律责任&#xff0c;保证您提供内容的真实性、合法性&#xff0c;并不得侵犯任何第三方的权益。

下面就开始吧&#xff01;
第一步&#xff1a;创建XML文件
        请您在创建XML文件前务必阅读百度新闻搜索的新闻源收录标准&#xff0c;并特别注意&#xff1a;

         1、百度新闻搜索收录的新闻源网站必须符合及严格遵守国家《互联网新闻信息服务管理规定》&#xff0c;并在新闻发布和转载过程中尊重创作人和源网站的著作权。

         2、百度新闻搜索不适合收录的网站类型包括&#xff1a;论坛、博客、公司网站等。

         3、百度新闻搜索不收录个人信息、广告、招标、教程、幽默笑话、情感故事、情色、写真、剧照、明星档案、食谱、下载、多媒体等其它类型、其它语言互联网信息。

         4、百度新闻搜索希望收录高质量的中文新闻&#xff0c;不收录英文等其它非中文新闻。

         5、请按照上面公布的开放协议内容制作XML文件。

  • 其它说明&#xff1a;
  • 支持的编码格式有GB2312、GB18030、UTF-8、BIG5&#xff0c;推荐使用GB18030或UTF-8格式。
  • 您可以将网站某一时间段发布的全部新闻放在一个XML文件中&#xff0c;也可以分频道或栏目放在多个XML文件中。
  • 请保持每个XML文件处于按更新周期持续自动更新状态。更新周期可根据您的需要随时进行调整。
  • 每个XML文件至多存放最新发布的100条新闻&#xff0c;无需保存之前的新闻
  • 请将发布的新闻按照时间排序&#xff0c;即最新发布的新闻在最上端&#xff0c;否则可能有新闻被遗漏。
  • XML标签内容中&#xff0c;除文字文本以外不能包含其它任何代码&#xff0c;下表中的特殊字符必须转换为XML定义的转义字符。否则将发生错误导致搜索引擎不能获取页面上的新闻。
    字符转义后的字符
    HTML字符字符编码
    和(and)&&&
    单引号&#39;'&#39;
    双引号"""
    大于号>>>
    小于号<<<
      转义字符中的"&"无需再转。

  • 建议您使用CDATA 部件。一个 CDATA 部件以""标记结束。将包含代码或特殊字符的文本置于CDATA 部件内 &#xff0c;就无需再对特殊字符进行转义。

第二步&#xff1a;验证XML文件
        下面的地址提供了帮助您验证XML文件结构的多种工具&#xff1a;
        http://www.w3.org/XML/Schema#Tools
        http://www.xml.com/pub/a/2000/12/13/schematools.html
        通过验证的XML文件能够使您提供的信息更加标准&#xff0c;确保您发布的新闻信息不被搜索引擎遗漏。

第三步&#xff1a;提交XML网址
        提交前请将XML文件上传到您的网站服务器&#xff0c;将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址&#xff0c;当URL地址发生变化时需要重新提交。
         若您的网站符合新闻源收录标准&#xff0c;百度新闻搜索将对您提交的数据进行测试和观察一周。如果XML文件基本按照 《互联网新闻开放协议》的要求制作但存在问题&#xff0c;我们会根据XML页面上提供的邮件地址与您联系。

         注意:

         1、 我们将对您提交的XML文件进行审核&#xff0c;百度新闻搜索不保证一定能收录您提交的全部内容。

         2、站点名、地址为必填项&#xff0c;同一站点一天之内最多提交5个不同的XML文件地址。

         3、提交地址后请您注意查看弹出窗口中的信息&#xff0c;以确认是否提交成功。

 

*站点名、地址为必填项。
站点名               地址
 
&#xff1a;百度             http://news.baidu.com/news.xml

备注

有需要时填写&#xff0c;并将内容控制在200字以内。






第四步&#xff1a;查询XML文件状态

        您可以在下面的方框中输入您提交的XML文件地址&#xff0c;查询该文件的处理进度和反馈信息。

       
注意&#xff1a;输入的地址必须完整&#xff0c;即与您提交时的地址完全一致。

 

     




 

 

推荐阅读
  • 本文探讨了利用Java实现WebSocket实时消息推送技术的方法。与传统的轮询、长连接或短连接等方案相比,WebSocket提供了一种更为高效和低延迟的双向通信机制。通过建立持久连接,服务器能够主动向客户端推送数据,从而实现真正的实时消息传递。此外,本文还介绍了WebSocket在实际应用中的优势和应用场景,并提供了详细的实现步骤和技术细节。 ... [详细]
  • 网站访问全流程解析
    本文详细介绍了从用户在浏览器中输入一个域名(如www.yy.com)到页面完全展示的整个过程,包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]
  • Spring – Bean Life Cycle
    Spring – Bean Life Cycle ... [详细]
  • Spring Boot 中配置全局文件上传路径并实现文件上传功能
    本文介绍如何在 Spring Boot 项目中配置全局文件上传路径,并通过读取配置项实现文件上传功能。通过这种方式,可以更好地管理和维护文件路径。 ... [详细]
  • 本文介绍如何在 Android 中自定义加载对话框 CustomProgressDialog,包括自定义 View 类和 XML 布局文件的详细步骤。 ... [详细]
  • 本文详细介绍了如何使用Python中的smtplib库来发送带有附件的邮件,并提供了完整的代码示例。作者:多测师_王sir,时间:2020年5月20日 17:24,微信:15367499889,公司:上海多测师信息有限公司。 ... [详细]
  • php更新数据库字段的函数是,php更新数据库字段的函数是 ... [详细]
  • 在JavaWeb开发中,文件上传是一个常见的需求。无论是通过表单还是其他方式上传文件,都必须使用POST请求。前端部分通常采用HTML表单来实现文件选择和提交功能。后端则利用Apache Commons FileUpload库来处理上传的文件,该库提供了强大的文件解析和存储能力,能够高效地处理各种文件类型。此外,为了提高系统的安全性和稳定性,还需要对上传文件的大小、格式等进行严格的校验和限制。 ... [详细]
  • 尽管我们尽最大努力,任何软件开发过程中都难免会出现缺陷。为了更有效地提升对支持部门的协助与支撑,本文探讨了多种策略和最佳实践,旨在通过改进沟通、增强培训和支持流程来减少这些缺陷的影响,并提高整体服务质量和客户满意度。 ... [详细]
  • 本文探讨了资源访问的学习路径与方法,旨在帮助学习者更高效地获取和利用各类资源。通过分析不同资源的特点和应用场景,提出了多种实用的学习策略和技术手段,为学习者提供了系统的指导和建议。 ... [详细]
  • 在处理遗留数据库的映射时,反向工程是一个重要的初始步骤。由于实体模式已经在数据库系统中存在,Hibernate 提供了自动化工具来简化这一过程,帮助开发人员快速生成持久化类和映射文件。通过反向工程,可以显著提高开发效率并减少手动配置的错误。此外,该工具还支持对现有数据库结构进行分析,自动生成符合 Hibernate 规范的配置文件,从而加速项目的启动和开发周期。 ... [详细]
  • 本文深入探讨了 hCalendar 微格式在事件与时间、地点相关活动标记中的应用。作为微格式系列文章的第四篇,前文已分别介绍了 rel 属性用于定义链接关系、XFN 微格式增强链接的人际关系描述以及 hCard 微格式对个人和组织信息的描述。本次将重点解析 hCalendar 如何通过结构化数据标记,提高事件信息的可读性和互操作性。 ... [详细]
  • 本文详细介绍了如何在 Linux 系统上安装 JDK 1.8、MySQL 和 Redis,并提供了相应的环境配置和验证步骤。 ... [详细]
  • 如何在Linux服务器上配置MySQL和Tomcat的开机自动启动
    在Linux服务器上部署Web项目时,通常需要确保MySQL和Tomcat服务能够随系统启动而自动运行。本文将详细介绍如何在Linux环境中配置MySQL和Tomcat的开机自启动,以确保服务的稳定性和可靠性。通过合理的配置,可以有效避免因服务未启动而导致的项目故障。 ... [详细]
  • Git命令基础应用指南
    本指南详细介绍了Git命令的基础应用,包括如何使用`git clone`从远程服务器克隆仓库(例如:`git clone [url/path/repository]`)以及如何克隆本地仓库(例如:`git clone [local/path/repository]`)。此外,还提供了常见的Git操作技巧,帮助开发者高效管理代码版本。 ... [详细]
author-avatar
誓言俱乐部
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有