热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

迅雷P2SP架构及服务策略的分析

一、引言P2SP是迅雷公司自造的术语,其定义为:他不但支持P2P技术,害通过多媒体检索数据库这个桥梁把原本孤立的服务器资源和P2P资源整合在一起在P2SP中,迅雷大致确立了用户辅助

一、引言

  1. P2SP是迅雷公司自造的术语,其定义为:他不但支持P2P技术,害通过多媒体检索数据库这个桥梁把原本孤立的服务器资源和P2P资源整合在一起


  2. 在P2SP中,迅雷大致确立了用户辅助开发模式。在中小规模的文件、专有文件的分发中,服务器负担了文件上传的主要部分,peer只是承担小部分。

  3. 迅雷作为一个公共下载平台,并不是发明出cs及p2p以外的下载方法,只是通过这个组织形成网络上的一个平台。因此研究迅雷应是研究他做了哪些必要的组织工作,如何对服务器和客户进行承诺的,实际上又是如何实现这些承诺的,以及平台所提供的下载质量。

  4. 下载过程的演进


最开始,文件下载是浏览器提供的,用户通过点击页面上的一个特定链接触发对该链接指向文件的下载,下载是单线程的,且不支持断点续传。对于大文件的下载费时下载带宽限制和费力断了必须通过手工操作重新下载。一般下载数据的规模在一字节的范围。

后来出现了NetAnts和FlashGet这类下载代理工具,通过多线程,断点续传和自动重新连接等措施提高了下载的速度和人工干预的过程。不过它仍然维持了原先文件下载中的sever-Client的关系。一般人们也就是下载十几,二十几字节的文件。下载的瓶颈从用户的接入带宽部分转移到了服务器的接入带宽和处理器处理能力上。

再后来出现了eMule和BitTorrent这样的P2P下载工具,能够一气下载几百M到几个G字节规模的文件。这样一个环境就像一个自由集市,用户自己提供资源,大家共享,根本无法实施任何程度的产权保护.




  1. 一个P2P的分发模式远比server-client模式复杂。后者一般只需要一台服务器,而前者一般需要的是一个平台。所谓一个平台,是指一个分工且相互密切联系的服务器群,他们要协同完成对每一个文件的在线用户收集,甄别和记录的工作,要对新加入的以及任何提出请求的老用户提供在线用户列表等等.


二、理解P2SP

P2SP平台的一般意义



  1. 体系结构如图所示




  • 与经典P2P的主要不同,是平台所服务的对象不再是单一类型的用户,而是两类不

    同的客户,并希望在不同类型客户的不同服务质量要求和安全要求间寻找策略平

    衡,在有一定安全的保障下实现最快速的服务。

  • 由于大量相同的文件会存放在许多不同的服务商处,因此客户可以选择他向哪个服务商来索取他所要的一个特定文件。也就是说不是用户直接通知我要什么,而是客户必须首先和某个服务商签约而形成一种合同关系。然后才能通过迅雷平台得到相应的服务。



  1. 很好的总结服务商和用户商之间的关系


用户和服务商是通过签约开始服务和被服务关系的,而这个商业关系中隐含了双方关于:




  • 文件下载速率的要求

  • 下载文件质量的要求

  • 文件下载中的安全的要求


服务商的目标




  • 和尽可能多的用户签约并实现服务

  • 仅仅提供文件上载服务,

  • 希望只为与我签约的客户服务,

  • 但又同时希望我的签约客户之间可以实现文件共享,减轻我的服

    务器的压力


用户




  • 尽量快的下载完我要的文件,但不在乎文件的哪个部分由哪个人提供

  • 希望保证下载的文件具有我签约的那个服务商所具有的信誉和可靠性

    保障如没有病毒,没有损坏等等

  • 如果出事可以向签约服务商投



  1. 迅雷选择的策略不是包含了上面全部,而是:


形式上支持签约的合同服务模式




  • 用户可以方便的通过签约方式进入迅雷系统从而开始接受服务

  • 签约服务商一定可以对签约用户实现服务

  • 用户经常会通过迅雷系统得知能够提供相同服务的其他服务商及其连接关系

  • 用户原则上可以通过迅雷的帮助与其他服务商实现非签约的服务

  • 其他服务商一般会通过自己的签约系统阻止这样的非签约服务


以保障用户的下载速度为第一体验




  • 迅雷向签约用户提供某些非签约服务商的信息

  • 迅雷在返回列表时并不刻意区分的签约服务商,甚至并不保障返回列表中的用户的在线状况

  • 迅雷对每个文件记录每个用户的下载日志也就是说迅雷可以支持限定返回用户列表的签约属性


服务商的信誉和用户得到的最终文件质量能够部分得到保障




  • 迅雷是按照签约用户的索取文件组织共享的,因此如果没有特别刻意的攻击的情况下,用户将下载得到的文件,应该原则上是他索取的那个签约服务商所提供文件的忠实副本。



  1. 迅雷的盗链问题需要注意

    目前对其指责的盗链问题,实际上主要是指其



  • 提供自己的搜索工具,并引导用户以不签约的方式得到服务

  • 在签约用户的服务中提供非签约服务商信息,以及

  • 记录用户下载信息并在无预告知的情况下强迫用户作为“seed”上载己下载文件。


三、工作流程分析

启动中的迅雷服务器

客户端最开始接入迅雷平台所采用的主要形式是客户端首先通过DNS对迅雷的固定域名进行查询,直接从得到迅雷服务器的IP地址,然后通过这个地址去和迅雷平台建立最初的联系,联系中会同时使用TCP与UDP协议.

迅雷有多个服务器,不同服务器有域名,也有对应的IP地址,有一个域

名对应多个地址的情况,也有多个域名对应一个地址的情况。不同的服务器有不同的功能,比如有用于存储资源和向用户发放所需资源列表的服务器;有提供广告索引的服务器;有广告内容存放的服务器;有热门图片存放的服务器;有查病毒的服务器。


启动过程中的报文协议



  1. 迅雷每次启动时会查询域名“hub5pn.sandai.net”,目前发现这个域名对应

    的IP地址只有两个60.19.64.60和58.254.39.5。客户端不会与这两个IP地址都进

    行报文交互,只会与DNS查询结果包中位于第一个的进行交互,使用的报文是UDP.

  2. 客户端向迅雷tracker发送一个UDP连接报文,如果有响应,则在启动阶段,不会再发连接报文,否则会以第一次发送的时间为起始,每隔10秒向tracker发送连接报文,3次为一组,每组的间隔时间为2分钟。(论文中有讲到报文的格式)



  • tracker的响应报文中有返回IP地址(称为迅雷nodes)和nodes的端口号,之后客户端就会使用端口号和nodes交互信息

    3. 启动后还会向main server发一个包。主要信息是客户主机的MAC地址,main server不会回复响应包。如果收到tracker的响应包里有关于nodes信息,则客户端会向main server连续发三个包,除了包括本用户的信息,还标识出nodes的信息。

    4. 客户端会每隔10秒使用中的回应请求报文去与某个server交互。这类server我们称其为“keep-alive server”。分析normal state及下载过程时发现,这个规律一直存在

    5.客户端也会和辅助server进行报文交互。报文格式和与tracker交互的比较类似,有时也会返回nodes的信息,然后客户端会和交互信息,但是不会将nodes的信息向server报告。


空闲状态和空闲过程

迅雷客户端在空闲状态并不完全空闲,它主要工作,是向迅雷平台定期汇报

自己的存在。有比较明显的以下四个规律:



  • 每隔10秒使用ICMP报文中的回应请求报文与keep-alive server交互。

  • 每隔45秒与nodes使用UDP报文交互。

  • 每隔2分钟与辅助server使用UDP报文交互。

  • 每隔5分钟向main server发送UDP报文


下载过程


cfg文件

使用迅雷下载一个文件时,在下载过程中会自动生成两个文件,一个文件的后缀为.td,下载完成后的扩展名会自动去掉另一个文件的后缀是td.cfg,这个

文件是下载过程的日志文件,下载完成后也会自动删除。.cfg文件的内容有:



  • 提供下载的站点的,文件存放位置及文件名。

  • 提供下载的peer的mac地址,IP,及端口信息。

    正是由于cfg文件记录了这种信息,我们可以刻意阻止客户端自动删除这些一记录,并利用这些记录中的信息进行许多有意义的推断工作,如在判断IP的类别时,

    使用cfg文件来判断一个IP是否是peer。


迅雷中“资源”的概念

“资源”就是指能够为用户提供下载服务可能存有用户指定文件的其它服务器或peers。因此我们将迅雷平台中专门用于存储资源和向用户发放所需资源列表的服务器称为“资源服务器”。


下载过程分析



  1. 用户A在服务商的服务器A上点击某URL下载一个文件。

  2. 迅雷除了与该服务器建立连接外,还会与迅雷的资源服务器建立TCP连接,并发送http资源搜索报文。由于报文是加密的,所以具体的信息无法解析,但推测一定是关于指定下载文件属性的通报。

  3. 迅雷的资源服务器会在其数据库搜索与用户指定文件匹配的资源记录,并返回资源回应报文,报文的内容也是加密的。猜测资源服务器会根据资源搜索报文的信息查找数据库,如果有这个文件的资源,则会向客户端返回这些资源,如果没有,则将报文的信息作为一条新的资源添加至数据库,为下个用户加速。但是目前还没有找到方法证实猜测。

  4. 客户端在收到返回时,也会向返回的地址发起连接。

  5. 开始下载数据,下载过程会重复步骤2,3,4.

  6. 数据下载完成后,客户端会使用DNS解析域名为“tag.sandai.net”的服务

    器。获得其IP后,与它建立TCP连接,发送报文。报文的内容有用户的MAC地址、文件长度、文件名、所用下载时间、原始URL等等。这个服务器的作用是搜集每次下载的信息,将文件的固有属性与进行对应,为资源服务器的数据库提供更新。


迅雷如何区分文件



  • 迅雷在下载前,靠URL(而不仅是文件名)和文件大小来区分文件。

  • 迅雷在下载完成后,会将文件的某些固有属性(例如大小和MD5)等传回服务器。在服务器端,如果两个文件的固有属性是一样的,则认为它们是同一个文件,与URL无关。



推荐阅读
  • MySQL缓存机制深度解析
    本文详细探讨了MySQL的缓存机制,包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术,读者可以更好地优化数据库性能。 ... [详细]
  • Docker的安全基准
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • 本文介绍了如何在 DB2 环境中创建和删除数据库编目。创建编目是连接新数据库的必要步骤,涉及获取数据库连接信息、使用命令行工具进行配置,并验证连接的有效性。删除编目则用于移除不再需要的数据库连接。 ... [详细]
  • 国内BI工具迎战国际巨头Tableau,稳步崛起
    尽管商业智能(BI)工具在中国的普及程度尚不及国际市场,但近年来,随着本土企业的持续创新和市场推广,国内主流BI工具正逐渐崭露头角。面对国际品牌如Tableau的强大竞争,国内BI工具通过不断优化产品和技术,赢得了越来越多用户的认可。 ... [详细]
  • Windows服务与数据库交互问题解析
    本文探讨了在Windows 10(64位)环境下开发的Windows服务,旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行,但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]
  • 探讨如何通过编程技术实现100个并发连接,解决线程创建顺序问题,并提供高效的并发测试方案。 ... [详细]
  • IT项目管理过程中的方法、工具、技术
    工欲善其事,必先利其器。而对于一个软件开发项目,最重要的器就是方法,工具和技术。而这三要素中重要的又是方法论,方法是基础&# ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 深入理解Cookie与Session会话管理
    本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息,以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制,解释其原理及应用场景。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 如何在PostgreSQL中查看数据表
    本文将指导您使用pgAdmin工具连接到PostgreSQL数据库,并展示如何浏览和查找其中的数据表。通过简单的步骤,您可以轻松访问所需的表结构和数据。 ... [详细]
  • 本文详细分析了Hive在启动过程中遇到的权限拒绝错误,并提供了多种解决方案,包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]
author-avatar
心情爱心_634
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有