1 P2P技术概述
对等网络(P2P,Peer to Peer)是一种资源(计算、存储、通信与信息等)分布利用与共享的网络体系架构,与目前网络中占据主导地位的客户机服务器(Client/Server,C/S)体系架构相对应。P2P可以用来进行流媒体通信(如话音、视频或即时消息),也可以传送如控制信令、管理信息和其它数据文件,具体的应用如Napster MP3音乐文件搜索与共享、BitTorrent多点文件下载和Skype VoIP话音通信等。开始的互联网基本的协议TCP/IP,它解决的是异机种计算机互联,所有设备的通信(Email、Ftp、bbs)都是对等的,它们是上下左右各向同性的。基于Web应用,使C/S结构获得巨大成功,人们通过Client上的浏览器来操作或访问远处的网站上的Server,用户所处理的数据与应用处理软件都存放在Server上。随着互联网应用的进一步普及,集中计算与存储及其C/S网络架构在功能上的缺陷正逐渐暴露出来。集中计算与存储的架构使每一个中央Server支持的网站成为一个个的数字孤岛。Client上的浏览器很容易从一个孤岛轻易跳到另一个孤岛,但是很难在客户端对它们之间的数据进行整合。网络的能力和资源(存储资源、计算资源、通信资源、信息资源和专家资源)全部集中在中央Server。在这种体系架构下,各个中央Server之间也难以按照用户的要求进行透明的通信和能力的集成,它们成为网络开放和能力扩展的瓶颈。与C/S网络架构相反,P2P的网络架构在进行媒体通信时不存在中心节点,节点之间(Peer)是对等的,即每一个节点可以进行对等的通信,各节点同时具有媒体内容(Content)的接收、存储、发送和集成及其对媒体元数据(Metadata)的搜索和被搜索功能等。这种网络架构所带来的优点是P2P网络各节点的能力和资源可以共享,理论上来说网络的能力和资源是P2P各节的总和。内容不再集中在网络的中央Server,而是分布在靠近用户的网络边缘的各P2P节点上。P2P技术的应用使得业务系统从集中向分布的演化,特别是服务器的发布化,克服了业务节点集中造成的瓶颈,大大降低系统的建设和使用成本、提高网络及系统设备的利用率。
2 P2P技术体系结构与分类
P2P技术存在三种结构模式的体系结构,即以Napster为代表的集中目录式结构、以Gnutella为代表的纯P2P网络结构和混合式P2P网络结构。从P2P技术的分代来说,到目前为止的P2P技术可分为四代:第一代P2P(中央控制网络体系结构),第二代P2P(分散分布网络体系结构),第三代P2P(混合网络体系结构),第四代P2P(目前发展中P2P技术)。
2.1 第一代P2P(中央控制网络体系结构——集中目录式结构)
集中目录式结构采用中央服务器管理P2P各节点,P2P节点向中央目录服务器注册关于自身的信息(名称、地址、资源和元数据),但所有内容存贮在各个节点中而非并服务器上,查询节点根据目录服务器中信息的查询以及网络流量和延迟等信息来选择与定位其它对等点并直接建立连接,而不必经过中央目录服务器进行。集中目录式结构的优点是提高了网络的可管理性,使得对共享资源的查找和更新非常方便;缺点是网络的稳定性(服务器失效则该服务器下的对等节点全部失效)。
2.2 第二代P2P(分散分布网络体系结构——纯P2P网络结构)
纯P2P网络结构也被称作广播式的P2P模型,它没有集中的中央目录服务器,每个用户随机接入网络,并与自己相邻的一组邻居节点通过端到端连接构成一个逻辑覆盖的网络。对等节点之间的内容查询和内容共享都是直接通过相邻节点广播接力传递,同时每个节点还会记录搜索轨迹,以防止搜索环路的产生。纯P2P网络结构解决了网络结构中心化的问题,扩展性和容错性较好。由于没有一个对等节点知道整个网络的结构,网络中的搜索算法以泛洪的方式进行,控制信息的泛滥消耗了大量带宽并很快造成网络拥塞甚至网络的不稳定,从而导致整个网络的可用性较差,另外这类系统更容易受到垃圾信息,甚至是病毒的恶意攻击。
2.3 第三代P2P(混合网络体系结构——混合式网络结构)
混合式网络结构综合了纯P2P去中心化和集中式P2P快速查找的优势。按节点能力不同(计算能力、内存大小、连接带宽、网络滞留时间等)区分为普通节点和搜索节点两类。搜索节点与其临近的若干普通节点之间构成一个自治的簇,簇内采用基于集中目录式的P2P模式,而整个P2P网络中各个不同的簇之间再通过纯P2P的模式将搜索节点相连起来。可以在各个搜索节点之间再次选取性能最优的节点,或者另外引入一新的性能最优的节点作为索引节点来保存整个网络中可以利用的搜索节点信息,并且负责维护整个网络的结构。由于普通节点的文件搜索先在本地所属的簇内进行,只有查询结果不充分的时候,再通过搜索节点之间进行有限的泛洪。这样就极为有效地消除纯P2P结构中使用泛洪算法带来的网络拥塞、搜索迟缓等不利影响。同时,由于每个簇中的搜索节点监控着所有普通节点的行为,能确保一些恶意的攻击行为能在网络局部得到控制,在一定程度上提高整个网络的负载平衡。
2.4 第四代P2P(发展中的P2P技术)
应该说第四代P2P并没有形成真正的代,而是在原有技术的基础上作了改进,提出和应用了一些新技术措施。典型的有:
(1)动态口选择之一。目前的P2P应用一般使用固定的端口,但是一些公司已经开始引入协议可以动态选择传输口,一般说口的数目在1024~4000之间。甚至P2P流可以用原来用于HTTP(SMTP)的口80(25)来传输以便隐藏。这将使得识别跨运营商网络的P2P流,掌握其流量变得更困难。
(2)双向下载。eD和BT等公司进一步发展引入双向流下载。该项技术可以多路并行下载和上载一个文件和/或多路并行下载一个文件的一部分。而目前传统的体系结构要求目标在完全下载后才能开始上载。这将大大加快文件分发速度。
(3)智能结点弹性重叠网络。智能结点弹性重叠网络是系统应用P2P技术来调度已有的IP承载网资源的新技术,在路由器网络层上设置智能结点用各种链路对等连接,构成网络应用层的弹性重叠网。可以在保持互联网分布自治体系结构前提下、改善网络的安全性、QoS和管理性。智能结点可以在路由器之间交换数据,能够对数据分类(分辩病毒、垃圾邮件)保证安全。通过多个几何上分布的结点观察互联网,共享信息可以了解互联网蠕虫感染范围和性质。提供高性能、可扩张、位置无关消息选路,以确定最近的本地资源位置。改进内容分发。使用智能结点探测互联网路径踪迹并且送回关于踪迹的数据;解决目前互联网跨自治区路径选择方面存在的问题。实现QoS选路,减少丢包和时延,快速自动恢复等。
3 宽带音视频业务中的P2P应用
在未来的宽带业务中,特别是音视频业务中,P2P技术可望有广泛的应用。目前,宽带音视频业务发展不起来的一个很重要的原因是业务网系统的价格太高,无论是视频点播业务系统、视频会议系统、远程教学系统等,建设系统的价格都非常高昂。由于系统的建设成本绝大部分是要转嫁到用户身上,用户消费不起导致业务无法开拓,因此大大降低业务系统的建设成本极为关键,P2P技术的合理应用有可能是建设投资下降一个数量级,从而有可能极大的推进宽带业务的商业化进程。
采用P2P技术可以设计一个运营商级的音视频业务系统。下面是一个实例,它采用集中目录式结构或者混合式网络结构,各P2P业务节点由具有高可靠性的营运级的服务器组成,其网络的拓扑结构对运营商来说都是事先可知的,并且可以根据用户、内容和业务流量的分布情况,对网络的拓扑结构进行规划和优化。音视频业务平台是不包含用户(或者内容提供商)客户机的基于专网的P2P体系架构,最终用户终端可能是处理能力相对较弱的机顶盒(不再是处理能力强大的PC机)。对于音视频业务,如果让用户终端直接作为P2P的业务节点,则会导致可管理性、服务质量和安全性方面的问题。用户终端相当于这个P2P网络的客户机(Client),而这个P2P网络便相当于一个大Server,满足可管理、服务质量和安全性的要求。该系统由三个基本的业务模块组成:业务会聚业务模块、内容分发业务模块和流媒体播放业务模块。
3.1 基于P2P的业务会聚模块
未来将要形成的音视频产业链包括内容提供商(CP)、运营商与用户。基于P2P的音视频业务平台由运营商(包括内容运营商与网络运营商)来承建、营运和管理。内容提供商的终端(PC机等)作为这个P2P网络的客户机,必须向这个业务平台提供节目内容。所提供的内容首先经过运营商的内容认证,所有经过认证的节目内容必须会聚到位于P2P网络内的中心业务节点,以便进行相关的内容处理,包括:内容提供商与运营商之间的版权许可、内容的编码转换、内容加密、内容切片和内容分发等工作。我们将由内容提供商向P2P网络的中心业务节点传送节目内容的这一过程称为业务会聚。业务会聚可能产生许多的应用,包括:关连广告和驻地广告的制作,虚拟家庭存储环境,网络游戏,基于音视频的内容提供等。图1表示了用P2P实现业务会聚的方式。

图1 基于P2P的业务会聚
3.2 基于P2P的内容分发模块
为了降低核心网的传送压力,需要将音视频节目内容的切片由中心业务节点分发到靠近用户的边缘业务节点内,这一过程被成为内容分发。内容分发可由传统的基于C/S的内容分发网(CDN,Content Distribution Network)来实现,它主要是服务于基于互联网的低码率的PC流媒体业务。对于音视频内容,可以采用基于P2P的内容分发。内容分发分为两种形式,一种是推送形式(Push),另一种是下拉形式(Pull)。基于推送形式的内容分发也称为预分发,它是非实时的,是在用户点播节目之前,预先将节目分发至边缘业务节点。基于下拉形式的内容分发是实时的,它是在用户点播节目的时候,边缘业务节点没有存储该节目内容的切片,需要由中心业务节点(或者其它边缘节点)提供内容,内容到达该边缘节点之后,一边存储,一边被边缘业务节点以流媒体的形式播放到用户的流媒体接收终端。对于不同的节目内容,我们往往会采用不同的内容分发策略。例如,针对VOD的视频点播节目,我们可以将10%所有节目的100%切片预分发到所有边缘业务节点,30%所有节目的50%的切片预分发到所有边缘业务节点,60%的所有节目的第一切片预分发到所有边缘业务节点,其余的切片存储在中心业务节点,它们在用户点播时可以通过的业务节点之间进行实时分发(或者内容交换)。对于驻地广告,我们只需要将相关的节目内容预分发到与驻地区域相关的边缘业务节点。对于个性化定制的音视频信息,我们同样将相关的节目内容预分发到最靠近用户的边缘业务节点,如果用户漫游到异地,我们可以将其定制的信息预分发到其漫游地的边缘节点。图2表示了用P2P实现内容分发的方式。传统的基于C/S内容分发(CDN)基本上都采用基于文件的分发机制和存储机制,在任何地方都是存储完整的视频文件。因为边缘节点的存储空间远远小于中心节点的存储空间,按照20/80原则,边缘节点的存储空间往往是中心节点的20%,所以边缘节点往往只能存储20%的热点内容,如果用户访问另外80%的冷门内容,系统或者让用户等待、先下载后服务、或者将用户访问请求重定向到中心节点的流媒体服务器提供媒体播放服务。对于第一种情况,因为基于文件的分发机制必须等到整个文件拷贝完成后才能进行服务,无法边分发边服务,这将引起用户点播响应速度的显著下降,用户需要等待几十秒甚至几分钟。对于第二种情况,它将导致骨干网络和中心节点的流媒体服务器流量的剧增,将导致服务质量的迅速下降,尤其是在大用户量的情况下,如果20%的用户都被重定向到中心节点服务,可能造成网络与系统的瘫痪。传统的CDN系统无法提供时移电视功能,因为传统的CDN是以文件的方式来存储音视频节目的,传统CDN难将一个24h不断播放的电视节目以文件的方式进行存储,因此它难以做到将实时节目的分发发到边缘节点,也就无法进行快退、快进等操作。

图2 基于P2P的内容分发
3.3 基于P2P的流媒体播放模块
流媒体播放业务就是通过靠近用户的边缘业务节点向用户提供流媒体服务的过程。流媒体播放业务也分为两者形式,一个是推送形式(Push),另一个是下拉形式(Pull)。推送式的流媒体播放业务可能是用户定制的个性化的音视频节目,也可能是驻地广告以推送的方式在用户开机时推送给用户的。下拉式流媒体播放则是用户根据电子节目单点播而进行的流媒体播放,它包括视频点播(VOD)、实时电视和包含有暂停、快进与快退功能的时移电视(Time Shift TV)等。流媒体业务可由传统的基于C/S的流媒体服务器来完成,但是由于内容的集中式处理,可能在服务器产生业务瓶颈。对于基于C/S的流媒体服务器,当用户点播一部影片时,他首先通过一系列的负载均衡(GSLB或者SLB)被导向到一个存储这部影片的流媒体服务器,并由其惟一地提供媒体播放服务,如果这部影片是热片,那么这个位于网络边缘的流媒体服务器会产生拥塞。用基于P2P的流媒体播放方式是必须的。图3表示了用P2P实现流媒体播放的方式。边缘业务节点由许多处于对等地位的流媒体服务器组成,为了满足P2P分布式处理的特点,一个音视频节目内容的切片为被分布存储在边缘业务节点的各个流媒体服务器内,用户点播节目时,分布在不同流媒体服务器内的内容切片通过计算与处理产生音视频流媒体,因此若用户点中一部节目,多个流媒体服务器同时在工作,当点播请求增加时,整个边缘业务节点内部的不同流媒体服务器的负载均匀增长,降低系统拥塞的风险。

图3 基于P2P的流媒体播放
4 P2P技术的利与弊
P2P是当前互联网上的热点技术之一。围绕IP音频和视频文件共享和播放应用,P2P技术获得快速发展,目前P2P应用占宽带流量50%~60%(白天)到90%(晚上)和企业带宽流量的40%。P2P已经成为宽带的主要的流量消耗者和重要的业务支持技术。
P2P是20世纪70年代提出的技术,并非最近发明的新技术。在长达30~40年内,P2P技术并没有获得广泛的使用,近年来却获得爆炸性的应用和急速的发展。究其原因来说,是互联网技术(IP承载网)发展无法满足互联网上业务快速发展的要求,互联网的“尽力而为”的传输特性和网络资源的不可知、不可控和不可管,使得网络资源不能获得充分的使用,特别是本地的网络资源不能得到充分的利用,再加上P2P业务的提供者在其网络资源的消耗是不需要付出代价的,“免费午餐”谁都想吃,并希望尽力多吃。另外,微电子技术的发展,使得端设备的能力(处理能力和存储能力)大为增强,系统设备分布化已是大势所趋,从引发了P2P应用的快速发展。
P2P技术的本质是化集中处理和存储为分布处理和存储,将闲散的资源集中起来使用,因此它是一种很有创意的技术,用好了它可以大大促进产业的发展,特别是可以大大降低系统的建设和使用成本和提高网络及系统设备的利用率,有着十分广阔的使用前景。但是同时必须注意到,P2P技术也是一种“杀伤力”很强的技术,它是以资源的大量消耗、甚至以用户设备的安全性为代价来提高业务的服务质量,用得不好可能会危及用户的安全,也可能导致产业链断裂,阻碍了产业的发展。P2P技术的应用是要非常认真的加以考虑的事。因而如何来使用P2P技术,站在什么立场上来使用这种技术,结果是有很大的不同。“兴利除弊”是引导产业发展的一条重要的原则,因此在P2P的应用上,要从信息服务业的完整产业链出发来考虑P2P技术,而不是图一时之利来使用P2P技术,从信息服务业的完整产业链出发来考虑使用P2P技术,则是可以持续发展的,如果只是图一时之利来使用P2P技术,很难会有持续发展的可能,因而在P2P技术的使用上是要作充分考虑。
对待P2P技术及其应用的态度与其在可能获得的收益和其在价值链中角色密切相关。一般来说,互联网界的业务系统开拓者对P2P技术是欢迎,互联网的业务提供商欢迎的原因很简单,因为目前互联网的业务网都是“寄生网”,业务网与承载网是完全分离的,业务网的运营成本与其消耗承载网资源完全无关,使用P2P技术以大量消耗不需要付出任何代价承载网资源,用消耗承载网的资源来换取业务提供者所提供业务的服务质量的提高来吸引用户使用,是业务提供者很自然的选择。从本质上来说,P2P技术与互联网的设计理念是向背的,它违背了互联网的基本原则(自率性和公平性原则),P2P技术的大规模应用是“尽力而为”网络能力和包月收费的商业模型逼出来。建立在P2P技术上的弹性重叠网,是承载网的重叠网,它可以对承载网的资源进行二次调度,以充分利用已有承载网的闲置或轻载资源,是对“尽力而为”网络的适配,充分利用目前可能提供的“尽力而为”网络的能力,以求能得到更好的服务质量。但是必须引起注意的是,建立在P2P技术上的弹性重叠网,它可以有效于一时,即在承载网资源尚没有完全耗尽,它可以对承载网的资源进行二次调度,以充分利用已有承载网的闲置或轻载资源,在这种场合它是有效的。但它不可能有效于长期,即当承载网的所有资源完全耗尽后,建立在P2P技术上的弹性重叠网将会完全失去作用,这一点特别要引起目前热衷于P2P弹性重叠网专家们的高度关注。
目前的电信运营商,一般都是主流IP承载网的运营商,他们不会欢迎目前的这种P2P的使用方式,目前这种P2P技术的引入的确也给他们带来很多烦恼。原因也很简单,使用P2P技术开发业务的业务提供商,是以大量消耗承载网的资源来换取其业务质量的提高,承载网资源的大量消耗不能使承载网的经营者特别是主流IP承载网的运营商得到合理的回报,自然承载网的经营者不会欢迎。但是电信网的经营者所经营的IP宽带网处于“有网没有业务”的尴尬处境,电信运营商没有宽带业务,不依靠互联网的宽带业务就无法发展它的宽带用户,因此不论互联网提供什么业务、用什么技术提供业务,只要是宽带业务它就必须接受,没有选择的余地。在P2P技术没有引入之前,产业链处于良性状态,产业链中的两个最重要的角色,宽带IP网运营商和宽带业务运营商处于“和平共处”两厢平安的状态,P2P技术的使用和引入,使得产业链由良性状态向非良性状态转变,产业链上的这两个角色也由“和平共处”两厢平安向利益冲突日益加剧转变,尽管目前从表面上看电信运营商是无可奈何,但这种状态是不可能维持的,也不会长期维持,巨大的变革正在酝酿之中。目前一些治标的措施已经出台,如:识别和控制P2P流,在IP宽带网中采取限流的措施,提出宽带用户按流量计费(包括采用计费套餐,对用户的上行流量计费等)。这些手段会有一定的作用但很有限,由于有一些措施是放不到桌面上来的,搞得不好运营商还会给自己带来很多麻烦。治标是不可取的,必须考虑要有治本的方法。从本质上说,这与目前采用的商业模型直接相关,不改变目前的这种商业模型,这个问题很难解决。业务网以寄生网的形态存在是不正常的,也不是方向,承载网资源无端被消耗,而得不到合理得回报,从商业上来讲绝对是不合理的,也是无法持续发展的。业务网不掌控必要的传输资源,就无法向用户做业务的质量保证和承诺,业务同样也不可能持续发展,“小打小闹”行,建设大规模业务网就不可能。业务网不以寄生网的形态存在,是根本的解决手段。这需要技术支持,目前技术严重缺位,这是运营商面临的重大挑战,当然巨大的机遇也摆在面前。
P2P是一项技术,用好了可以促进发展,如在IPTV的内容分发系统中使用将会大大降低系统的设备费用,有利于大规模发展音视频业务。用的不好将会加速互联网上的业务网从良性寄生向恶性寄生发展的趋势,并引发大量安全问题,必须引起各界的高度关注;
5 互联网与P2P技术
随着互联网的高速发展,互联网的用户群体发生了巨大的改变,互联网的外部环境发生巨大的变化,社会对互联网的期望越来越高,对互联网的依赖度也越来越高,互联网正在成为事实上的信息基础设施的网络主体部分。目前对互联网产生的作用和互联网产生的积极意义已经有足够得认识。对其消极面并没有足够的认识,特别是对于互联网技术上存在的严重问题,而导致的互联网安全问题、对社会和消费者影响问题和互联网的可持续发展问题还没有足够的认识。
安全问题是互联网存在的最大的问题,随着互联网应用的迅速发展,社会对互联网的依赖度越来越高,互联网正在成为事实上的信息基础设施的网络主体部分。互联网的应用,特别是Web2.0和Web3.0的应用和P2P技术的“非理性”使用,不良信息的生成、传播和扩散速度大大加快,能力大大加强。Web2.0和Web3.0的应用,使得原来需要一个网站能进行的工作,现在几个人就能完成了,P2P技术的“非理性”使用,使原来需要大型设备增加、传输渠道速度加快;网络的恶意攻击、网络欺诈等网络犯罪增多,增加了社会的不稳定因素。
互联网是以“用户自律”为基准来设计的网络,它假定互联网的用户都是‘谦谦君子’在对网络资源的使用上都是“自我约束、相互谦让”的,互联网上的一个著名的协议“TCP协议”就是一个以用户自律为基础的通信协议,在相当长的一段时间内互联网的用户是严格遵守自律原则的,互联网据此保持稳定的运营。随着互联网业务的不断开拓,应用的迅速发展,“用户自律原则”已遭到彻底的破坏,掠夺性的资源消费在不断增长,特别是P2P技术的广泛应用,用户为了改善和提高自身的用户体验,无节制地掠夺和把控网络的资源,“用户自律”原则在新一代的互联网用户中已经不复存在,但是互联网技术并没有获得根本的改进。互联网网络的运营者(IP网的运营者)和互联网上业务的运营者原本和谐、共存的关系发生了改变,两者之间的冲突在增加。业务网有从良性寄生向恶性寄生发展的趋势,其结果有可能会使通信信息产业链严重扭曲甚至断裂,对整个产业产生严重的影响。世界各国对此都高度关注,并已经投入大力量进行研究。
6 结束语
P2P是一种新技术,是一种很有创意的技术,关键在于如何使用它和站在什么立场上来使用这种技术。一种好的技术,用好了它可以大大促进产业的发展,用不好可能会使产业链断裂,阻碍了产业的发展。因而如何来使用P2P技术,结果是有很大不同的。目前对P2P技术的说法很多,要认真思考,不要“人云亦云”,只有这样才可能对一种新技术有深刻的理解,才可能让新技术的优势发挥到极致。
作者:蒋林涛 来源:泰尔网