作者简介:金顺福(1966-),女,教授,博士生导师.研究方向:通信系统建模理论.E-mail:jsf@ysu.edu.cn
针对P2P网络中节点均追求个人收益的最大化导致系统收益不能达到社会最优的问题,提出向请求节点征收接入费用的方案。依据P2P网络节点的在线机制,建立服务台数随机变化的连续时间排队模型,采用矩阵几何解方法,基于不可观察排队规则进行系统模型的稳态分析,给出节点平均延迟以及节点激活率等指标的表达式。构造收益函数,分析节点在线机制的纳什均衡策略和社会最优策略,通过合理的收费方案,实现P2P网络的社会最优。
In P2P networks, due to the selfish behavior, all the nodes pursue the maximum individual gains, but the system cannot achieve socially optimal gain. To solve this problem, a charging scheme to the requesting nodes is proposed. Based on the online mechanism of the P2P nodes, a continuous time queuing model with random number of services is built. Using the method of a matrix-geometric solution, the system model is analyzed in steady state based on an unobservable queuing rule. The expressions of the average delay and activation ratio are given. By establishing a reward function, the strategies with Nash equilibrium and social optimization are investigated. With a reasonable pricing policy the P2P network is socially optimized.
P2P网络用较低的成本聚合海量资源, 使更多的用户参与到互联网中, 对互联网的迅速成长与普及起到了至关重要的作用[1]。P2P节点是对等的关系, 既可以作为服务节点将自身的资源共享, 被其他节点访问; 也可以作为访问节点, 共享网络中其他节点的资源[2]。P2P节点普遍存在自私行为, 均追求个人利益最大化, 导致出现只请求资源不提供服务的“ 搭便车” 现象, 严重影响了P2P网络的性能和运行[3, 4]。因此, 调节节点的行为对P2P网络的优化十分重要。
近年来, 部分学者基于激励机制[5]研究了P2P网络中的节点在线行为。按照工作方式, 激励机制可以分为虚拟货币激励机制和非货币激励机制。文献[6]提出了一种基于电子票券和全局信誉度的激励机制。根据节点的信誉度, 以有偿服务的方式控制节点的行为, 激励节点更好地提供服务。文献[7]提出了一种以货易货的资源配置机制, 该机制下节点之间是激励相容的, 每个节点只有采取诚实行为提供相应的服务或者资源, 才能获得等值的回报。文献[8]提出了另外一种基于激励机制的优化方法, 即差分服务机制。根据节点提供的不同服务, 系统中的服务器通过衡量节点的贡献值, 对节点给予不同的服务值。还有人将经济学中的博弈论应用于P2P网络的研究中。文献[9]提出了一种基于博弈策略的研究模型, 对系统中的节点进行量化分析, 在随机博弈收益矩阵的基础上, 通过调整相关参数引导节点行为。文献[10]结合博弈论, 提出了一种新型的激励机制(Novel incentive mechanism)。考虑网络中的有用信息和P2P节点对网络性能的影响因素, 利用博弈论定义节点的策略空间, 找出节点的纳什均衡, 以控制节点的自私行为。
综合已有的文献可以看出, 已有的研究均未考虑P2P节点的排队现象。本文结合连续时间随机理论和博弈论, 从不可观察排队的角度出发, 建立节点在线机制的系统模型。进行纳什均衡策略和社会最优策略的研究, 面向节点给出合理的收费方案, 抑制节点的自私行为, 实现网络最优。
在P2P网络中, 节点的上线过程是随机的, 在线时间也是随机的, 因此, 任意时刻在线节点数量为随机变量。依节点在线机制建立服务台数随机变化的连续时间排队模型。
假设系统中提供某一服务的节点数量为N。令nc(t)=i, i∈ {0, 1, 2, …}表示时刻t向网络发出服务请求的节点个数; 令ns(t)=j, j∈ {0, 1, 2, …, N}表示时刻t网络中提供服务的在线节点个数。{nc(t), ns(t)}构成二维随机过程, 其状态空间Ω 为:
假设请求节点的到达过程服从参数为λ c(λ c> 0)的泊松分布, 传输时间服从参数为μ c(μ c> 0)的指数分布; 服务节点的上线过程服从参数为λ s(λ s> 0)的泊松分布, 在线时间服从参数为μ s(μ s> 0)的指数分布。假设任意两个在线节点提供的传输服务相互独立。综合上述假设条件, {nc(t), ns(t)}为Markov过程。
针对特定服务, 当系统中请求节点的个数为i(i≥ 0)时, 称系统处于i水平。在相同水平下, 考虑系统中在线节点个数j(0≤ j≤ N)的状态变化。当系统中在线节点个数为j时, 下一时刻可能由于节点离线, 在线节点个数减少一个; 也可能既没有节点上线也没有节点离线, 在线节点个数保持不变; 还可能由于新节点上线, 在线节点个数增加一个。
综合以上的分析结果, 构造系统在同一水平下的状态转移率矩阵T如下:
令Ai为系统水平保持不变的转移率矩阵, 则:
令Bi为系统水平由i到i-1的转移率矩阵, 则:
当i≥ N时, 矩阵Ai和Bi均保持不变。矩阵Ai, i≥ N用A表示, 矩阵Bi, i≥ N用B表示。
令C为系统水平由i到i+1的转移率矩阵, 则:
C=diag
矩阵Ai、A、Bi、B、C均为N+1阶方阵。令Q为二维连续时间Markov链
定义二维Markov链
根据转移率矩阵Q的分块结构特点, 将稳态分布向量写成分块形式, 表示如下:
π =
由转移率矩阵结构可知, 二维Markov过程
R是方程R2B+RA+C=0的最小非负解, 并且R的谱半径小于1。基于方程R=-
请求节点的平均延迟W(λ c)表示请求服务的节点在系统中的平均逗留时间。在线节点的数量代表着P2P网络的服务质量。在线节点数目越多, 系统的服务质量越高, 请求节点的平均延迟越短。反之, 在线节点越少, 系统的服务质量越低, 请求节点的平均延迟越长。稳态下, P2P网络的平均队长E
利用Little公式, 请求节点的平均延迟W(λ c)可以表示为关于λ c的函数:
节点激活率β 定义为稳态下P2P网络中某节点处于在线状态的概率。节点激活率体现了在线节点的积极性。在线节点的积极性越高, 节点激活率越大。反之, 在线节点的积极性越低, 节点激活率越小。在线节点状态独立于请求节点状态。节点激活率β 表示为:
在实际的P2P网络中, 请求节点加入队列之前可能并不知道队列的内部信息, 比如系统已有的请求节点个数或在线节点个数。本文基于不可观察排队模型[11, 12, 13]研究P2P网络请求节点的纳什均衡到达率、社会最优到达率及收费策略。
根据节点在线机制对服务台数随机变化的连续时间排队模型做以下假设:
(1)请求节点在决定是否进入系统时, 不能观察到缓存中的队列长度, 且一旦进入系统之后不允许中途离开。
(2)一个请求节点完成传输对应的回报为R。
(3)请求节点加入队列后, 延迟单位时间所产生的成本为fW1。节点在线单位时间所产生的费用为fW2。
(4)所有单个节点的净收益函数是相同的, 并且是可加的。
基于上述假设, 定义单个节点的平均净收益为:
P2P网络中, 大部分节点都希望从网络中获取数据或者服务, 同时, 又不希望贡献自身的资源。但是, 请求节点越多, 节点在系统中平均延迟越长, 其净收益就越小。显然, 个人收益函数Ui是单调减函数。根据式(7)可知, 净收益Ui的值为0的点为纳什均衡点, 此时的到达率是纳什均衡到达率λ e, 则:
针对社会最优策略的分析, 要考虑每个时刻系统中节点的平均净收益。不考虑系统对节点征收的接入费用, 则社会平均净收益Us表示为:
社会最优的目标是最大化系统中所有节点的总收益, 因此, 社会收益最大时的到达率是社会最优请求到达率。令λ * 表示社会最优策略下请求节点的到达率, 则:
因为平均延迟W
W
比较式(8)与式(11), 可得W
为了实现P2P网络的社会最优, 抑制节点的自私行为, 适当降低请求节点的到达率, 对请求节点征收合理的接入费用p, 并重新定义单个节点的平均净收益如下:
令Ui=0, 可得纳什均衡策略下的接入费用
社会最优的目的是为了最大化系统中全部节点的总收益, 而单位时间内社会平均净收益Us表示为:
由式(14)可知, 系统对请求节点征收接入费用并不影响社会平均净收益。实际上, 从社会角度来看, 征收的接入费用只是在P2P节点之间转移了部分收益, 并不影响总体的收益, 即社会最优到达率不变。但是, 征收接入费用后个人收益降低, 也就是说纳什均衡到达率变小, 当p=R-fW1W
针对不同的传输回报R, 逗留成本fW1, 激活费用fW2, 系统服务节点个数N, 请求节点传输率μ c, 服务节点到达率λ s与离去率μ s, 进行纳什均衡策略、社会最优策略及收费策略的仿真验证。
由式(7)可知, 当R-fW1W
以N=4, μ c=0.40, λ s=0.006, μ s=0.0010为例, 针对不同的传输回报R, 逗留成本fW1及激活费用fW2, 社会平均净收益Us随请求节点到达率λ c的变化趋势如图1所示。
由图1可以看出, 对于一定的请求节点到达率λ c, 逗留成本fW1及激活费用fW2, 随着回报R的增大, 请求节点因完成传输得到的回报增大, 单个请求节点的净收益随之增加, 社会平均净收益提升。随着逗留成本或激活费用的提高, 发出服务请求的节点因在系统中逗留产生的成本, 或者P2P节点由于提供服务引起的费用增加, 导致单个节点的平均净收益减少, 社会平均净收益降低。
以R=5.0, fW1=1.0, fW2=2.0, λ s=0.006, μ s=0.0010为例, 针对不同的服务节点个数N和请求节点传输率μ c, 社会平均净收益Us随请求节点到达率λ c的变化趋势如图2所示。
由图2可以看出, 对于一定的请求节点到达率λ c和传输率μ c, 服务节点个数N越大, 系统中在线节点个数越多, 请求节点因逗留而产生的成本越小, 因此, 社会平均净收益呈上升趋势。当请求节点到达率λ c和服务节点个数N固定时, 因为请求节点传输率的增大, 系统中其他请求节点在缓存中消耗的时间减少, 成本降低, 社会平均净收益增加。
以R=5.0, fW1=1.0, fW2=2.0, N=5, μ c=0.45为例, 针对不同的服务节点到达率λ s和离去率μ s, 社会平均净收益Us随请求节点到达率λ c的变化趋势如图3所示。
由图3可以看出, 当在线节点离去率μ s和请求节点到达率λ c不变时, 社会平均净收益Us随着在线节点到达率λ s的增大而增大。这是因为在线节点到达率的增加会引起系统中在线节点个数的增多, 系统的服务质量提高, 请求节点在系统中逗留时间因此减少, 社会平均净收益随之增加。在线节点到达率λ s和请求节点到达率λ c不变的情况下, 社会平均净收益Us随着在线节点离去率μ s的减小而增加。这是因为在线节点离去率越小, 稳态下网络中的在线节点个数越多, P2P网络的传输能力越强, 请求节点在系统中将延迟更少的时间, 逗留成本下降, 社会平均净收益提升。
由图1~图3还可以看出, 在其他参数保持不变的情况下, 随着请求节点到达率λ c的增加, 社会平均净收益Us曲线呈现先上升后下降的趋势。当请求节点到达率的整体水平较低时, 随着请求节点到达率的增加, 能从网络中获得回报的节点数增多, 社会平均净收益呈上升趋势。当请求节点到达率的整体水平较高时, 随着请求节点的增多, 节点的平均逗留时间增加, 逗留成本增加, 社会平均净收益呈下降趋势。综合这两种趋势可知, 社会平均净收益存在一个最大值。
不同系统参数下的社会最优请求到达率的数值结果如表2所示。
根据P2P节点的在线机制建立了服务台数随机变化的连续时间排队模型, 给出了节点平均延迟和节点激活率的表达式。通过收益函数, 揭示了纳什均衡请求到达率大于社会最优请求到达率, 并面向请求节点制定了收费方案。实验结果表明, 本文给出的收费方案可以有效调整请求节点的到达方式, 实现P2P网络的社会最优。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|