[go: up one dir, main page]

CN111212438A - 一种无线携能通信技术的资源分配方法 - Google Patents

一种无线携能通信技术的资源分配方法 Download PDF

Info

Publication number
CN111212438A
CN111212438A CN202010113438.6A CN202010113438A CN111212438A CN 111212438 A CN111212438 A CN 111212438A CN 202010113438 A CN202010113438 A CN 202010113438A CN 111212438 A CN111212438 A CN 111212438A
Authority
CN
China
Prior art keywords
user
resource allocation
decision process
markov decision
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010113438.6A
Other languages
English (en)
Other versions
CN111212438B (zh
Inventor
李立欣
马慧
王大伟
李旭
程岳
杨富程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202010113438.6A priority Critical patent/CN111212438B/zh
Publication of CN111212438A publication Critical patent/CN111212438A/zh
Application granted granted Critical
Publication of CN111212438B publication Critical patent/CN111212438B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. Transmission Power Control [TPC] or power classes
    • H04W52/04Transmission power control [TPC]
    • H04W52/06TPC algorithms
    • H04W52/14Separate analysis of uplink or downlink
    • H04W52/143Downlink power control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. Transmission Power Control [TPC] or power classes
    • H04W52/04Transmission power control [TPC]
    • H04W52/18TPC being performed according to specific parameters
    • H04W52/24TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
    • H04W52/241TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account channel quality metrics, e.g. SIR, SNR, CIR or Eb/lo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. Transmission Power Control [TPC] or power classes
    • H04W52/04Transmission power control [TPC]
    • H04W52/18TPC being performed according to specific parameters
    • H04W52/26TPC being performed according to specific parameters using transmission rate or quality of service QoS [Quality of Service]
    • H04W52/265TPC being performed according to specific parameters using transmission rate or quality of service QoS [Quality of Service] taking into account the quality of service QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. Transmission Power Control [TPC] or power classes
    • H04W52/04Transmission power control [TPC]
    • H04W52/18TPC being performed according to specific parameters
    • H04W52/26TPC being performed according to specific parameters using transmission rate or quality of service QoS [Quality of Service]
    • H04W52/267TPC being performed according to specific parameters using transmission rate or quality of service QoS [Quality of Service] taking into account the information rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. Transmission Power Control [TPC] or power classes
    • H04W52/04Transmission power control [TPC]
    • H04W52/30Transmission power control [TPC] using constraints in the total amount of available transmission power
    • H04W52/34TPC management, i.e. sharing limited amount of power among users or channels or data types, e.g. cell loading

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种面向模式划分多址接入技术的无线携能下行链路通信场景的资源分配方法,通过提出了基于约束马尔可夫过程的Q学习算法,解决了在保证所有用户服务质量的前提下最小化发射端的传输总功率的问题,其中所提到的用户服务质量包括用户接收到的最小能量要求和最小数据速率要求。经验证,所提出的资源分配策略可以明显降低发射端的传输总功率。

Description

一种无线携能通信技术的资源分配方法
【技术领域】
本发明属于无线携能通信领域,具体涉及到一种面向模式划分多址接入技术的无线携能下行链路通信场景中的资源分配方法。
【背景技术】
无线携能通信技术是一种新型的无线通信类型,其将无线电能传输与无线信号传输结合,在实现信息可靠交互的同时,来传输能量。随着无线携能通信技术的快速发展,传统供电方式的很多弊端:电线容易老化、很难做到及时更换电池等被解决。但是,解决无线携能通信技术中的节能和频谱利用率问题在目前仍具有挑战性。
此外,非正交多址接入技术是非常有前景的5G技术,可以满足下一代移动通信系统低功耗、高吞吐量、低时延和广覆盖的需求。并且非正交多址接入技术中的高频谱效率和高接入量等优点,恰好符合了5G时代的爆炸性的数据增长和接入需求。另外,非正交多址接入技术中的模式划分多址接入技术可充分利用多维域处理,具有编码灵活性高、适用范围广、复杂度低等优点。并且,模式划分多址接入技术在无线携能通信技术中的应用可以有效提高频谱资源利用率和能量效率。此处所提的用户服务质量包含接收端用户的最小接收能量需求和最小数据速率需求。因此,有必要寻找一种有效的工具来应对严峻的挑战。
近年来,如何在无线携能通信系统中设计合理有效的资源分配方法被越来越多的讨论。有人提出了一种基于无线携能通信的资源分配方法,具体方法是通过拉格朗日对偶法迭代计算子载波传输集合及子载波传输功率来作为最优传输功率,该方法的优势是具有通用性且用户服务质量最优,但是劣势是无法使发射端的功耗最小。传统方法在求解面向模式划分多址接入技术的无线携能下行链路通信场景中的发射端传输总功率最小化问题时,具有高计算复杂度和许多约束。尤其是当接收端有多个用户时,每个用户的服务质量都要被满足。
【发明内容】
本发明的目的是提供一种面向模式划分多址接入技术的无线携能下行链路通信场景中的资源分配方法,以解决在满足接收端用户的服务质量的同时,保证发射端传输总功率最小仍具有很大的计算复杂度的问题。
本发明采用的技术方案是,一种面向模式划分多址接入技术的无线携能下行链路通信场景中的资源分配方法,按照以下步骤实施:
步骤一、约束马尔可夫决策过程的制定:
将面向模式划分多址接入技术的无线携能通信场景中的资源分配问题描述为约束马尔可夫决策过程,使用拉格朗日对偶方法将其转化为无约束马尔可夫决策过程;
步骤二、使用强化学习的方法求解步骤一中的无约束马尔可夫决策过程,最终得到最优的资源分配策略;该策略的目标是在满足接收端每个用户的服务质量的前提下最小化发射端的传输总功率。
进一步的,将所述无线携能下行链路通信场景构建为系统模型,所述的系统模型具体为:
一个基站通过K个子载波对特定区域内的T个用户进行数据和能量的无线传输,其中发射端采用叠加编码,接收端采用串行干扰消除技术,且发射端的基站和接收端的用户均匹配单个天线;用户随机分布在以基站为中心,半径为r的圆内。
进一步的,步骤一具体为:
1)根据所述系统模型,定义系统的状态空间和动作空间:
所述系统的状态空间具体如下:
s=(SINRk,t,k=0,1,...K,t=0,1,...T)∈S=SINR (1),
其中,SINRk,t是第k个子载波加载到第t个用户时的信干噪比,状态集合SINR是属于信干噪比的有限集;
所述系统的动作空间具体如下:
Figure BDA0002390761150000031
其中,
Figure BDA0002390761150000032
是T个用户分配给信息解码的传输时间比率组成的向量,PPDMA是功率分配矩阵,GPDMA是子载波映射矩阵,
Figure BDA0002390761150000033
GPDMA∈G,PPDMA∈P表示上述向量和矩阵分别属于分配给信息解码的传输时间比率、子载波映射和功率分配的有限集;
2)约束马尔可夫决策过程具体如下:
Figure BDA0002390761150000034
Figure BDA0002390761150000035
Figure BDA0002390761150000036
其中,Ptotal是发射端的传输总功率;公式(4)和公式(5)表示每个用户的服务质量的约束,即每个用户接收到的能量Et和数据速率Rt都要分别满足最小能量要求Ereq和数据速率要求Rreq;马尔可夫决策过程描述为通过调整动作
Figure BDA0002390761150000037
GPDMA,PPDMA,在满足每个用户的服务质量的约束下使发射端的传输总功率最小;
该马尔科夫决策过程可以放宽为无约束的马尔可夫过程,即:
Figure BDA0002390761150000041
Figure BDA0002390761150000042
其中,
Figure BDA0002390761150000043
分别是两组拉格朗日算子;Π*是最优的资源分配策略,所述最优资源分配策略转化为求解函数L(λ,μ,Π)的鞍点。
进一步的,步骤二中,强化学习中的Q值的更新公式具体如下:
Figure BDA0002390761150000044
其中,rk+1、γ和0<ρ<1分别是k+1时刻得到的奖赏、奖励折扣系数和学习率;
最优值函数表示如下:
Figure BDA0002390761150000045
其中,Q*(s,a)是对于状态s和动作a遵循最优策略时给出的Q值。
本发明的有益成果是:
1、本发明提出了一种面向模式划分多址接入技术的无线携能下行链路通信场景中的资源分配方法。以时间切换接收机为例,通过联合优化接收机分配给能量接收和数据速率的时隙比率、子载波映射矩阵及功率分配矩阵,获得发射端处最小传输总功率。
2、为了解决约束马尔可夫决策过程求解困难的问题,此处使用拉格朗日对偶理论将其转化为无约束的马尔可夫决策过程。最后,通过应用强化学习中的Q学习算法来获取马尔可夫决策过程中的最优策略。
3、本发明通过实验验证了所提方法的有效性,该方法与其他方法相比,发射端可以获取更低的传输总功率。
【附图说明】
图1为本发明一种面向模式划分多址接入技术的无线携能下行链路通信场景中的系统模型图;
图2为实施例中在不同的迭代次数下,传输总功率的变化示意图;
图3为实施例中在不同的用户数据速率需求下,采用DBN算法和所提出的Q学习算法的性能比较;
图4为实施例中在不同的用户接收能量需求下,采用DBN算法和所提出的Q学习算法的性能比较;
图5为实施例中不同用户服务质量需求及不同用户数量下,发射端最小传输总功率的比较。
【具体实施方式】
下面结合附图和具体实施方式对本发明进行详细说明。
本发明为了保证面向模式划分多址接入技术的无线携能下行链路通信场景中发射端的传输总功率最小,研究了基于约束马尔可夫决策过程的资源分配方法。具体地,将面向模式划分多址接入技术的无线携能通信场景中的资源分配问题描述为约束马尔可夫决策过程,通过利用拉格朗日对偶理论将约束马尔可夫决策问题转化为无约束马尔可夫决策过程。最后,提出了一种Q学习算法来求解无约束马尔可夫决策过程的最优解。以时间切换接收机为例:在满足每个用户服务质量的同时将上述场景中的功率分配矩阵、子载波映射矩阵和分配给信息解码和能量收集的时隙比率调整为最佳值以最小化发射机的传输总功率。
步骤一、构建系统模型:系统模型为基于模式划分多址接入技术的无线携能下行链路通信系统模型,是由一个基站和多个用户组成;
步骤一的具体方式为:
如附图1所示,假设存在一个基站通过K个子载波在特定区域内给T个用户无线传输数据和能量,其中
Figure BDA0002390761150000061
Figure BDA0002390761150000062
分别是用户索引和子载波索引。除此之外,发射机处采用叠加编码并且满足子载波映射矩阵GPDMA∈NK×T,其中Kk={n|gk,t=1}(k∈K)和
Figure BDA0002390761150000063
分别是第k个子载波映射给用户的集合和数量。在附图1中展示了具有3个子载波和5个用户的映射矩阵,其中K1={1,2,3,4}和|K1|=4。另外,这里以时间切换接收机为例来求解最优资源分配策略。用户Ut通过子载波Hk接收到的信号是:
Figure BDA0002390761150000064
其中,hk,t=rk,tdk 是通过子载波Hk从基站到用户Ut的信道增益,rk,t是满足瑞利分布的小规模衰落,
Figure BDA0002390761150000065
是与基站和用户间的距离有关的大规模衰落;另外,Pk,t和xk,t是传输信号通过子载波Hk加载给用户Ut的功率和信号,wk,t~CN(0,σk 2)是加性高斯白噪声。
接收端采用串行干扰消除技术,按照
Figure BDA0002390761150000066
的顺序进行解码。初此之外,
Figure BDA0002390761150000067
是信道对噪声的比率,并且CNRk,t应该满足
Figure BDA0002390761150000068
那么,归一化干扰是:
Figure BDA0002390761150000069
因此,第k个子载波加载到第t个用户时的信干燥比是:
Figure BDA00023907611500000610
其中,
Figure BDA00023907611500000611
确保解码过程不被中断。用户Ut基于子载波Hk获得的信息速率和能量分别是:
Rk,t=Bklog2(1+SINRk,t) (4)
Figure BDA0002390761150000071
其中,η是能量收集效率。另外,αt和1-αt分别是分配给信息解码和能量收集的传输时隙比率,从而可以推出每一个用户收集的信息及能量分别是:
Figure BDA0002390761150000072
Figure BDA0002390761150000073
步骤二、约束马尔可夫决策问题的制定:将无线携能通信系统中的资源分配问题转换为约束马尔可夫决策问题,通过使用拉格朗日对偶理论来将其转化成无约束马尔可夫决策问题。
步骤二的具体实施方式如下:
决策者在满足接收端每个用户接收到的能量需求和数据速率需求时,最小化发射端的传输总功率。下面将带有用户服务质量约束的资源分配问题表示为约束马尔可夫决策问题,其为每个状态提供了相应的资源分配策略。接下来,系统的状态空间、动作空间、目标和约束将被分别描述。
1)状态空间:为了表征用户接收的能量和信号,我们定义状态空间为:
s=(SINRk,t,k=0,1,...K,t=0,1,...T)∈S=SINR (8)
其中,状态集合SINR是属于信干燥比的有限集。
2)动作空间:发射机通过控制功率分配及子载波映射,接收机通过控制分配给信息解码和能量收集的时隙比率,来使传输总功率最小。因此,动作空间是:
Figure BDA0002390761150000074
其中,
Figure BDA0002390761150000075
和PPDMA分别是所有用户接收机分配给信息解码的时隙比率向量和功率分配矩阵。另外,
Figure BDA0002390761150000076
GPDMA∈G,PPDMA∈P在系统中均是离散的,并且α、G、P集合分别属于所有接收机分配给信息解码的时隙比率、子载波映射及功率分配的有限集。
3)目标和约束:目标是寻找最优策略π,使得发射端的传输总功率,即Ptotal最小;约束是满足每个用户最小的能量和数据速率需求。该资源分配问题可以转化成约束马尔可夫决策过程,即P1:
Figure BDA0002390761150000081
Figure BDA0002390761150000082
Figure BDA0002390761150000083
Figure BDA0002390761150000084
Figure BDA0002390761150000085
Figure BDA0002390761150000086
Figure BDA0002390761150000087
该问题在满足每个用户服务质量约束的同时,采取策略π自适应的调整所有接收机分配给信息解码的时隙比率、发射端的子载波映射及功率分配来使发射端的传输总功率最小。为了解决该约束马尔科夫问题,拉格朗日对偶理论将其转化为无约束的马尔科夫过程。下面将引入广义拉格朗日函数:
Figure BDA0002390761150000088
其中,λ={λ123,...,λt=T}、μ={μ123,...,μt=T}是拉格朗日算子集合,并且元素λ123,...,λt=T和μ123,...,μt=T分别是拉格朗日乘子分别对应于每个用户收获的能量和接收的数据速率的约束。考虑L(λ,μ,Π)作为λ和μ的函数,被定义为:
Figure BDA0002390761150000089
当接收机满足用户服务质量约束时,θ(Π)的值是Ptotal。当约束不被满足时,使两组拉格朗日算子取正无穷大,则θ(Π)的值趋于无穷大,导致函数无解。因此,θ(Π)函数可以被描述为:
Figure BDA0002390761150000091
因此,约束马尔可夫决策过程可以放宽为无约束的马尔可夫决策过程,即:
Figure BDA0002390761150000092
其中,
Figure BDA0002390761150000093
Figure BDA0002390761150000094
另外,Π*是最优策略。因此,最优资源分配策略转化为求解函数L(Π,λ,μ)的鞍点。即,(Π***)应该满足:
L(Π,λ**)≥L(Π***)≥L(Π*,λ,μ) (21)
由于信道转移概率难以估计,Q学习算法被提出用来求解该无约束马尔可夫决策过程的最优解。
步骤三、使用强化学习的方法获取面向模式划分多址接入技术的无线携能通信场景中基于约束马尔可夫决策过程的资源分配的最优策略。
步骤三的具体实施方式如下:
强化学习算法被广泛应用于无模型MDP问题的最优控制策略的学习,这意味着信道转换等环境模型不需要考虑。因此,强化学习中的Q学习算法被提出来求解上述资源分配问题。下面将分别给出Q学习算法的Q值计算公式、更新公式、ε-greedy策略及奖励函数。对于策略π,在状态s处执行动作a时的Q值计算公式是:
Qπ(s,a)=Eπ[rk+1+γQπ(sk+1,ak+1)|sk=s,ak=a] (22)
其中,rk+1和γ分别是k+1时刻得到的奖赏和奖励折扣系数。在Q学习算法中,Q值的更新公式是:
Figure BDA0002390761150000101
其中,0<ρ<1是学习率。在状态s时,行动a是根据ε-greedy的策略选择的,以便做出总体上的最佳决策。因此,动作的选择遵循:
Figure BDA0002390761150000102
其中,~U(A)函数是在均匀动作空间内随机选取任一动作。为了直接反映目标值的奖赏函数,其被定义为:
Figure BDA0002390761150000103
另外,使用次梯度法计算和更新拉格朗日乘子。计算和更新完Q值之后,对问题的控制策略(P2)可以描述为:
Figure BDA0002390761150000104
在这里Q*(s,a)是对于状态s和动作a遵循最优策略给出的Q值。
实施例:
以下实例中所提供的图示以及模型中的具体参数值的设定主要是为了说明本发明的基本构想以及对本发明做仿真验证,具体的应用环境中,可视实际场景和需求进行适当调整。
本发明面向模式划分多址接入技术的无线携能通信场景,其中发射机和接收机都配备单个天线。通过仿真证明了所提方法的有效性:(1)比较了算法在不同学习率下的收敛性能;(2)随着用户接收能量需求的变化,发射端的传输总功率随算法的不同而变化。这里,将所提出的基于约束马尔可夫过程的Q学习的算法与基于遗传算法的DBN算法进行了比较;(3)随着用户数据速率需求的变化,发射端的传输总功率随算法的不同而变化。这里,将所提出的基于约束马尔可夫过程的Q学习的算法与基于遗传算法的DBN算法进行了比较;(4)随着接收端用户数量的变化,发射端的最小传输总功率随用户服务质量需求的不同而变化。
在仿真中,我们假设所有的用户分布在以基站为中心,半径为300米的圆内,即dk在(0meters,300meters)中被随机产生。路径损耗系数β被假设为3.76。为了满足接收端的能量需求,能量收集的接收机的功率转换效率被假设为η=30%。另外,假定最大可用发射功率和噪声值分别被设定为P=30%和σ2=0.01w。为了学习Q值,设置满足约束(13)、(14)和(15)的动作集。因此,状态空间是对应动作空间的有限集合。除此之外,其他参数设定为:kmax=2500,ε=0.1和γ=0.8。在仿真过程中,三个性能指标是:发射端的传输总功率、接收端收获的能量和数据速率。资源分配策略的优缺点通过性能指标被表征。
如图2所示,研究了不同学习率下总发射功率的收敛性,确定了合适的算法学习率,其中ρ被分别设置为0.4、0.5和0.6。另外,用户数和子载波数均被设置为2。此外,获取的能量约束和数据速率约束分别被设置为Ereq=0.1w和Rreq=1Mbit/s。可以观察到,在不同的学习速率下,传输总功率收敛到0.35w。显然,收敛速度和稳定性在不同的学习率下是不同的。考虑到收敛速度和稳定性两个因素,采用了学习率为0.6。由于算法采用贪婪策略,基于约束马尔可夫过程的资源分配方案的总传输功率将随着迭代次数的增加而略有变化,但总传输功率的总体趋势不受影响。
如图3和图4所示,算法的有效性被研究,其反映了所提出来的基于Q学习算法和DBN算法在不同用户服务质量下的性能比较。在仿真参数设置中,接收端用户数目被设置为3。结果表明,该算法是有效的,可以显著降低总传输功率。
最后,图5展示了在不同用户数和不同用户服务质量约束下,所提出的Q学习算法估计的发射端的最小传输总功率,其中接收机的用户数分别设置为2、3和4。如图5所示,观察到由于用户的服务质量的增加导致发射端的传输总功率有增加的趋势。此外,随着用户数的增加,发射端的最小传输总功率的增长趋势也逐渐显现出来。以上结果均验证了该算法的有效性和合理性。

Claims (4)

1.一种面向模式划分多址接入技术的无线携能下行链路通信场景中的资源分配方法,其特征在于,按照以下步骤实施:
步骤一、约束马尔可夫决策过程的制定:
将面向模式划分多址接入技术的无线携能通信场景中的资源分配问题描述为约束马尔可夫决策过程,使用拉格朗日对偶方法将其转化为无约束马尔可夫决策过程;
步骤二、使用强化学习的方法求解步骤一中的无约束马尔可夫决策过程,最终得到最优的资源分配策略;该策略的目标是在满足接收端每个用户的服务质量的前提下最小化发射端的传输总功率。
2.如权利要求1所述的面向模式划分多址接入技术的无线携能通信场景中的资源分配方法,其特征在于,将所述无线携能下行链路通信场景构建为系统模型,所述的系统模型具体为:
一个基站通过K个子载波对特定区域内的T个用户进行数据和能量的无线传输,其中发射端采用叠加编码,接收端采用串行干扰消除技术,且发射端的基站和接收端的用户均匹配单个天线;用户随机分布在以基站为中心,半径为r的圆内。
3.如权利要求2所述的面向模式划分多址接入技术的无线携能通信场景中的资源分配方法,其特征在于,所述步骤一具体为:
1)根据所述系统模型,定义系统的状态空间和动作空间:
所述系统的状态空间具体如下:
s=(SINRk,t,k=0,1,...K,t=0,1,...T)∈S=SINR (1),
其中,SINRk,t是第k个子载波加载到第t个用户时的信干噪比,状态集合SINR是属于信干噪比的有限集;
所述系统的动作空间具体如下:
Figure FDA0002390761140000021
其中,
Figure FDA0002390761140000022
是T个用户分配给信息解码的传输时间比率组成的向量,PPDMA是功率分配矩阵,GPDMA是子载波映射矩阵,
Figure FDA0002390761140000023
GPDMA∈G,PPDMA∈P表示上述向量和矩阵分别属于分配给信息解码的传输时间比率、子载波映射和功率分配的有限集;
2)约束马尔可夫决策过程具体如下:
Figure FDA0002390761140000024
Figure FDA0002390761140000025
Figure FDA0002390761140000026
其中,Ptotal是发射端的传输总功率;公式(4)和公式(5)表示每个用户的服务质量的约束,即每个用户接收到的能量Et和数据速率Rt都要分别满足最小能量要求Ereq和数据速率要求Rreq;马尔可夫决策过程描述为通过调整动作
Figure FDA0002390761140000027
GPDMA,PPDMA,在满足每个用户的服务质量的约束下使发射端的传输总功率最小;
该马尔科夫决策过程可以放宽为无约束的马尔可夫过程,即:
Figure FDA0002390761140000028
Figure FDA0002390761140000029
其中,
Figure FDA00023907611400000210
分别是两组拉格朗日算子;Π*是最优的资源分配策略,所述最优资源分配策略转化为求解函数L(λ,μ,Π)的鞍点。
4.如权利要求2或3所述的一种面向模式划分多址接入技术的无线携能下行链路通信场景中的资源分配方法,其特征在于,所述步骤二中,强化学习中的Q值的更新公式具体如下:
Figure FDA0002390761140000031
其中,rk+1、γ和0<ρ<1分别是k+1时刻得到的奖赏、奖励折扣系数和学习率;
最优值函数表示如下:
Figure FDA0002390761140000032
其中,Q*(s,a)是对于状态s和动作a遵循最优策略时给出的Q值。
CN202010113438.6A 2020-02-24 2020-02-24 一种无线携能通信技术的资源分配方法 Active CN111212438B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010113438.6A CN111212438B (zh) 2020-02-24 2020-02-24 一种无线携能通信技术的资源分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010113438.6A CN111212438B (zh) 2020-02-24 2020-02-24 一种无线携能通信技术的资源分配方法

Publications (2)

Publication Number Publication Date
CN111212438A true CN111212438A (zh) 2020-05-29
CN111212438B CN111212438B (zh) 2021-07-16

Family

ID=70789128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010113438.6A Active CN111212438B (zh) 2020-02-24 2020-02-24 一种无线携能通信技术的资源分配方法

Country Status (1)

Country Link
CN (1) CN111212438B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113542124A (zh) * 2021-06-25 2021-10-22 西安交通大学 一种d2d缓存网络中信用驱动的协作传输方法
CN113938917A (zh) * 2021-08-30 2022-01-14 北京工业大学 应用于工业物联网的异构b5g/rfid智能资源分配系统
CN114222368A (zh) * 2021-11-30 2022-03-22 中山大学·深圳 一种面向物联网数据卸载的多智能体强化学习方法
CN115085237A (zh) * 2022-07-05 2022-09-20 南通大学 一种考虑电池响应速度的混合储能自适应功率分配方法
TWI812371B (zh) * 2022-07-28 2023-08-11 國立成功大學 基於人工智慧算法之下行模式區分多址接入系統資源分配方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105407535A (zh) * 2015-10-22 2016-03-16 东南大学 一种基于约束马尔可夫决策过程的高能效资源优化方法
CN110113179A (zh) * 2019-02-22 2019-08-09 华南理工大学 一种基于深度学习的携能noma系统的资源分配方法
CN110602730A (zh) * 2019-09-19 2019-12-20 重庆邮电大学 基于无线携能的noma异构网络的资源分配方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105407535A (zh) * 2015-10-22 2016-03-16 东南大学 一种基于约束马尔可夫决策过程的高能效资源优化方法
CN110113179A (zh) * 2019-02-22 2019-08-09 华南理工大学 一种基于深度学习的携能noma系统的资源分配方法
CN110602730A (zh) * 2019-09-19 2019-12-20 重庆邮电大学 基于无线携能的noma异构网络的资源分配方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JINGCI LUO ET AL.: "A Deep Learning-Based Approach to Power Minimization in Multi-Carrier NOMA With SWIPT", 《IEEE ACCESS》 *
LIXIN LI ET AL.: "Learning-Aided Resource Allocation for Pattern Division Multiple Access Based SWIPT Systems", 《IEEE WIRELESS COMMUNICATIONS LETTERS(EARLY ACCESS)》 *
彭明遥: "《中国优秀硕士学位论文全文数据库 信息科技辑》", 15 December 2019 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113542124A (zh) * 2021-06-25 2021-10-22 西安交通大学 一种d2d缓存网络中信用驱动的协作传输方法
CN113938917A (zh) * 2021-08-30 2022-01-14 北京工业大学 应用于工业物联网的异构b5g/rfid智能资源分配系统
CN114222368A (zh) * 2021-11-30 2022-03-22 中山大学·深圳 一种面向物联网数据卸载的多智能体强化学习方法
CN114222368B (zh) * 2021-11-30 2025-06-27 中山大学·深圳 一种面向物联网数据卸载的多智能体强化学习方法
CN115085237A (zh) * 2022-07-05 2022-09-20 南通大学 一种考虑电池响应速度的混合储能自适应功率分配方法
TWI812371B (zh) * 2022-07-28 2023-08-11 國立成功大學 基於人工智慧算法之下行模式區分多址接入系統資源分配方法

Also Published As

Publication number Publication date
CN111212438B (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
CN111212438A (zh) 一种无线携能通信技术的资源分配方法
CN109600828B (zh) 无人机基站下行链路的自适应传输功率分配方法
CN111446992B (zh) 无线供电大规模mimo网络中的最大化最小能效资源分配方法
CN112702792B (zh) 基于gfdm的无线携能网络上下行链路资源联合分配方法
CN108183733B (zh) 基于在线noma多天线系统的波束成形优化方法
CN104703270B (zh) 适用于异构无线蜂窝网络的用户接入和功率分配方法
CN117560043B (zh) 一种基于图神经网络的无蜂窝网络功率控制方法
CN110460556B (zh) 正交多载波系统无线数据与能量一体化传输信号设计方法
CN116321186B (zh) Irs辅助认知swipt系统最大和速率资源优化方法
CN110113179A (zh) 一种基于深度学习的携能noma系统的资源分配方法
CN109714806A (zh) 一种非正交多址接入的无线供电中继网络优化方法
CN102571179B (zh) Mimo系统中基于不完全信道状态信息的跨层优化设计方法
CN110418360B (zh) 无线携能网络多用户子载波比特联合分配方法
Li et al. Learning-aided resource allocation for pattern division multiple access-based SWIPT systems
CN111917444B (zh) 一种适用于毫米波mimo-noma系统的资源分配方法
CN104158572B (zh) 一种基于智能天线的绿色分布式天线系统通信方法
CN107071881B (zh) 一种基于博弈论的小蜂窝网络分布式能量分配方法
CN115633402A (zh) 一种面向混合业务吞吐量优化的资源调度方法
CN109787737A (zh) 一种基于混合能量采集的ofdm系统下行链路多用户资源优化方法
CN114051205A (zh) 基于强化学习动态多用户无线通信场景下边缘优化方法
CN111565394B (zh) 一种面向动态无人机群Mesh网络的信道绑定与接入方法及系统
CN111654920B (zh) 一种分布式能效子载波功率分配方法
CN108471621B (zh) 一种基于电磁波供能的通信方法
CN114980163A (zh) 基于非线性能量采集的大规模mimo系统能效优化方法
CN114389784A (zh) 基于迁移学习的下行miso-ofdma协作传输方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant