[go: up one dir, main page]

CN116248156A - 基于深度学习的大规模mimo信道状态信息反馈及重建方法 - Google Patents

基于深度学习的大规模mimo信道状态信息反馈及重建方法 Download PDF

Info

Publication number
CN116248156A
CN116248156A CN202211395637.6A CN202211395637A CN116248156A CN 116248156 A CN116248156 A CN 116248156A CN 202211395637 A CN202211395637 A CN 202211395637A CN 116248156 A CN116248156 A CN 116248156A
Authority
CN
China
Prior art keywords
network
channel matrix
model
channel
state information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211395637.6A
Other languages
English (en)
Inventor
杨朔
李勇
刘丽哲
王斌
李行健
朱云飞
汪畅
夏金涛
赵显超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 54 Research Institute
Original Assignee
CETC 54 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 54 Research Institute filed Critical CETC 54 Research Institute
Priority to CN202211395637.6A priority Critical patent/CN116248156A/zh
Publication of CN116248156A publication Critical patent/CN116248156A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0613Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission
    • H04B7/0615Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal
    • H04B7/0619Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal using feedback from receiving side
    • H04B7/0621Feedback content
    • H04B7/0626Channel coefficients, e.g. channel state information [CSI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/0202Channel estimation
    • H04L25/024Channel estimation channel estimation algorithms
    • H04L25/0242Channel estimation channel estimation algorithms using matrix methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/0202Channel estimation
    • H04L25/024Channel estimation channel estimation algorithms
    • H04L25/0254Channel estimation channel estimation algorithms using neural network algorithms
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Power Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Radio Transmission System (AREA)

Abstract

本发明公开了一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法,属于通信技术领域。其包括:搭建深度神经网络模型;产生训练、验证和测试需要的样本数据集;将搭建好的模型在训练集上进行训练;保存训练好的模型参数;加载保存好的模型参数,在测试集上进行模型性能测试;将测试性能最好的模型用于信道状态信息反馈和重建,在用户端对MIMO信道状态信息在空频域的信道矩阵做二维离散傅立叶变换,获得信道矩阵,将信道矩阵从用户终端的编码器网络输入,传输到基站端,基站端的译码器网络通过译码得到原始信道矩阵估计值。本发明可大幅度提高模型算法特征提取能力和CSI重建性能。

Description

基于深度学习的大规模MIMO信道状态信息反馈及重建方法
技术领域
本发明属于通信技术领域,涉及无线通信系统的信道状态信息反馈方法,具体来说是一种基于深度学习的大规模多输入多输出(Multiple-in Multiple-out,MIMO)通信系统信道状态信息反馈及重建方法。
背景技术
大规模MIMO因具备提升系统容量、频谱效率、用户体验速率、降低时延和用户间干扰、增强全维覆盖和节约能耗等诸多优点,被认为是5G最有潜力的核心技术之一。
然而,大规模MIMO的发展和应用也面临着诸多问题。例如,大规模MIMO的性能与发射机获得的信道状态信息(Channel State Information,CSI)的质量息息相关。对于上行链路,只需要用户端发送训练导频,BS就可以很容易地通过终端发送的导频来准确估计CSI,而下行链路的CSI获取很难实现,这也是在当前大规模MIMO技术中需要解决的问题。在时分双工(Time Division Duplexing,TDD)模式中,基站端(Base Station,BS)通过上行链路发送训练导频进行信道估计,再利用互易性就可以推断出下行链路的CSI。而在频分双工(Frequency Division Duplexing,FDD)模式中存在弱互易性,这使得通过观察上行链路CSI来推断下行链路的CSI变得困难。在传统的MIMO系统中,FDD系统的下行链路CSI首先由用户端通过下行导频估计获取后反馈给BS,然后采用基于码本或者采用矢量量化的方法来减小反馈开销,但是这种方式在大规模MIMO中是不可行的,因为在BS处使用了大量天线,这将大大增加CSI矩阵的维数,码本的反馈量和设计复杂度会显著提升。同时,由于上下行链路不存在互易性,只能通过上行传输链路反馈下行CSI,占用了上行资源,导致了极大的带宽浪费。因此如何高准确度、低开销地将下行链路信道状态信息反馈到基站就成为了FDD模式下大规模MIMO通信系统发展急需解决的问题。
由于在实际信道物理传播环境中存在共享的局部散射,且大规模MIMO系统的多天线阵列赋予信道一定的空间相关性,因此大规模MIMO系统在用户信道矩阵中表现出联合稀疏性,这也启发了基于压缩感知(Compressive Sensing,CS)的CSI反馈方案的提出。首先将CSI矩阵表示为某个基下的稀疏矩阵,之后通过压缩采样得到更低维度的码字,再利用压缩感知的理论和相关优化算法,从该码字中重建出原CSI矩阵。然而由于真实信道并非完美稀疏的,且基于CS的方法没有考虑到实际应用中信道时延差、信道估计误差、反馈链路误差以及提高重构精度带来的计算复杂度问题,导致该算法无法完整保留信道结构信息,信道重建性能不佳。
随着人工智能技术的快速发展,基于压缩感知理论的深度学习网络模型算法CsiNet被提出并用于信道状态信息反馈及重建。该模型算法属于一种自编码器网络,包含一对编码器和解码器网络。编码器网络在用户端对信道状态信息进行编码,解码器在接收端对反馈信息进行译码重建。通过实验验证该算法性能明显优于传统算法。然而,CsiNet网络对于压缩信息特征的提取能力相对较弱,接收端信道状态信息重建性能仍有较大的提升空间,且CsiNet在低压缩率条件下的重建性能相对较差,这在相干时间较长的大规模MIMO系统下是不可取的。
发明内容
有鉴于此,本发明提供一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法,该方法能够解决FDD系统中CSI反馈信道重建性能差的问题,并在低压缩率条件下仍能保持良好的信道重建性能。
为了实现上述目的,本发明采用的技术方案为:
一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法,包括以下步骤:
步骤1:搭建深度神经网络模型CBAM-CsiNet,该模型包含编码器网络、译码器网络、CBAM注意力模块,其中,编码器网络位于用户终端,用于将信道矩阵H压缩编码为维度更低的码字s,译码器网络位于基站端,用于从反馈链路传来的码字s中重建出原始信道矩阵的估计值
Figure BDA0003933471370000031
步骤2:使用COST 2100模型在室内和室外条件下分别产生训练、验证和测试需要的样本数据集;
步骤3:将搭建好的CBAM-CsiNet神经网络模型在训练集上进行训练,使得
Figure BDA0003933471370000032
和H尽可能接近,选用Adam梯度优化算法进行梯度优化,使得损失函数降低到最小,并最终趋于平稳;
步骤4:保存步骤3中训练好的模型参数,包括权重、偏置、步长和卷积核大小;
步骤5:加载保存好的模型参数,在测试集上进行模型性能测试;
步骤6:将测试性能最好的模型用于信道状态信息反馈和重建,在用户端对MIMO信道状态信息在空频域的信道矩阵
Figure BDA0003933471370000041
做二维离散傅立叶变换,获得在角延迟域稀疏的信道矩阵H,将信道矩阵H从部署在用户终端的编码器网络输入,经过压缩编码后,经反馈链路传输到基站端,基站端的译码器网络通过译码得到原始信道矩阵估计值
Figure BDA0003933471370000042
进一步地,步骤1中,编码器网络包含一个卷积层和一个全连接层,对网络各层的参数进行随机初始化,编码器网络的输入是角延迟域稀疏的信道矩阵H,输出是压缩编码后得到的码字s,该码字是比H维度低的一维矢量;
码字s通过反馈链路被传送到基站端,通过基站端的译码器网络进行译码操作,得到原始信道矩阵估计值;
译码器网络包含一个全连接层、两个RefineNet+单元和一个卷积层,对译码器网络各层参数进行随机初始化操作,将码字s输入到译码器网络当中,输出与信道矩阵H同维度的重建信道矩阵估计值;
CBAM注意力模块包含通道注意力模块和空间注意力模块两个部分,给定一个中间特征图,CBAM注意力模块按照通道和空间两个独立的维度依次推断注意力图谱,然后将注意力图谱乘到输入特征图中进行自适应特征细化;其中,通道注意力模块利用通道间的特征关系来生成通道注意力特征图,用于寻找网络需要关注的重点输入特征;空间注意力模块通过特征空间的空间关系生成空间注意力特征图,用于寻找需要提取的重要信息特征所在的位置,通道注意力模块和空间注意力模块采用串行排列的方式构成CBAM注意力模块;
译码器网络的最后一个卷积层使用Sigmoid激活函数,编码器网络和译码器网络的其余各卷积层均采用ReLU激活函数并使用批量标准化操作,全连接层采用线性激活函数。
进一步地,步骤2的具体方式为:
使用COST 2100模型,在5.3GHz的室内微微蜂窝场景和300MHz室外乡村场景下产生150000个空频域信道矩阵样本,并将矩阵样本数据划分为训练集、验证集和测试集;其中,训练集包含100000个样本数据,用于驱动神经网络模型训练,验证集包含30000个样本数据,用于验证训练过程中的模型收敛情况,测试集包含20000个样本数据,用于测试神经网络模型的训练效果。
进一步地,步骤3采用Adam梯度优化算法和端到端的学习方式,联合训练编码器网络和译码器网络参数,使得损失函数最小;损失函数为译码器网络输出的原始信道矩阵估计值
Figure BDA0003933471370000051
与真实信道矩阵H的均方误差,损失函数L具体表示如下:
Figure BDA0003933471370000061
其中,T为训练集的所有样本数,||·||2为欧几里得范数,下标i表示估计出的信道矩阵与原始信道矩阵的编号。
进一步地,所述RefineNet+单元由1个输入层、3个卷积层和1个CBAM注意力模块组成,通过跳跃连接结构将输入层的数据、第三个卷积层的输出和CBAM注意力模块的输出三者相加,作为RefineNet+单元的输出。
本发明的有益效果:
(1)与传统基于压缩感知的算法相比,本发明采用基于CBAM-CsiNet神经网络的算法,不依赖于信道的完美稀疏特性,在结构上使用编码器网络代替随机测量方法,用译码器网络代替传统的迭代式重建算法,信道状态信息反馈和重建性能和精度都有了大幅度的上升。
(2)与当前的基于深度学习的算法相比,本发明采用基于CBAM-CsiNet神经网络的算法,由于引入了CBAM注意力模块,其特征提取能力更强,译码过程中保留的关键信息更多,信息损失更小,性能有明显提升,尤其在低压缩率条件下仍能保持良好的重建性能和精度。
附图说明
图1是本发明实施例中CBAM-CsiNet神经网络模型的结构示意图。
图2是本发明实施例中RefineNet+单元的结构示意图。
图3是本发明实施例中CBAM注意力模块的结构示意图。
图4是本发明实施例中通道注意力模块的结构示意图。
图5是本发明实施例中空间注意力模块的结构示意图。
需要说明的是,图1和图2中模块上方的数字表示生成的特征映射的数量。
具体实施方式
下面结合附图对本发明进行详细的描述。
一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法,该方法以深度学习理论为基础搭建了神经网络模型架构,该架构包含了一对编码器和译码器,编码器在移动用户终端,译码器在基站端,通过在信道状态信息数据上训练该神经网络模型,使得编码器能够将信道状态信息压缩编码为低维度码字,再将低维度码字通过反馈链路传送至基站端,由基站端的译码器重建出信道状态信息。
具体来说,该方法包括如下步骤:
步骤1:搭建深度神经网络模型CBAM-CsiNet,该模型包含编码器网络、译码器网络、CBAM注意力模块,其中,编码器网络位于用户终端,用于将信道矩阵H压缩编码为维度更低的码字s,译码器网络位于基站端,用于从反馈链路传来的码字s中重建出原始信道矩阵的估计值
Figure BDA0003933471370000071
步骤2:使用COST 2100模型在室内和室外条件下分别产生训练、验证和测试需要的样本数据集;
步骤3:将搭建好的CBAM-CsiNet神经网络模型在训练集上进行训练,使得
Figure BDA0003933471370000081
和H尽可能接近,选用Adam梯度优化算法进行梯度优化,使得损失函数降低到最小,并最终趋于平稳;
步骤4:保存步骤3中训练好的模型参数,包括权重、偏置、步长和卷积核大小;
步骤5:加载保存好的模型参数,在测试集上进行模型性能测试;
步骤6:将性能测试数据指标最好的模型用于信道状态信息反馈和重建,在用户端对MIMO信道状态信息在空频域的信道矩阵
Figure BDA0003933471370000082
做二维离散傅立叶变换,获得在角延迟域稀疏的信道矩阵H,将信道矩阵H从部署在用户终端的编码器网络输入,经过压缩编码后,经反馈链路传输到基站端,基站端的译码器网络通过译码得到原始信道矩阵估计值
Figure BDA0003933471370000083
其中,用于性能测试的数据指标可以采用归一化均方误差(NMSE)。
进一步地,步骤1中,编码器网络包含一个卷积层和一个全连接层,对网络各层的参数进行随机初始化,编码器网络的输入是角延迟域稀疏的信道矩阵H,输出是压缩编码后得到的码字s,该码字是比H维度低的一维矢量;
码字s通过反馈链路被传送到基站端,通过基站端的译码器网络进行译码操作,得到原始信道矩阵估计值;
译码器网络包含一个全连接层、两个RefineNet+单元和一个卷积层,对译码器网络各层参数进行随机初始化操作,将码字s输入到译码器网络当中,输出与信道矩阵H同维度的重建信道矩阵估计值;
CBAM注意力模块包含通道注意力模块和空间注意力模块两个部分,给定一个中间特征图,CBAM注意力模块按照通道和空间两个独立的维度依次推断注意力图谱,然后将注意力图谱乘到输入特征图中进行自适应特征细化;其中,通道注意力模块利用通道间的特征关系来生成通道注意力特征图,用于寻找网络需要关注的重点输入特征;空间注意力模块通过特征空间的空间关系生成空间注意力特征图,用于寻找需要提取的重要信息特征所在的位置,通道注意力模块和空间注意力模块采用串行排列的方式构成CBAM注意力模块;
译码器网络的最后一个卷积层使用Sigmoid激活函数,编码器网络和译码器网络的其余各卷积层均采用ReLU激活函数并使用批量标准化操作,全连接层采用线性激活函数。
进一步地,步骤2的具体方式为:
使用COST 2100模型,在5.3GHz的室内微微蜂窝场景和300MHz室外乡村场景下产生150000个空频域信道矩阵样本,并将矩阵样本数据划分为训练集、验证集和测试集;其中,训练集包含100000个样本数据,用于驱动神经网络模型训练,验证集包含30000个样本数据,用于验证训练过程中的模型收敛情况,测试集包含20000个样本数据,用于测试神经网络模型的训练效果。
进一步地,步骤3采用Adam梯度优化算法和端到端的学习方式,联合训练编码器网络和译码器网络参数,使得损失函数最小;损失函数为译码器网络输出的原始信道矩阵估计值
Figure BDA0003933471370000101
与真实信道矩阵H的均方误差,损失函数L具体表示如下:
Figure BDA0003933471370000102
其中,T为训练集的所有样本数,||·||2为欧几里得范数,下标i表示估计出的信道矩阵与原始信道矩阵的编号。
进一步地,所述RefineNet+单元由1个输入层、3个卷积层和1个CBAM注意力模块组成,通过跳跃连接结构将输入层的数据、第三个卷积层的输出和CBAM注意力模块的输出三者相加,作为RefineNet+单元的输出。
该方法可降低收发端的计算量、反馈开销,并提升算法信道重建性能和准确性。
以下为一个更具体的例子:
一种大规模MIMO通信系统,其下行链路基站端发送天线数目为Nt=32,用户接收端使用单根天线,子载波数目为
Figure BDA0003933471370000103
该大规模MIMO系统采用OFDM信号调制方式。
基于上述条件,使用COST 2100模型在室内和室外条件下分别产生训练、验证和测试需要的样本数据集。具体来说,在5.3GHz的室内微微蜂窝场景和300MHz室外乡村场景下产生150000个空频域信道矩阵样本,并将矩阵样本数据划分为训练集、验证集和测试集。其中,训练集包含100000个样本数据,用于驱动神经网络模型训练,验证集包含30000个样本数据,用于验证训练过程中的模型收敛情况,测试集包含20000个样本数据,用于测试神经网络模型的训练效果。使用
Figure BDA0003933471370000111
和Nt×Nt 32×32的离散傅里叶变换矩阵Fd和Fa对样本中的每一个空频域的信道矩阵
Figure BDA0003933471370000112
做二维离散傅里叶变换,从而获得角延迟域上稀疏的信道矩阵
Figure BDA0003933471370000113
也即是
Figure BDA0003933471370000114
因为多径到达时延控制在有限的时间范围内,因此在延迟域上,信道矩阵H只有在前
Figure BDA0003933471370000115
行上有值,因此保留前W=32行元素值,将其修正为32×32的信道矩阵
Figure BDA0003933471370000116
CBAM-CsiNet架构中的编码器网络如图1所示,将复数域信道矩阵
Figure BDA0003933471370000117
的实部和虚部拆分为两个均为32×32大小的特征图,即两个32×32大小的实数矩阵。将这两个矩阵拉直重组为一个2048×1的向量,输入编码器的第二层,即一个含有M个神经元的全连接层,采用线性激活函数,输出M×1的向量s,即为用户终端要传送给基站端的压缩编码后的码字。
CBAM-CsiNet架构中的译码器网络如图1所示,译码器网络包含一个全连接层,两个RefineNet+单元和一个卷积层,RefineNet+单元包含一个输入层、三个卷积层和一个CBAM注意力模块,并将输入层的输入数据通过一个跳跃连接结构与最后一个卷积层的输出、CBAM注意力模块的输出相加,如图2所示。第一层为包含2048个神经元的全连接层,以接收到的码字s为输入,采用线性激活函数,输出2048×1的向量。该向量输入译码器网络的第二层,即一个RefineNet+单元,该单元的第一层为输入层,将上一层输入的2048×1向量重组为两个32×32大小的实数矩阵,分别作为估计的信道矩阵的实部和虚部的初始化值。RefineNet+的第二、三、四层均为卷积层,分别采用8个、16个和2个大小为3×3大小的卷积核,采用适当的零填充、ReLU激活函数和批量标准化操作(Batch Normalization),使得每次卷积后特征图的尺寸大小均为32×32,与原始信道矩阵H大小保持一致。此外,输入层的数据还通过一个跳跃连接结构与第三个卷积层输出的数据、CBAM注意力模块输出的数据相加,作为整个RefiNet+单元的输出。跳跃链接结构的加入降低了经过卷积层和网络反向传播过程中的信息损失。第一个RefineNet+单元的输出作为第二个RefineNet+单元的输入,第二个RefineNet+单元的结构与第一个RefineNet+单元的结构相同,将其输出的特征图输入译码器的最后一个卷积层,并使用Sigmoid激活函数,将输出值范围限定在[0,1]区间,从而该译码器网络的输出为两个32×32大小的实数矩阵,分别作为最终重建信道矩阵
Figure BDA0003933471370000121
的实部和虚部。
CBAM注意力模块是一种高效的前馈卷积神经网络,包含通道注意力模块和空间注意力模块两个部分,如图3所示。给定一个中间特征图,模块按照通道和空间两个独立的维度依次推断注意力图谱,然后将注意力图谱乘到输入特征图中进行自适应特征细化。给定一个中间特征
Figure BDA0003933471370000131
作为输入,CBAM注意力模块逐步预测出一个一维通道注意力图谱
Figure BDA0003933471370000132
和一个二维空间注意力图谱
Figure BDA0003933471370000133
整个注意力过程可以概括为:
Figure BDA0003933471370000134
Figure BDA0003933471370000135
其中,
Figure BDA0003933471370000136
表示element-wise乘法,在乘法过程中,通道注意力值沿着空间维度传播做复制,反之亦然。F”是CBAM注意力模块最终输出的精细化结果。
通道注意力模块如图4所示,该模块是利用通道间的特征关系来生成通道注意力特征图。由于特征图的每个通道均相当于是一个特征检测器,因此通道注意力主要用于寻找网络需要关注的重点输入特征。为了更有效地计算通道注意力,需要对输入特征空间的空间维数进行压缩。所述的通道注意力模块当中同时包含了均值池化和最大值池化两种池化操作,均值池化可以有效聚合空间信息特征,最大值池化操作用于寻找不同特征对象的其他相关信息,以获取更精准的通道注意力特征,两种赤化操作相结合的方式,相较于仅使用一种池化操作的方法,能够大幅度提高网络的表征能力。
通道注意力模块的具体操作过程如下:
首先,利用均值池化和最大值池化操作聚合特征图的空间信息,生成两个不同的空间特征图
Figure BDA0003933471370000141
Figure BDA0003933471370000142
其中
Figure BDA0003933471370000143
表示均值池化特征,
Figure BDA0003933471370000144
表示最大值池化特征。
然后,将这两个特征图一起送入一个共享网络,生成通道注意力图谱
Figure BDA0003933471370000145
所述的共享网络是一个两层的神经网络,包含一个多层感知器(MLP)和一个隐藏层。将两个特征图分别送入共享网络之后,再使用元素求和的方法合并输出特征向量。
通道注意力的计算过程可以表示为:
Figure BDA0003933471370000146
其中,s表示Sigmoid函数,
Figure BDA0003933471370000147
且MLP的权值W0和W1对于两个输入是共享的。
空间注意力模块如图5所示,主要通过特征空间的空间关系生成空间注意力特征图。与通道注意力不同,空间注意力主要关注需要提取的重要信息特征所在的位置,空间注意力是对通道注意力的补充。为了计算空间注意力,需要首先沿着通道轴的方向分别使用均值池化和最大值池化操作,并将输出向量连接起来生成一个有效的特征描述,之后使用一个卷积层生成空间注意力特征图谱
Figure BDA0003933471370000148
该注意力特征图谱用于需要特别关注或者抑制的位置进行编码。
空间注意力模块的具体实现步骤如下:
通过使用两个池化操作聚合特征图的通道信息,生成两个二维映射:
Figure BDA0003933471370000151
Figure BDA0003933471370000152
这两个二维映射分别表示通道方向上的均值池化特征和最大值池化特征;
然后,通过一个卷积层将两个特征连接起来并进行卷积操作,生成二维空间注意力特征图谱。空间注意力的具体计算方法如下:
Figure BDA0003933471370000153
其中,s表示Sigmoid激活函数,f7×7表示卷积操作采用尺寸为7×7的卷积核。
通道注意力模块和空间注意力模块采用串行排列的方式构成CBAM注意力模块。CBAM注意力模块的引入提升了译码器网络的特征提取能力,使得译码器网络在根据压缩码字进行解码操作时能够保留尽可能多的细节特征,降低信息损耗,提高基站端译码能力,提升网络信道状态信息重建性能。
所述的CBAM-CsiNet神经网络模型的损失函数为译码器网络输出的信道矩阵
Figure BDA0003933471370000154
与真实信道矩阵H的均方误差,用公式表示为:
Figure BDA0003933471370000155
其中,T为训练集的所有样本数,||·||2为Frobenius范数。
使用步骤1产生的100000个训练集信道矩阵H样本训练搭建好的神经网络模型,选用Adam优化器进行梯度优化,采用端到端的学习方式联合训练编码器网络和译码器网络的参数,主要包括权重、偏置、步长和卷积核大小等参数,使得损失函数最小,并趋于平稳。其中,Adam算法中采用的学习率为0.001,每次迭代是使用训练集中的512个样本来计算梯度,并根据Adam算法的公式更新参数,以此方式遍历整个训练集1000次。完成训练后保存相关模型权重参数,之后可以用测试集测试网络模型的性能。
测试性能表现良好的CBAM-CsiNet网络模型可以用于MIMO系统的信道状态信息反馈。将空频域信道状态信息转变为角延迟域的信道矩阵H,输入CBAM-CsiNet架构,输出即为模型重建后的信道矩阵
Figure BDA0003933471370000161
将该矩阵进行二维逆离散傅里叶变换,即可以恢复出原空频域的信道状态信息。
经过测试可得,本实施例的基于CBAM-CsiNet神经网络模型算法的大规模MIMO通信系统下的信道状态信息反馈及重建方法性能明显优于传统算法及现有的深度学习算法,如表1所示。其中NMSE表示归一化均方误差,计算重建信道矩阵
Figure BDA0003933471370000162
与原始信道矩阵H之差的平方的期望值;r表示重建信道矩阵
Figure BDA0003933471370000163
与原始信道矩阵H之间的余弦相似度。
表1本实施例算法与其他算法性能测试结果对比
Figure BDA0003933471370000171
总之,本发明针对传统的信道状态信息(Channel State Information,CSI)反馈及重建算法过于依赖信道的完美稀疏性、反馈开销大和CSI重建能力弱,以及现有的基于深度学习算法的CSI反馈及重建方法特征提取能力相对较弱,CSI重建性能尤其是低压缩率下CSI反馈及重建性能不佳的缺陷,本发明通过设计搭建深度神经网络CBAM-CsiNet网络模型,结合卷积层、卷积块注意力模块(CBAM)等构建RefineNet+模块,大幅度提高模型算法特征提取能力和CSI重建性能,尤其使得低压缩率下CSI反馈及重建性能得到明显提升;并通过使用信道矩阵数据作为驱动,大幅度降低了算法对于信道完美稀疏性的依赖性。同时,本发明模型采用线下训练和线上测试的方式,将计算量和开销转移到线下训练过程,大幅度降低了算法实际应用中的反馈开销。理论分析和仿真结果均表明,本发明相较于现有算法有明显的优越性。

Claims (5)

1.一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法,其特征在于,包括以下步骤:
步骤1:搭建深度神经网络模型CBAM-CsiNet,该模型包含编码器网络、译码器网络、CBAM注意力模块,其中,编码器网络位于用户终端,用于将信道矩阵H压缩编码为维度更低的码字s,译码器网络位于基站端,用于从反馈链路传来的码字s中重建出原始信道矩阵的估计值
Figure 31445DEST_PATH_IMAGE002
步骤2:使用COST 2100模型在室内和室外条件下分别产生训练、验证和测试需要的样本数据集;
步骤3:将搭建好的CBAM-CsiNet神经网络模型在训练集上进行训练,使得
Figure 417427DEST_PATH_IMAGE004
和H尽可能接近,选用Adam梯度优化算法进行梯度优化,使得损失函数降低到最小,并最终趋于平稳;
步骤4:保存步骤3中训练好的模型参数,包括权重、偏置、步长和卷积核大小;
步骤5:加载保存好的模型参数,在测试集上进行模型性能测试;
步骤6:将测试性能最好的模型用于信道状态信息反馈和重建,在用户端对MIMO信道状 态信息在空频域的信道矩阵
Figure DEST_PATH_IMAGE005
做二维离散傅立叶变换,获得在角延迟域稀疏的信道矩阵H, 将信道矩阵H从部署在用户终端的编码器网络输入,经过压缩编码后,经反馈链路传输到基 站端,基站端的译码器网络通过译码得到原始信道矩阵估计值
Figure DEST_PATH_IMAGE007
2.根据权利要求1所述的一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法,其特征在于,步骤1中,编码器网络包含一个卷积层和一个全连接层,对网络各层的参数进行随机初始化,编码器网络的输入是角延迟域稀疏的信道矩阵H,输出是压缩编码后得到的码字s,该码字是比H维度低的一维矢量;
码字s通过反馈链路被传送到基站端,通过基站端的译码器网络进行译码操作,得到原始信道矩阵估计值;
译码器网络包含一个全连接层、两个RefineNet+单元和一个卷积层,对译码器网络各层参数进行随机初始化操作,将码字s输入到译码器网络当中,输出与信道矩阵H同维度的重建信道矩阵估计值;
CBAM注意力模块包含通道注意力模块和空间注意力模块两个部分,给定一个中间特征图,CBAM注意力模块按照通道和空间两个独立的维度依次推断注意力图谱,然后将注意力图谱乘到输入特征图中进行自适应特征细化;其中,通道注意力模块利用通道间的特征关系来生成通道注意力特征图,用于寻找网络需要关注的重点输入特征;空间注意力模块通过特征空间的空间关系生成空间注意力特征图,用于寻找需要提取的重要信息特征所在的位置,通道注意力模块和空间注意力模块采用串行排列的方式构成CBAM注意力模块;
译码器网络的最后一个卷积层使用Sigmoid激活函数,编码器网络和译码器网络的其余各卷积层均采用ReLU激活函数并使用批量标准化操作,全连接层采用线性激活函数。
3.根据权利要求1所述的一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法,其特征在于,步骤2的具体方式为:
使用COST 2100模型,在5.3GHz的室内微微蜂窝场景和300MHz室外乡村场景下产生150000个空频域信道矩阵样本,并将矩阵样本数据划分为训练集、验证集和测试集;其中,训练集包含100000个样本数据,用于驱动神经网络模型训练,验证集包含30000个样本数据,用于验证训练过程中的模型收敛情况,测试集包含20000个样本数据,用于测试神经网络模型的训练效果。
4.根据权利要求1所述的一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法,其特征在于,步骤3采用Adam梯度优化算法和端到端的学习方式,联合训练编码器网络和译码器网络参数,使得损失函数最小;损失函数为译码器网络输出的原始信道矩阵估计值
Figure DEST_PATH_IMAGE009
与真实信道矩阵H的均方误差,损失函数L具体表示如下:
Figure 102224DEST_PATH_IMAGE010
其中,T为训练集的所有样本数,
Figure DEST_PATH_IMAGE011
为欧几里得范数,下标i表示估计出的信道矩阵与 原始信道矩阵的编号。
5.根据权利要求2所述的一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法,其特征在于,所述RefineNet+单元由1个输入层、3个卷积层和1个CBAM注意力模块组成,通过跳跃连接结构将输入层的数据、第三个卷积层的输出和CBAM注意力模块的输出三者相加,作为RefineNet+单元的输出。
CN202211395637.6A 2022-11-09 2022-11-09 基于深度学习的大规模mimo信道状态信息反馈及重建方法 Pending CN116248156A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211395637.6A CN116248156A (zh) 2022-11-09 2022-11-09 基于深度学习的大规模mimo信道状态信息反馈及重建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211395637.6A CN116248156A (zh) 2022-11-09 2022-11-09 基于深度学习的大规模mimo信道状态信息反馈及重建方法

Publications (1)

Publication Number Publication Date
CN116248156A true CN116248156A (zh) 2023-06-09

Family

ID=86633749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211395637.6A Pending CN116248156A (zh) 2022-11-09 2022-11-09 基于深度学习的大规模mimo信道状态信息反馈及重建方法

Country Status (1)

Country Link
CN (1) CN116248156A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117220745A (zh) * 2023-11-08 2023-12-12 北京邮电大学 基于深度学习的多用户信道状态信息联合压缩反馈方法
CN117376064A (zh) * 2023-11-27 2024-01-09 浙江大学 一种基于空频相关性的信道获取方法
CN117528756A (zh) * 2023-11-11 2024-02-06 国网吉林省电力有限公司信息通信公司 一种用于无线网络的时频同步方法及系统
CN117856848A (zh) * 2024-03-08 2024-04-09 北京航空航天大学 一种基于自动编码器结构的csi反馈方法
CN117914657A (zh) * 2024-03-15 2024-04-19 齐鲁工业大学(山东省科学院) 基于FFDNet的毫米波大规模MIMO系统信道估计方法
CN119030579A (zh) * 2024-07-11 2024-11-26 湖南大学 一种基于深度学习的大规模mimo下行csi反馈方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108390706A (zh) * 2018-01-30 2018-08-10 东南大学 一种基于深度学习的大规模mimo信道状态信息反馈方法
CN110912598A (zh) * 2019-11-22 2020-03-24 中原工学院 基于长短时注意力机制的大规模mimo系统csi反馈方法
US20210410135A1 (en) * 2020-06-26 2021-12-30 Huawei Technologies Canada Co., Ltd. Deep-learning for distributed channel feedback and precoding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108390706A (zh) * 2018-01-30 2018-08-10 东南大学 一种基于深度学习的大规模mimo信道状态信息反馈方法
CN110912598A (zh) * 2019-11-22 2020-03-24 中原工学院 基于长短时注意力机制的大规模mimo系统csi反馈方法
US20210410135A1 (en) * 2020-06-26 2021-12-30 Huawei Technologies Canada Co., Ltd. Deep-learning for distributed channel feedback and precoding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WOO, S., PARK, J., LEE, JY., KWEON, I.S.: "CBAM: Convolutional Block Attention Module", LECTURE NOTES IN COMPUTER SCIENCE, vol. 11211, 6 October 2018 (2018-10-06), pages 3 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117220745A (zh) * 2023-11-08 2023-12-12 北京邮电大学 基于深度学习的多用户信道状态信息联合压缩反馈方法
CN117220745B (zh) * 2023-11-08 2024-02-09 北京邮电大学 基于深度学习的多用户信道状态信息联合压缩反馈方法
CN117528756A (zh) * 2023-11-11 2024-02-06 国网吉林省电力有限公司信息通信公司 一种用于无线网络的时频同步方法及系统
CN117376064A (zh) * 2023-11-27 2024-01-09 浙江大学 一种基于空频相关性的信道获取方法
CN117856848A (zh) * 2024-03-08 2024-04-09 北京航空航天大学 一种基于自动编码器结构的csi反馈方法
CN117856848B (zh) * 2024-03-08 2024-05-28 北京航空航天大学 一种基于自动编码器结构的csi反馈方法
CN117914657A (zh) * 2024-03-15 2024-04-19 齐鲁工业大学(山东省科学院) 基于FFDNet的毫米波大规模MIMO系统信道估计方法
CN119030579A (zh) * 2024-07-11 2024-11-26 湖南大学 一种基于深度学习的大规模mimo下行csi反馈方法
CN119030579B (zh) * 2024-07-11 2025-12-09 湖南大学 一种基于深度学习的大规模mimo下行csi反馈方法

Similar Documents

Publication Publication Date Title
CN108390706B (zh) 一种基于深度学习的大规模mimo信道状态信息反馈方法
CN109672464B (zh) 基于fcfnn的大规模mimo信道状态信息反馈方法
CN110311718B (zh) 一种大规模mimo信道状态信息反馈中的量化和逆量化方法
CN116248156A (zh) 基于深度学习的大规模mimo信道状态信息反馈及重建方法
Chen et al. Deep learning-based implicit CSI feedback in massive MIMO
CN111630787B (zh) 基于深度学习的mimo多天线信号传输与检测技术
CN110350958B (zh) 一种基于神经网络的大规模mimo的csi多倍率压缩反馈方法
CN113098804B (zh) 一种基于深度学习与熵编码的信道状态信息反馈方法
Liao et al. CSI feedback based on deep learning for massive MIMO systems
CN111464220B (zh) 一种基于深度学习的信道状态信息重建方法
Lu et al. Bit-level optimized neural network for multi-antenna channel quantization
CN108847876B (zh) 一种大规模mimo时变信道状态信息压缩反馈及重建方法
Chen et al. A novel quantization method for deep learning-based massive MIMO CSI feedback
Feng et al. Deep learning-based joint channel estimation and CSI feedback for RIS-assisted communications
CN101304300A (zh) 基于有限反馈的多用户mimo系统信道量化方法和装置
CN111555781B (zh) 一种基于深度学习注意力机制的大规模mimo信道状态信息压缩及重建方法
CN114553280B (zh) 一种基于深度学习大规模mimo系统的csi反馈方法
CN114884549A (zh) 基于深度学习的大规模mimo信道状态信息反馈方法
CN113660020A (zh) 一种无线通信信道信息传输方法、系统和解码器
CN116155333A (zh) 一种适用于大规模mimo系统的信道状态信息反馈方法
CN115865145A (zh) 一种基于Transformer的大规模MIMO信道状态信息反馈方法
Sadeghi et al. Deep learning-based massive MIMO channel estimation with reduced feedback
Liu et al. CSI feedback based on complex neural network for massive MIMO systems
TWI669921B (zh) 基於深度學習作為通道狀態資訊之回饋方法
Sun et al. An effective network with discrete latent representation designed for massive MIMO CSI feedback

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination