CN116248156A

CN116248156A - 基于深度学习的大规模mimo信道状态信息反馈及重建方法

Info

Publication number: CN116248156A
Application number: CN202211395637.6A
Authority: CN
Inventors: 杨朔; 李勇; 刘丽哲; 王斌; 李行健; 朱云飞; 汪畅; 夏金涛; 赵显超
Original assignee: CETC 54 Research Institute
Current assignee: CETC 54 Research Institute
Priority date: 2022-11-09
Filing date: 2022-11-09
Publication date: 2023-06-09

Abstract

本发明公开了一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法，属于通信技术领域。其包括：搭建深度神经网络模型；产生训练、验证和测试需要的样本数据集；将搭建好的模型在训练集上进行训练；保存训练好的模型参数；加载保存好的模型参数，在测试集上进行模型性能测试；将测试性能最好的模型用于信道状态信息反馈和重建，在用户端对MIMO信道状态信息在空频域的信道矩阵做二维离散傅立叶变换，获得信道矩阵，将信道矩阵从用户终端的编码器网络输入，传输到基站端，基站端的译码器网络通过译码得到原始信道矩阵估计值。本发明可大幅度提高模型算法特征提取能力和CSI重建性能。

Description

基于深度学习的大规模MIMO信道状态信息反馈及重建方法

技术领域

本发明属于通信技术领域，涉及无线通信系统的信道状态信息反馈方法，具体来说是一种基于深度学习的大规模多输入多输出(Multiple-in Multiple-out，MIMO)通信系统信道状态信息反馈及重建方法。

背景技术

大规模MIMO因具备提升系统容量、频谱效率、用户体验速率、降低时延和用户间干扰、增强全维覆盖和节约能耗等诸多优点，被认为是5G最有潜力的核心技术之一。

然而，大规模MIMO的发展和应用也面临着诸多问题。例如，大规模MIMO的性能与发射机获得的信道状态信息(Channel State Information，CSI)的质量息息相关。对于上行链路，只需要用户端发送训练导频，BS就可以很容易地通过终端发送的导频来准确估计CSI，而下行链路的CSI获取很难实现，这也是在当前大规模MIMO技术中需要解决的问题。在时分双工(Time Division Duplexing，TDD)模式中，基站端(Base Station，BS)通过上行链路发送训练导频进行信道估计，再利用互易性就可以推断出下行链路的CSI。而在频分双工(Frequency Division Duplexing，FDD)模式中存在弱互易性，这使得通过观察上行链路CSI来推断下行链路的CSI变得困难。在传统的MIMO系统中，FDD系统的下行链路CSI首先由用户端通过下行导频估计获取后反馈给BS，然后采用基于码本或者采用矢量量化的方法来减小反馈开销，但是这种方式在大规模MIMO中是不可行的，因为在BS处使用了大量天线，这将大大增加CSI矩阵的维数，码本的反馈量和设计复杂度会显著提升。同时，由于上下行链路不存在互易性，只能通过上行传输链路反馈下行CSI，占用了上行资源，导致了极大的带宽浪费。因此如何高准确度、低开销地将下行链路信道状态信息反馈到基站就成为了FDD模式下大规模MIMO通信系统发展急需解决的问题。

由于在实际信道物理传播环境中存在共享的局部散射，且大规模MIMO系统的多天线阵列赋予信道一定的空间相关性，因此大规模MIMO系统在用户信道矩阵中表现出联合稀疏性，这也启发了基于压缩感知(Compressive Sensing，CS)的CSI反馈方案的提出。首先将CSI矩阵表示为某个基下的稀疏矩阵，之后通过压缩采样得到更低维度的码字，再利用压缩感知的理论和相关优化算法，从该码字中重建出原CSI矩阵。然而由于真实信道并非完美稀疏的，且基于CS的方法没有考虑到实际应用中信道时延差、信道估计误差、反馈链路误差以及提高重构精度带来的计算复杂度问题，导致该算法无法完整保留信道结构信息，信道重建性能不佳。

随着人工智能技术的快速发展，基于压缩感知理论的深度学习网络模型算法CsiNet被提出并用于信道状态信息反馈及重建。该模型算法属于一种自编码器网络，包含一对编码器和解码器网络。编码器网络在用户端对信道状态信息进行编码，解码器在接收端对反馈信息进行译码重建。通过实验验证该算法性能明显优于传统算法。然而，CsiNet网络对于压缩信息特征的提取能力相对较弱，接收端信道状态信息重建性能仍有较大的提升空间，且CsiNet在低压缩率条件下的重建性能相对较差，这在相干时间较长的大规模MIMO系统下是不可取的。

发明内容

有鉴于此，本发明提供一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法，该方法能够解决FDD系统中CSI反馈信道重建性能差的问题，并在低压缩率条件下仍能保持良好的信道重建性能。

为了实现上述目的，本发明采用的技术方案为：

一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法，包括以下步骤：

步骤1：搭建深度神经网络模型CBAM-CsiNet，该模型包含编码器网络、译码器网络、CBAM注意力模块，其中，编码器网络位于用户终端，用于将信道矩阵H压缩编码为维度更低的码字s，译码器网络位于基站端，用于从反馈链路传来的码字s中重建出原始信道矩阵的估计值

步骤2：使用COST 2100模型在室内和室外条件下分别产生训练、验证和测试需要的样本数据集；

步骤3：将搭建好的CBAM-CsiNet神经网络模型在训练集上进行训练，使得

和H尽可能接近，选用Adam梯度优化算法进行梯度优化，使得损失函数降低到最小，并最终趋于平稳；

步骤4：保存步骤3中训练好的模型参数，包括权重、偏置、步长和卷积核大小；

步骤5：加载保存好的模型参数，在测试集上进行模型性能测试；

步骤6：将测试性能最好的模型用于信道状态信息反馈和重建，在用户端对MIMO信道状态信息在空频域的信道矩阵

做二维离散傅立叶变换，获得在角延迟域稀疏的信道矩阵H，将信道矩阵H从部署在用户终端的编码器网络输入，经过压缩编码后，经反馈链路传输到基站端，基站端的译码器网络通过译码得到原始信道矩阵估计值

进一步地，步骤1中，编码器网络包含一个卷积层和一个全连接层，对网络各层的参数进行随机初始化，编码器网络的输入是角延迟域稀疏的信道矩阵H，输出是压缩编码后得到的码字s，该码字是比H维度低的一维矢量；

码字s通过反馈链路被传送到基站端，通过基站端的译码器网络进行译码操作，得到原始信道矩阵估计值；

译码器网络包含一个全连接层、两个RefineNet+单元和一个卷积层，对译码器网络各层参数进行随机初始化操作，将码字s输入到译码器网络当中，输出与信道矩阵H同维度的重建信道矩阵估计值；

CBAM注意力模块包含通道注意力模块和空间注意力模块两个部分，给定一个中间特征图，CBAM注意力模块按照通道和空间两个独立的维度依次推断注意力图谱，然后将注意力图谱乘到输入特征图中进行自适应特征细化；其中，通道注意力模块利用通道间的特征关系来生成通道注意力特征图，用于寻找网络需要关注的重点输入特征；空间注意力模块通过特征空间的空间关系生成空间注意力特征图，用于寻找需要提取的重要信息特征所在的位置，通道注意力模块和空间注意力模块采用串行排列的方式构成CBAM注意力模块；

译码器网络的最后一个卷积层使用Sigmoid激活函数，编码器网络和译码器网络的其余各卷积层均采用ReLU激活函数并使用批量标准化操作，全连接层采用线性激活函数。

进一步地，步骤2的具体方式为：

使用COST 2100模型，在5.3GHz的室内微微蜂窝场景和300MHz室外乡村场景下产生150000个空频域信道矩阵样本，并将矩阵样本数据划分为训练集、验证集和测试集；其中，训练集包含100000个样本数据，用于驱动神经网络模型训练，验证集包含30000个样本数据，用于验证训练过程中的模型收敛情况，测试集包含20000个样本数据，用于测试神经网络模型的训练效果。

进一步地，步骤3采用Adam梯度优化算法和端到端的学习方式，联合训练编码器网络和译码器网络参数，使得损失函数最小；损失函数为译码器网络输出的原始信道矩阵估计值

与真实信道矩阵H的均方误差，损失函数L具体表示如下：

其中，T为训练集的所有样本数，||·||₂为欧几里得范数，下标i表示估计出的信道矩阵与原始信道矩阵的编号。

进一步地，所述RefineNet+单元由1个输入层、3个卷积层和1个CBAM注意力模块组成，通过跳跃连接结构将输入层的数据、第三个卷积层的输出和CBAM注意力模块的输出三者相加，作为RefineNet+单元的输出。

本发明的有益效果：

(1)与传统基于压缩感知的算法相比，本发明采用基于CBAM-CsiNet神经网络的算法，不依赖于信道的完美稀疏特性，在结构上使用编码器网络代替随机测量方法，用译码器网络代替传统的迭代式重建算法，信道状态信息反馈和重建性能和精度都有了大幅度的上升。

(2)与当前的基于深度学习的算法相比，本发明采用基于CBAM-CsiNet神经网络的算法，由于引入了CBAM注意力模块，其特征提取能力更强，译码过程中保留的关键信息更多，信息损失更小，性能有明显提升，尤其在低压缩率条件下仍能保持良好的重建性能和精度。

附图说明

图1是本发明实施例中CBAM-CsiNet神经网络模型的结构示意图。

图2是本发明实施例中RefineNet+单元的结构示意图。

图3是本发明实施例中CBAM注意力模块的结构示意图。

图4是本发明实施例中通道注意力模块的结构示意图。

图5是本发明实施例中空间注意力模块的结构示意图。

需要说明的是，图1和图2中模块上方的数字表示生成的特征映射的数量。

具体实施方式

下面结合附图对本发明进行详细的描述。

一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法，该方法以深度学习理论为基础搭建了神经网络模型架构，该架构包含了一对编码器和译码器，编码器在移动用户终端，译码器在基站端，通过在信道状态信息数据上训练该神经网络模型，使得编码器能够将信道状态信息压缩编码为低维度码字，再将低维度码字通过反馈链路传送至基站端，由基站端的译码器重建出信道状态信息。

具体来说，该方法包括如下步骤：

步骤6：将性能测试数据指标最好的模型用于信道状态信息反馈和重建，在用户端对MIMO信道状态信息在空频域的信道矩阵

其中，用于性能测试的数据指标可以采用归一化均方误差(NMSE)。

进一步地，步骤2的具体方式为：

与真实信道矩阵H的均方误差，损失函数L具体表示如下：

该方法可降低收发端的计算量、反馈开销，并提升算法信道重建性能和准确性。

以下为一个更具体的例子：

一种大规模MIMO通信系统，其下行链路基站端发送天线数目为N_t＝32，用户接收端使用单根天线，子载波数目为

该大规模MIMO系统采用OFDM信号调制方式。

基于上述条件，使用COST 2100模型在室内和室外条件下分别产生训练、验证和测试需要的样本数据集。具体来说，在5.3GHz的室内微微蜂窝场景和300MHz室外乡村场景下产生150000个空频域信道矩阵样本，并将矩阵样本数据划分为训练集、验证集和测试集。其中，训练集包含100000个样本数据，用于驱动神经网络模型训练，验证集包含30000个样本数据，用于验证训练过程中的模型收敛情况，测试集包含20000个样本数据，用于测试神经网络模型的训练效果。使用

和N_t×N_t 32×32的离散傅里叶变换矩阵F_d和F_a对样本中的每一个空频域的信道矩阵

做二维离散傅里叶变换，从而获得角延迟域上稀疏的信道矩阵

也即是

因为多径到达时延控制在有限的时间范围内，因此在延迟域上，信道矩阵H只有在前

行上有值，因此保留前W＝32行元素值，将其修正为32×32的信道矩阵

CBAM-CsiNet架构中的编码器网络如图1所示，将复数域信道矩阵

的实部和虚部拆分为两个均为32×32大小的特征图，即两个32×32大小的实数矩阵。将这两个矩阵拉直重组为一个2048×1的向量，输入编码器的第二层，即一个含有M个神经元的全连接层，采用线性激活函数，输出M×1的向量s，即为用户终端要传送给基站端的压缩编码后的码字。

CBAM-CsiNet架构中的译码器网络如图1所示，译码器网络包含一个全连接层，两个RefineNet+单元和一个卷积层，RefineNet+单元包含一个输入层、三个卷积层和一个CBAM注意力模块，并将输入层的输入数据通过一个跳跃连接结构与最后一个卷积层的输出、CBAM注意力模块的输出相加，如图2所示。第一层为包含2048个神经元的全连接层，以接收到的码字s为输入，采用线性激活函数，输出2048×1的向量。该向量输入译码器网络的第二层，即一个RefineNet+单元，该单元的第一层为输入层，将上一层输入的2048×1向量重组为两个32×32大小的实数矩阵，分别作为估计的信道矩阵的实部和虚部的初始化值。RefineNet+的第二、三、四层均为卷积层，分别采用8个、16个和2个大小为3×3大小的卷积核，采用适当的零填充、ReLU激活函数和批量标准化操作(Batch Normalization)，使得每次卷积后特征图的尺寸大小均为32×32，与原始信道矩阵H大小保持一致。此外，输入层的数据还通过一个跳跃连接结构与第三个卷积层输出的数据、CBAM注意力模块输出的数据相加，作为整个RefiNet+单元的输出。跳跃链接结构的加入降低了经过卷积层和网络反向传播过程中的信息损失。第一个RefineNet+单元的输出作为第二个RefineNet+单元的输入，第二个RefineNet+单元的结构与第一个RefineNet+单元的结构相同，将其输出的特征图输入译码器的最后一个卷积层，并使用Sigmoid激活函数，将输出值范围限定在[0,1]区间，从而该译码器网络的输出为两个32×32大小的实数矩阵，分别作为最终重建信道矩阵

的实部和虚部。

CBAM注意力模块是一种高效的前馈卷积神经网络，包含通道注意力模块和空间注意力模块两个部分，如图3所示。给定一个中间特征图，模块按照通道和空间两个独立的维度依次推断注意力图谱，然后将注意力图谱乘到输入特征图中进行自适应特征细化。给定一个中间特征

作为输入，CBAM注意力模块逐步预测出一个一维通道注意力图谱

和一个二维空间注意力图谱

整个注意力过程可以概括为：

其中，

表示element-wise乘法，在乘法过程中，通道注意力值沿着空间维度传播做复制，反之亦然。F”是CBAM注意力模块最终输出的精细化结果。

通道注意力模块如图4所示，该模块是利用通道间的特征关系来生成通道注意力特征图。由于特征图的每个通道均相当于是一个特征检测器，因此通道注意力主要用于寻找网络需要关注的重点输入特征。为了更有效地计算通道注意力，需要对输入特征空间的空间维数进行压缩。所述的通道注意力模块当中同时包含了均值池化和最大值池化两种池化操作，均值池化可以有效聚合空间信息特征，最大值池化操作用于寻找不同特征对象的其他相关信息，以获取更精准的通道注意力特征，两种赤化操作相结合的方式，相较于仅使用一种池化操作的方法，能够大幅度提高网络的表征能力。

通道注意力模块的具体操作过程如下：

首先，利用均值池化和最大值池化操作聚合特征图的空间信息，生成两个不同的空间特征图

和

其中

表示均值池化特征，

表示最大值池化特征。

然后，将这两个特征图一起送入一个共享网络，生成通道注意力图谱

所述的共享网络是一个两层的神经网络，包含一个多层感知器(MLP)和一个隐藏层。将两个特征图分别送入共享网络之后，再使用元素求和的方法合并输出特征向量。

通道注意力的计算过程可以表示为：

其中，s表示Sigmoid函数，

且MLP的权值W₀和W₁对于两个输入是共享的。

空间注意力模块如图5所示，主要通过特征空间的空间关系生成空间注意力特征图。与通道注意力不同，空间注意力主要关注需要提取的重要信息特征所在的位置，空间注意力是对通道注意力的补充。为了计算空间注意力，需要首先沿着通道轴的方向分别使用均值池化和最大值池化操作，并将输出向量连接起来生成一个有效的特征描述，之后使用一个卷积层生成空间注意力特征图谱

该注意力特征图谱用于需要特别关注或者抑制的位置进行编码。

空间注意力模块的具体实现步骤如下：

通过使用两个池化操作聚合特征图的通道信息，生成两个二维映射：

和

这两个二维映射分别表示通道方向上的均值池化特征和最大值池化特征；

然后，通过一个卷积层将两个特征连接起来并进行卷积操作，生成二维空间注意力特征图谱。空间注意力的具体计算方法如下：

其中，s表示Sigmoid激活函数，f^7×7表示卷积操作采用尺寸为7×7的卷积核。

通道注意力模块和空间注意力模块采用串行排列的方式构成CBAM注意力模块。CBAM注意力模块的引入提升了译码器网络的特征提取能力，使得译码器网络在根据压缩码字进行解码操作时能够保留尽可能多的细节特征，降低信息损耗，提高基站端译码能力，提升网络信道状态信息重建性能。

所述的CBAM-CsiNet神经网络模型的损失函数为译码器网络输出的信道矩阵

与真实信道矩阵H的均方误差，用公式表示为：

其中，T为训练集的所有样本数，||·||₂为Frobenius范数。

使用步骤1产生的100000个训练集信道矩阵H样本训练搭建好的神经网络模型，选用Adam优化器进行梯度优化，采用端到端的学习方式联合训练编码器网络和译码器网络的参数，主要包括权重、偏置、步长和卷积核大小等参数，使得损失函数最小，并趋于平稳。其中，Adam算法中采用的学习率为0.001，每次迭代是使用训练集中的512个样本来计算梯度，并根据Adam算法的公式更新参数，以此方式遍历整个训练集1000次。完成训练后保存相关模型权重参数，之后可以用测试集测试网络模型的性能。

测试性能表现良好的CBAM-CsiNet网络模型可以用于MIMO系统的信道状态信息反馈。将空频域信道状态信息转变为角延迟域的信道矩阵H，输入CBAM-CsiNet架构，输出即为模型重建后的信道矩阵

将该矩阵进行二维逆离散傅里叶变换，即可以恢复出原空频域的信道状态信息。

经过测试可得，本实施例的基于CBAM-CsiNet神经网络模型算法的大规模MIMO通信系统下的信道状态信息反馈及重建方法性能明显优于传统算法及现有的深度学习算法，如表1所示。其中NMSE表示归一化均方误差，计算重建信道矩阵

与原始信道矩阵H之差的平方的期望值；r表示重建信道矩阵

与原始信道矩阵H之间的余弦相似度。

表1本实施例算法与其他算法性能测试结果对比

总之，本发明针对传统的信道状态信息(Channel State Information，CSI)反馈及重建算法过于依赖信道的完美稀疏性、反馈开销大和CSI重建能力弱，以及现有的基于深度学习算法的CSI反馈及重建方法特征提取能力相对较弱，CSI重建性能尤其是低压缩率下CSI反馈及重建性能不佳的缺陷，本发明通过设计搭建深度神经网络CBAM-CsiNet网络模型，结合卷积层、卷积块注意力模块(CBAM)等构建RefineNet+模块，大幅度提高模型算法特征提取能力和CSI重建性能，尤其使得低压缩率下CSI反馈及重建性能得到明显提升；并通过使用信道矩阵数据作为驱动，大幅度降低了算法对于信道完美稀疏性的依赖性。同时，本发明模型采用线下训练和线上测试的方式，将计算量和开销转移到线下训练过程，大幅度降低了算法实际应用中的反馈开销。理论分析和仿真结果均表明，本发明相较于现有算法有明显的优越性。

Claims

1.一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法，其特征在于，包括以下步骤：

；

。

2.根据权利要求1所述的一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法，其特征在于，步骤1中，编码器网络包含一个卷积层和一个全连接层，对网络各层的参数进行随机初始化，编码器网络的输入是角延迟域稀疏的信道矩阵H，输出是压缩编码后得到的码字s，该码字是比H维度低的一维矢量；

3.根据权利要求1所述的一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法，其特征在于，步骤2的具体方式为：

4.根据权利要求1所述的一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法，其特征在于，步骤3采用Adam梯度优化算法和端到端的学习方式，联合训练编码器网络和译码器网络参数，使得损失函数最小；损失函数为译码器网络输出的原始信道矩阵估计值

与真实信道矩阵H的均方误差，损失函数L具体表示如下：

其中，T为训练集的所有样本数，

为欧几里得范数，下标i表示估计出的信道矩阵与原始信道矩阵的编号。

5.根据权利要求2所述的一种基于深度学习的大规模MIMO信道状态信息反馈及重建方法，其特征在于，所述RefineNet+单元由1个输入层、3个卷积层和1个CBAM注意力模块组成，通过跳跃连接结构将输入层的数据、第三个卷积层的输出和CBAM注意力模块的输出三者相加，作为RefineNet+单元的输出。