智能无线通信技术研究概况Word格式文档下载.docx

资源描述

智能无线通信技术研究概况Word格式文档下载.docx

《智能无线通信技术研究概况Word格式文档下载.docx》由会员分享，可在线阅读，更多相关《智能无线通信技术研究概况Word格式文档下载.docx（16页珍藏版）》请在冰豆网上搜索。

智能无线通信技术研究概况Word格式文档下载.docx

在这一背景下，近年来快速发展的人工智能（AI,artificialintelligence）技术为解决无线通信技术发展中遇到的困境带来了新的思路。

机器学习在AI发展中发挥了重要作用，它能够直接从海量数据中学习到所需的隐藏规律，并利用这些规律做出相应的预测或决策。

AI在计算机领域已经得到广泛的应用，主要包括深度学习（DL,deeplearning）、深度强化学习（DRL,deepreinforcementlearning）以及联邦学习（FL,federatedlearning）三类机器学习方法。

其中，DL利用深度神经网络（DNN,deepneuralnetwork）建立源数据与目标数据间的映射关系，从而能够根据未知源数据预测对应的目标数据，目前它主要被应用在计算机视觉和自然语言处理等领域。

DRL则是一类在动态环境中做出最优决策的机器学习方法，它首先通过与环境交互来记录经验，然后利用DNN分析环境存在的规律，最后据此做出最优决策，目前主要被应用在机器人控制等领域。

无论是DL还是DRL，它们都需要收集和处理海量的数据，因而产生了数据隐私和安全性问题。

为解决这一问题，FL被提出用于保护数据隐私的协同学习，目前主要被应用在数据敏感的学习任务中，如输入法联想词预测等。

AI的数据驱动特性正好可以解决传统无线通信系统设计中因依赖专家知识和优化算法而产生的问题。

此外，AI的自动控制能力也契合了运营商一直以来致力于减少人工对网络管理和维护的干预，从而降低运作成本的目标。

因此，AI无疑会为无线通信的发展带来新的机遇。

目前，AI中的DL、DRL和FL等机器学习方法已经被成功用于解决无线通信中的某些问题，为无线通信技术的发展带来了深远影响。

值得注意的是，这些机器学习方法最初都是针对计算机领域的特定任务而诞生的，其设计并没有考虑无线通信中的特点。

为了最大化AI带来的性能增益，在利用AI发展无线通信技术时，需要根据无线通信的特点和所需完成的任务来选择合适的机器学习方法并进行针对性的设计。

本文通过介绍AI中的DL、DRL和FL三类主要的机器学习方法及其在无线通信领域应用的研究进展，分析AI在解决不同无线通信问题时的原理、适用性、设计方法和优缺点，并针对这些方法的局限性指出未来智能无线通信技术的发展趋势和研究方向。

2背景知识

2.1深度学习概述

DL是近年来人工智能领域应用最广泛的一类机器学习方法，其基本思想是利用DNN来拟合源数据与目标数据的关系[2,9]。

图1展示了一个简单的DNN结构。

DNN的基本单位是神经元，神经元间的连线表示信息的传递，而连线的箭头方向为信息传递的方向。

此外，神经元的排列具有层次结构。

根据信息传递的方向，该DNN中的神经元分别构成了一个输入层、多个隐含层（又称隐层）和一个输出层。

每个神经元的输入信息由与之连接的上一层神经元的输出经缩放与求和得到，该缩放值称为权值。

而后，信息再通过神经元的激活函数处理后传递至与之连接的下一层神经元。

为了更好地理解，图2展示了属于图1所示DNN中隐层1某神经元的内部结构。

其中，激活函数为DNN带来非线性表征能力，常用的激活函数有Sigmoid[10]、tanh、ReLu[11]等。

图1DNN结构

图2DNN中隐层1某神经元的内部结构

若给定DNN中的神经元连接方式和权值，源数据通过输入层进入DNN后，经过神经元间的信息传递规则层层传递后在输出端可以得到相应的目标数据预测值。

这一过程称为正向传播。

若此时训练数据集中有此源数据对应的目标数据真实值，那么DNN可以比对真实值与预测值间的误差，并将误差值从输出层逐层向前传递，以此调整各个神经元的权值，这一过程称为误差反向传递。

在DL的训练阶段，随机梯度下降算法利用训练数据集反复进行以上2个步骤，直至各神经元的权值收敛，则DNN的训练结束。

完成训练后的DNN可以有效地表征源数据和目标数据间的关系，从而能根据未知的源数据预测其目标数据值。

值得注意的是，训练DNN仅能调整DNN中神经元的权值，而不能改变神经元的排列结构和连接方式，即DNN的结构。

由图1可知，源数据和目标数据的维度决定了DNN的输入层和输出层，因此隐层的结构决定了DNN的结构。

在图1DNN的隐层中，所有的神经元都相互连接，这样的结构称为全连接层（fully-connectedlayer）。

虽然全连接层是最简单的神经元排列结构，但是它理论上可以捕捉数据间的所有特征。

然而，采用全连接层会使权值的数量随着神经元个数的增加而呈指数上升，容易造成训练时间过长、泛化能力差等问题。

因此，设计最优的DNN需要根据数据的特征或任务特点采用合适的隐层。

根据所采用的不同隐层结构，常见的DNN有卷积神经网络（CNN,convolutionalneuralnetwork）[5]、循环神经网络（RNN,recurrentneuralnetwork）[12]、长短期记忆（LSTM,longshorttermmemory）[13]神经网络。

其中，CNN适用于处理具有局部相似特性的数据，而RNN和LSTM则擅长处理序列信息。

此外，还有一类称为自动编码器（autoencoder）[14]的特殊DNN结构，可以通过训练得到最优的编码器和解码器。

2.2深度强化学习概述

作为机器学习的另一重要分支，DRL的目标是在动态环境中做出最优决策[15]。

决策者被称为智能体。

DRL的技术内涵是在强化学习（RL,reinforcementlearning）[16]的基础上发展而来的。

传统的RL技术可以分为基于值和基于策略这2种方法，其具体介绍请参见附录。

如附录的分析可知，无论是哪种RL方法，都存在较大的局限性，因而难以被广泛应用。

DRL通过结合DL来克服传统RL技术中存在的局限性。

其中，基于值的RL方法需要建立表格来存储值函数，由此产生了维度爆炸问题。

为此，DNN被提出用于拟合值函数，也被称为深度Q网络（DQN,deepQ-network）。

DQN的输出记为Q（s,a;

θ），对应RL中的值函数

Q（s,a）。

其中，θ是DQN的权值。

为了提高决策的精准度，智能体需要利用它与环境互动时记录下的经验对θ

进行迭代训练和更新。

进一步地，文献[3]提出经验回放和拟静态目标网络（quasi-statictargetnetwork）技术来提高DQN的训练效率和准确性。

在经验回放中，智能体构建一个大小为M

的先入先出（FIFO,firstinputfirstoutput）队列来存储经验，因此该队列被称为经验池M

。

然后，每次更新权值θ

时，智能体将从经验池中随机调用B

个经验组成经验集合B

来进行批量梯度下降。

在拟静态目标网络中，智能体将构建2个DQN，一个用于实时训练（称为训练DQN），另一个则被用于获得较稳定的目标值估计值（称为目标DQN）。

每隔K

时刻，智能体将当前时刻的训练DQN同步为新的目标DQN。

以上介绍的是DeepMind团队于2015年提出的深度Q学习（DQL,deepQ-learning）算法[3]。

此后，在DQL算法基础上相继发展出了双深度Q学习（doubledeepQ-learning）算法[17]和竞争深度Q学习（duelingdeepQ-learning）算法[18]。

上述算法都需要借助值函数，因而被称为基于值的DRL方法。

虽然基于值的DRL方法允许连续的状态空间，但是它们在动作选取时依旧需要遍历所有动作的值函数。

因此，它们只能被用于解决具有离散动作空间的问题。

为了既能实现连续动作的选取，又能提高数据利用率和决策的稳定性，人们结合基于策略和基于值这2种方法的特点提出了深度确定性策略梯度（DDPG,deepdeterministicpolicygradient）算法[19]。

DDPG使用了2个分别称为动作家（actor）和评论家（critic）的DNN。

其中，评论家用于评估值函数，而动作家则用于建立值函数与动作的映射关系。

相较于基于值的DRL方法，DDPG直接从动作家获得动作，而不是选择值函数最大的动作。

具有动作家和评论家架构的方法称为基于动作评论家（AC,actor-critic）的DRL方法。

除DDPG外，近端策略优化（PPO,proximalpolicyoptimization）[20]和异步优势动作评价（A3C,asynchronousadvantageactor-critic）[21]也是基于AC的代表算法。

2.3联邦学习概述

DL和DRL都需要利用大量数据对DNN进行训练。

传统的训练方法首先需要假设存在一个完整的训练数据集D，然后通过优化DNN的权值使DNN可以对数据集D

进行最优拟合。

其中数据集D

由源数据集X={

x1,…,xN

}和相应的目标数据集Y={

y1,…,yN}构成。

若DNN的权值记为θ，则训练DNN的目标是最小化损失函数

其中，Li（θ）是描述DNN在权值θ

下对

的输出与其真实目标数据

间差异的损失函数。

因此，θ

应该向

L（θ）梯度下降的方向更新，即

通过数据集D

和式

（2）可以对DNN的权值进行迭代更新，并最终获得最优的权值。

然而，在无线通信系统中，建立这样一个完整的训练数据集往往是难以实现的。

一方面，无线通信系统中的数据具有天然的分布式特性，在数据收集的过程会产生巨大的通信开销。

例如，系统中各个用户的通信设备都会自主产生大量数据。

另一方面，这些数据有可能包含用户个人信息或归属不同的利益集团。

出于对个人隐私和数据安全的考虑，数据的拥有者不会轻易地将数据与不信任的第三方共享。

基于这一背景，FL被提出用于多个智能体在不需要共享训练数据的前提下对DNN进行协作训练[4]。

通过观察式

（2），若将D

划分成多个子集D1,…,D

J，则有

其中，Nj

是数据集jD

的大小。

从式（3）可以看出，θ

基于数据集D

的更新可以分解为θ

关于多个子数据集的更新。

利用这一特性，FedAvg算法[8]被提出用于多个拥有本地数据集的智能体共同训练一个全局DNN。

其训练过程主要包含2个迭代的步骤，即本地训练和全局更新。

在本地训练中，智能体首先从服务器下载最新的全局DNN权值，然后利用本地数据集对DNN进行训练，并将训练后的DNN权值与此前下载的全局DNN权值的差值（又称权值更新值）发送至服务器。

在全局更新中，服务器将从各智能体收集得到的权值更新值进行平均运算后再与全局DNN的权值进行合并。

2.4小结

作为支撑AI的三类重要的机器学习方法，DL、DRL和FL均有其特定的适用性。

其中，DL的本质是利用DNN对源数据和目标数据进行拟合，建立源数据和目标数据之间的关系。

因此，DL适用于数据预测和判决问题。

DRL通过试错（trial-and-error）的过程在与环境不断交互中学习到隐含的规律并据此做出最优决策，因而适用于解决动态系统或动态环境中的决策问题。

针对DL和DRL中存在的数据隐私问题，FL通过仅传输DNN权值来避免数据泄露，从而实现了对原始数据的保护。

因此，FL适用于所有需要多智能体协作训练，但对隐私保护有较高要求的问题。

下面，本文将具体阐述这三类机器学习方法在无线通信系统中的应用，包括无线传输、频谱管理、资源配置、网络接入、网络及系统优化5个方面，以支持智能无线通信的实现。

3无线传输

3.1信道估计

在无线通信中，发送端向接收端发送的信号会受信道的影响发生畸变。

因此，为了正确检测发送信号，接收端需要对信道状态信息（CSI,channelstateinformation）进行估计并以此对信号进行均衡处理。

信道估计通常包括2个步骤：

首先发送端向接收端发送导频信号；

然后接收端根据接收到的导频对CSI进行估计。

未来无线通信系统的用户规模和天线阵列规模都将急剧增大，这会给传统的信道估计方法带来挑战。

一方面，能用于精确估计信道的正交导频资源有限，而采用非正交导频会极大降低信道估计的准确性。

另一方面，随着系统规模增大，经典信道估计算法的计算复杂度也在攀升。

鉴于信道估计是一个从接收导频推测CSI的过程，DL可以有效地解决这一类问题。

受传统最小均方误差（MMSE,minimummeansquareerror）信道估计器的启发，文献[22]提出了一种基于DL的MMSE信道估计方案。

作者首先根据MMSE估计器的结构设计DNN结构，在信道协方差矩阵为拓普利兹矩阵（Toeplitzmatrix）的假设下，利用CNN来降低DNN的计算复杂度。

仿真结果表明，在协方差矩阵不是拓普利兹矩阵的3GPP信道模型中，该方案依然能在较低的运算复杂度下获得比传统信道估计方法更低的信道估计误差。

同样是从传统信道估计方法出发，文献[23]针对导频非正交分配下的信道估计问题，将DNN与最小二乘信道（LS,leastsquare）估计器相结合。

其中，DNN被用于对因采用非正交导频造成的导频污染进行降噪，而LS估计器被用于利用降噪后的导频进行信道估计。

在处理高维信号时，作者证明了该方案能以更低的计算复杂度获得与MMSE相同的渐进性能。

此外，文献[24]考虑了单频相移键控信号的信道估计问题。

对于单频信号而言，其CSI由载频偏移值（CFO,carrierfrequencyoffset）和定时偏移值（TO,timingoffset）决定。

因此，文献[24]提出使用DNN建立接收导频与CFO和TO间的映射关系，从而对CSI进行准确估计。

值得注意的是，文献[22-24]采用了传统导频设计方案。

为了进一步提升性能，文献[25]利用DL对导频设计和信道估计进行联合设计。

在该文献中，作者考虑一个多输入多输出（MIMO,multi-inputmulti-output）系统中的多用户上行信道联合估计问题。

为了得到符合信道特性的最优导频序列和信道估计器，作者基于自动编码器将DNN设计为导频设计模块和信道估计模块两部分。

在利用真实CSI数据集对DNN进行离线训练后，得到的导频设计模块和信道估计模块可以分别在发送端和接收端进行在线部署。

仿真结果显示，该方案产生的均方误差（MSE,meansquareerror）比经典线性最小均方误差（LMMSE,linearMMSE）算法产生的MSE低40%。

3.2信道预测和反馈

除了在接收端需要进行信道估计外，为提升频谱效率，MIMO系统中的发送端也需要获取CSI对信号进行预编码，从而进行多信息流的并行传输。

然而，这在采用频分复用（FDD,frequencydivisionduplexing）的大规模MIMO系统难以进行实现。

在大规模MIMO系统中，基站的天线数远大于用户数及用户终端的天线数。

因此，从用户到基站的上行CSI在基站端容易估计得到。

然而，基站到用户的下行CSI数据量庞大，若让用户终端进行信道估计并直接向基站进行反馈，回传链路会因此过载[26]。

与此同时，由于FDD系统中上下行信道频率不同，基站也无法从上行CSI直接得到下行CSI，即不存在信道互异性。

为此，文献[27-28]尝试通过信道预测来解决这一问题。

虽然FDD系统中的上下行信道不存在严格的互异性，但是其信道存在共性。

例如，因为信号经过的散射物体是一致的，所以其多径方向大致相同[29]。

基于这一原理，文献[27-28]提出使用DL来挖掘上行CSI与下行CSI之间的映射关系。

其中，文献[27]设计了一个由卷积层和全连接层构成的DNN来提取上、下行CSI的映射关系。

仿真结果显示，该方案在不同信道数据集上的性能差异较大，其稳定性欠佳。

文献[28]进一步利用多径数量通常少于接收天线数的稀疏性设计了一个稀疏复值神经网络（SCNet,sparsecomplex-valuedneuralnetwork）来对上、下行CSI的关联性进行分析。

SCNet通过减少中间层的神经元个数来迫使DL提取上、下行CSI共同包含的关键共性信息，从而获得更高的预测准确率。

降低反馈开销是另一种解决思路。

文献[30-31]利用自动编码器对CSI进行压缩，通过仅传输CSI压缩值来降低回传链路负载。

其中，文献[30]考虑了室内环境下的大规模MIMO系统。

在该环境下，信道矩阵具有低秩特性。

因此，作者首先对信道矩阵进行角度域的二维离散傅里叶变换后去除零元素，然后提出了一个名为CsiNet的自动编码器对非零元素进行压缩编码和重构。

CsiNet的编码器部分模仿压缩感知算法中的投影操作，由卷积层和全连接层构成，而CsiNet的解码器部分则由提炼网络RefineNet构成。

仿真结果表明，CsiNet能够获得比压缩感知算法更高的CSI重构质量。

文献[31]进一步考虑了信道时变带来的影响。

为了挖掘相邻时刻CSI的相关性，文献[31]在CsiNet基础上引入了LSTM层，提出了CsiNet-LSTM。

CsiNet-LSTM对多个时刻的CSI进行同时处理，提高了对时变CSI的压缩和重构质量。

3.3信号检测

信号检测是实现无线传输的重要组成部分，其目标是从接收信号恢复发送信号。

传统的信号检测方法需要首先根据发送信号、信道和噪声的先验概率来构建接收信号的后验概率，然后依据后验概率进行判决。

显然，若系统对信道和噪声的先验知识不完美，信号检测准确率将会降低。

此外，当发送信号比较复杂时，例如在MIMO、正交频分复用（OFDM,orthogonalfrequency-divisionmultiplexing）等技术的引入后，信号检测的复杂度会极大地提升。

作为典型的判决问题，信号检测问题可以被DL高效求解。

在MIMO系统中，现有的文献提出了最大似然（ML,maximumlikelihood）、消息传递（MP,messagepassing）、近似消息传递（AMP,approximateMP）等经典检测算法。

这些算法基于迭代结构，其计算复杂度较高。

文献[32-35]从经典的MIMO信号检测算法出发，将它们的迭代结构展开成DNN中的层结构，即DNN中的每一层对应原算法中的一次迭代。

以文献[32]为例，作者利用DL将正交AMP（OAMP,orthogonalAMP）检测器展开。

为了避免在直接计算后验概率时对高维矩阵进行积分，OAMP算法需要迭代地近似接收信号的后验概率。

其中，有部分迭代变量需要人工设置更新步长，而不合适的步长会导致过多的迭代步数且增加计算复杂度。

为此，文献[32]设计了一种OAMP-Net，它将每一次迭代运算展开为一层神经元的内部连接，而更新步长由神经元的权值决定。

在给定DNN层数后，OAMP-Net可以从大量数据中学习到迭代变量每次更新的最优步长。

仿真结果表明，OAMP-Net可以在极低的运算复杂度下获得比OAMP和LMMSE更低的误比特率。

基于类似的思想，文献[33-35]分别利用DNN对MP、共轭梯度下降（CGD,conjugategradientdescent）和ML检测算法进行了展开，将其中需要人工调节的更新步长转变为可以从训练数据中学习得到的神经元权值。

仿真结果显示，它们都能以更低的计算开销获得比原经典算法更优的检测准确率。

文献[32-35]提出的方案依赖于准确的信道估计。

由于信道估计的误差会传播到信号检测中，信号检测的准确率将会降低，文献[36]提出将信道估计与信号检测进行联合处理，考虑的是OFDM系统，其中每个OFDM帧包含导频和发送数据。

作者采用了一个由全连接层构成的DNN将接收到的OFDM帧直接映射为发送数据。

仿真结果表明，该方案在导频数量较少或缺少循环前缀时可以获得比传统的LS和MMSE检测器更优的性能。

更进一步，文献[37-39]利用自动编码器设计了端到端的信号编码与检测系统。

虽然文献[37-39]分别考虑了单输入单输出（SISO,single-inputsingle-output）、单输入多输出（SIMO,single-inputmulti-output）和1bitOFDM这3种不同的无线通信系统，但是它们所采用的方法是类似的。

首先，一个DNN被设计用于模拟通信系统的编码和解码过程，其输入为发送端的原始信号，而输出则是接收端解码后的信号。

然后，引起信号畸变的信道响应被抽象为DNN中的一层。

在使用大量信道数据训练后，自动编码器可以根据发送信号和信道的内在特征对导频、信道估计和信号检测进行最优的联合设计。

当训练完成后，自动编码器的编码模块和解码模块将分别部署于发送端和接收端来进行通信。

仿真结果表明，由于基于DL的端到端的设计方案可以充分挖掘和利用原始信号及信道的先验知识，它们相较于传统方法可以取得明显的性能优势。

然而，端到端的设计方案完全依赖于原始信号和信道的训练数据集，它们在面对未知环境下的泛化性值得探讨，而目前尚未有相关研究。

4频谱管理

4.1频谱感知

频谱是进行无线通信的基础，但频谱资源却是有限和稀缺的。

为了缓解激增流量和有限频谱之间的矛盾，认知无线电（CR,cognitiveradio）被提出用于提高频谱利用率[40]。

CR的基本思想是允许次用户（SU,secondaryuser）在拥有频谱的主用户（PU,primaryuser）空闲时使用频谱。

显然，准确地判断PU是否在使用频谱是实现CR的关键，相关技术被称为频谱感知（spectrumsensing）技术。

与传统的信号检测和调制识别方法类似，传统的频谱感知技术通过构建检验统计量的似然函数来对PU状态进行判断，例如根据接收信号功率进行

展开阅读全文