基于通感一体化技术的自适应调制方

doi:10.3969/j.issn.1003-3114.2023.01.013
肝病专家咨询引用格式:李本翔,向路平,胡杰,等.基于通感一体化技术的自适应调制方案[J].无线电通信技术,2023,49(1):110-117.
[LI Benxiang,XIANG Luping,HU Jie,et al.Adaptive Modulation Design Assisted by Integrated Sensing and Communication [J].Radio Communications Technology,2023,49(1):110-117.]
基于通感一体化技术的自适应调制方案
李本翔,向路平∗,胡㊀杰,杨㊀鲲
(电子科技大学信息与通信工程学院,四川成都611731)
摘㊀要:通感一体化(Integrated Sensing and Communication,ISAC)技术能够通过共享频谱资源实现通信与感知功
能,进一步提升频谱利用率㊂介绍了ISAC 系统模型,包括传输协议㊁传感模型和通信模型,提出了一种基于ISAC 技术的自适应调制(Adaptive Modulation,AM)方案,利用匹配滤波从回波中提取车辆距离信息,采用深度强化学习(Deep
Reinforcement Learning,DRL)算法,自适应选择下一个时刻的调制模式㊂减少了导频信息㊁提升了信道容量,并且省去信道预测过程,减少了计算资源消耗㊂仿真结果表明,采用深度强化学习自适应选择下一时刻调制模式提升了误码率约束下的最大信道容量,并且相比于传统通信,吞吐量有较大的提升
关键词:通感一体化;6G 移动通信;车载网;自适应调制;深度强化学习中图分类号:TN919.23㊀㊀㊀
文献标志码:A㊀㊀㊀
开放科学(资源服务)标识码(OSID):
文章编号:1003-3114(2023)01-0110-08
Adaptive Modulation Design Assisted by Integrated
Sensing and Communication
LI Benxiang,XIANG Luping ∗,HU Jie,YANG Kun
(School of Information and Communication Engineering,University of Electronic Science and Technology of China,
Chengdu 611731,China)
madAbstract :Integrated Sensing and Communication (ISAC)achieves communication and sensing functi
ons by sharing spectrum
resources,improving spectrum utilization.This paper introduces an ISAC system model,including transmission protocols,sensing
models and communication models,and proposes an ISAC-assisted Adaptive Modulation (AM)scheme with a Deep reinforcement
Learning (DRL)approach where the modulation mode for the next slot is selected based on vehicle distance information extracted from the echo by matched filter.In the proposed ISAC transmission protocol,the number of pilots is reduced to improve the transmission ca-pacity.Additionally,the channel estimation process is eliminated to reduce computing resource consumption.Simulation results show that the maximum channel capacity under Bit Error Rate (BER)constraint is increased by applying DRL for modulation mode selec-tion,and the throughput is significantly increased compared to traditional communication.
Keywords :integrated sensing and communication;6G mobile communication;vehicle network;adaptive modulation;deep rein-forcement learning
收稿日期:2022-10-15
基金项目:国家重点研发计划(2021YFB2900200);国家自然科学基金重点项目(62132004)
Foundation Item :National Key Research and Development Program of China (2021YFB2900200);Key Program of National Natural Science Foundation
of China (62132004)
0 引言
随着无线通信技术的发展,联网设备的数量急剧增加,产生了许多新的通信场景和需求[1-2],例如
车联网(Vehicle-to-Everything,V2X)㊁物联网(Inter-net of Things,IoT)等㊂未来6G 承载多种智能应用的V2X 系统不仅对通信性能有着较高的要求[3],还要完成一定的感知任务㊂然而,随着通信系统的载
波频段不断提升,已经和雷达感知的频段相近,这会对雷达感知造成干扰,同时雷达也会影响通信性能㊂而通感一体化技术(Integrated Sensing and Communi-cation,ISAC)是解决这一问题的关键,并且如今对
于V2X系统中ISAC技术的研究已经获得了学术界和工业界的广泛关注[4]㊂
波士顿咨询公司模型
传统的通信和雷达系统使用不同的正交频带并进行独立设计[5]㊂然而随着大规模天线技术发展和毫米波技术的应用,通信和雷达系统的性能都得到了大幅提升,并且可以共用一些硬件设备和频谱资源,例如大规模天线雷达和大规模天线通信[6]㊂此外,在载波频率达到毫米波频段时,雷达系统与通信系统的信道特性和信号处理方法十分相似[7]㊂正是由于这些相似性,具有感知和雷达集成增益的ISAC被认为是一种很有前景的技术㊂例如,在基于ISAC的V2X网络中,路边单元(Roadside Unit, RSU)通过利用从车辆上反射的ISAC回波信号来预测车辆的位置,从而提供更好的通信服务[8]㊂发射机可以通过多种方式利用回波中的隐藏信息提高通信性能,包括自适应调制(Adaptive Modulation,AM)㊁波束成形和自适应编码等㊂众所周知,AM是一种基于信道估计来实现最优容量的简单且有效的方法[9]㊂通常,发射机从上行导频信号中获取信道信息,并根据误码率(Bit Error Rate,BER)选择调制方案来提升通信性能㊂例如,文献[10]提出了一种自适应编码和调制(Adaptive Coding and Modulation,ACM)技术,该技术根据来自上行导频反馈的飞机之间的距离信息确定调制和编码方式㊂同时,文献[11]使用深度强化学习(Deep Reinforcement Learning,DRL)根据导频反馈的历史信道状态信息(Channel State Information, CSI)预测调制模式㊂然而,在ISAC系统中,发射机可以直接从雷达回波信号中获得信道信息,无需导频交互的过程㊂
如何根据反射的回波做出决策对ISAC系统来说是一个重要的挑战㊂通常,这个过程被分为两个步骤:①从回波中估计反射体的位置和速度信息并由此估计信道状态;②提升各种通信技术[5,12-15]㊂文献
[12]使用匹配滤波估计用户的位置和速度,实时调整车辆的波束宽度,以此来覆盖整个车辆㊂同样,在匹配滤波之后,也可以利用扩展卡尔曼滤波(Extended Kalman Filter,EKF)[13]㊁因子图[14]等方法实现波束预测㊂此外,数据驱动技术也与ISAC 系统相结合用来适应复杂的时变环境[15],例如文献[5]根据估计的信道状态信息采用深度神经网络(Deep Neural Networks,DNNs)进行波束预测㊂这
些研究已经证明了ISAC系统的优越性㊂然而, ISAC系统中自适应调制方案的设计还存在空缺,因此本文主要考虑基于ISAC系统AM的实现,并与传统通信进行比较㊂
本文提出了一种ISAC系统传输协议,能够基于回波预测下一个时刻的调制模式㊂相比于传统通信减少了导频开销,提升了信道容量,并且减少了信道预测过程带来的计算资源消耗㊂为了实现所提出的框架,采用DRL算法来实现AM,根据车辆距离预测下一时刻的调制模式,在保证满足误码率约束同时,最大化通信容量㊂具体来说,RSU从回波中提取车辆的距离信息,并且将历史距离作为DRL状态输入,下一时刻调制模式作为DRL动作输出㊂
1㊀系统建模
如图1所示,本文考虑了V2X场景下基于ISAC的多输入多输出(Multiple-input Multiple-output,MIMO)系统,一个配备了两组均匀线性阵列天线(Uniform Linear Array,ULA)RSU为一辆车提供服务㊂其中,RSU包含N t根发射天线和N r根接收天线㊂通过多天线,RSU能够向车辆发射下行ISAC信号并接收反射回波
图1㊀基于ISAC的系统通信模型
Fig.1㊀ISAC-assisted communication system
1.1㊀传输协议
如图2(a)所示,RSU与车辆之间的传输数据流被划分为不同的时隙㊂在传统通信中的AM策略依赖于车辆的上行导频来获得CSI从而做出决策[10-11],而在车辆高速移动的V2X网络下,
信道状
态时刻变化,频繁的导频交互会导致通信资源的浪费,也会导致信道估计的滞后㊂
ISAC辅助的传输协议可以有效地解决这个问题㊂如图2(b)所示,在本文提出的基于ISAC的传输协议中,发射机连续发送ISAC信号用于下行通信和感知㊂具体来说,ISAC系统将每个时隙分为两个阶段:①信号传输和回波接收;②信号处理㊂例如,在第一阶段,RSU根据上个时隙预测的调制模式传输ISAC信
号并接收回波信号㊂在第二阶段,RSU 首先从回波信号中提取车辆的距离信息,然后根据距离直接预测下一个时隙的调制模式㊂因此,由于舍去了上下行导频信号,ISAC系统下的AM相比于传统通信能较大程度的提升系统容量,并且省去了信道预测的过程,一定程度上减少了计算资源的消耗
(a)传统
AM
(b)ISAC-AM
图2㊀传统AM和基于ISAC的AM的传输协议比较
Fig.2㊀Comparison of transmission protocols between traditional AM and ISAC-based AM
1.2㊀感知模型
在车辆运动过程中,RSU可以使用ISAC信号
感知车辆的位置㊂假设t时刻RSU传输给车辆的信
息为s(t),所以RSU发送的下行信号表示为:
s^(t)=w s(t),(1)
式中,w=㊀p a(θ)ɪC N tˑ1表示波束成形向量,其中,
p表示RSU传输功率,a(θ)=
㊀1
N t
[1,e-jπcosθ, ,
e-jπ(N t-1)cosθ]TɪC N tˑ1表示发送方向向量㊂
RSU通过天线接收车辆反射的ISAC回波㊂因
为光速足够快,本文假设车辆的位置在一个传输时
隙中保持不变㊂所以反射的回波可以表示为:
r(t)=Gβb(θ)a H(θ)s^(t-τ)e j2πυt+z(t),(2)
式中,r(t)ɪC N r
ˑ1㊂G=㊀N t N r,θ㊁τ㊁υ分别表示RSU
和车辆之间的天线增益㊁角度,时延和多普勒频移㊂
β=ξ2cτ表示车辆表面反射系数,其中,c表示光速,
ξ表示雷达散射截面(Radar Cross Section,RCS)㊂
b(θ)=
㊀1
N r
[1,e-jπcosθ, ,e-jπ(N r-1)cosθ]TɪC N rˑ1表
示接收方向向量,b(θ)和a(θ)是反向的关系㊂
z(t)~N(0,N0)表示高斯白噪声㊂
RSU在接收到车辆反射回波后,采用匹配滤波
米奇的甜心屋的方法获得信号的时延和多普勒频移,由此估计车
辆的距离和速度㊂匹配滤波如下所示:
E(τ,υ)=ʏΔT e0b H(θ)r(t)s(t-τ)e j2πυt d t,(3)
式中,ΔT e表示ISAC回波信号的持续时间㊂根据时
延τn和多普勒频移υn,车辆的距离d n和速度μn可
以表示为:
d=τ2ˑc,(4)
μ=υc
f c sinθ,(5)
式中,f c为载波频率㊂
1.3㊀通信模型
装有单天线的车辆在t时刻接收到由RSU发送
的下行信息可以表示为:
y(t)=G^H a H(θ)s^(t)e j2πυt+μ(t),(6)
式中,G^=㊀N t表示RSU发送天线增益,H n表示大
尺度路径损耗,μ(t)~CN(0,N1)表示在汽车接收端
方差为N1的复高斯噪声㊂众所周知,在毫米波通信
系统中[16],视距信道(Line of Sight,LoS)主导着信
号传输㊂为不失一般性,本文假设车辆在开阔的道
路如高速公路上行驶,RSU和汽车之间的H n可以
用friis方程[17]表示如下:
H2
=λ2
(4π)2d2,(7)
式中,λ=
c
f c表示载波波长㊂用h表示RSU到车辆
的等效信道:
h=G^H a H(θ)㊂(8)
基于式(6)和式(8),车辆接收信号的SNR 可以表示为:
γ=|h w |2
N 1
(9)
㊀㊀假设RSU 使用多进制正交幅度调制(Multiple Quadrature Amplitude Modulation,MQAM),并且每个调制符号被传输的概率都一样㊂根据文献[18],传输系统容量C ∗可以被上界和下界约束为:
C low ɤC ∗ɤC upper ,
(10)
式中,上下边界C low 和C upper 可以表示为:
C low
=lb M -1
M
ˑðx i
ɪχlb 1+(M -1)ˑ1
2[
exp -h 2
4(M -1)ðx j ɪχx i -x j
2
(
)
],
C upper =lb M -
1M
ˑðx i
ɪχlb 1+(M -1)
ˑ
12
[exp -h 2
N 1(M -1)ðx j ɪχx i
-x j
2
(
)],
(11)
式中,M 表示RSU 选择的调制方式,χ表示调制星座点的集合,其中,x i 和x j 表示在集合中的任何一对调制符号㊂并且根据文献[18],C low 和C upper 是渐进紧的㊂因此,使用C upper 作为C 去衡量系统的最大
容量,可以描述为[19]:
C =lb M -1M
ˑðx i
ɪχlb 1+(M -1)exp ˑ
12
[
-γM -1ðx j ɪχx i
-x j
2
(
)]㊂
(12)
㊀㊀此外,假设每个星座点的最近邻数量均为4,则误码率可以表示为[20]:
ρ=4lb M
F
3ˑγM -1(
)
,(13)
式中,函数F (x )表示如下:
F (x )=
ʏ
x
e -0.5t
2
d t ㊂(14)
㊀㊀在式(12)~(13)的基础上,可以建立一个优化
问题,在保证误码率满足要求的同时提高通信速率:
max M
C ,
(ρɤρ0,
(16)
式中,ρ0为给定瞬时误码率上界㊂
2 DRL 算法设计
本节基于文献[21]提出了一种基于DRL 的
AM 算法,DRL 智能体会根据状态选择具体的调制
模式,这个过程可以被建模为一个马尔可夫决策过程(Markov Decision Process,MDP )㊂由于车辆在
V2X 网络中的状态不断变化,基本的RL 算法的Q 表不能管理无限连续的状态空间,而DRL 使用DNN 建立Q 表,然后通过更新DNN 的权重来更新Q 表[22],可以较好地适应大规模动态环境[23]㊂
如图3所示,本文采用经验重放和固定目标网络策略来加速训练过程[24]
图3㊀DRL 结构Fig.3㊀DRL construction
㊀㊀如图3所示,经验重放回放是将每一时刻的元
组{s t ,a t ,r t ,s t +1}存储在记忆空间O ,并且随机从中抽取B 个样本{s j ,a j ,r j ,s j +1},j ɪ[1,2, ,B ]进行训练来破坏连续传输的元组之间的相关性㊂固定目标网络即定期更新目标Q
^网络的权值,以加速训练㊂DNN 的损失函数表示为:
L (θ+)=(y target j
-Q (s j ,a j ;θ+))2,(17)
式中,y target j
和Q (s j ,a j ;θ+)分别是在DRL 智能体在时隙j 选择动作a j 时Q 表的目标输出和实际输出,因此L (θ+
)表示为预测误差㊂y
target
j
我不喜欢有风的日子可以表示为:
y target
j
=r j +γmax aᶄ
㊀Q ^(s j +1
,aᶄ;θ-),(18)
式中,s j ,a j ,r j 分别表示j 时隙的状态㊁选择的动作和相应的奖励㊂Q ^(s j +1,aᶄ;θ-)表示在j +1时隙考虑动作aᶄ目标Q 表的输出㊂
基于所提出的ISAC 传输协议,DRL 网络的输
入为汽车当前距离d t 和前k 个时刻的距离{d t -1,d t -2, ,d t -k },输出为预测的下一个时隙调制模式㊂因此,对DRL 的状态空间㊁动作空间㊁即时奖励定义如下㊂
状态空间㊀即所有可能的状态集合㊂具体时刻
t 的状态由(k +1)个车辆距RSU 的距离组成㊂可以描述为:
s t ={d t ,d t -1, ,d t -k }㊂
(19)
㊀㊀动作空间㊀包括所有可能选择的调制模式,如下所示:
A ={M 1,M 2, ,M P },
(20)
在时隙j 选择的动作a j ɪA ㊂即时奖励㊀为了在保证最佳的通信速率和质
量,即时奖励被设计为:
r t =
-lg 1-
ρt +1-ρ0
ρt +1
(
)
,ρt +1>ρ0
C t +1,
else
{
,(21)
式中,C t +1和ρt +1可分别用式(12)~(13)计算㊂ρ0为最大瞬时误码率㊂该算法在约束ρt +1<ρ0下使C t +1最大化,来实现下一时隙调制模式的预测,并由此解决式(15)~(16)中描述的优化问题㊂DRL 具体实现如算法1所示㊂
算法1㊀
DRL 算法
输入:存储空间O ,奖励衰减γ,学习速率l ,样本数量B ,
初始化:分别用随机权值θ+和θ-初始化Q 网络和目标Q
^网络  1.㊀for episode =1,E do 2.㊀初始化状态s 13.㊀for i =1,I do 4.根据贪婪因子随机选择动作为随机值
㊀㊀㊀或者最大Q 值对应动作,即a i =argmax a Q (s i ,a ;θ+)5.执行动作a i ,得到奖励r i 和下一个状态s i +16.将(s i ,a i ,r i ,s i +1)存储到O
7.随机在存储空间采样B 个元组(s j ,a j ,r j ,s j +1)
8.
计算y target j =r j +γmax a ᶄ
Q ^(s j +1
,aᶄ;θ-),并跟据预测误差对Q 网络的权值θ+进行梯度下降更新,预测误差计算如式(17)
9.每隔J 步更新目标网络Q
^=Q 10.㊀end d for
3 仿真结果
本节利用一些数值结果来评估所提算法的有效性㊂在所考虑的V2X 系统中,N 0=N 1=-50dBm㊂使用笛卡尔坐标系来表示RSU 与车辆之间的空间关系,RSU 定义在[0m,0m],车辆坐标为[X ,Y ]㊂为不失一般性,设置Y 为30m㊂此外,假设车辆的初始速度μ0为23m/s,车辆从道路左边界[-150m,30m]驶向右边界[150m,30m],加速度设置为a ~N (0,5m /s 2)㊂此外,假定发射机支持6种调制模式:0㊁4QAM㊁8QAM㊁16QAM㊁32QAM㊁64QAM,模式0意味着发射机继续传输4QAM 信号仅进行感知㊂并且将输入的距离信息进行归一化处理,设k =5㊂其他仿真参数见表1㊂
表1㊀仿真参数
Tab.1㊀Simulation parameters
参数值天线增益G /dB 0
载波频率f c /GHz
美丽会说话5
一个时隙符号数N 1024传输功率p 0/dB 21
误码率阈值ρ0
1ˑ10-4
信号时隙周期/ms 20
㊀㊀本文使用如下基线来评价系统的性能:
传统导频训练㊀考虑文献[9]中使用的传统通信方案,它从导频交互中得到过时的CSI㊂本文直接使用此时刻h t 作为下一时刻h t +1来选择调制模式,其中导频开销假定为8%[25]㊂
理想模式㊀根据完美CSI 选择给定瞬时BER 约束下最优调制模式㊂
DRL 算法㊀它建立在本文提出的考虑历史距离的ISAC 系统上㊂DRL 中的DNN 由一个包含(k +1)个神经元的输入层,3个分别包含200㊁100和40
个神

本文发布于:2024-09-23 16:25:59,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/297429.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:车辆   调制   表示   信息   系统
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议