徐明楓 李陽 韓凱峰 徐曉燕 江甲沫
(中國信息通信研究院移動通信創新中心,北京 100191)
0 引言
信道估計是無線通信系統中的一個基本問題,其準確性對于信號恢復、干擾管理以及無線資源分配等應用都有著重大影響。根據是否發送導頻信號,信道估計方法可以分為三類,即盲信道估計、基于導頻的信道估計和半盲信道估計。其中,盲信道估計基于接收信號的統計特性進行,而基于導頻的信道估計通過解發送端已知的導頻信號來獲取信道信息。為了確保高精度的信道估計,后者被廣泛應用。
由于大量高移動性和超密集連接的場景出現,未來5G 和6G 無線通信系統面臨的一個挑戰是如何獲取高精度的信道估計結果[1]。有研究者提出信道估計的精度受益于導頻數量的增加[2]。為了確保信道估計的精度能夠滿足業務的需求,一些傳統的信道估計方法,例如最小二乘估計和最小均方誤差估計等,均需要增加一定的導頻數量。此外,這兩種方法還各有缺點[3]。具體而言,最小二乘估計無法直接用于估計數據信道,而最小均方誤差估計需要先獲取導頻信道和數據信道間的相關性且還需要消耗額外的計算資源以進行矩陣的逆運算操作。
為了克服上述瓶頸,業界研究了一些基于深度學習的信道估計方法。根據是否結合了傳統信道估計方法,這些基于深度學習的方法可以分為兩類:一類是設計神經網絡結構用作去噪模塊并添加到傳統方法流程中;另一類是應用神經網絡模型學習導頻信道和數據信道間的相關性。然而,雖然上述方法能夠取得相較于傳統方法更精確的信道估計結果,但其網絡結構的設計往往深度依賴于具體的導頻配置方案。這意味著當改變導頻配置方案時,模型可能需要重新進行訓練,不能支持靈活自適應的模型部署。
關鍵詞,指的是一篇文章內容的核心詞匯與詞組,是文章主題的高度凝練與總結。一篇文章一般通過3~5個關鍵詞來獲取文章的研究對象與方法,對關鍵詞進行分析可以得到研究的熱點。本文運用CitespaceIV對關鍵詞進行分析,在Thresholds模式下選擇閾值為(4,4,15)、(4,4,15)、(5,5,20),得到了73個節點、747條連線(圖2)。圖中每個年輪表示為一個節點,即意味著一個關鍵詞,年輪的大小表示其出現的頻次,節點之間的連線表示年輪之間的聯系,黑色短語表示高頻關鍵詞,字體的大小反映了各關鍵詞之間出現頻次的相對高低,這些高頻詞匯便代表著服務供應鏈相關領域的研究熱點。
生成對抗網絡(Generative Adversarial Network,GAN)模型作為新興的神經網絡模型,已經在多個領域展現出強大的數據分布學習能力[4],包括圖像生成、圖像修復、數據擴展和通信網絡等[5]。在無線通信領域,基于GAN 的信道建模方案引起了廣泛的研究熱潮。
基于此,本文設計了一種基于GAN 的信道估計方法,該方法的整體流程如圖1 所示,整體流程包含兩個階段,分別是模型訓練階段和模型應用階段。在模型訓練階段,GAN 模型被用于訓練以生成能夠貼近真實信道樣本分布的合成信道樣本。模型訓練在線上或線下均可實施。對于線下訓練,可以用提前收集的信道數據進行模型訓練,然后部署到線上進行應用。對于線上訓練,模型基于實時收集的當前信道數據進行訓練,能夠學習到更貼合當前環境的信道特征。因此,兩個訓練模式存在著部署時延和生成樣本相似度的折中關系,可以根據不同業務的要求選擇合適的訓練模式。此外,兩個模式的聯合應用也是可行的,具體可通過先線下訓練一個模型再線上微調模型的方式實現。在模型應用階段,將當前導頻信道的估計值輸入到已訓練模型中,可以獲得數據信道估計值
針對導頻位置配置優化問題,可以在給定的導頻數量K的條件下建模,在Nf×Ns維度的空間中尋找K個包含最大信息量的資源塊集合,使得能夠通過這K個資源塊上的信道信息重建出誤差最小的完整OFDM信道矩陣,具體形式如公式(2)所示:
1 基于GAN 的信道估計優化方法研究
現有信道估計方法難以兼顧性能和導頻配置靈活性。具體而言,傳統信道估計方法不依賴具體的導頻配置方案,兼容性強但性能差;而傳統人工智能(Artificial Intelligence,AI)模型依賴具體導頻配置方案,性能強但兼容性差。此外,傳統AI 模型主要對低速場景下信道時域變化緩慢的情況進行驗證,尚未對高速移動場景進行性能驗證。為此,需要提出一種新的信道估計方法,實現在不同導頻配置方案下的估計誤差均能達到較低值。
本文提出了一種基于GAN 的信道估計方法用于支撐任何導頻配置方案下的靈活信道估計,并在正交頻分復用技術(Orthogonal Frequency Division Multiplexing,OFDM)系統下進行中高移速場景的性能驗證。基于此,進行聯合的導頻配置優化,并給出性能仿真驗證結果。
加強質檢過程監控,預裂孔造孔過程質檢員旁站,監督鉆工開孔20cm、60cm、100cm進行3次校鉆,終孔時使用有標示的鉆桿控制孔深偏差≤5cm,并要求鉆工作詳細的造孔記錄,特別要在記錄中說明造孔過程各孔深位置對應的返塵情況;同時,隨時檢查樣架的穩定性,如有問題及時停鉆進行處理;鉆孔過程中隨時檢查樣架、鉆桿的角度及樣架與鉆機連接的牢固性,鉆桿角度采用特制鋼量角器測量,當傾角偏差>0.3°、方位角偏差>0.5°或鉆機固定卡松動時,必須停鉆采取措施糾偏。鉆孔完成后,逐孔檢查驗收,驗收標準為傾角偏差≤0.3°、方位角偏差≤0.5°、孔深偏差≤5cm。

圖1 基于GAN 的信道估計方法流程
圖2 給出了訓練GAN 模型的流程。根據輸入到鑒別器模型的數據種類,訓練過程可分為兩步。當輸入數據為真實樣本時,僅需要更新鑒別器模型的參數。鑒別器模型的訓練目標是將輸入的真實樣本判別為真樣本,即使得模型的輸出結果最大,如公式(1)所示:

圖2 GAN 模型的訓練流程示意圖
本站使用的CHS-10型側滑檢驗臺,是交通部汽車保修機械廠產品。本檢測臺用于前輪定位的綜合檢驗。當汽車低速駛過檢驗臺時,通過測定車輪作用在測試設備上的側向力,來判斷前輪定位參數是否正確。它以輪胎每公里的側滑米數來表示。
根據上述的爭論,我們可以總結出關于馬克思自由勞動概念的核心議題。第一,如何理解馬克思的自由勞動,是把自由勞動理解為一種非物質領域的人類活動,還是理解為一種人類社會歷史發展的階段?第二,如何理解人類自由勞動的實現,是把自由勞動的實現理解為人類從不自由勞動到自由勞動的歷史跨越,還是一種人類自由勞動發展與實現的歷史漸進過程?
信道估計階段其實就是信道數據恢復的過程。在該階段,通過已知的導頻信道和已訓練好的GAN 模型來進行數據信道信息的估計和還原。信道還原問題和計算機視覺領域中的圖像修復問題類似[6]。基于生成器可以生成任何服從真實信道樣本分布的合成信道樣本,該問題可以通過以下方式得到有效解決。即可以通過不斷調節潛變量z來改變生成器輸出的合成信道樣本,因此在已知部分導頻信息的情況下,找到一個導頻位置的信道信息與真實值接近的合成信道樣本是有可能的。如圖3 所示,將已知真實的導頻位置信道信息與生成器初始隨機生成的合成信道樣本在對應的導頻位置的信道信息進行比較,計算得到二者的差值。接著,可以應用梯度下降算法來更新參數z的值,使得生成器模型輸出的合成信道樣本能夠在導頻位置上逼近真實的導頻信道信息。當迭代到一定次數時,兩者之間的差值達到最小化,此時即可得到重建信道樣本的最優解z*。再將z*輸入到生成器模型中,即可獲取到數據信道信息。

圖3 應用生成器模型恢復數據信道的過程
2 基于GAN 的導頻配置和信道估計聯合優化算法
如圖4 所示,現有3GPP TS 38.211 標準[7]對于導頻配置方案進行了規范,候選配置類型包含Type 1 和Type 2 兩類。這兩類配置方案以導頻在頻域的插入密度作為區分。對于Type 1 配置方案,導頻在頻域上呈現間隔分布,頻域的插入密度為50%;而對于Type 2配置方案,導頻在頻域上的相鄰兩個子載波構成一組,每間隔四個子載波插入一組,頻域的插入密度為33%[7]。另外,從OFDM 符號的時域角度來看,也分為單符號和雙符號兩種配置方案。具體而言,以列為單位,單符號配置可根據需要最多擴展至四列,Type 1 和Type 2 的單符號配置方案分別如圖4(a)和圖4(c)所示;而雙符號配置以相鄰的兩列為一組,根據需要最多擴展至兩組,Type 1 和Type 2 的雙符號配置方案分別如圖4(b)和圖4(d)所示。

圖4 導頻配置方案
基于Abid[8]等提出的神經元選擇層的概念和思想,本小節將在前述所提GAN 模型的基礎上添加該模塊,使其能夠用于優化導頻選擇。下面先介紹神經元選擇層的基本思想。圖5 給出了兩層的線性網絡模型結構圖,其中第一層的神經元個數設置為Nf×Ns個,對應著OFDM 單幀上所有資源塊的個數,第二層的神經元個數設置為K個,對應著要選擇的導頻個數。如圖5(a)所示,在訓練的初始狀態下,兩層神經元互相之間完全相連,代表著每個資源塊都存在著同等被選中的概率。經過對模型的不斷訓練,如果能使得某一些信息量大的資源塊被選中的概率得到提升,那么模型最終的收斂效果就如圖5(b)所示,第一層中的部分神經元與第二層中的神經元一對一連接,從而優化導頻選擇。
物聯網正開啟下一個時代。成立多部門合作研發小組,將管理理念與智能技術融合,建立全覆蓋物聯網管理系統。匠心與創新聯袂,未來有無限可能。
其中,hk,k=1,…,K表示選取的導頻集合,F表示信道重建函數,則F(hk)表示重建的信道矩陣,H表示完整OFDM 信道矩陣。考慮所研究問題的候選解集存在種可能,且隨著信道尺度的增長呈現出爆炸式的增長,所以最簡單的遍歷算法無法適用。此外,由于傳統方法對于時頻資源塊間的相關性的刻畫表征能力有限,因此,本小節提出基于AI 模型的解決方案。
基站可根據調度的需求從中選擇合適的配置方案,極大地簡化配置導頻信號的流程和復雜度,但代價卻是犧牲潛在的空口傳輸性能。需要指出的是,對于任意一組OFDM 幀構成的數據集,每個資源塊上所包含的信息量是不同的。因此,按照標準給出的行列數規范的導頻集合是否是刻畫最大信息量的資源塊集合,從而通過該導頻集合能夠重建出最為精確的完整OFDM 幀信道尚且存疑。此外,對于不同的信道環境,每個資源塊所含的信息量可能發生變化,從而使得最優的導頻集合發生改變。綜上所述,現有導頻配置方案無法針對具體信道環境為自適應適配的優化導頻配置提供支持,限制了信道估計潛在性能的深入挖掘和釋放。

圖5 兩層線性網絡模型結構圖
通過在第二層的每個神經元后面接一個溫控Softmax 函數模塊即可實現上述目標。溫控Softmax函數是在原來的Softmax 函數基礎上引入了“模擬退火”機制后的改進,如公式(3)所示:
腦出血是一種極為普遍的慢性疾病[3],臨床上多以肢體活動不協調最為常見,重癥病人會出現肺部感染及腎功能衰竭等并發癥發生[5],嚴重影響病人的生活質量,危及病人的生命安全,因此如何為腦出血病人提供有效的護理措施,已引起醫護人員的高度重視。
其中,Wi,j表示第一層中第i個神經元到第二層中第j個神經元間的權重,T表示溫度,且對于任意的j,有=1。當溫度T取值很大時,在i=1 到Nf×Ns的范圍內,Wi,j/T的取值都很小,此時對于所有的資源塊來說都有著類似同等的概率被選中。在訓練過程中,隨著溫度的逐漸降低,Wi,j的作用愈發凸顯,權重越大的神經元意味著持有的信息量越大,因此被選中的概率更高。神經元選擇層的完整結構如圖6所示。

圖6 神經元選擇層結構圖
將導頻選擇模塊神經元選擇層與上述GAN 模型相結合,即可實現導頻圖樣與信道估計的聯合設計,具體結構如圖7 所示。該聯合設計方案的核心在于將導頻選擇模塊與生成器網絡級聯。由于導頻選擇模塊是從完整維度的信道資源塊中選擇信息量大的資源塊作為導頻,使得生成器網絡的輸入從原有的低維高斯隨機向量變為了真實的信道樣本。因此,級聯后的生成器網絡的模型結構也變為了如圖8 所示的結構,導頻選擇模塊的第一層中包含Nf×Ns個神經元,第二層則包含K個神經元,后續層的模型結構與前述模型保持一致。鑒別器網絡的模型結構保持不變。

圖7 基于GAN 的導頻配置與信道估計聯合設計模型訓練框圖

圖8 級聯導頻選擇模塊的生成器模型結構
在仿真驗證中,信道數據集包含了20 000 個信道樣本,這些信道樣本均基于抽頭延遲線-C 類(Tapped Delay Line Type C,TDL-C)模型生成[9]。本文中,訓練集數據占總數據量的80%。所有數據樣本均進行了功率歸一化處理。OFDM 塊中的子載波數和符號數分別設為Nf=48 和Ns=14。載波頻率設置為f=3.5 GHz,每個子載波的帶寬設置為Bf=30 kHz,每個OFDM 塊的總傳輸時間為T=0.5 ms。為了避免符號間干擾,在每個符號前添加了占總符號長度6%的循環前綴。此外,為了確保多徑的最大傳輸時延不超過循環前綴的持續時間,將均方根時延擴展設置為Td=300 ns。并給出了在150 km/h 和300 km/h 兩種移速場景下不同導頻數量的優化選擇結果,并驗證了所提方法的性能增益。新增加的仿真參數設置如下:初始溫度和冷卻溫度分別設置為T0=10 和TE=0.05。
3 仿真設置和結果分析
在級聯生成器模型訓練過程中,需要不斷降低溫度,將解的搜索空間從維度為的初始候選池逐步收斂到小范圍。此外,損失函數的作用是刻畫出基于被選中的資源塊的信道信息重建的完整信道與真實完整信道間的差異程度,經由模型參數的不斷更新,可以使該差異度達到最小。
其中,θd表示鑒別器模型的參數,D(·)表示鑒別器模型的輸出值,pr表示真實樣本數據的分布。
圖9 和圖10 分別給出了150 km/h 和300 km/h移速場景下的導頻優化結果。與圖4 中3GPP 標準規范的導頻配置方案相比,優化后的導頻配置結果更為離散且缺少排列規律。就兩個場景的導頻優化結果來看,150 km/h 移速場景下優化的結果相對集中于幾處特定區域內,說明這些位置中蘊含的信息量較大;而300 km/h 移速場景下優化的結果相對較為分散,說明對于移速更高的場景,其信息量分散在全域范圍內。此外,從圖中還可以看出,24 個導頻下的優化結果就已經將信息量高的資源塊選出,而選出來的48 個導頻和96 個導頻中額外的導頻更多是起到信息補充的作用,填充在24 個基礎導頻的周圍。

圖9 150 km/h 移速場景下的導頻選擇優化結果

圖10 300 km/h 移速場景下的導頻選擇優化結果
為了定量地對本小節所提出的基于GAN 的導頻配置和信道估計聯合優化方案進行性能評估,本文以歸一化均方誤差(Normalized Mean Squared Error,NMSE)作為評估指標,并且將經典二維維納濾波插值算法和未進行導頻優化的GAN 信道估計方法作為對比方案。表1 顯示了信噪比為20 dB 時兩種移速場景的評估結果。如表1 所示,與未優化導頻配置的GAN方案相比,聯合優化方案可以進一步提升信道估計性能。具體而言,面向兩種移速場景,聯合優化方案僅用24 個導頻時的性能就相當于未優化導頻配置的GAN方案在96 個導頻時的性能,意味著聯合優化方案可以在幾乎無性能損失的情況下進一步降低75%的導頻開銷。此外,當兩種方案的導頻開銷相同時,對于150 km/h 移速場景,聯合優化方案的性能可提升約1.7 dB;而對于300 km/h 移速場景,聯合優化方案的性能提升可達到2.1 dB 左右。

表1 信噪比為20 dB 時聯合優化方案的仿真性能評估
圖11 顯示了聯合優化方案在300 km/h 移速場景下對于不同信噪比條件的NMSE 性能曲線。將未進行導頻配置優化的GAN 信道估計方法作為對比方案。由圖11 可知,聯合優化方案在應用24 個導頻的情況下,在5~20 dB 的信噪比范圍內,其性能與未進行導頻配置優化的GAN 信道估計方法的性能相當。而當信噪比更低時,聯合優化方案的性能更好,說明聯合優化方案有著一定的抗噪聲能力。此外,在更多導頻的支持下,聯合優化方案在0~20 dB 的信噪比范圍內都有著更為出眾的NMSE 性能表現。

圖11 300 km/h 移速場景下聯合優化方案的性能評估
4 結束語
未來,人類社會將進入智能化時代,6G 將構建一張泛在互聯的智慧網絡,實現從服務于人、人與物,到萬戶互聯、萬物智聯的美好愿景。無線通信與人工智能的深度融合有望促進未來通信范式演變和網絡架構創新,為實現6G 時代智能化發展愿景提供支撐。為充分利用分布在網絡邊緣的豐富數據使之服務于人工智能模型訓練,以聯邦邊緣學習為代表的邊緣智能技術應運而生。本文以無線通信中的信道估計為切入點,對基于GAN 的信道估計方法展開研究,并通過仿真結果驗證了所提算法的可行性。