国产91免费_国产精品电影一区_日本s色大片在线观看_中文在线免费看视频

CNTXJ.NET | 通信界-中國(guó)通信門戶 | 通信圈 | 通信家 | 下載吧 | 說吧 | 人物 | 前瞻 | 智慧(區(qū)塊鏈 | AI
 國(guó)際新聞 | 國(guó)內(nèi)新聞 | 運(yùn)營(yíng)動(dòng)態(tài) | 市場(chǎng)動(dòng)態(tài) | 信息安全 | 通信電源 | 網(wǎng)絡(luò)融合 | 通信測(cè)試 | 通信終端 | 通信政策
 專網(wǎng)通信 | 交換技術(shù) | 視頻通信 | 接入技術(shù) | 無線通信 | 通信線纜 | 互聯(lián)網(wǎng)絡(luò) | 數(shù)據(jù)通信 | 通信視界 | 通信前沿
 智能電網(wǎng) | 虛擬現(xiàn)實(shí) | 人工智能 | 自動(dòng)化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信會(huì)展
您現(xiàn)在的位置: 通信界 >> 視頻通信 >> 技術(shù)正文
 
面向高混響環(huán)境的欠定卷積盲源分離算法
[ 通信界 | 解元1 鄒濤1 孫為軍2 謝勝利3 | www.6611o.com | 2023/7/31 22:45:03 ]
 

(1.廣州大學(xué)機(jī)械與電氣工程學(xué)院,廣東 廣州 510006;2.廣東工業(yè)大學(xué)智能檢測(cè)與制造物聯(lián)教育部重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510006;3.廣東工業(yè)大學(xué)物聯(lián)網(wǎng)智能信息處理與系統(tǒng)集成教育部重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510006)

0 引言

盲源分離,又稱盲信號(hào)分離,是指僅根據(jù)接收的混疊信號(hào)(觀測(cè)信號(hào))分離或恢復(fù)未知源信號(hào),目的是求得源信號(hào)的最佳估計(jì)[1-2]。其因強(qiáng)大的分離功能已在通信信號(hào)處理[3]、生物醫(yī)學(xué)信號(hào)處理(心肺音信號(hào)分離等)[4]、圖像處理[5]以及語音信號(hào)處理[6-7]等多領(lǐng)域得到了廣泛的應(yīng)用。在實(shí)際的信號(hào)接收過程中,傳感器的數(shù)目往往小于源信號(hào)的數(shù)目(即欠定混疊),導(dǎo)致通道的盲辨識(shí)極具挑戰(zhàn)性,特別是在高混響復(fù)雜環(huán)境下,可聽回聲對(duì)音質(zhì)有著重要的影響,導(dǎo)致接收信號(hào)具有復(fù)雜性,給源信號(hào)的分離帶來了巨大的挑戰(zhàn),傳統(tǒng)的盲源分離算法無法徹底解決該類問題。

對(duì)人類聽覺系統(tǒng)特性的研究表明,當(dāng)回聲低于由直接聲音引起的掩蔽極限時(shí),將聽不到回聲,這就是人類聽覺系統(tǒng)的時(shí)間掩蔽效應(yīng)[8-9]。當(dāng)回聲剛好低于掩蔽極限時(shí)人類聽覺系統(tǒng)是聽不見的,人類聽覺系統(tǒng)對(duì)那些超過掩蔽極限的回聲非常敏感。在低混響環(huán)境下,可利用空間脈沖響應(yīng)重塑技術(shù)完全消除可聽回聲,而不影響聲音的質(zhì)量。然而,在高混響環(huán)境下,可聽回聲的存在是不可避免的,對(duì)此,一些改進(jìn)的空間脈沖響應(yīng)重塑技術(shù)被提出[10-11]。其中,Jungmann 等[10]結(jié)合聲學(xué)多輸入多輸出信道串?dāng)_消除和空間脈沖響應(yīng)重塑技術(shù)降低了混響的影響。Mertins 等[11]提出的基于凸正則化技術(shù)實(shí)現(xiàn)了空間脈沖響應(yīng)重塑和串?dāng)_消除。然而,以上研究主要集中于空間脈沖響應(yīng)重塑技術(shù)本身,而基于該技術(shù)的盲源分離研究尚不多見。鑒于此,本文在盲源分離算法中引入空間脈沖響應(yīng)重塑技術(shù),通過改進(jìn)該技術(shù)以及設(shè)計(jì)新的盲源分離算法,提出面向高混響復(fù)雜環(huán)境的欠定卷積盲源分離算法。

目前,比較流行的盲源分離算法主要利用短時(shí)傅里葉變化把時(shí)域混疊信號(hào)轉(zhuǎn)換到頻域中,根據(jù)信號(hào)在頻域上的統(tǒng)計(jì)特性[12]、獨(dú)立性[13]、非負(fù)性[14]、稀疏性[15]等性質(zhì),設(shè)計(jì)相應(yīng)的時(shí)頻域盲源分離算法。在模型變換過程中,把時(shí)域上的卷積混疊變換成頻域上的瞬時(shí)線性混疊,減少了時(shí)域卷積計(jì)算帶來的復(fù)雜性。在低混響混疊環(huán)境下,該模型變換具有較低的近似誤差,由此衍生出一系列欠定卷積盲源分離算法[16-19]。其中,文獻(xiàn)[16-17]基于聯(lián)合矩陣塊對(duì)角化方法,實(shí)現(xiàn)了卷積混疊信號(hào)的盲源分離;文獻(xiàn)[18-19]基于矩陣狀態(tài)協(xié)方差模型,提出了迭代期望最大化算法估計(jì)模型參數(shù),通過實(shí)時(shí)更新優(yōu)化模型參數(shù),再用維納濾波法分離源信號(hào)。然而,這類算法收斂速度受限,而且對(duì)通道階數(shù)與算法初始化較敏感。

非負(fù)矩陣分解是一種機(jī)器學(xué)習(xí)算法框架,將非負(fù)矩陣分解為2 個(gè)低秩非負(fù)因子矩陣的乘積[20],在處理卷積混疊盲源分離問題中,通過將源信號(hào)的功率譜密度矩陣分解為2 個(gè)非負(fù)矩陣的乘積,一系列基于非負(fù)矩陣分解源模型的盲源分離算法被提出[21-23]。其中,Sawada 等[21]基于非負(fù)矩陣分解的低秩源模型,利用多元復(fù)高斯分布的統(tǒng)計(jì)模型定義多通道歐幾里得距離和多通道IS(Itakura-Saito)散度,為了最小化這種散度,通過設(shè)計(jì)適當(dāng)?shù)妮o助函數(shù),推導(dǎo)出乘法更新形式的優(yōu)化算法;Sekiguchi 等[22]假設(shè)源圖像遵循無約束全秩空間協(xié)方差矩陣的多元復(fù)高斯分布,將空間協(xié)方差矩陣限制為以頻率方式聯(lián)合對(duì)角化滿秩矩陣,從而實(shí)現(xiàn)了快速多通道非負(fù)矩陣分解;Wang 等[23]通過最小體積先驗(yàn)分布來增強(qiáng)源模型的可識(shí)別性,利用最小體積正則化多通道非負(fù)矩陣分解,最大化分離源的后驗(yàn)分布,保證了收斂的穩(wěn)定性。

然而,基于非負(fù)矩陣分解設(shè)計(jì)的優(yōu)化算法對(duì)模型參數(shù)的初始化比較敏感,限制了算法的自適應(yīng)性。另外,時(shí)域上的卷積混疊模型通過短時(shí)傅里葉變換變換到頻域上的瞬時(shí)線性混疊模型是一種近似變換模型,其成立的前提條件是短時(shí)傅里葉變換的窗長(zhǎng)度遠(yuǎn)大于脈沖響應(yīng)的長(zhǎng)度,而在高混響環(huán)境下該條件是很難得到滿足的,極易導(dǎo)致較大的模型近似誤差,所以在此變換模型下設(shè)計(jì)的算法往往不適用于高混響環(huán)境。對(duì)此,文獻(xiàn)[24-25]提出基于卷積傳遞函數(shù)的卷積窄帶近似,該卷積寬帶近似模型能避免以上條件的限制,更精準(zhǔn)地近似時(shí)域上的卷積模型,適用于高混響混疊情形,但其是卷積計(jì)算,容易帶來更高的計(jì)算量。

鑒于目前研究現(xiàn)狀,面向高混響環(huán)境的欠定卷積盲源分離問題仍然存在以下難點(diǎn)。

1) 在高混響復(fù)雜環(huán)境下,可聽回聲和混響對(duì)音質(zhì)有著重要的影響,導(dǎo)致接收信號(hào)具有復(fù)雜性。

2) 缺乏對(duì)高混響環(huán)境下欠定卷積混疊信號(hào)精確的數(shù)學(xué)建模,導(dǎo)致模型近似誤差增大。

3) 欠定卷積混疊盲源分離實(shí)質(zhì)上是一個(gè)非線性問題,其求解困難,由于外界環(huán)境的復(fù)雜性,導(dǎo)致傳統(tǒng)盲源分離算法的性能受限。

針對(duì)以上問題,本文從空間脈沖響應(yīng)重塑的角度出發(fā),結(jié)合欠定卷積盲源分離研究思路,提出一種面向高混響環(huán)境的欠定卷積盲源分離算法——全局脈沖響應(yīng)欠定盲源分離(GIR-UBSS,global impulse response underdetermined blind source separation)。本文創(chuàng)新點(diǎn)概括如下。

1) 設(shè)計(jì)了全局脈沖響應(yīng)網(wǎng)絡(luò),通過優(yōu)化可調(diào)濾波器削弱可聽回聲的影響,提高了信號(hào)的質(zhì)量。

2) 構(gòu)建了面向高混響復(fù)雜環(huán)境的時(shí)頻域混疊信號(hào)數(shù)學(xué)模型,降低了模型近似誤差,對(duì)高混響環(huán)境具有較好的自適應(yīng)性。

3) 提出了一種GIR-UBSS 算法,設(shè)計(jì)了新模型下參數(shù)的實(shí)時(shí)更新規(guī)則,實(shí)現(xiàn)了源信號(hào)的盲分離。理論分析與一系列仿真實(shí)驗(yàn)驗(yàn)證了GIR-UBSS 算法的有效性與優(yōu)越性。

1 問題描述

對(duì)高混響環(huán)境下記錄的混疊信號(hào)進(jìn)行如下數(shù)學(xué)建模。

其中,xj(t)是第j個(gè)通道記錄的混疊信號(hào),時(shí)間t是連續(xù)的,i= 1,2,…,I是源信號(hào)數(shù)目,j= 1,2,…,J是傳感器數(shù)目,a ji(t)是第i個(gè)源信號(hào)到第j個(gè)通道過程中產(chǎn)生的空間脈沖響應(yīng),si(t)是第i個(gè)源信號(hào),τ是時(shí)延,L是脈沖響應(yīng)的長(zhǎng)度,b(t)是噪聲。利用矩陣向量的形式,式(1)可表示為

其中,*是卷積符號(hào),x(t) =[x1(t),…,x J(t)]T,是混疊系統(tǒng)。本文考慮高混響環(huán)境下的欠定卷積混疊盲源分離問題,即I>J為欠定混疊,且空間混響時(shí)間逐漸增大導(dǎo)致高混響。盲源分離的目的是僅根據(jù)接收的混疊信號(hào)x(t)分離源信號(hào)s(t)。

2 本文算法

2.1 全局脈沖響應(yīng)網(wǎng)絡(luò)的設(shè)計(jì)

在高混響環(huán)境下,接收到的混疊信號(hào)常常伴隨混響回聲,為了消除或削弱可聽回聲的影響,本文設(shè)計(jì)一種全局脈沖響應(yīng)網(wǎng)絡(luò),如圖1 所示,該網(wǎng)絡(luò)設(shè)計(jì)思路來源于信道串?dāng)_消除和空間脈沖響應(yīng)重塑技術(shù)[10]。

圖1 全局脈沖響應(yīng)網(wǎng)絡(luò)的設(shè)計(jì)流程

考慮在接收器前安裝L個(gè)擴(kuò)音器,其中,I個(gè)源信號(hào)經(jīng)過L個(gè)擴(kuò)音器傳遞到J個(gè)接收器,hli是第i個(gè)源信號(hào)通過第l個(gè)擴(kuò)音器產(chǎn)生的脈沖響應(yīng),其長(zhǎng)度為L(zhǎng)h,Ajl是第l個(gè)擴(kuò)音器到達(dá)第j個(gè)接收器產(chǎn)生的空間脈沖響應(yīng),長(zhǎng)度為L(zhǎng)a,則從第i個(gè)源信號(hào)到達(dá)第j個(gè)接收器產(chǎn)生的全局脈沖響應(yīng)可以表示為

其 中,N1=t0fs,N2=αfs,N3=Lg-N1-N2,n=0,…,N3-1;α和β是可調(diào)參數(shù),在設(shè)計(jì)濾波器過程中,通過調(diào)節(jié)其值得到不同的窗函數(shù),實(shí)現(xiàn)不同的濾波目的。

最小化不期望部分同時(shí)最大化期望部分,考慮優(yōu)化問題

其中,pu和pd是可調(diào)的正整數(shù),通過調(diào)節(jié)其值設(shè)計(jì)不同范數(shù)的算法,實(shí)現(xiàn)不同的脈沖響應(yīng)重塑效果。

利用梯度下降法對(duì)式(11)求偏導(dǎo),得到

2.2 欠定卷積盲源分離算法的設(shè)計(jì)

2.2.1 模型變換

為解決模型式(2)下的盲源分離問題,傳統(tǒng)的方法利用短時(shí)傅里葉變換得到頻域上近似的線性混疊模型,表示為

其中,f=1,…,F是頻點(diǎn)指數(shù),F(xiàn)是短時(shí)傅里葉變換的窗長(zhǎng)度,n=1,…,N是時(shí)間窗指數(shù),和分別是x(t)、s(t)和b(t)通過短時(shí)傅里葉變換得到的,噪聲b(t)是模擬現(xiàn)實(shí)生活中的真實(shí)噪聲,是頻域上的脈沖響應(yīng)混疊矩陣。然而,這種變換成立的前提條件是短時(shí)傅里葉變換的窗長(zhǎng)度F遠(yuǎn)大于脈沖響應(yīng)的長(zhǎng)度L,即F≫L。在高混響環(huán)境下,隨著混響時(shí)間(RT,reverberation time)的增加,脈沖響應(yīng)的長(zhǎng)度L逐漸變大,甚至超過窗長(zhǎng)度F,導(dǎo)致線性混疊模型式(16)近似誤差增大,甚至無效。為了避免這種限制,本文設(shè)計(jì)全局脈沖響應(yīng)網(wǎng)絡(luò),消除或削弱可聽回聲的影響,縮短脈沖響應(yīng)的長(zhǎng)度,降低高混響環(huán)境的影響,建立如下近似模型。

2.2.2 非負(fù)矩陣分解模型

假設(shè)[18]

2.2.3 模型參數(shù)的更新規(guī)則

為了更好地分析,通過式(34)和式(35)表示邊際分布和成對(duì)聯(lián)合后驗(yàn)分布,即

因此,通過上述計(jì)算g和c的后驗(yàn)統(tǒng)計(jì)量,可最大化對(duì)數(shù)似然,表示為

2.2.4 頻域源信號(hào)的估計(jì)

通過實(shí)時(shí)更新模型參數(shù),得到頻域上的源信號(hào)表達(dá)式為

綜上,通過式(46)獲得頻域上的源信號(hào),再利用短時(shí)傅里葉逆變換得到時(shí)域上的源信號(hào),實(shí)現(xiàn)盲源分離。

3 實(shí)驗(yàn)

3.1 實(shí)驗(yàn)參數(shù)設(shè)置與評(píng)價(jià)準(zhǔn)則

為了模擬真實(shí)環(huán)境,利用國(guó)際上公用的模擬環(huán)境方法[26],創(chuàng)建一個(gè)有限脈沖響應(yīng)房間,該房間的維數(shù)是5m×3m×2.5m,固定2 個(gè)傳感器,其坐標(biāo)分別為[3 1 1.6]和[3 1.05 1.6],把源信號(hào)放置在3 個(gè)位置[2 0.5 1.6]、[2 1 1.6]和[2 1.5 1.6],即3 個(gè)源信號(hào)兩通道的欠定混疊(I= 2,J=3)。RT 設(shè)置為100~900 ms,值越大說明混響程度越強(qiáng),通過此模擬環(huán)境產(chǎn)生有混響的欠定混疊信號(hào)。在參數(shù)設(shè)置方面,全局脈沖響應(yīng)網(wǎng)絡(luò)中La=Lh=fsRT(fs為信號(hào)的采樣頻率),α= 0.05,β=2.0,pu=10,pd=20,iter=1000,μ= 10-6。在非負(fù)矩陣分解源模型中,設(shè)置κi= 20;在參數(shù)初始化方面,=I,ufk和vkn利用KL(Kullback-Leibler)散度的非負(fù)矩陣分解獲得,且。

為了評(píng)價(jià)GIR-UBSS 算法的有效性,利用國(guó)際公認(rèn)的評(píng)價(jià)準(zhǔn)則:信號(hào)失真比(SDR,source-todistortion ratio)、信號(hào)干擾比(SIR,source-tointerference ratio )、信號(hào)偽像比(SAR,source-to-artifacts ratio)[27],其值越大,盲源分離性能就越好。因此,利用評(píng)價(jià)準(zhǔn)則SDR、SIR、SAR值的大小衡量盲源分離的好壞。

為了評(píng)價(jià)GIR-UBSS 算法的優(yōu)越性,對(duì)比目前國(guó)際上比較流行的幾種盲源分離算法:變分期望最大化(VEM,variational expectation-maximization)算法[19]、卷積近端交替線性化最小化(C-PALM,convolutive proximal alternating linearized minimization)算法[24]、帶正則化的窄帶優(yōu)化(N-Regu,narrowband optimization with regularizatio)算法[24]、全秩空間協(xié)方差模型(FullRankSCM,full-rank spatial covariance model)算法[18]。其中,VEM 算法先利用卡爾曼平滑器估計(jì)混疊矩陣和源信號(hào)參數(shù),再用維納濾波法分離源信號(hào)。C-PALM 算法是一種卷積近似交替線性化極小化方法,通過利用卷積窄帶近似獲得更好的模型近似,減少了卷積核的長(zhǎng)度,避免了短時(shí)傅里葉變換窗函數(shù)長(zhǎng)度的限制。N-Regu 算法是一種經(jīng)典的帶正則化的窄帶優(yōu)化方法,利用了傳統(tǒng)的線性窄帶近似及1-范數(shù)正則化。FullRankSCM 算法利用滿秩空間協(xié)方差模型,是EM 算法中比較成熟的方法之一。以上對(duì)比算法是解決欠定卷積混疊盲分離問題中比較流行的算法,通過與這些流行的盲源分離算法進(jìn)行對(duì)比,可以很好地說明GIR-UBSS 算法的優(yōu)越性。同時(shí),所有對(duì)比算法中的參數(shù)及模型采用的是與本文實(shí)驗(yàn)相同的設(shè)置,這樣對(duì)比更有說服力。

3.2 全局脈沖網(wǎng)絡(luò)去混響效果分析

為了定量描述全局脈沖網(wǎng)絡(luò)實(shí)現(xiàn)的去混響效果,將可感知混響量化(nPRQ,perceivable reverberation quantization)度量作為評(píng)價(jià)準(zhǔn)則[11],當(dāng)脈沖響應(yīng)被完全重塑或沒有時(shí)間系數(shù)超過時(shí)間掩蔽極限時(shí),nPRQ=0,說明混響被完全消除;否則,nPRQ 越大,脈沖響應(yīng)被重塑的效果越差。為了驗(yàn)證全局脈沖網(wǎng)絡(luò)對(duì)不同混響的影響,設(shè)定混響時(shí)間RT 為100~900 ms,并與原始脈沖網(wǎng)絡(luò)進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如圖2 所示。相比于原始脈沖網(wǎng)絡(luò),在低混響下,全局脈沖網(wǎng)絡(luò)可以完全消除混響,使nPRQ趨于0;在高混響下,全局脈沖網(wǎng)絡(luò)可以削弱混響的影響,提高信號(hào)的質(zhì)量。

圖2 全局脈沖網(wǎng)絡(luò)去混響效果

3.3 仿真實(shí)驗(yàn)1:英文語音信號(hào)欠定卷積盲源分離

為了驗(yàn)證GIR-UBSS 算法的有效性和優(yōu)越性,首選3 組英文語音信號(hào),如表1 所示。數(shù)據(jù)集來源于國(guó)際上公開的信號(hào)分離評(píng)價(jià)實(shí)驗(yàn)數(shù)據(jù)。本文創(chuàng)建一個(gè)兩通道三語音源的欠定卷積混疊,利用GIR-UBSS 算法進(jìn)行分離,同時(shí)與幾種比較流行的盲源分離算法進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如圖3 所示。從圖3 可知,隨著RT 的增加,算法的分離性能下降,這是由于RT 的增加帶來了混響的復(fù)雜性,導(dǎo)致分離越來越困難,其中,SDR 和SAR 的數(shù)值下降比較明顯,但是SIR 的值比較穩(wěn)定,這是由于本文所設(shè)計(jì)的全局脈沖響應(yīng)網(wǎng)絡(luò)可以很好地減弱RT 的影響,從而得到穩(wěn)定的SIR。

表1 仿真實(shí)驗(yàn)1:3 組英文語音

圖3 英文語音信號(hào)欠定卷積盲源分離性能對(duì)比

在高混響環(huán)境下,對(duì)比算法分離性能下降嚴(yán)重,甚至失效,而GIR-UBSS 算法依然可獲得較好的分離結(jié)果。與對(duì)比算法中最好的分離結(jié)果相比,GIR-UBSS 算法得到的SDR、SIR 和SAR 值分別提高了約1 dB、5 dB 和1 dB,該實(shí)驗(yàn)驗(yàn)證了GIR-UBSS算法在高混響環(huán)境下分離欠定卷積語音混疊信號(hào)的有效性和優(yōu)越性。

另外,為了從視覺的角度解析英文語音混疊信號(hào)分離情況,可視化混響時(shí)間為300 ms 下的原始英文語音混疊信號(hào)波形以及分離后的英文語音信號(hào)波形,如圖4 所示。

圖4 英文語音混疊信號(hào)波形以及分離后的英文語音信號(hào)波形

3.4 仿真實(shí)驗(yàn)2:音樂信號(hào)欠定卷積盲源分離

為了驗(yàn)證GIR-UBSS 算法對(duì)音樂混疊信號(hào)的有效性和優(yōu)越性,測(cè)試3 組音樂欠定卷積混疊信號(hào),選取的源信號(hào)如表2 所示,該音樂信號(hào)包括吉他聲、人聲和鼓聲,全時(shí)長(zhǎng)為25 s,采樣頻率為44.1 kHz,為了減少分離所需的時(shí)間,本文實(shí)驗(yàn)將信號(hào)截?cái)酁?0 s,下采樣至16 kHz,保持與實(shí)驗(yàn)1 的一致性,盲源分離結(jié)果如圖5 所示。

表2 仿真實(shí)驗(yàn)2:3 組音樂信號(hào)

圖5 音樂信號(hào)欠定卷積盲源分離性能對(duì)比

從圖5 可知,隨著RT 的增大,算法的分離性能與預(yù)期基本一致。與對(duì)比算法中最好的分離結(jié)果相比,GIR-UBSS 算法得到的SDR、SIR、SAR 值分別提高了約6 dB、7 dB 和6 dB。該實(shí)驗(yàn)驗(yàn)證了GIR-UBSS 算法在高混響環(huán)境下分離欠定卷積音樂混疊信號(hào)的有效性和優(yōu)越性。

與仿真實(shí)驗(yàn)1 的結(jié)果對(duì)比可發(fā)現(xiàn),GIR-UBSS算法在分離音樂混疊信號(hào)表現(xiàn)出更好的優(yōu)越性。這是由于本文利用了非負(fù)矩陣分解源模型,相比于語音源,音樂源可以被較小數(shù)目的源成分表示,更適用于非負(fù)矩陣分解模型,從而獲得更好的分離結(jié)果。

為了從視覺的角度解析音樂混疊信號(hào)分離情況,可視化300 ms 下的原始音樂混疊信號(hào)波形以及分離后的音樂信號(hào)波形,如圖6 所示。

圖6 音樂混疊信號(hào)波形以及分離后的音樂信號(hào)波形

3.5 仿真實(shí)驗(yàn)3:中文語音信號(hào)欠定卷積盲源分離

為了驗(yàn)證GIR-UBSS 算法對(duì)中文語音混疊信號(hào)的有效性和優(yōu)越性,測(cè)試3 組中文語音混疊信號(hào),數(shù)據(jù)集來自國(guó)內(nèi)公共中文語音數(shù)據(jù)集。選取3 組語音信號(hào),如表3 所示,盲源分離結(jié)果如圖7 所示。與對(duì)比算法中最好的分離結(jié)果相比,GIR-UBSS 算法得到的SDR、SIR、SAR 值分別提高了約1 dB、5 dB 和1 dB。驗(yàn)證了GIR-UBSS 算法對(duì)分離中文語音欠定卷積混疊信號(hào)仍然具有較好的有效性和優(yōu)越性。

表3 仿真實(shí)驗(yàn)3:3 組中文語音

圖7 中文語音信號(hào)欠定卷積盲源分離性能對(duì)比

另外,為了從視覺的角度解析中文語音混疊信號(hào)分離情況,可視化混響時(shí)間為300 ms 下的原始中文語音混疊信號(hào)波形以及分離后的中文語音信號(hào)波形如圖8 所示。

圖8 中文語音混疊信號(hào)波形以及分離后的中文語音信號(hào)波形

3.6 算法對(duì)真實(shí)噪聲的穩(wěn)健性分析

為了驗(yàn)證GIR-UBSS 算法對(duì)真實(shí)噪聲的穩(wěn)健性,現(xiàn)實(shí)生活中遇到的噪聲場(chǎng)通常可以近似為球形或圓柱形噪聲場(chǎng),如時(shí)間相關(guān)噪聲、由相互獨(dú)立的語音片段混合而成的巴布語音或工廠噪聲,以及室外測(cè)量經(jīng)常受到各種聲源(如交通、自然環(huán)境聲音等)的干擾。本文實(shí)驗(yàn)測(cè)試3 種真實(shí)噪聲:由球形產(chǎn)生的各向同性噪聲(isotropic noise)、由相互獨(dú)立的語音片段混合而成的巴布語音噪聲(babble noise)以及風(fēng)噪聲(wind noise)。然后分別把這3 種噪聲加入仿真實(shí)驗(yàn)1 中的混疊語音信號(hào)中構(gòu)成含噪聲的混疊信號(hào),利用GIR-UBSS 算法對(duì)混疊信號(hào)進(jìn)行分離,同時(shí)對(duì)比無噪聲(without noise)下的盲源分離,實(shí)驗(yàn)結(jié)果如圖9 所示。從圖9可知,加入不同噪聲以后獲得的盲源分離結(jié)果與無噪聲下得到的結(jié)果相似,驗(yàn)證了GIR-UBSS 算法對(duì)真實(shí)噪聲具有很好的穩(wěn)健性。

圖9 含有真實(shí)噪聲的盲源分離性能對(duì)比

4 結(jié)束語

現(xiàn)實(shí)生活中,接收的混疊信號(hào)往往伴隨高混響等不確定因素,如何消除或削弱高混響的影響,提高盲源分離性能,已經(jīng)成為信號(hào)處理中極具挑戰(zhàn)性和現(xiàn)實(shí)意義的課題。為此,本文提出一種面向高混響復(fù)雜環(huán)境的欠定卷積盲源分離算法,通過設(shè)計(jì)全局脈沖響應(yīng)網(wǎng)絡(luò),減少脈沖響應(yīng)的長(zhǎng)度,削弱可聽混響回聲的影響。進(jìn)而構(gòu)建高混響環(huán)境的時(shí)頻域混疊信號(hào)數(shù)學(xué)模型,設(shè)計(jì)新模型下的參數(shù)更新規(guī)則,實(shí)現(xiàn)源信號(hào)的盲分離。理論分析表明,在新的實(shí)時(shí)模型更新規(guī)則下,可得到頻域上的源信號(hào)。實(shí)驗(yàn)驗(yàn)證了所提GIR-UBSS 算法對(duì)分離中英文語音混疊信號(hào)、音樂混疊信號(hào)具有很好的有效性。另外,通過與國(guó)際上比較流行的盲源分離算法對(duì)比,證實(shí)了GIR-UBSS 算法的優(yōu)越性,以及對(duì)真實(shí)噪聲具有良好的穩(wěn)健性。

 

1276作者:解元1 鄒濤1 孫為軍2 謝勝利3 來源:通信學(xué)報(bào) 編輯:顧北

 

聲明:①凡本網(wǎng)注明“來源:通信界”的內(nèi)容,版權(quán)均屬于通信界,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。經(jīng)授權(quán)可轉(zhuǎn)載,須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息并注明“來源:通信界”。②凡本網(wǎng)注明“來源:XXX(非通信界)”的內(nèi)容,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多行業(yè)信息,僅代表作者本人觀點(diǎn),與本網(wǎng)無關(guān)。本網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。③如因內(nèi)容涉及版權(quán)和其它問題,請(qǐng)自發(fā)布之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。 
熱點(diǎn)動(dòng)態(tài)
普通新聞 中信科智聯(lián)亮相2023中國(guó)移動(dòng)全球合作伙伴大會(huì)
普通新聞 全球首個(gè)基于Data Channel的新通話商用網(wǎng)絡(luò)呼叫成功撥通
普通新聞 中國(guó)聯(lián)通:以優(yōu)質(zhì)通信服務(wù) 助力“一帶一路”共建繁華
普通新聞 楊杰:未來五年,智算規(guī)模復(fù)合增長(zhǎng)率將超過50%
普通新聞 長(zhǎng)沙電信大樓火災(zāi)調(diào)查報(bào)告發(fā)布:系未熄滅煙頭引燃,20余人被問責(zé)
普通新聞 鄔賀銓:生態(tài)短板掣肘5G潛能發(fā)揮,AI有望成“破局之劍”
普通新聞 工信部:加大對(duì)民營(yíng)企業(yè)參與移動(dòng)通信轉(zhuǎn)售等業(yè)務(wù)和服務(wù)創(chuàng)新的支持力
普通新聞 摩爾線程亮相2023中國(guó)移動(dòng)全球合作伙伴大會(huì),全功能GPU加速云電腦體
普通新聞 看齊微軟!谷歌表示將保護(hù)用戶免受人工智能版權(quán)訴訟
普通新聞 聯(lián)想王傳東:AI能力已成為推動(dòng)產(chǎn)業(yè)升級(jí)和生產(chǎn)力躍遷的利刃
普通新聞 APUS李濤:中國(guó)的AI應(yīng)用 只能生長(zhǎng)在中國(guó)的大模型之上
普通新聞 外媒:在電池競(jìng)賽中,中國(guó)如何將世界遠(yuǎn)遠(yuǎn)甩在后面
普通新聞 三星電子預(yù)計(jì)其盈利能力將再次下降
普通新聞 報(bào)告稱華為5G專利全球第1 蘋果排名第12
普通新聞 黨中央、國(guó)務(wù)院批準(zhǔn),工信部職責(zé)、機(jī)構(gòu)、編制調(diào)整
普通新聞 榮耀Magic Vs2系列正式發(fā)布,刷新橫向大內(nèi)折手機(jī)輕薄紀(jì)錄
普通新聞 GSMA首席技術(shù)官:全球連接數(shù)超15億,5G推動(dòng)全行業(yè)數(shù)字化轉(zhuǎn)型
普通新聞 北京聯(lián)通完成全球首個(gè)F5G-A“單纖百T”現(xiàn)網(wǎng)驗(yàn)證,助力北京邁向萬兆
普通新聞 中科曙光亮相2023中國(guó)移動(dòng)全球合作伙伴大會(huì)
普通新聞 最高補(bǔ)貼500萬元!哈爾濱市制定工業(yè)互聯(lián)網(wǎng)專項(xiàng)資金使用細(xì)則
通信視界
鄔賀銓:移動(dòng)通信開啟5G-A新周期,云網(wǎng)融合/算
普通對(duì)話 中興通訊徐子陽:強(qiáng)基慧智,共建數(shù)智熱帶雨
普通對(duì)話 鄔賀銓:移動(dòng)通信開啟5G-A新周期,云網(wǎng)融合
普通對(duì)話 華為輪值董事長(zhǎng)胡厚崑:我們正努力將5G-A帶
普通對(duì)話 高通中國(guó)區(qū)董事長(zhǎng)孟樸:5G與AI結(jié)合,助力提
普通對(duì)話 雷軍發(fā)布小米年度演講:堅(jiān)持做高端,擁抱大
普通對(duì)話 聞庫:算網(wǎng)融合正值挑戰(zhàn)與機(jī)遇并存的關(guān)鍵階
普通對(duì)話 工信部副部長(zhǎng)張?jiān)泼鳎何覈?guó)算力總規(guī)模已居世
普通對(duì)話 鄔賀銓:我國(guó)互聯(lián)網(wǎng)平臺(tái)企業(yè)發(fā)展的新一輪機(jī)
普通對(duì)話 張志成:繼續(xù)加強(qiáng)海外知識(shí)產(chǎn)權(quán)保護(hù)工作 為助
普通對(duì)話 吳春波:華為如何突破美國(guó)6次打壓的逆境?
通信前瞻
亨通光電實(shí)踐數(shù)字化工廠,“5G+光纖”助力新一
普通對(duì)話 亨通光電實(shí)踐數(shù)字化工廠,“5G+光纖”助力新
普通對(duì)話 中科院錢德沛:計(jì)算與網(wǎng)絡(luò)基礎(chǔ)設(shè)施的全面部
普通對(duì)話 工信部趙志國(guó):我國(guó)算力總規(guī)模居全球第二 保
普通對(duì)話 鄔賀銓院士解讀ChatGPT等數(shù)字技術(shù)熱點(diǎn)
普通對(duì)話 我國(guó)北方海區(qū)運(yùn)用北斗三號(hào)短報(bào)文通信服務(wù)開
普通對(duì)話 華為云Stack智能進(jìn)化,三大舉措賦能政企深度
普通對(duì)話 孟晚舟:“三大聚力”迎接數(shù)字化、智能化、
普通對(duì)話 物聯(lián)網(wǎng)設(shè)備在智能工作場(chǎng)所技術(shù)中的作用
普通對(duì)話 軟銀研發(fā)出以無人機(jī)探測(cè)災(zāi)害被埋者手機(jī)信號(hào)
普通對(duì)話 AI材料可自我學(xué)習(xí)并形成“肌肉記憶”
普通對(duì)話 北斗三號(hào)衛(wèi)星低能離子能譜儀載荷研制成功
普通對(duì)話 為什么Wi-Fi6將成為未來物聯(lián)網(wǎng)的關(guān)鍵?
普通對(duì)話 馬斯克出現(xiàn)在推特總部 收購(gòu)應(yīng)該沒有懸念了
普通對(duì)話 臺(tái)積電澄清:未強(qiáng)迫員工休假或有任何無薪假
普通對(duì)話 新一代載人運(yùn)載火箭發(fā)動(dòng)機(jī)研制獲重大突破
推薦閱讀

亚信科技被Omdia评为5G专网全球供应商挑战者

极简以太彩光网络解决方案4.0正式发布,“彩光”重构园区网络极简之道

首次!不听人类指挥,AI模型拒绝关闭!马斯克评论:令人担忧......

安全+数智 AI赢未来 C3安全大会•2025重磅发布

AI Agent,联想集团能否赢得巨头之战?

开源共建智启未来 开源鸿蒙开发者大会2025成功举办

OpenAI将以65亿美元收购AI初创企业io 携手前苹果设计师Ive进军硬件

微软称全球 39.4 万台 Windows 电脑遭 Lumma 恶意软件感染

魅族Note 16补货来袭,23日开售,火热预约中!

Agent应用爆发 数码视讯助力加速构建自动化大时代
Copyright @ Cntxj.Net All Right Reserved 通信界 版權(quán)所有
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像