1、盲源分离
盲源分离(Blind Source SeparationBSS),是指在不知源信号和传输通道的参数的情况下,根据输入源信号的统计特性,仅由观测信号恢复出源信号各个独立成分的过程(这一过程又称为独立分量分析(Independent Component AnalysisICA)。现在所指的盲源分离通常是对观测到的源信号的线性瞬时混迭信号进行分离(当考虑到时间延迟的情况下,观测到的信号应该是源信号和通道的卷积,对卷积混迭信号进行盲分离通常称为盲反卷积(BlindDeconvolutionBD)。盲源分离和盲反卷积方法的研究在语音、通信、生物医学工程和地震等各个领域具有非常重要的理论价值和实际意义。
2、盲源分离和盲反卷积系统的数学模型
考虑如下线性瞬时混迭信号系统模型:
x(t)=As(t) +n(t),
其中X(t)是M维观测信号矢量,s(t)为N维未知源信号矢量,n(t)为M维加性观测噪声,A为未知混合矩阵;每个观测信号Xi(t)都是N个未知源信号s(t)的瞬时线性组合。
盲源分离问题就是求一分离矩阵W,使得通过它可以仅从观测信号x(t)来恢复出源信号s(t),设y(t)为源信号的估计矢量,则分离系统输出可通过如下数学模型表示:
y(t)=Wx(t),
更一般地,传感器测得的信号是源及其滤波和延迟的混迭信号的线性组合,通常称为卷积混迭’无噪声多通道卷积混迭信号的数学模型可以用下式所示:
x(t)=A(z)s(t)=∑A(k)s(t-k)
其中y(t)为均衡输出矢量;W(z)称为均衡器,W(k)为均衡器系数矩阵。
3、盲源分离方法
在已有的盲源分离方法中————,都是利用了源信号统计独立的假设,主要的方法是基于高阶统计和信息理论的方法。
基于高阶统计的自适应盲源分离算法大致可分为两类:准则函数或训练算法中不明确含有高阶累积量的算法称为隐累积量算法准则函数或训练算法中含有高阶累积量的算法-称为显累积量算法。
隐累积量算法这类方法中较典型的是由Herault和Jutten 较早提出的神经网络算法通常称为H-J 算法 他
们选用递归网络结构,分离网络输出为
y(t)=x(t)-W(t)y(t)
其权系数训练公式为
显累积量算法是一类以简单的高阶统计峭度作为代价函数,利用随机梯度算法来得到分离阵W的自适应训练算法,通常称为基于峭度极值的算法,设对第i个源信号分量Si(t),它的没有归一化的峭度定义为:
对高斯信号,峭度=0,当峭度小于0时,称源信号si(t)为亚高斯(sub-gaussian)的,其概率分布比高斯信号的要平;当峭度大于0时,称si(t)为超高斯(super-gaussian)的,其概率分布比高斯信号的要尖。所以,峭度可以用来衡量信号的高斯性,定义峭度作准则函数,也就是用它来衡量信号与高斯分布的距离。这是因为在盲源分量问题中,观测信号是源信号的线性叠加,根据统计理论,其高斯性应增强;信号分离的过程,就是网络输出的各分量非高斯性增强的过程。
这类算法通常需要预白化,即E[s2i(t)]=1,从而简化为:
基于信息理论的方法:盲源分离问题也引起人工神经网络社会的广泛关注,因为分离网络事实上为一线性前馈神经网络,完全可以用神经网络的理论和方法求解。此时,盲源分离就是发展一个自适应权更新规则以使网
络输出尽可能独立,所以这类网络又称独立分量分析网络
Linsker认为,神经网络应从其输入中获取最大信息量并导出了无监督训练(Infomax)算法,以最大化神经网络输入和输出之间的互信息.可以这样认为,通过独立分量分析进行盲源分离,就是使网络输入输出之间获得最大信息传输并使输出互信息为零。
现阶段基于信息理论准则的自适应盲源分离算法研究大致可分为最大信息传输(Information-Maximiation-Infomax),最大似然估计(MLE)和输出互信息最小化(MMI)三类.具体请参考相关文献。
盲反卷积方法:Tokkola提出了一个反馈网络结构将Infomax算法推广到更广泛的情况,即具有时间延迟的源的混迭或卷积混迭信号的盲分离。Lee和Bell将基于信息最大传输或最大似然算法得出的盲源分离训练算法变换到频率域,并利用FIR多项式代数技术进行盲反卷积。
H-J算法的扩展这类算法是瞬时混迭盲源分离H-J网络训练算法的直接推广.针对反馈分离网络和卷积混迭模
型,卷积混迭信号的反馈分离网络输出为:
Plat和Faggin为这类网络确定了用来进行优化的理论准则-最小输出功率原理,即当独立分量得以分离,则信号的功率达到最小,由此利用梯度下降法得到该网络的训练公式,它恰好是H-J算法的推广:
此外还有累积量算法的扩展和信息理论算法扩展。
非线性盲源分离方法:在实际的环境里,观测到的混迭信号可能是经过非线性混迭得到的,此时线性混迭信号盲分离的方法不再适用,如果把非线性混迭模型仍视为线性混迭并利用线性方法求解,可能导致错误的结果。因而,作为一般的模型,非线性混迭信号的盲分离问题的研究近来也引起许多研究者的注意。由于完全非线性混迭盲分离问题的复杂性,现有的非线性混迭信号盲分离算法研究的都是后非线性混迭的情况,即对源信号线性混迭后再加以非线性。
已经进行的研究可以分为两类:一类是直接将现有的线性混迭分离方法通过引入非线性进行扩展,使之适用于非线性混迭的情况!。这一类算法主要针对后非线性混迭情况,对不同的目标函数进行优化!。如Table和Jutten提出了基于输出互信息的后非线性混迭信号的盲分离方法,该方法分别自适应地估计非线性和线性部分,它和Lee提出的基于信息最大化准则的方法类似;Yang等提出的信息后向传输方法,包含了以上两种准则,但可以分离通道间存在交叉非线性混迭的情况,即对后非线性后再对f(s(t))进行线性混迭的信号作为观测信号,此仍然属于特定的混迭情况。另一类则是通过提取非线性特征等方法直接进行分离。
4、总结与展望
到目前为止,大多数从事盲信号处理研究的人都局限于方法的研究,还有许多理论上的问题需要解决,如盲分离算法的全局收敛性和渐近稳定性等问题的分析以及算法的鲁棒性研究等。要想取得理论上的突破,需要更多的基础理论方面的学者的参与。我们认为在今后应该对以下问题进一步研究:
(1)带噪声混迭信号的盲分离问题。由于在盲信号处理中,存在太多的未知条件,带噪声的混迭信号盲分离是困难的。现在研究的大部分盲源分离或盲反卷积算法,大都假设无噪声情况或把噪声看作一个独立源信号。在高阶统计方法中由于高斯信号高阶累积量为零,所以可以假设加性高斯噪声存在。已有的盲分离方法在什么情况下可以应用到一般的噪声混迭模型,是有待研究的问题。
(2)虽然盲源分离是从所谓的“鸡尾酒会”问题引出的,但是这个问题还远没有很好地解决。由于这涉及到多通道卷积混迭系统和盲反卷积系统的稳定性和相位不确定性问题。尤其是源的数目未知时盲反卷积问题以及带噪声的情况,由于需要太多的参数来描述系统,这即使在非盲的情况下的反卷积的研究都是非常困难的,盲反卷积问题的研究远比线性瞬时混迭信号的盲分离要复杂得多。
(3)无论是盲源分离还是盲反卷积,现在的研究都假设传感器的个数不少于源信号的个数,对源信号个数多于传感器个数的问题如何解是又一个困难的问题。
(4)现在的非线性混迭信号盲源分离方法研究的只是在极特殊情况下的非线性混迭的情况。对更一般的非线性混迭信号的可分离性以及分离的充要条件需作进一步的研究。
(5)非平稳混迭信号的盲分离问题。许多情况下源信号可能是非平稳的,例如源可能消失后再出现。如何利用信号的非平稳特性进行盲分离是解决这类问题的一个方向。
以上内容皆参考自刘琚,何振亚.盲源分离和盲反卷积[J],电子学报,2002,30(4):570-575