语音信号的盲分离(毛丽娟).docx

资源描述

语音信号的盲分离(毛丽娟).docx

《语音信号的盲分离(毛丽娟).docx》由会员分享，可在线阅读，更多相关《语音信号的盲分离(毛丽娟).docx（28页珍藏版）》请在冰豆网上搜索。

语音信号的盲分离(毛丽娟).docx

武汉理工大学《信息群处理课程设计》报告书

课程设计任务书

学生姓名：

毛丽娟专业班级：

通信0906

指导教师：

黄铮工作单位：

信息工程学院

题目:

语音信号的盲分离

初始条件

①matlab软件

②盲信号处理知识

要求完成的主要任务:

根据盲信号分离原理，用matlab采集两路以上的语音信号，选择合适的混合矩阵生成若干混合信号。

选取合适的盲信号分离算法（如独立成分分析ICA等）进行训练学习，求出分离矩阵和分离后的语音信号。

设计要求

（1）用matlab做出采样之后语音信号的时域和频域波形图

（2）选择合适的混合矩阵，得到混合信号，并做出其时域波形和频谱图

（3）采用混合声音信号进行训练学习，求出分离矩阵，编写出相应的确matlab

代码。

（4）用求出的分离矩阵从混合信号中分离出原语音信号，并画出各分离信号的时域波形和频谱图。

（5）对结果进行对比分析。

时间安排

第17周，仿真设计

第18周，完成（答辩，提交报告，演示）

指导教师签名：

年月日

系主任（或责任教师）签名：

年月日

摘要 3

Abstract. 4

1语音信号 5

1.1 语音特性分析 5

1.2 语音信号的基本特征 6

2盲信号处理 8

2.1 盲信号处理的概述 8

2.1.1盲信号处理的基本概念 8

2.1.2盲信号处理的方法和分类 9

2.1.3盲信号处理技术的研究应用 9

2.2 盲源分离法 10

2.2.1盲源分离技术 10

2.2.2盲分离算法实现 10

2.3 独立成分分析 11

2.3.1独立成分分析的定义 11

2.3.2ICA的基本原理 13

3语音信号盲分离的实现 15

3.1 盲信号分离的三种算法 15

3.1.1二阶盲辨识（SOBI） 15

3.1.2FastICA算法 15

3.1.3CICA算法 16

3.2 不同算法的分离性能比较 17

3.3FastlCA 的算法仿真及结果分析 17

4结论 22

5参考文献 23

附录 24

摘要

语音信号盲分离处理的含义是指利用BSS技术对麦克风检测到的一段语音信号进行处理。

混合语音信号的分离是盲分离的重要内容，目前的混叠语音分离大多是建立在无噪环境中的混叠情形下，主要以盲源分离（BlindSourceSeparation，BSS），根据信号的统计特性从几个观测信号中恢复出未知的独立源成分。

本文重点研究了以语音信号为背景的盲处理方法，在语音和听觉信号处理领域中，如何从混叠语音信号中分离出各个语音源信号，来模仿人类的语音分离能力，成为一个重要的研究问题。

我们所要研究的混合语音信号盲分离问题就是用麦克风阵列或多个麦克风阵列来模仿人的耳朵,采集得到相互干扰的混叠语音信号,然后通过分离算法将混叠的语音信号相互分离开来,提取我们所感兴趣的信号。

“鸡尾酒会”问题是语音盲分离问题的典型描述。

它描述了在多人同时说话的嘈杂环境下,我们能够辨识感兴趣人的说话声的能力。

本文主要用ICA算法进行盲分离。

关键词：

语音信号，盲源分离，独立成分分析

Abstract

BlindseparationofspeechsignalprocessingmeansistheuseofBSStechniquesmicrophonedetectsavoicesignalprocessing.Separationofmixedspeechsignalsisimportantforblindseparation,thecurrentseparationofoverlappingspeechisbuiltmostlyintheabsenceofaliasingnoiseintheenvironment,underthecircumstances,mainlyinblindsourceseparation（BlindSourceSeparation,BSS）,thestatisticalcharacteristicsofsignalSeveralobservationsfromtheunknownsignaltorecovertheindependentsourcecomponents;

Thisarticlefocusesonthebackgroundtotheblindspeechsignalprocessingmethod,signalprocessing,speechandhearing,howthenoisefromamixtureofoverlappingspeechsignaltoseparatethevariousaudiosourcesignalstomimichumanspeechseparationabilitybecomeanimportantresearchquestion.wewillstudymixofspeechsignalisblindsourceseparationwithamicrophonearrayormoremicrophonearraytoimitatehumanears,acquisitiongeteachotherinterferencealiasingspeechsignal,andthenthroughtheseparationalgorithmwillaliasingvoicesignalmutualseparated,extractionweareinterestedinsignal."Cocktail"problemisblindsourceseparationoftypicalproblemsspeechdescription.Itdescribesthepeoplespeakatthesametimeinthenoisyenvironment,wecanidentifyinterestedintheabilityofthehumanvoice.ThispapermainlyICAalgorithmwithblindseparation.keywords:

speechsignal,blindsourceseparation,independentcomponentanalysis

1语音信号

1.1语音特性分析

1.语音产生机理

发声器官分为三部分：

肺、喉（声门）和声道。

肺的作用相当于一个动力源，将气流输送到喉部。

喉将来自肺部的气流调制为周期脉冲或类似随机噪声的激励声源，并送入声道。

喉在发声中的作用是控制声带的开启和闭合，使得气流形成一系列脉冲，声带振动的频率决定了声音频率的高低。

由声带振动产生的音统称为浊音，而不由声带振动产生的音统称为清音。

声道包括口腔、鼻腔和咽腔，它们对声源的频谱进行整形而产生不同音色的声音。

声道的谐振频率称为共振峰频率，它与声道的形状和大小有关，每种形状都有一套共振峰频率作为其特征，改变声道的形状就产生不同的语音，因而，当声道形状改变时，语音信号的频谱特性就随之改变。

声源经过声道润色频谱后，最后从嘴唇或鼻孔或同时从嘴唇和鼻孔辐射出来，形成可传播的声波，被人感知为语音。

综上所述，语音由空气流经过声门激励，经由声道调制，经过嘴辐射出去，完整的语音信号产生的数学模型可以用三个子模型：

激励模型、声道模型和辐射模型的串连来表示。

2.语音的特性

（1）短时平稳性

根据对语音信号的研究，语音是一种时变的、非平稳的随机过程，但另一方面，由于人类发声系统的生理结构的变化速度是有一定限度的，在一段短时间内（10～30ms）人的声带和声道形状基本稳定，并且大部分情况下，激励源参数也是如此，因此可认为短时间内语音特征是不变的，语音的短时性特点是对语音信号进行分析和处理的基础。

（2）浊音和清音

语音分为浊音和清音两大类，二者从语音产生的机理上有明显的差异，前者由周期性脉冲产生，后者由随机噪声产生，因而在特征上也有明显的区别。

浊音

在时域上呈现出明显的周期性，在频域上具有共振峰结构而且能量大部分集中在较低频段内。

清音则完全不同，它没有明显的时域和频域特征，类似于白噪声。

浊音在频谱上有共振峰结构，能量重要集中在低频区（<1000Hz），清音没有共振峰结构，能量小且主要集中在高频段（>1000Hz）。

1.2语音信号的基本特征

（1）语音信号的时域特征

由于说话人在不同时刻的说话内容千变万化，而且没有确定的规律性，因此语音信号是时变的。

但由于人类的发声器官的变化速率有限，声道在短时间内（5．500ms）处于平稳状态，因此语音信号具有短时平稳性。

而这种短时平稳性，也是语音处理中许多理论和算法的必要前提。

由于人们在说话时，各个音节或单词之间总会存在着时间上的间隔，

因此语音信号在时域上存在着有音段和无音段。

通过有音段和无音段的检测，可用去除带噪语音中平稳的噪声。

此外，无音段所占比例越大，语音的稀疏性越好，利用这一特点，产生了许多基于语音稀疏性的增强算法。

（2）语音信号的频域特征

语音信号的频谱能量主要集中在300-3400Hz范围内。

语音本身由浊音和清音组成，浊音含有语音信号的大部分能量，其频谱分布主要集中在低频段中的基音频率及其各次谐波上，呈现出明显的周期性；清音则表现出随机性，在频谱上类似于白噪声。

（3）语音信号的统计特征

语音信号可以看作是一个遍历性随机过程的样本函数，其统计特性可用其幅度的概率密度函数来描述。

对语音信号的统计特性的研究表明，其幅度分布的概率密度函数可以用两种近似的表达式来较好地描述，其中一种是伽马（Gamma）分布

p（x）

2 x

（1-1）

式中k是一个常数，与标准差仃，有下列关系

k （1-2）

另一种是拉普拉斯分布（Laplacian）分布

p（x） 0.5 e

（1-3）

式中，口是一个由标准差仃。

决定的常数，即

（1-4）

相对说来，伽马分布对语音信号的幅度分布描述更为精确一点，而拉普拉斯分布的函数形式则更加简洁。

2盲信号处理

2.1盲信号处理的概述

2.1.1盲信号处理的基本概念

盲信号处理是现代数学信号处理、算智能学近年来迅速发展的重要方向。

电子信息、通信、生物医学、图像增强、雷达、地球物理信号处理等众多领域有广泛的应用前景。

盲信号处理就是利用系统（如无线信道、通信系统等）的输出观测数据,通过某种信号处理的手段,获得我们感兴趣的有关信息（如原来独立发射的信号等）。

盲信号的研究是当前学术界的一个研究热点，而盲信号分离则是盲信号研究中的一个重要的课题。

BSS是指从观测到的混合信号中分离出未知的源信号。

展开阅读全文