论文总字数：18716字

目录

1 绪论 5

1.1 研究背景和意义 5

1.2 国内外研究现状及分析 5

1.3 本文研究内容与组织结构 5

2 麦克风阵列模型 6

2.1 声源特性 6

2.2 近场远场范围判断准则 7

2.3近场模型 8

2.4远场模型 9

3 PSO-BP 算法 10

3.1 粒子群算法的简单介绍 10

3.1.1 PSO基本原理 11

3.1.2 PSO算法优缺点 11

3.2 BP神经网络 11

3.2.1 BP神经网络模型结构 11

3.2.2 BP神经网络学习过程 12

3.3 PSO优化BP神经网络 12

3.3.1 可行性分析 12

3.3.2 PSO-BP组合模型核心思想 12

4 窄带信号的DOA估计模型 13

4.1 传统DOA估计方法 14

4.1.1 MUSIC算法 14

4.2 基于PSO-BP的DOA估计方法 15

4.3 仿真分析 16

4.3.1 DOA估计精确性比较 16

4.3.2 信噪比对算法性能影响 17

5 宽带信号的DOA估计模型 18

5.1 基本互相关法 18

5.2 广义互相关法 19

5.3 仿真分析 21

5.3.2 信噪比对算法性能影响 22

5.3.3 阵元个数对算法性能影响 23

5.4 实验分析 23

5.4.1 信噪比对算法性能影响 24

5.4.2 阵元个数对算法性能影响 25

6 总结与展望 25

6.1 总结 25

6.2 展望 26

参考文献： 27

致谢 28

基于神经网络的麦克风阵列DOA估计算法

蔡力坚

，China

Abstract: This paper proposes an PSO-BP algorithm which applies to DOA estimation of microphone array. We use the first row of the array covariance matrix as the arrival wave azimuth characteristics. The conventional upper triangular matrix algorithm can greatly reduce the feature dimension, and the effective azimuth information is not lost. In the DOA estimation of wideband signals, the phase shift weighted generalized cross-correlation (GCC-PHAT) method is used to calculate the time difference of the signals arriving at each array element. As the input of the PSO-BP network, the computational load is not that big. And through simulation and some kind of experiments, it can be proved that compared with the classical RBF neural network method, the neural network structure of this method is more concise and the accuracy of incoming wave azimuth estimation is higher.

Key words: DOA estimation; microphone array; network; GCC-PHAT

1.绪论

1.1 研究背景和意义

语音信号易于传递信息，尽管信息传递方式种类繁多，包括早期的烽火台燃烟报告敌情、驿站快马加鞭传递军令，比如QQ、E-mail等，仍然改变不了语音通信在人类社会发展过程中至关重要的地位。朋友之间的嘘寒问暖，脍炙人口的乡间小调，私塾老师的传道授业解惑，无不涉及语音。语言能力作为人类特有的功能，以声音作为表达工具，以空气作为传播途径传递着信息。语音信号发展至今，仅仅近距离的实时交流己经远远不能满足人们的日常生活需求，但是远程的语音通信却通常受制于环境噪声等因素，处理性能下降，达不到人们的期望。核心工作如下在于接收和处理携带语音信号特征的语音参数，但是复杂的语音环境使得其中困难重重，即使是经过这么多年来无数学者的努力，仍有巨大的改进空间。得益于先进的阵列处理技术以及计算机处理能力的飞速发展，由多个麦克风构成的麦克风阵列被用于通信和语音识别。单个麦克风收到太多的噪音和混响，限制了单声道噪音抑制算法的性能。而麦克风阵列可以将其看成一个麦克风对于多个阵元接收到的信号，只是这个信号拥有更高的方向性。这意味着减少了接收到的噪声和混响，麦克风阵列接收到的信号实现了降噪和减少了混响对其的影响，噪声抑制算法表现更加良好。

1.2 国内外研究现状及分析

上世纪八十年代，麦克风阵列技术被试图添加到数字信号处理领域。随后，人们提高了对语音数字信号质量的要求，越来越多的国家也开始跟进，投入对这方面的研究当中，成为科研领域一大热点。后来随着科技的发展，麦克风阵列的数字处理算法也发展迅速。尤其是近年来，麦克风阵列技术在理论研究方面掀起了一个新的高潮，各种新的理论和新的算法不断涌出。经过多年来的共同努力，科学家们也已取得了长足的进步。

谱空间^[1]估计技术代表空间范围内各个方向上的不同阵元间的能量分布，信号的波达方向即是能量最大处。Schmidt等人于1979年提出确立了的核心思想：通过特征分解、奇异值分解构造出信号子空间和与之正交的噪声子空间，两者再于空间谱能量最大处构造出谱峰，由此获取信号DOA，极大提高了算法分辨精度。

来波信号到达角估计问题一直以来都会被用于处理各种信号问题，并广泛为人关注。无论是DOA估计中还是在数学计算过程中也可以进行并行快速运算，这样才能够具有实用性，应用到工程中去。目前该领域大部分文献采用了RBF神经网络和BP神经网络来解决DOA估计问题,但BP算法会存在一定程度上不可预测的缺点

1.3 本文研究内容与组织结构

本文主要对采用神经网络实现DOA估计问题进行研究与探讨。首先介绍了背景，然后建立了麦克风阵列模型应用于阵元研究。在此基础上，通过粒子群算法和BP算法的比较分析对照，建立了-BP神经网络算法。粒子群算法会采用目标函数去自适应不同的梯度信号，避免了噪声和混响对于阵列的干扰接着分别对于窄带信号和宽带信号采用-BP神经网络算法分析，并进行阵元之间的仿真实验，从而验证结论。

第一章：绪论。首先说明麦克风阵列技术和DOA估计方法的研究背景、意义和研究现状。

第二章：详细分析了麦克风阵列模型。对于麦克风近场模型进行阵列分析，这是展开本文工作的基础。

第三章：分析了-BP模型。分别对粒子群算法和BP神经网络算法进行原理介绍和分析，并探讨了各个算法对于各种环境的局限性，在可行性基础上，讨论了改进方案。并提出了-BP模型的建立及原理，对于其对信号来波到达角进行初步探测的步骤进行了分析。

第四章：介绍了窄带信号的DOA估计。首先介绍了传统的应用于麦克风阵列的DOA估计方法即算法，对于其原理和基本步骤都进行了简要分析介绍。重点讨论了基于PSO-BP神经网络的窄带信号的估计方法，并进行可行性分析，并对于RBF，-BP，MUSIC三种算法，在MATLAB平台上，对三种算法分别进行不同的仿真试验，并进行对比分析，验证了-BP算法进行DOA估计的优越性。

第五章：介绍了宽带信号的估计。采用GCC-PHAT算法计算信号到达个阵元的时间差，让其作为-BP神经网络的阵元导入量，大大减少了运算量。并进行了仿真试验和消音室实验，验证了其优越性。

第六章：总结与展望。