基于麦克风阵列的鸟声定位识别系统

 2022-01-19 11:01

论文总字数:22353字

目 录

一、绪论 1

1.1 研究背景及意义 1

1.2 国内外研究现状 1

1.2.1 对鸟鸣声的研究发展 1

1.2.2 使用鸟鸣声进行鸟类观测的研究发展 2

1.3 研究内容与实现方案 2

1.3.1 声音信号特点分析 2

1.3.2 声源定位算法的选取 2

1.3.3 特征提取算法的选取 3

1.3.4 分类模型的选取 3

1.3.5 软件编写 3

二、设计方案的选择和论证 4

2.1 系统设计平台的选择论证 4

2.2 数据采集电路的选择论证 5

2.3 开发软件平台的选择论证 5

2.4 开发语言的选择论证 6

2.5设计框图 7

2.6 硬件电路设计 8

2.6.1 ARM单板计算机的电路设计 8

2.6.2 音频采集模块的电路设计 11

三、软件与算法设计 14

3.1 软件开发平台与开发语言简介 14

3.2 软件实现功能与算法分析 14

3.2.1 语音信号端点检测 14

3.2.2 声源定位实现 15

3.2.3 特征提取 16

3.3 流程图 21

3.4 存在的问题和持续改进的方案 22

四、系统测试结果 23

4.1 系统测试方案 23

4.2 声源定位精度测试 23

4.3 鸟类种类识别精度测试 23

参考文献 24

致谢 26

基于麦克风阵列的鸟声定位识别系统

石磊

电子与信息工程学院

摘要:随着现代科技水平的逐步提高,电子设备具有向小型化和自动化发展的大趋势。在此背景下,我们可以设计一个使用声音进行监测的小型装置,众所周知,丛林中广泛存在的声音有很多,鸟声是其中一种。为此我们提出了一种可以对鸟鸣声定位识别的系统。该系统基于树莓派开发板结合音频采集模块,设计了一个具有录制和对音频文件进行特征分析处理功能的小型设备。首先是通过监测环境声音的短时平均能量来判断鸟鸣声的信号端点。如果检测到鸟鸣声,则开始进行定时的录音。通过广义互相关算法(GCC_PHAT)和梅尔频率倒谱系数算法(MFCC)可以对多通道的录音文件进行分析,从而得到到达时延信息(TDOA)和语言信号特征。对照已有样本训练的模型可以进行概率估计从而得到鸣声的方位信息和鸟类品种信息。

关键词:麦克风阵列,广义互相关,梅尔频率倒谱,到达时延信息,语言信号特征

Bird Sound Localization and Recognition System Based on Microphone Array

Shi Lei

School of Electronic amp; Information Engineering,NUIST,Nanjing 210044,China

Abstract:With the gradual improvement of the level of modern science and technology, electronic equipment has a major trend towards miniaturization and automation. In this context, we can design a small device that uses sound to monitor. As we all know, there are many sounds that are widely found in the jungle, and bird sound is one of them. For this reason we have proposed a system that can locate and identify bird sounds. The system is based on the Raspberry Pi development board combined with the audio acquisition module and designed a small device with the ability to record and analyze the audio files. The first is to determine the signal endpoint of the bird song by monitoring the short-term average energy of the ambient sound. If a bird song is detected, a timed recording starts. Through the generalized cross-correlation algorithm (GCC_PHAT) and the mel-frequency cepstrum coefficient algorithm (MFCC), multi-channel recording files can be analyzed to obtain arrival delay information (TDOA) and speech signal characteristics. The model trained against existing samples can be used to estimate the probability to obtain the azimuth information of birds and bird species information.

Key words:Microphone array,generalized cross-correlation,Mel frequency cepstrum,arrival delay information,speech signal characteristics

一、绪论

1.1 研究背景及意义

地球不仅是人类赖以生存的家园还具有多个生态系统包括湿地,森林与海洋。这三大生态系统有各自的特点也有共性,于此之上诞生了各具特色且有着丰富的物种资源的生物群落。研究生物群落可以帮助我们得到许多的有用的信息,包括该地的物种多样性,物种分布等等。得到原始数据后,通过进一步分析,我们可以对该地的生态系统进行分类和特征评估,从而加深对不同生物群落和生态系统的了解。

但是对物种信息进行观测和统计往往耗费了大量的人力,即便如此也无法进行持续的可靠的统计,尤其是某些濒危物种的统计更是困难。例如在鸟类的观测和统计上,由于鸟类的警惕性高,目标小,目前只能使用观鸟镜加人工计数的方式进行统计,某些稀少的不易见到的鸟类品种更是无从下手,只能依靠偶遇或者鸟巢的发现。然而无论如何的小心翼翼,这些接触式的观测手段都会对鸟类存在或多或少的影响甚至伤害。由此看来,观测手段的落后使得对稀有鸟类的追踪和统计存在较大的误差和不确定性。

从观察目标的特征考虑,由于鸟类物理体积小,且隐匿与树木之间,通过直接的视觉方式(例如摄像头)探测存在较大困难。众所周知的是鸟类具有优秀的“歌喉”,它们通常使用声音来进行交流和传递信号。通常鸟类会通过鸣声进行歌唱、警报这两类基本的信息传递,且鸣声频率较高(例如知更鸟可以发出2000~13000HZ的声音),在野外环境下传播距离远,适合通过设备进行采集,分析。

剩余内容已隐藏,请支付后下载全文,论文总字数:22353字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;