一个音乐搜索引擎的设计与实现

 2023-03-05 12:03

论文总字数:27345字

摘 要

互联网上数据总量一直成指数级的增长,人们为了快速获取自己寻找的信息,往往要到搜索引擎网站利用搜索引擎帮助自己表达意思,帮助实现查询。我们也都已经习惯使用Google、Baidu等通用的全文搜索引擎,并发现自己已经离不开搜索引擎了。但于此同时我们也发现,强大的Google和Baidu有时并不能很好的得到查询结果,特别是对于一些专业领域,效果并不好。然而,对于特定领域的搜索,垂直搜索引擎要比通用搜索引擎表现的更出色。垂直搜索引擎是针对专业领域信息进行爬取、索引、处理、查询。因为它查找的内容更具有鲜明的特点,所以搜索的结果更准确、更可靠。

为了让用户得到更好音乐资源搜索体验,本文对于音乐搜索领域展开研究,试图找到一个更好的音乐垂直搜索引擎,因此准备研究和设计一个音乐搜索引擎。音乐搜素引擎总的由四个部分组成:网络爬虫(Crawler),索引器和检索器,用户接口,音乐播放器。

本文使用网络爬虫对各种音乐种子网站进行爬取,将爬取到音乐文件存储在索引库中。索引器和检索器利用Apache提供的Lucene开源库,实现对索引库中音乐文件进行索引、中文分词、提供查询等功能。用户接口是通过使用JSP、Servlet、Html、JFinal等技术实现的一个音乐搜索网站,提供基于Web的音乐搜索。并提供音乐播放器,在线播放音乐。

关键字:音乐;搜索引擎;垂直搜索;Crawler;Lucene

Abstract

Internet on the amount of data has been exponential growth, people in order to quickly obtain information to find their own tend to to search engine sites use search engine to help himself to express their meaning, help realize the query. We have also used the Google, Baidu and other general search engine, and found himself can not do without the search engine. But at the same time, we also found that the powerful Google and Baidu sometimes can not get good results, especially for some professional areas, the effect is not good. However, search for a specific area, the vertical search engine is better than the general search engine performance. The vertical search engine is the information of the professional field to climb, index, process, query. Because it finds the content more features, so the search results more accurate and reliable.

In order to allow users to get better music resources search experience, this paper for music search launches the research, trying to find a better music vertical search engine, so ready to research and design a music search engine. The music search engine consists of four parts: web crawler (Crawler), an index device and a search device, user interface, and music player..

In this paper, web crawler is used to climb the various music seed sites, and the music file is stored in the index database.. The index and the retrieval device use the Lucene source database provided by Apache, and realize the function of the music file index, Chinese word segmentation, and query etc.. The user interface is a music search website which is realized by JSP, Servlet, Html, JFinal, etc., and provides the music search based on Web.. And provides the music player, the on-line plays music.

Keywords: music; search engine; vertical search; Lucene; Crawler

目录

摘要 I

Abstract II

目录 III

第一章 引言 1

1.1背景与意义 1

1.2国内外相关研究现状 1

1.2.1搜素引擎研究现状 1

1.2.2垂直搜索研究现状 2

1.3本文的研究目标和内容 2

1.4研究方法与技术路线 3

1.4.1研究方法 3

1.4.2技术路线 3

1.5论文结构安排 6

第二章 相关技术基础 7

2.1面向对象的分析与设计 7

2.2JAVA编程环境介绍 7

2.3Eclipse集成开发环境 8

2.4Web服务器Tomcat 8

2.5JAVA框架JFinal 8

第三章 系统需求分析与设计 9

3.1需求分析 9

3.1.1功能需求分析 9

3.1.2数据需求分析 9

3.2总体设计 10

3.3详细设计 11

3.3.1网络爬虫的设计 12

3.3.2索引内容提取 13

3.3.3建立索引和建立查询 14

3.3.4构建Web 搜索程序 18

第四章 系统实现及运行测试 19

4.1运行环境及工具介绍 19

4.2核心代码分析 19

4.2.1网络爬虫代码分析 19

4.2.2网络爬虫运行代码分析 25

4.3系统测试 27

4.3.1功能测试 27

4.3.2性能测试 29

4.4系统运行 31

第五章 总结 35

致谢 36

参考文献 37

附录 39

附录1 音乐搜索引擎项目的包资源目录结构 39

附录2 音乐搜索引擎项目的包资源目录解释 39

第一章 引言

1.1背景与意义

剩余内容已隐藏,请支付后下载全文,论文总字数:27345字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;