信息检索技术论文_科技信息检索论文
信息检索技术论文由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“科技信息检索论文”。
期末课程论文
论文标题:课程名称:信息检索技术课程编号:学生姓名:潘国伟学生学号:所在学院:计算机科学与工程学院学习专业:计算机科学与技术课程教师:
基于音频的信息检索
1220500 1100310220
王
冲
2013年7月3 日
引言:
进入知识经济时代,知识管理、知识服务的理念得到广泛认同,信息检索技术也由基于关键词的信息检索逐步转向针对内容的基于知识的信息检索。较之前者,其检索结果更准确,更贴近用户需求。信息检索是将信息按照一定的规律组织起来,找到所需信息的过程和技术,简单的说,就是信息的有序化识别和查找。信息检索效率就是实施识别和查找过程的效率。信息检索效率不仅是影响信息检索工具价值的重要因素,也是评价信息检索技术发展的重要指标。目前一些基于文本的Web引擎,如Google,Baidu,功能已非常强大,但还缺乏比较实用的音频搜索引擎。Internet上的多媒体流非常巨大,需要一些高效的搜索引擎从浩如烟海的数据中找出需要的信息。另外,音频检索在辅助视频检索和卡拉OK检索系统以及军事、刑侦领域方面都有巨大的应用价值和广阔的研究前景。
基于内容的音频检基索关键技术
问题:
传统的方法,其主要缺点有:
一是当数据量越来越多时,人工注释的工作量加大;
二是人对音频的感知有时难以用文字注释表达清楚,人工注释存在不完整性和主观性; 三是不能支持实时音频数据流的检索。
这里主要综述了音频检索方法,讨论了一些音频检索中的关键技术:音频特征提取、音频分类、语音识别技术等。总体介绍:
语音识别技术概述
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
语音识别技术是以语音信号处理为研究对象,让机器接收并识别、理解语音信号,并将其转换为相应数字信号的技术。让机器听懂人类的语言,这是人们长期以来梦寐以求的事情,而语音识别是一门非常复杂的交叉性学科,它涉及语音语言学、计算机科学、信号处理学、生理学、心理学等一系列学科,是模式识别的重要分支。50年代,是语音识别研究工作的开始时期,它以贝尔实验室研制成功可识别十个数字的Audry系统为标志。20世纪80年代语言识别研究进一步走向深入,基于特定人孤立语音技术的系统研制成功。在过去的30年里,隐马尔可夫模型和人工神经元网络在语音识别中得到了成功的应用。
语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。并通过算法和计算机技术相结合的方式来实现。目前,这样的系统能够做到识别理解数十万条词汇的连续语音信号。这种现代模式识别系统除了在语音领域的应用外,还可以广泛应用于信号处理和模式识别的其他领域。语音识别一般分为两个步骤:
学习和识别阶段。学习阶段的任务是建立识别基本单元的声学模型以及语言模型。识别阶段是将输入的目标语言的特征参数和模型进行比较,得到识别结果。语音识别系统本质上讲是一种模式识别系统,其原理如下图所示:
图1语音识别原理示意图
语音信号的获取
计算机声卡作为语音信号与计算机的接口卡件,其最基本的一项功能就是A/D转换。声卡是pc的一种多媒体设备,可以用windows的MCI(Media Control Interface)命令来控制声卡。
图3信号获取过程中相关函数使用流程示意图
音频检索的基本方法
音频检索第一步是建立数据库,对音频数据进行特征提取,并通过特征对数据聚类。音频检索主要采用示例查询方式(Query by example),用户通过查询界面选择一个查询例子,并设定属性值,然后提交查询。系统对用户选择的示例提取特征,结合属性值确定查询特征矢量,并对特征矢量进行模糊聚类,然后检索引擎对特征矢量与聚类参数集匹配,按相关性排序后通过查询接口返回给用户。相似音频例子检索
相似音频例子检索是指基于用户提交的查询音频,得到最相似的音频,即计算音频特征的距离。对音频数据提取特征后,假设共N个特征,则形成了一个N维特征矢量的序列。为了缩减数据量而又不失掉每个音频原来的特征,可以对N维特征矢量进行聚类,提取出固定数目的质心来表示音频,即用聚类质心来为音频建立索引。一般采用模糊聚类法,模糊聚类首先要对N维特征矢量进行归一化,一般采用高斯归一化。音频分类识别
音频分类是判断一个给定样本所在的类别,其任务是通过相似度匹配算法将相似音频归属到一类,属于模式识别的问题。首先应提供适量的训练样本,比如选取足量的音乐文件,然后提取样本特征,类似如上所述进行聚类处理,不同的是将每类的全体文件看成一个音频数据来处理,计算该类的样本模板。
判断文件的类别时,与计算音频相似度类似,计算音频的模板与各类模板间的距离,当距离小于某一阈值或为最小距离时,则此时的类即为文件所在的类。结
语
本文阐述了基于音频检索的一些常用技术及相关问题,包括音频特征提取、相似音频检索及音频分类。基于音频检索是一个涵盖十分广泛的研究领域与想好处理,人感知心理研究,语音识别等科学密切相关。为使计算机与人一样能自动对音频语义实现自动理解并根据语义高级内容进行音频检索,还要面临很大挑战。参考文献:
[1] 卢 坚, 陈毅松, 孙正兴, 等.基于隐马尔可夫模型的音频自动分类[J].软件学报, 2002, 13(8): 1 593-597.[2] 庄越挺, 潘云鹤, 吴 飞.网上多媒体信息分析与检索[M].北京:清华大学出版社,2002.[3] 李国辉,李恒峰.基于内容的音频检索:概念和方法[J].小型微型计算机系统, 2000,(11): 1 173-1 177.[4]尹江艳.基于HMM和ANN语音识别研究[J].2007.4:14 [5] 柳春 语音识别技术研究进展[J] 甘肃科技 2008/09 [6刘幺和 语音识别与控制应用技术[M] 北京科学出版社 2008
文中涉及的公式:
Em1N[x(n)]m2
频率中心 是度量声音亮度(brightne)的指标,计算公式为
WFC0F(w)wdw/E
刀豆文库小编为你整合推荐4篇信息检索技术论文,也许这些就是您需要的文章,但愿刀豆文库能带给您一些学习、工作上的帮助。......
信息检索技术论文无论是身处学校还是步入社会,说到论文,大家肯定都不陌生吧,论文是对某些学术问题进行研究的手段。你知道论文怎样才能写的好吗?以下是小编为大家整理的信息检索......
近年来,计算机技术、语言学以及人工智能技术的发展促进了整个信息检索技术领域的发展。今天小编要给大家介绍的便是信息检索技术论文,欢迎阅读!信息检索技术论文[摘要]通过对近......
信息检索技术论文近年来,计算机技术、语言学以及人工智能技术的发展促进了整个信息检索技术领域的发展。今天小编要给大家介绍的便是信息检索技术论文,欢迎阅读!信息检索技术论......
应用化学化学与化工信息检索论文题目:造纸污水处理技术现状及进展学生姓名------学号--------专业应用化学指导教师----2010年12月 25日造纸污水处理技术现状及进展摘要:本文......
