完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
随着互联网(Internet)和电信网等信息网络的蓬勃发展,人们的信息交互变得越来越方便,除了文字信息,语音、音乐、图像等多媒体信息也越来越多地进入了人们的日常生活中。例如,在广播或电视媒体中每天都在增加的语音文档或视频文档,在日常生活中的音视频电子邮件等。目前针对文字信息的检索已经有许多成功的应用,如:Google、Yahoo、百度等搜索引擎,但如何利用计算机对非结构化的海量多媒体数据做信息检索是目前急需解决的一个难题。音频信息中主要包含语音、音乐、说话人、语种等内容信息。相应的音频识别威廉希尔官方网站
主要包含以下几类:语音识别威廉希尔官方网站
、说话人识别威廉希尔官方网站
、语种识别威廉希尔官方网站
、音乐识别检索威廉希尔官方网站
。语音识别威廉希尔官方网站
可以将音频中语音转换为文字,说话人识别威廉希尔官方网站
可以确定音频信息中的说话人身份,语种识别威廉希尔官方网站
可以确定音频信息中所用语言的种类,音乐识别检索威廉希尔官方网站
可以识别检索出音频中的音乐旋律片断。通俗一些说,给定一个音频文件,运用上述威廉希尔官方网站
可以自动从音频文件中获得这段音频的内容信息:“由谁说的、用的什么语言、说的内容是什么”。因此,利用音频信息识别与检索威廉希尔官方网站
可以对多媒体文档中的音频信息自动建立索引,以解决对非结构化的海量多媒体数据的信息检索。以下将主要介绍音频信息识别与检索的几项关键威廉希尔官方网站
。
|
|
相关推荐 |
|
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2025-1-31 10:45 , Processed in 0.437020 second(s), Total 42, Slave 33 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号