像大多数识别问题一样,音频识别分为几个步骤:
1.特征提取2。索引数据库3。搜索和模糊匹配4。识别结果的拼接特征提取算法很多,基于FFT的频域信息比较简单,值得进一步研究。频域信号提取出来后,因为频带太多,一般需要合并成几个大的频带。
比如飞利浦 算法是合并成32个频段。我之前做的系统是合并成6个频段,Shazam s是4个频带。特征的好坏直接影响识别效果,需要反复优化。
特征提取出来后,需要建立一个索引库来存储所有的特征,每个特征要对应一部分实际内容。
事实上,索引数据库往往非常大,因此通常不使用普通的关系数据库。我用了redis和python dict。因为查询太频繁,尽量不要上网。我之前做了一个系统,一个24小时的音频,数据库上的特征查询次数是几十亿到几百亿。上网是不可想象的。
搜索过程就麻烦多了,因为是多媒体数据。
具体来说,需要设计一种模糊匹配方法。很多因素都会导致提取的特征与原始特征之间产生误差,所以需要想办法减小误差对结果的影响。
比如FFT分段的过程会引入高频噪声,50Hz的工频也会引入噪声,所以我取FFT频段一般选择64~3300Hz的范围。
在模糊匹配方面,可以使特征中的每一个值/-1,然后生成很多子特征在索引数据库中查询。
上面的识别结果只是一些点,也就是说这个点匹配了一些结果,往往会有很多结果。
这时候就要把点连成段才是有意义的结果。
例如,如果你认识三个单词,中间的那个可以 你听不见我吗?你#34,并且索引数据库已经包含句子#34我爱你#34。那么从这些应该可以推断出,有一定的概率结果与索引数据库中的结果相同。
实际建立概率模型也是一个巨大的麻烦。中间跳过的不明点数量也是经验数据。
比如我试了一个点1/8秒,跳过六个点会产生很多误识别,但是跳过两个点会比不跳的识别率高很多。
我在过去的两年里设计了一个音频识别系统,包括上面所有的组件,用来识别电视节目中的广告。
在高峰期,索引库中大约有1000小时的音频。正确识别率在95%-98%之间波动,错误识别率在2%-3%之间波动。
输入24小时音频的识别时间约为5~10分钟。
想更好的了解传统数据和大数据的区别,去哪里找数据,可以用什么技术处理数据?
这些在处理数据时是必要的。迈出第一步,所以这是一个很好的起点,尤其是如果你正在考虑从事数据科学的职业!
"数据与信息是一个宽泛的术语,可以指 "原始事实和证据, "处理过的数据和or "信息与广告。为了确保我们在同一页上,让 让我们在进入细节之前把它们分开。
我们收集原始数据,然后对其进行处理以获得有意义的信息。
嗯,它 分开它们很容易!
现在,让我们 让我们进入细节吧!
智能家居正逐渐成为现代家庭的新标配,而其中的家具设计则扮演着重要的角色。随着科技的不断进步,智能家居家具的设计也在不断演变,以满足人们对于舒适、便利和智能化生活的需求。本文将从几个论点出发,介绍智能家居中的家具设计。首先,智能家居家具设计考
导言:随着科技的不断发展,人们对音频设备的需求也越来越高。小米音箱作为一款颇受欢迎的智能音箱,与笔记本电脑的连接方式也备受关注。本文将为你详细介绍如何连接小米音箱和笔记本电脑的步骤,并提供一些注意事项,帮助你更好地利用这两个设备。第一步:确
excel怎么在线共同编辑?首先打开我们需要协同编辑的ExcExcel表格在网络共享的情况下,怎么才能使多人同时进行编辑并保存?打开要共享的表单,单击工具-共享工作簿。点击确定即可。怎样将一个excel共享后,多人同步操作和编辑?几个不同文
1. 系统原因导致无法重新安装首先,有些软件在卸载时可能并没有完全清除与其相关的数据和注册表项,导致重新安装时出现冲突。此时,我们可以尝试通过以下步骤解决:- 使用专业的卸载工具:借助第三方卸载工具,能够深度清理软件残留文件和注册表项,确保
Windows 7作为一款成熟稳定的操作系统,十分受用户喜爱。然而,随着科技的不断发展,Windows 10作为最新版本的Windows操作系统,带来了更多的功能与优化。因此,许多用户都希望将自己的旧系统升级到Windows 10,以获得更
UG软件是一款常用于机械设计的强大工具,其装配模块可以帮助用户进行零部件的组装和查找。在复杂的装配结构中,找到特定的零部件可能会变得很困难。下面将介绍几种在UG装配模块中查找零部件的方法。1. 使用“查找”功能UG软件提供了一个强大的“查找
怎样取消大白菜的绑定文件?已取消绑定的详细步骤::1.在使用白菜重装电脑前面,将不需要的软件啊列表中中间的勾点掉。2.打开后大白菜启动光盘软件是包,将的那个软件删除掉即可。3.在用原始系统安装方法再安装系统后,尽量减少在用水萝卜软件啊来再安
引言:购买了新的苹果手机后,很多人都会面临一个问题,就是如何将旧手机中的重要数据(如联系人、短信、照片等)迁移到新设备上。在本篇文章中,我们将为您详细介绍导入旧手机数据到新苹果的具体步骤和一些实用技巧。第一步:备份旧手机数据1. 使用iCl
1. 选择适当的图片水印工具 首先,您需要选择一款适合您需求的图片水印工具。在市场上有很多免费和付费的选项,例如Photoshop、GIMP、PicMarkr等。根据您的需求和技能水平,选择一款最方便易用的工具。2. 准备水印图片
oppo R17恢复出厂设置步骤详解,让你的手机重归如新oppo R17出厂设置、oppo R17重置教程oppo R17、恢复出厂设置、操作步骤、重置教程电子产品教程、手机技巧本文详细介绍了oppo R17恢复出厂设置的步骤,帮助用户在需