WELCOME TO CHINA UNIVERSITY-ENTERPRISE COOPERATION

设为主页 收藏本站 本站服务 关于我们 联系我们

合作单位登录

本站首页
科技成果 技术需求 推荐项目 寻求合作 浙大专题 合作单位 人才交流 《高校与企业》 科海导航

分类浏览
按入库时间
按行业分类
按项目编号
 
科技成果基于语音识别处理的专用芯片设计与应用

项目名称:基于语音识别处理的专用芯片设计与应用
项目编号:219-235
行业分类:无线电电子学、电信技术
完成时间:
内容简介:由于现有语音处理芯片性能价格比低,不能满足市场要求,所以我们积极准备开发的基于语音识别处理芯片的应用项目是定位在低端的控制市场,满足芯片的功能稳定可靠及价格低廉(由于低端市场的应用利润空间不是很大)。我们已开发的有特色的语音识别算法已在PC上成功实现。同时,我们基本完成该算法的FPGA仿真。 
项目投资估算详细方案和资金用途:
未来五年内,我们拟投资380万元,但资金主要集中在前两年上,第一年需要180万,第二年需要200万。
国内外相关产品及相关技术的发展现状和趋势:
1、算法特点
与Microsoft和IBM的算法相比,我们的算法专门针对小码本、孤立词、特定人,与他们的算法本质上完全不同。他们的算法属于自然语言识别范畴,难度极大,至今仍不成熟,其核心部分都是基于隐马尔科夫模型(HMM)方法,单独应用于孤立词识别领域效果并不理想,且不适合硬件实现。
我们的算法的主体部分采用了目前已比较成熟的小码本孤立词语音识别技术,主要由预处理、特征提取、特征匹配三大模块组成,在充分应用成熟算法的基础上,我们构建了大容量的语音库,并以此为依据对整个算法做出优化。此外,我们在抗噪、防误识别等方面也有一定改进,并针对硬件实现的特点进行了相应的修改。
2、硬件实现的特点
完全用硬件实现算法:我们要做的是ASIC芯片,摒弃了传统的CPU串行执行方式,从而可大量使用硬件的并行处理技术和流水线操作方式来优化算法,大大提高性能。
芯片中不含模拟部分和存储器:最大限度的简化了芯片的设计,降低了成本,大幅度减少了设计风险。
不使用SOC的体系结构:由于芯片中不含CPU、AD、存储器,所以无需使用其它IP核,从而也无需使用SOC模式,提高了设计的灵活性,降低了成本。
3、抗噪和防止误识别上使用的措施
抗噪:抗噪是目前语音识别领域的一个重大课题,目前所有的语音识别系统在有较大背景噪声下的识别率都会显著降低。我们采取的主要措施是根据码本特征动态构造滤波器对待识别音作前置滤波。在小码本、低训练噪声的情况下,这种方法有较好的效果。
防误识别:目前绝大部分的语音识别系统对码本内语音有较好的识别效果,但对码本外语音的误识率则高得多。我们对此采取了两种措施:一是动态调整识别阈值,二是采用多特征联合识别,取得了较好的效果。
 
对本项目、产品及同类产品的市场前景的分析报告:
让机器接受来自人类的语言指令,是最简单的指令发布形式,因而实现这一人机交互的语音技术是人类迈向最终现代化的下一个台阶,其市场潜力不言而喻。美国Cahners In-Stat Group调查公司的结果显示,2005年时的全球语音识别软件市场规模,将由目前的2亿美元增至27亿美元。IBM预测,2006年语音技术市场在美国将达到300亿美元的规模。而业内人士估测中国在未来5年内,语音应用行业的市场价值为1000亿人民币。语音处理技术与图像处理技术并称为今后处理技术的发展方向。
我们非常希望将交互式语音控制玩具作为推出我们芯片的载体,因而有必要对玩具市场有一个客观的认识。中国作为玩具消费大国和玩具生产大国,2001年国内消费100亿人民币,并且出口51亿美元的玩具,总计500亿人民币。而到2010年仅国内市场将会成长为1000亿元。在这样一个市场空间里,以2001年为基数,假定控制类玩具占其中的10%,就是50亿人民币,再假定用于芯片的采购费用为其售价的10%,则总共的市场规模为5亿人民币。

主办单位:浙江长三角高校企业技术合作中心 浙江大学技术咨询中心 技术支持:浙江省杭嘉湖技术开发公司
Copyright© 中国高校-企业合作网,备案序号:浙ICP备05006851号