【科技】百度取得汉语语音识别技术重大突破
本篇文章1610字,读完约4分钟
近年来,随着机器学习行业深度学习技术的迅速发展和大数据词汇的积累,语音识别技术取得了飞跃性的进步。 但是,进一步提高语音识别的准确率、识别速度,比较有效地控制价格,使语音技术将来能够大规模产业化仍然是一大课题。
这个难题最近取得了很大的突破。
日前,百度企业在中文语音识别方面取得了重大理论和产品突破,研究出的更先进的中文语音识别技术使机器语音识别的相对错误率比现有技术降低了15%以上,使中文安静环境普通话语音识别的准确率接近97%,更是人的
据说这是年引进深度学习技术,相对错误率降低20%~30%后语音技术行业再次具有象征意义的重要进展。
初级框架性创新
近年来,语音识别技术取得了飞跃性的进步。 近年来,随着深入的学习技术引入语音识别行业,语音识别技术翻开了新的篇章。 在随后的几年里,语音识别工业产品出现了cnn (卷积神经网络)、lstm (长短记忆模型)、cnn混合lstm的建模技术,持续提高了语音识别产品的效果。
百度开发了基于多层单向lstm的中文语音韵母整体建模技术,将连接时间序列分类( ctc )训练技术纳入以前传来的语音识别建模框架,与语音识别行业的决策树聚类、语间解码、区分度训练等技术
多
我是
空空如也
创新尤其是创新创新这种
脱下鞋子
只是。
功夫不背有心人。 不明白
所有的一切都已经都已经结束了,已经已经结束了,已经结束了,已经结束了,已经结束了,已经结束了。 已经是了。已经是了。已经是了。已经是了。已经是了。已经是了。已经是了。已经是了。已经是了。已经是了。已经是了。
事实上,lstm和ctc技术已经存在很久了。 但是,10多年来,lstm和ctc的结合在语音工业行业并不成功。
结合lstm和ctc建模技术,其中心难度之一是,在大容量数据中深度学习需要强大的计算能力,这两种技术的计算量比以前传来的深度学习的计算量大一位数。 为了根据数学公式直接实现上述算法,lstm和ctc的训练需要使用单帧递归模式,这样的训练速度在工业条件下约1万小时的训练数据中几乎不能实现。 贾磊解释说。
因此,百度进行了一系列算法改革创新,利用百度大数据平台的计算特点,克服了这一学术训练课题,成功地打破了十年来的技术困难。
对于谷歌去年9月在interspeech上发表的英语行业的同样研究成果,百度的训练数据是谷歌的4~5倍,模型训练参数的规模是谷歌的10~20倍。 这项技术成功突破的核心要素之一是训练能力的大幅度提高,大模型在大数据中的难度比实验室小数据、小模型时要大得多。 百度开发的新训练算法是更接近工业大数据的产品实践并能宣传10万小时训练的新技术。
真的吗
所以,所以,所以,所以,所以,所以,所以,请使用。 已经。但已经实现了最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后最后中国最后、中国、语音识别工业技术的实质性提高,实现了中国语音识别工业产品技术的实质性提高。
把
也
现在百度已经开始使用数万小时的样品训练模型了。 预计不久,语音识别技术将迅速发展,很快进入10万小时数据样本的训练阶段,只有这样,才能涵盖千差万别的顾客口音差异。 考虑到环境变化的影响,将来的训练数据量有可能突破一百万小时。
贾磊认为,随着训练数据量的迅速增加,如何实现大规模lstm建模和ctc的比较有效的训练将成为核心技术课题。 今后,语音识别行业的深入学习将进入数百gpu并行训练的状态,理论创新和算法技术创新将以大数据为中心展开。 语音识别技术的开发方法将对现在带来深刻的变革。
除此之外,ctc建模技术进一步降低了语音识别应用的解码价格,随着适合深度模型计算的专业硬件的大量出现,语音识别云服务的价格大幅下降,推动语音交互技术的更广泛普及
贾磊告诉我,这次百度进行的重大技术革新是更大的百度发掘计算能力极限的尝试。 未来这样的尝试一定还会增加。
标题:【科技】百度取得汉语语音识别技术重大突破
地址:http://www.greenichiban.com/news/17311.html
免责声明:国际科技时报是中国具有影响力的科技媒体,以全球视角,第一时间呈现最新科技资讯。所著的内容转载自互联网,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,国际科技时报的作者:何鸿宝将予以删除。