未来索引
开启左侧

智能语音合成技术哪家强?

[复制链接]
minggao 发表于 2014-10-29 14:00:51 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
智能语音技术作为人工智能的入口,如今已成为科技巨头们参与行业竞争的重大筹码。纵观市面上流行的如“灵犀“、”小I机器人“等类siri产品,其实他们大多都搭载了智能语音技术商提供的语音合成技术。

目前,国内智能语音技术提供商除了科大讯飞、捷通华声以及云知声等行业先锋,也不乏一些后起新秀。作为一个科技爱好者与关注者,闲来无事拿三个语音在线平台测试对比了一下,给大家分析一下个人的体验。

以 “乘坐运通101到知春里101号下车“这句话为例,我们来试试国内各个语音合成技术的表现。这句话主要测试语音合成技术对于数字的敏感性,正常人通常将这样念:“乘坐运通幺零幺到知春里一百零一号下车”。

第一个受测的平台是行业内有十几年积累的科大讯飞,他家的语音转化上极为流畅,听起来舒服。不过也有bug,在文字转化的第一个“101”并没有按照人们语言习惯“幺零幺”,而是“一百零一”。

第二个受测的是捷通华声的灵云,效果不太理想。不光第一个“101”读成“一百零一”,且第二“101”干脆就合成错误,读成了“十一”,可能在数字语音的合成上灵云还需要改进啊。
由于云知声和思必驰等语音公司没有提供在线的语音合成体验,那么我们选择的第三个受测对象是语音行业新秀Okvoice,结果可以说出人意料。他家的平台居然所有发音都符合“说人话”的习惯,公交号,门牌号都解读正确。虽然合成过程中也有不尽人意的地方,例如整句解读没有科大讯飞顺畅,在不该停顿的地方停顿了一下,但作为行业后辈实属难得。

之后还测了如“小宝宝今年2岁了“,“老板,来2两米饭”等生活常用语,各家结果差强人意。综合来说,科大讯飞作为行业老大虽然识别技术无可挑剔,但在语音合成的细微之处似乎欠缺了一些;而捷通华声的表现感觉需要努把力啊!Okvoice虽为刚上线不久的智能语音技术提供商,却在这种数字语音合成上有明显的优势,文字转化语音更加准确。当然,这几家的技术都还在不断改善,而终究谁能独占市场,我还在拭目~

智能技术共享平台 - 未来论 http://www.mywll.com/
高级模式
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

发布主题
阅读排行 更多
广告位
!jz_fbzt! !jz_sgzt! !jz_xgzt! 快速回复 !jz_sctz! !jz_fhlb! 搜索

智能技术共享平台 - 未来论

关注服务号

进入小程序

全国服务中心:

运维中心:天津

未来之家:天津 青岛 济南 郑州 石家庄

                商务邮箱:xy@mywll.com

Copyright © 2012-2021 未来派 未来论 (津ICP备16000236号-5)