想要制造完美的语音助手,首先你得有足够大的语音数据库。谷歌与Mozilla都对此有清晰的认识,他们正在展开一场竞赛,收集世界各地不同语言、不同口音人们的语音片段。本文编译自FastCompany原题为“Google, Mozilla, And The Race To Make Voice Data For Everyone”的文章。
Common Voice邀请每一个人加入,只要能上网、有麦克风就可以阅读特定句子,将简短的语音记录提交上去,所有一切只需要在Web浏览器上点击几下、触击几下就能完成。谷歌的项目大体也是这样运行的,只是Common Voice要求大家提交完整的句子录音,而谷歌只要求提交特定单词或者数字,这些单词和数字在命令中经常使用。句子有的是贡献者提交的对话短语,还有引文,比如电影中出现的话语。Mozilla要求参与者提供一些基本统计信息,比如年龄、性别、所说英语的类型。