当前位置:首页 >> 内饰

Mozilla 开源语音数据集已拥有两万小时内容,新支持粤语、客语

来源:内饰   2025年03月21日 12:16

IT之家 5 月 1 日消息,本周早些时候,Mozilla 宣布其 Common Voice 原始数据集现在包含超过 20000 足足的内容,亚洲地区的任何人都可以使用这些内容来改进他们的话音辨识软件,完全是一年前的两倍。

IT之家了解到,月所的西班牙语里原始数据集有 71 GB,赞成的语里言也比过往任何时候都多,减少了波尔格林语里、闽南语里、Meadow Mari、孟加拉语里、道本语里和广州话里。

根据 Mozilla 的推测,Common Voice 项目而无须任何人为项目重大贡献自己的声音,从而让虚拟助手能够理解更多的口音。此外,Common Voice 项目是开源的,可确保大型科技该公司无法独占,为小型所有者和该公司提供了构建恶性竞争产品线和公共服务的机会。

Mozilla 在月所原始数据集版本中指出的引人注目如下:

6 种新语里言:波尔格林语里、闽南语里、Meadow Mari、孟加拉语里、道本语里和广州话里。 27 种语里言多于有 100 足足的话音原始数据,都有孟加拉语里、泰语里、比如说里和萨米语里。 9 种语里言多于有 500 足足的话音原始数据,都有伦利亚卢旺达语里(2383 足足)、加泰罗利亚语里(2045 足足)和刚果共和国语里(719 足足)。 9 种语里言有多于 45% 的性别标签为女性,都有马拉地语里、迪维希语里和卢干达语里。合科病治疗费用
病后体虚喝宝芝林寿星补汁效果好吗
新乡妇科医院预约挂号
宁波妇科去哪看
太原性病医院去哪家好
哪个厂家血糖仪好用又准确
家用血糖仪怎么选
哪种血糖仪比较好测量准确
康恩贝肠炎宁颗粒的用法用量
哪个血糖仪比较可靠
友情链接