当前位置: 首页 > news >正文

语音技术助力非标准语音人群沟通

Voiceitt将语音革命延伸至非标准语音人群

根据某机构的数据,美国约有750万人存在语音使用障碍。随着计算机技术从基于文本转向基于语音的界面,非标准语音人群面临着被边缘化的风险。

Voiceitt致力于确保这种情况不会发生。通过Voiceitt,客户可以训练适应其语音模式的个性化语音识别模型,使他们能够与语音控制设备或其他人进行交流。

应用程序功能

Voiceitt的界面是一个iOS移动应用程序,具有两种模式:

  • 对话模式:让客户使用合成语音和手机扬声器与他人交流
  • 智能家居模式:让客户与语音助手互动

每种模式都有一套语音类别。对话模式的类别包括交通、购物和医疗就诊等场景;智能家居模式则是语音助手功能,如灯光、音乐和电视控制。

非标准语音建模技术

识别非标准语音与普通语音识别在一些基本方面存在差异。当训练数据稀疏时,自动语音识别(ASR)的常见方法是流水线方法。在这种方法中,声学模型将声学数据转换为音素;"词典"提供音素的候选词级解释;语言模型通过考虑每种可能性来裁决可能的词级解释。

Voiceitt没有使用循环神经网络,而是使用卷积神经网络,该网络将更大块的声学信号作为输入。卷积神经网络最初设计用于在图像中寻找特定像素模式,同样可以在信号中寻找关键声学模式。

"只要客户的发音保持一致,这就给了我们利用这种一致性的机会,"Voiceitt语音识别团队负责人表示。"发音不必遵循标准词典。"

持续学习与未来规划

当客户训练他们的自定义模型时,Voiceitt使用他们录制的语音进行训练和测试。一旦模型的输出置信度超过某个阈值,该短语就被"解锁",客户可以开始使用它来控制语音助手或与他人交流。

但训练并不会停止。每次客户使用短语时,都会为模型提供更多训练数据,Voiceitt表示会持续更新模型以提高性能。

目前,Voiceitt有限的操作菜单意味着可以为每个客户学习并存储单独的模型。但Voiceitt计划显著扩展服务规模,因此研究人员正在研究更有效的训练和存储模型的方法。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

http://www.fuzeviewer.com/news/61084/

相关文章:

  • 用asp.net做网站计数器营销案例分析
  • 广东涂料网站建设网站网页设计公司有哪些
  • 百度做的网站招聘门户网站有哪些
  • 中国门户网站有哪些网站点击按钮回到页面顶部怎么做
  • 小白如何搭建个人网站东莞微信网站建设咨询
  • 营销型网站的公司网站制作什么样的字体好看
  • 建设财经资讯网站的目的口碑好的无锡网站建设
  • 天凡建设股份有限公司网站seo外链优化
  • 青州专业网站建设洪宇建设集团公司网站
  • 营销网站开发isuos全网覆盖推广
  • 阿里云服务器官方网站鞍山市网站建设
  • 让人做网站需要准备什么条件网站添加wordpress博客
  • 网站网站是否需要备案书籍网站设计
  • 网站建设pc移动appwordpress网址
  • 彩票销售网站开发电话销售做网站认证
  • 中山专业做网站公司wordpress 微信导航
  • 广州市做网站公司wordpress 教育
  • ui设计网站开发织梦教育网站开发
  • 20231427田泽航实验3-1
  • 做淘宝推广开网站合适企业seo网站营销推广
  • 运城市住房与城乡建设厅网站美食网站开发目的与意义
  • 山东省住房建设厅网站首页方寸网站建设
  • 医疗网站 seo怎么做莱芜论坛哪个比较好
  • 《道德经》第三十八章 - 教程
  • 如何为网站添加谷歌分析工具网站营销计划书
  • 做网站需要什么语言com域名的网站
  • 做营销网站那个好网站开发中视屏怎样编辑到网页上
  • wordpress调用头像成都网站优化费用
  • 北京网站建设哪家专业seo怎么才能优化好
  • 宁波公司名称大全重庆seo杨洋