我们从2011年坚守至今,只想做存粹的技术论坛。  由于网站在外面,点击附件后要很长世间才弹出下载,请耐心等待,勿重复点击不要用Edge和IE浏览器下载,否则提示不安全下载不了

 找回密码
 立即注册
搜索
查看: 1173|回复: 10

[最新新闻] 索尼“无声语音识别”大法:脖颈贴合传感器 AI转换皮肤

[复制链接]

该用户从未签到

134

主题

294

回帖

0

积分

1元学习Allegro(1期)

积分
0

终身成就奖

发表于 2020-4-6 08:13:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区

您需要 登录 才可以下载或查看,没有账号?立即注册

×
如今,对于听力有障碍的群体来说,听不到的声音,可以触摸到了。“触摸”听不到的语言,是由东京大学和索尼计算机科学研究所(CSL)共同研发的 AI 系统“Derma”实现的。有了 Derma 系统,只要在喉咙周围的皮肤上贴上传感器,利用喉咙和下颚的皮肤震动,就能将口形转化为语音。

                               
登录/注册后可看大图

可“触摸”的语言
根据病症的严重程度,现阶段治疗听力障碍的主流手段包括:
[align=justify]
    [li]
    药物治疗:通过静脉点滴或局部滴药(如激素、抗菌素、抗病毒药物等)消退炎症,使听力尽快恢复;[/li][li]
    手术治疗:主要针对外、中耳畸形、各种压迫咽鼓管疾病、耳外伤等进行手术;[/li][li]
    仪器辅助:如助听器(听力损失程度≤80dB)、人工耳蜗(听力损失程度>80dB)。[/li]
其中,人工耳蜗植入是当前让重度、极重度耳聋患者恢复听力的唯一有效办法。
早在 1957 年,法国科学家首次将电极植入一位全聋病人的耳蜗内,使该患者感知到周围的环境音。直到上世纪 90 年代,人工耳蜗进入临床应用阶段,给极重度耳聋患者带来了“新生”。
实际上,人工耳蜗的发展离不开电子技术、计算机技术、语音学、电生理学、材料学、耳显微外科学的发展。在这些学科兴起、发展之前,针对听力障碍患者,科学家给出的应对措施是一种叫做 Tadoma 的触诊唇读法。顾名思义,这种疗法是指——听力障碍患者通过用手指触摸说话者的嘴唇、下巴、脖颈处,读取说话者想表达的内容。
而上述日本团队研发 AI 系统 Derma 的灵感,最初正是源于 Tadoma。
通过机器学习将 Tadoma 自动化
该团队的设计其实就是将 Tadoma 疗法的过程通过机器学习自动化了。
就其原理而言,如下图所示,在喉咙周边的皮肤上贴上一个加速度/角速度传感器,获取无声发声时下颚、舌肌运动引起的从下颚到喉咙的皮肤颤动信息,采用深度学习进行分析识别,最终实现将无声语音转换为语音输入的无声语音交互(Silent Speech Interaction,SSI)。

                               
登录/注册后可看大图

该传感器可获取 12 维的皮肤运动信息,深度学习可以分析、识别 35 种发声类型。实验表明,识别皮肤颤动信息的精准度超过 94%。
值得一提的是,研究团队训练模型用到了连接时间分类(Connectionist Temporal Classification, CTC)。
实际上,在训练语音识别器的过程中,受说话者语速等因素影响,将输入与输出对齐是一个难点。为解决这一问题,连接时间分类就派上用场了。
就其外形而言,与现有的一些无声语音交互设备相比,这一设备体积小、重量轻、并不显眼。此外,这一系统耗电量低,不易受到环境亮度等因素的影响,不会影响到佩戴者的正常生活,可以说是非常实用了。
另外研究团队表示,经转换后的语音合成不仅可以输入到具有语音识别功能的数字设备(语音助手),同时也能帮助有语言障碍的患者进行交流。
将来,该团队的研究方向则是可穿戴电子设备和体内嵌入式计算集成。
基于 AI 的无声语音交互
近年来,无声语音交互领域方兴未艾,当前产业和学界在该领域的思路主要有 2 条——通过感知气流识别话语(气流采集)和通过感知肌肉运动的方式识别话语(EMG 信号采集)。以下是该领域发展的大致时间线:
[align=justify]
    [li]
    2009 年,麻省理工学院感知交流组研发的触觉设备能够克服读唇语无法清晰识别的障碍,成本比人工耳蜗植入手术低几个数量级;[/li][li]
    2016 年,牛津大学人工智能实验室、谷歌 DeepMind 和加拿大高等研究院(CIFAR)联合开发了结合深度学习技术的唇读程序 LipNet;[/li][li]
    2016 年,DeepMind 经 1 万小时的新闻视频训练,将 AI 唇读准确率提升至 46.8%;[/li][li]
    2019 年,世界知识产权组织公布了微软申请的“无声语音输入”(Silent Voice Input)专利,丰富了“机器听懂人话”的场景;[/li][li]
    2020 年 3 月,浙江工业大学、中科院计算技术研究所智能信息处理重点实验室及中国科学院大学共同提出了在局部特征层和全局序列层上引入互信息约束,增强口型特征与语音内容的关系,将计算机唇读精度提升至 84.41%。[/li]
实际上,无声语音识别不仅可以帮助有听力、语言障碍的人群,也适用于包括灾害现场、舱外探索、水下作业、工厂车间在内的场景。
不过,无声语音交互设备要想真正成为消费级产品,还需打磨。正如微软全球资深技术院士、微软云与人工智能事业部负责人黄学东博士曾表示:
[blockquote]
公开的测试、已发表的学术文章,虽不能与现实完全割裂,但相比消费级产品与商业场景,仍需要不一样的评判标准。[/blockquote]关于索尼 CSL
正如上文所述,Derma 由东京大学和索尼 CSL 共同研发。

                               
登录/注册后可看大图

在中国人民大学出版社 2011 年出版的一本名为《索尼研究所的经营哲学》的书中,索尼 CSL 董事长所真理雄便讲述了索尼 CSL 的经营管理理念。所真理雄写道,索尼 CSL 遵循“小即是美”的经营理念,坚持不扩大规模,因此诞生了众多的“异类和天才”,同时也支持人才的“流通”。
索尼 CSL 成立于 1988 年,作为索尼公司的“创新工厂”,广泛关注计算机科学、生命科学、脑科学和经济学等多个领域。当前索尼 CSL 的研究方向包括“全球议程”(涵盖从能源到食品和医疗保健的问题)、“人类增强”(包括探索人类创造力和人机交互/集成的研究)与“网络智能”(AI)。
2019 年 11 月,索尼宣布成立索尼 AI 部门,以“利用 AI 激发人类的想象力和创造力” 为使命,旨在推进 AI 技术的基础研发,而索尼 CSL 总裁兼 CEO Hiroaki Kitano 便是索尼 AI 的全球负责人。
回复

使用道具 举报

  • TA的每日心情
    开心
    昨天 08:39
  • 签到天数: 25 天

    [LV.4]偶尔看看III

    102

    主题

    182

    回帖

    1040

    积分

    二级逆天

    积分
    1040

    社区居民终身成就奖金点子奖

    QQ
    发表于 2020-4-6 08:18:09 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    5014

    回帖

    16

    积分

    二级逆天

    积分
    16

    社区居民终身成就奖优秀斑竹奖

    QQ
    发表于 2020-4-6 08:30:41 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2024-6-2 22:30
  • 签到天数: 1 天

    [LV.1]初来乍到

    1

    主题

    244

    回帖

    1248

    积分

    二级逆天

    积分
    1248

    社区居民终身成就奖特殊贡献奖

    发表于 2020-4-6 08:34:50 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    开心
    昨天 16:44
  • 签到天数: 55 天

    [LV.5]常住居民I

    2

    主题

    1万

    回帖

    2万

    积分

    三级逆天

    积分
    20564

    终身成就奖特殊贡献奖原创先锋奖优秀斑竹奖

    QQ
    发表于 2020-4-6 08:36:09 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    2024-7-20 08:39
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    30

    主题

    1906

    回帖

    6446

    积分

    PADS-2020国庆特训班

    积分
    6446

    终身成就奖特殊贡献奖

    发表于 2020-4-6 08:39:28 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    13

    主题

    1111

    回帖

    2687

    积分

    二级逆天

    积分
    2687

    社区居民终身成就奖

    QQ
    发表于 2020-4-6 08:51:56 | 显示全部楼层
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2024-8-26 10:11
  • 签到天数: 24 天

    [LV.4]偶尔看看III

    4

    主题

    791

    回帖

    791

    积分

    二级逆天

    积分
    791

    终身成就奖特殊贡献奖

    QQ
    发表于 2020-4-6 08:54:10 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    12

    主题

    7221

    回帖

    100

    积分

    游客

    积分
    100

    终身成就奖特殊贡献奖原创先锋奖优秀斑竹奖

    QQ
    发表于 2020-4-6 08:55:10 | 显示全部楼层
    回复

    使用道具 举报

    该用户从未签到

    67

    主题

    290

    回帖

    0

    积分

    PADS20220406高级特惠班

    积分
    0

    终身成就奖

    发表于 2020-4-6 16:12:54 | 显示全部楼层
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    每日签到,有金币领取。


    Copyright ©2011-2024 NTpcb.com All Right Reserved.  Powered by Discuz! (NTpcb)

    本站信息均由会员发表,不代表NTpcb立场,如侵犯了您的权利请发帖投诉

    ( 闽ICP备2024076463号-1 ) 论坛技术支持QQ群171867948 ,论坛问题,充值问题请联系QQ1308068381

    平平安安
    TOP
    快速回复 返回顶部 返回列表