草庐IT

科学家研发人工智能声呐眼镜:可识别唇语,准确率达95%

IT之家 2023-04-14 原文

美国康奈尔大学的研究人员开发了一种新技术,可以通过声纳眼镜进行无声沟通。这种眼镜利用微型扬声器和麦克风来读取佩戴者默念的单词,从而可以在不需要物理输入的情况下执行各种任务。

这项技术由康奈尔大学的博士生张瑞东(音译)领导开发,是在一个类似的项目的基础上进行的改进,该项目使用了一个无线耳机,而之前的模型则依赖于摄像头。

据IT之家了解,该声纳眼镜使用一种名为 EchoSpeech 的无声语音识别接口,利用声纳来感知嘴部运动,同时使用一个深度学习算法实时分析回波特征。这使得系统能够以约 95% 的准确率识别佩戴者默念的单词。

这项技术最令人兴奋的前景之一是,对于有语言障碍的人来说,可以使用它来无声地将对话输入到语音合成器中,然后将单词大声说出来。眼镜也可以用来在安静的图书馆中控制音乐播放,或者在嘈杂的音乐会上口述信息。

该技术既小巧又低功耗,也不会侵犯隐私,因为没有数据离开用户的手机。这样,就不会有隐私方面的担忧。眼镜佩戴非常方便,比其他可用的无声语音识别技术更实用、更可行。

研究人员表示,该系统只需要几分钟的训练数据来学习用户的语音模式,学习完成后,就可以朝用户的脸上发送和接收声波,感知嘴部运动,同时使用深度学习算法分析回波特征。该系统目前能够识别 31 个孤立的命令和一串连续的数字,并且错误率低于 10%。

该系统目前的版本提供了大约 10 小时的电池续航,并且可以通过蓝牙无线地与用户的智能手机通信。智能手机负责处理和预测所有数据,并将结果传输到一些“动作键”,让它可以播放音乐、与智能设备交互或激活语音助手。

康奈尔大学智能计算机接口未来交互(SciFi)实验室正在利用康奈尔大学的一个资助计划来探索将这项技术商业化的可能性。

有关科学家研发人工智能声呐眼镜:可识别唇语,准确率达95%的更多相关文章

  1. ruby - 强制 Ruby 不以标准形式/科学记数法/指数记数法输出 float - 2

    我遇到了同样的问题here对于python,但对于ruby​​。我需要输出这样一个小数字:0.00001,而不是1e-5。有关我的特定问题的更多信息,我正在使用f.write("Mynumber:"+small_number.to_s+"\n")输出到一个文件对于我的问题,准确性不是什么大问题,所以只做一个if语句来检查是否small_number那么更通用的方法是什么? 最佳答案 f.printf"Mynumber:%.5f\n",small_number您可以将.5(小数点右侧5位数字)替换为您喜欢的任何特定格式大小,例如,%8

  2. 智能客服 | 浅谈人工智能聊天机器人ChatGPT - 2

    2022年底,OpenAI的预训练模型ChatGPT给人工智能领域的爱好者和研究人员留下了深刻的印象和启发,他展现的惊人能力将人工智能的研究和应用热度推向高潮,网上也充斥着和ChatGPT的各种聊天,他可以作诗、写小说、写代码、讨论疫情问题等。下面就是一些他的神回复:人命关天的坑: 写歌,留给词作者的机会不多了。。。 回答人类怎么样面对人工智能: 什么是ChatGPT?借用网上的一段介绍,ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动

  3. ruby - 如何强制 Float 在不使用科学记数法的情况下以完全精确的方式显示,而不是作为字符串显示? - 2

    在Ruby中,如何在没有科学记数法的情况下强制显示所有重要位置/完全精确的float?目前我将BigDecimal转换为Float,BigDecimal(0.000000001453).to_f,但这会产生1.453e-09的结果float。如果我执行类似"%14.12f"%BigDecimal("0.000000001453").to_f的操作,我会得到一个字符串。然而,在这种情况下,字符串作为输出是NotAcceptable,因为我需要它作为没有科学记数法的实际数字float。---编辑---好吧,让我在这里提供一些背景信息,这可能需要更改我原来的问题。我正在尝试使用Highsto

  4. ruby - 从 float 中删除科学记数法 - 2

    我目前正在将两个float相乘:0.0004*0.0000000000012=4.8e-16如何获得正常格式的结果,即没有科学记数法,例如0.0000000000324,然后将其四舍五入为5个数字。 最佳答案 您可以使用stringformatting.a=0.0004*0.0000000000012#=>4.8e-16'%.5f'%a#=>"0.00000"pi=Math::PI#=>3.141592653589793'%.5f'%pi#=>"3.14159" 关于ruby-从floa

  5. BigData/Cloud Computing:基于阿里云技术产品的人工智能与大数据/云计算/分布式引擎的综合应用案例目录来理解技术交互流程 - 2

    BigData/CloudComputing:基于阿里云技术产品的人工智能与大数据/云计算/分布式引擎的综合应用案例目录来理解技术交互流程目录一、云计算网站建设:部署与发布网站建设:简单动态网站搭建云服务器管理维护云数据库管理与数据迁移云存储:对象存储管理与安全超大流量网站的负载均衡二、大数据MOOC网站日志分析搭建企业级数据分析平台基于LBS的热点店铺搜索基于机器学习PAI实现精细化营销基于机器学习的客户流失预警分析使用DataV制作实时销售数据可视化大屏使用MaxCompute进行数据质量核查使用Quick BI制作图形化报表使用时间序列分解模型预测商品销量三、云安全云平台使用安全云上服务

  6. ruby - 使用 Ruby 进行科学编程 - 2

    我使用python或octave进行数学计算,因为手头有非常好的函数和库。但最近我对ruby​​产生了兴趣,我想知道Ruby中是否有与Python中的numpy、scipy等价的用于科学编程的东西。具体来说,我正在寻找可以像在matplotlib中那样绘制绘图并像在numpy和scipy中那样快速进行数学代数计算的东西。 最佳答案 SciRuby正在研究这个。NMatrix和Statsample分别是线性代数和统计最有用的SciRubygem,尽管您可能还会发现这些有用:distribution,minimization,和inte

  7. 生成式人工智能(AIGC)综述:ChatGPT从GPT-4到GPT-5可以一统AIGC? - 2

    原文题目:《ACompleteSurveyonGenerativeAI(AIGC):IsChatGPTfromGPT-4toGPT-5AllYouNeed?》文章链接:https://arxiv.org/abs/2303.11717https://arxiv.org/abs/2303.11717引言:随着ChatGPT的火热传播,生成式AI(AIGC,即AI生成的内容)因其分析和创造文本、图像等能力而在各地引起了轰动。在如此强烈的媒体关注下,我们几乎不可能错过从某个角度欣赏AIGC的机会。 “一个具有未来科幻感的机器人坐着,手握画笔正在创作一幅五颜六色的图画“由dalle2创作在AI从纯分析转

  8. ruby - 如何将科学计数法字符串转换为十进制计数法? - 2

    我想查找并将csv文件中的所有科学记数法字符串转换为十进制记数法,例如:1.0e-05to0.00001我如何在ruby​​中做到这一点? 最佳答案 只需使用字符串转换。必要的强制float将自动完成:"%f"%"1.0e-05"=>"0.000010"#Which,behindthescenesisthesameas:"%f"%"1.0e-05".to_f=>"0.000010"根据需要进行调整以获得或多或少的准确性。例如:"%.5f"%"1.0e-05"=>"0.00001"如果您想要真正的花哨并在末尾砍掉不必要的零,这是一种方

  9. Ruby:以科学记数法控制打印 - 2

    如果我在Ruby中有一个非常长的float,例如:x=123456789012345.to_f当它显示时,比如说,通过to_s,它以科学记数法出现:"1.23456789012345e+14"有什么方法可以抑制科学记数法的格式化,或者在硬币的另一面,强制它用于极短的float? 最佳答案 您可以使用%operator做各种各样的事情。例如:x=123456789012345.to_f"%f"%x#=>"123456789012345.000000"y=1.23"%E"%y#=>"1.230000E+000"各种选项与sprintf函

  10. ruby - 获取以兆字节为单位的准确文件大小? - 2

    如何获得以MB为单位的准确文件大小?我试过这个:compressed_file_size=File.size("Compressed/#{project}.tar.bz2")/1024000puts"filesizeis#{compressed_file_size}MB"但它截断了0.9并显示2MB而不是2.9MB 最佳答案 尝试:compressed_file_size=File.size("Compressed/#{project}.tar.bz2").to_f/2**20formatted_file_size='%.2f'%c

随机推荐