草庐IT

sound-recognition

全部标签

javascript - Angular 2 : Web Speech API - Voice recognition

阅读webkitSpeechRecognition的文档后(Javascript中的语音识别)我试图在Angular2中实现它.但是当我这样做的时候:constrecognition=newwebkitSpeechRecognition();typescript说这个错误:[ts]Cannotfindname'webkitSpeechRecognition'.any如果我尝试从window中提取webkitSpeechRecognition:if('webkitSpeechRecognition'inwindow){console.log("Entersinsidetheconditi

连接麦克风后Java Sound刷新行列表

我有一个简单的捕获/回放Swing应用程序,它必须检测计算机是否没有连接合适的麦克风并警告用户。经过大量的摆弄之后,我找到了唯一可以让我检测到新连接或移除的麦克风的解决方案:com.sun.media.sound.JDK13Services.setCachingPeriod(0);privatestaticbooleanisMicrophoneAvailable(){try{if(!AudioSystem.isLineSupported(Port.Info.MICROPHONE)){log.debug("NOMICROPHONEFOUND");returnfalse;}else{log

java - 使用 javax.sound.sampled.Clip 在游戏中播放、循环和停止多个声音。意外错误

我正在尝试在游戏中同时播放两个wav声音(背景音乐和效果)。我首先使用java中的另一个音频处理程序构造了这段代码,该处理程序将处理声音的播放、停止和循环。该结构将播放背景音乐或效果,但一次只能播放一个。我环顾了互联网,并被告知使用javax.sound.sampled.Clip来处理声音,因此重复使用了相同的结构(播放、停止、循环),但将其切换为使用javax.sound.sampled.Clip。现在我完全迷路了。从我目前所读的内容来看,我所做的一切都是正确的,并且在eclipse编辑器中没有出现任何错误,但是当我运行它时,我遇到了两个错误之一。在eclipse(在Linux上运行

java - 使用 Java Sound API 播放 MP3

你能建议我如何写一首播放歌曲的作品吗?我尝试了以下代码片段,但出现此异常:importsun.audio.*;importjava.io.*;classtester{publicstaticvoidmain(Stringargs[])throwsException{InputStreamin=newFileInputStream("tester.mp3");AudioStreamas=newAudioStream(in);AudioPlayer.player.start(as);}} 最佳答案 如前所述,JavaSound默认不支持

java - Java Sound API 在您的计算机上找到哪些输出和录音端口?

按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭10年前。我正在使用JavaSoundAPI,事实证明,如果我想调整录音音量,我需要对操作系统向Java公开的硬件建模。事实证明,所呈现的内容多种多样。正因为如此,我谦虚地请求任何人能够帮助我在他们的计算机上运行以下程序并发回结果,以便我可以了解那里有什么。提前感谢任何可以提供帮助的人:-)importjavax.sound.sampled.*;publiccla

java - Java Sound可以用来控制系统音量吗?

JavaSound为各种声线功能提供了FloatControl实例,并且都是MASTER_GAIN&VOLUME控制类型。可以使用这些控件来更改系统音量吗? 最佳答案 不,它不能。这是改编自对Adjustingmastervolume的回答的来源在coderanch上。源代码迭代可用行,检查它们是否具有正确类型的控件,如果是,则将它们放入附加到JSlider的GUI中importjava.awt.*;importjavax.swing.*;importjavax.sound.sampled.*;importjavax.swing.e

c++ - Portaudio + 作品 : Horrible sound quality

我目前正在开发一个VOIP应用程序。为此,我使用PortAudio库检索和播放声音,并使用Opus库编码和解码声音数据包。目前,我成功地使用了PortAudio。我的程序只是做:从麦克风获取声音播放声音音质绝对好。我现在正在尝试对声音数据包进行编码和解码。我编写了一个EncodeManagerClass来执行此操作,我的程序现在执行以下操作:从麦克风获取声音编码声音解码回放但现在,音质绝对糟糕(而且在VOIP应用程序中显然是有问题的)。这是我的EncodeManager类:classEncodeManager{//ctor-dtorpublic:EncodeManager(void);

【定位系列论文阅读】-Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition(一)

这里写目录标题概述研究内容Abstract第一段(介绍本文算法大致结构与优点)1.Introduction介绍第一段(介绍视觉位置识别的重要性)第二段(VPR的两种常见方法,本文方法结合了两种方法)第三段(本文贡献)第四段(为证明本文方法优越性,进行的测试以及比较)2.RelatedWork相关工作第一段(介绍早期与深度学习的全局图像描述符)第二段(介绍局部关键点描述符)第三段(局部描述符可以进一步改进)第四段(列举不在VPR背景下的局部区域描述符)第五段(列举在VPR背景下的局部区域描述符)第六段(现有的多尺度方法存在缺陷,本文方法更好)3.Methodology方法第一段(介绍本文方法)3

【论文阅读】Long-Tailed Recognition via Weight Balancing(CVPR2022)附MaxNorm的代码

目录论文使用方法weightdecayMaxNorm如果使用原来的代码报错的可以看下面这个论文问题:真实世界中普遍存在长尾识别问题,朴素训练产生的模型在更高准确率方面偏向于普通类,导致稀有的类别准确率偏低。key:解决LTR的关键是平衡各方面,包括数据分布、训练损失和学习中的梯度。文章主要讨论了三种方法:L2normalization,weightdecay,andMaxNorm本文提出了一个两阶段训练的范式:a.利用调节权重衰减的交叉熵损失学习特征。b.通过调节权重衰减和MaxNorm使用类平衡损失学习分类器。一些有用的看法:研究表明,与联合训练特征学习和分类器学习的模型相比,解耦特征学习和

【AI视野·今日Sound 声学论文速览 第四十二期】Fri, 5 Jan 2024

AI视野·今日CS.Sound声学论文速览Fri,5Jan2024Totally10papers👉上期速览✈更多精彩请移步主页DailySoundPapersPosCUDA:PositionbasedConvolutionforUnlearnableAudioDatasetsAuthorsVigneshGokul,ShlomoDubnov深度学习模型需要大量干净的数据才能获得良好的性能。为了避免昂贵的数据采集成本,研究人员使用互联网上提供的丰富数据。这引发了严重的隐私问题,即未经授权可能滥用个人数据进行模型训练。最近的工作(例如CUDA)提出了这个问题的解决方案,通过添加类模糊来使数据集变得不