草庐IT

handwriting-recognition

全部标签

java - 语音识别器 : no selected voice recognition service

这就是我开始RecogniseListenerIntent的方式:Intentintent=newIntent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);intent.putExtra("android.speech.extra.DICTATION_MODE",true);intent.putExtra(RecognizerIntent.EXTRA_CA

android - Marker Recognition on Android(识别魔方)

我正在为Android开发一个增强现实应用程序,它使用手机的摄像头来识别魔方每个面上彩色方block的排列。我不确定的一件事是我将如何准确地检测和识别立方体每个面上的彩色方block。如果您查看魔方,您会发现每个方block都是六种可能颜色中的一种,带有黑色细边框。这让我认为检测正方形应该相对简单,可以使用现有的标记检测API。我的问题是,这里有人有过图像识别和Android方面的经验吗?理想情况下,我希望能够实现现有API,但如果有人能为我指明正确的入门方向,那么从头开始做这将是一个有趣的项目。非常感谢。 最佳答案 你想把相机对准

c++ - 如何从像 UCI 的 "Letter Image Recognition Dataset"这样的图像创建数据

我正在使用来自OpenCV的letter_regcog示例,它使用来自UCI的数据集,其结构如下:AttributeInformation:1.lettrcapitalletter(26valuesfromAtoZ)2.x-boxhorizontalpositionofbox(integer)3.y-boxverticalpositionofbox(integer)4.widthwidthofbox(integer)5.highheightofbox(integer)6.onpixtotal#onpixels(integer)7.x-barmeanxofonpixelsinbox(in

android - Firebase ML 套件给出 FirebaseMLException : Waiting for the text recognition model to be downloaded. 请稍候

我使用firebaseml工具包进行文本识别,但在模拟器和真实设备上给出了这个异常(exception)。W/System.err:com.google.firebase.ml.common.FirebaseMLException:Waitingforthetextrecognitionmodeltobedownloaded.Pleasewait.atcom.google.android.gms.internal.firebase_ml.zzjz.zzc(UnknownSource)atcom.google.android.gms.internal.firebase_ml.zzjz.z

android - Firebase ML 套件给出 FirebaseMLException : Waiting for the text recognition model to be downloaded. 请稍候

我使用firebaseml工具包进行文本识别,但在模拟器和真实设备上给出了这个异常(exception)。W/System.err:com.google.firebase.ml.common.FirebaseMLException:Waitingforthetextrecognitionmodeltobedownloaded.Pleasewait.atcom.google.android.gms.internal.firebase_ml.zzjz.zzc(UnknownSource)atcom.google.android.gms.internal.firebase_ml.zzjz.z

TSRFormer: Table Structure Recognition with Transformers ----论文阅读

TSRFormerSepRETR特征增强模块基于SepRETR的分割线预测模块参考点检测分割线回归先验增强匹配辅助分割基于关系网络的单元格合并模块损失函数参考点检测分割线回归辅助分割单元格合并效果论文地址:https://arxiv.org/abs/2208.04921这篇论文是对论文RobusTabNet1的改进,是同一个作者写的,以下内容以本论文为主,部分细节来源于RobusTabNet论文。TSRFormer,可以从各种表格图像中稳健地识别具有几何变形的复杂表格的结构,可以处理几何扭曲甚至弯曲的表格,有边框和无边框的表格。此方法是把表格分隔线预测当作线回归问题而不是图像分割问题,并提出了

ios - iOS 中是否有与 Android 的 Activity Recognition API 等效的功能?

在上一届GoogleI/O大会上,Android的LocationAPI中引入了一项新服务-事件识别。iOS有这样的框架吗? 最佳答案 我意识到这个问题很老了,但以供将来引用CMMotionActivity提供此功能。iOS7的新功能,由M7协处理器启用。 关于ios-iOS中是否有与Android的ActivityRecognitionAPI等效的功能?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

Flutter speech_recognition 快速构建错误

我在使用flutterspeech_recognition包时遇到构建错误。立即尝试为iOS构建。尚未测试Android。我遵循了安装指南。该包似乎在修改.yaml文件后加载。我在MacBookPro上使用VisualStudioIDE。Launchinglib/main.dartoniPhoneXʀindebugmode...Xcodebuilddone.9.8sFailedtobuildiOSappErroroutputfromXcodebuild:↳**BUILDFAILED**Xcode'soutput:↳===BUILDTARGETspeech_recognitionOFPR

android - Flutter speech_recognition locale de_DE 不工作

我正在尝试使用de_DE作为语言环境,使用flutterspeech_recognizer将语音转为文本,但识别器返回法语。使用en_US它工作正常。我正在使用iPhone进行测试,没有模拟器。_speechRecognition.listen(locale:"de_DE").then((result)=>setState((){_textController.text=resultText;resultText="";}));我怎样才能做到这一点? 最佳答案 查看库的限制部分:https://github.com/rxlabz/s

c++ - 图像处理 : Algorithm Improvement for 'Coca-Cola Can' Recognition

在过去的几年里,我参与过的最有趣的项目之一是关于imageprocessing的项目。.目标是开发一个能够识别可口可乐的系统'jar'(请注意,我在强调“jar头”这个词,稍后您就会明白为什么)。您可以在下面看到一个示例,在带有缩放和旋转的绿色矩形中识别出jar头。对项目的一些限制:背景可能非常嘈杂。jar可以有任何比例或旋转,甚至方向(在合理的范围内)。图像可能有一定程度的模糊性(轮廓可能不完全是直的)。图像中可能有可口可乐瓶,算法应该只检测jar!图像的亮度可能会有很大差异(因此您不能“过分”依赖颜色检测)。jar可以部分隐藏在侧面或中间,也可能部分隐藏在瓶子后面。图像中可能根本没