草庐IT

中文识别

全部标签

使用opencv识别滑块验证

滑块验证码对于某些简单的滑块,无需进行模型训练,可以使用opencv就能识别,比如:有一种常用方法cv2.matchTemplate,可以将滑动的图案与背景图案进行模板匹配,这种方法适用于滑动图案与背景图片中目标位置有相同图案的情况。但是本文想介绍的是另一种:背景中目标位置是空白的情况。验证码详情如何识别图片中的矩形位置?分析主要有三个特点:待识别目标是规则的轮廓;轮廓内是纯白色,与周边像素界限明显;整个图片对轮廓中的白色干扰很少,除了中间的白色圆圈同为白色。识别方案基于以上分析,识别方案不需要使用深度学习,利用opencv就能实现,主要思路是:将图片转为灰度图,方便后续处理;将图片二值化,比

被误解的「中文版Sora」背后,字节跳动有哪些技术?

2024开年,OpenAI就在生成式AI领域扔下了重磅炸弹:Sora。这几年,视频生成领域的技术迭代持续加速,很多科技公司也公布了相关技术进展和落地成果。在此之前,Pika、Runway都曾推出过类似产品,但Sora放出的Demo,显然以一己之力抬高了视频生成领域的标准。在今后的这场竞争中,哪家公司将率先打造出超越Sora的产品,仍是未知数。国内这边,目光聚集于一众科技大厂。此前有消息称,字节跳动在Sora发布之前就研发出了一款名为Boximator的视频生成模型。Boximator提供了一种能够精确控制视频中物体的生成方法。用户无需编写复杂的文本提示,可以直接在参考图像中通过在物体周围画方框

Claude 3正式发布,性能超越GPT-4,免费使用且支持中文!

Claude3正式发布,性能超越GPT-4,免费使用且支持中文!前言评测展示Claude3功能对比指令遵循能力大幅度提升200K上下文窗口和近乎完美的记忆近乎即时的结果强大的视觉能力后记前言在3月4日晚,著名的生成式AI平台Anthropic在其官方网站上正式发布了Claude3系列多模态大模型。这个系列包括三个版本:Haiku、Sonnet和Opus。其中,Claude3Opu为Claude3系列模型的最强版本,具有接近人类的理解能力,可以灵巧地处理开放式提示和复杂的任务,根据官方给到的资料,其性能全面超过了GPT-4。Opus:在多个维度上超过了OpenAI的GPT-4,包括研究生水平专家

使用opencv+tesseract识别图片中的表格

描述在java环境中使用opencv和tesserac识别一个图片表格环境:opencv和tesseract安装在linux环境下,docker将运行springboot服务opencv和tesseract的安装和docker加载可参考之前的文章过程将图片进行预处理,过滤掉颜色等干扰元素提取图片的水平线和垂直线,并进行重叠过滤得到水平线和垂直线的交点,根据交点构建单元格对每个单元格进行识别1.转换将image转换成matprivateMatbufferedImageToMat(BufferedImagebufferedImage){Matmat=newMat();try{//ConvertBu

YSU-ISBN码识别C++实现

YSU_ISBN码识别项目前言正文研究内容的基本原理图像灰度化处理中值滤波图像二值化边界填充Sobel边缘检测Hough直线检测倾斜修正字符框的截取与字符分割模板匹配所采用的研究方法及相关工具项目的方案设计核心代码实现读入要识别的图像调整图像大小灰度化处理去噪处理图像二值化处理调整图像角度水漫操作提取图像ROI区域与字符分割字符识别项目测试研究结果并讨论结论主要工作主要结果写在最后前言国际标准书号(InternationalStandardBookNumber),简称ISBN,是专门为识别图书等文献而设计的国际编号。随着科技的不断发展,我们早已进入了信息时代,计算机科学正在融入到我们生活的方方

java - Hopfield 神经网络无法识别

我正在尝试用Java编写Hopfield神经网络类,但网络不想识别模式。而且我不明白错误在哪里。网络用互连矩阵w[n][n]表示。当使用一些标准模式教授网络时,我使用以下方法更改互连矩阵:privatevoidteaching(int[]pattern){//teachingfor(inti=0;i然后我尝试在一些相似的模式中识别标准模式。当神经元状态停止变化或超过阈值(65535次迭代)时,该过程应停止:privateint[]recognition(int[]pattern){intnet=0,s,j=0;int[]previousState=newint[n];do{System

探究WPF中文字模糊的问题:TextOptions的用法

有网友问WPF中一些文字模糊是什么问题。之前我也没有认真思考过这个问题,只是大概知道和WPF的像素对齐(pixelsnapping)、抗锯齿(anti-aliasing)有关,通过设置附加属性TextOptions.TextFormattingMode或者TextOptions.TextRenderingMode来解决。这次我也查了下资料,了解了这几个附加属性的取值范围以及用法。像素对齐和抗锯齿我们经常听到WPF具有分辨率无关性这个说法,因为WPF使用的是与设备无关的绘图系统,为字体和形状等内容指定大小或者尺寸的数值并不是真实的像素,在WPF中称之为设备无关单位。渲染过程中,WPF会自动把设备

java - Java EE 应用程序无法识别 Google Visualization API

我想在我的JavaEE应用程序中包含GoogleVisualizationAPI的图表。但是,无论我做什么,应用程序都无法识别API。我以前这样使用过它,所以我不明白我做错了什么。有人可以看看我的代码并告诉我我做错了什么吗?谢谢!//LoadtheVisualizationAPIandthepiechartpackage.google.load('visualization','1.0',{'packages':['corechart']});//SetacallbacktorunwhentheGoogleVisualizationAPIisloaded.google.setOnLoa

Java 控制台无法正确读取中文字符

我正在努力让Eclipse正确读取中文字符,但我不确定我可能哪里出错了。具体来说,在从控制台读取一串中文(简体或繁体)和输出之间的某个地方,它会出现乱码。即使在输出一大串混合文本(英文/中文字符)时,它似乎也只是改变了中文字符的外观。我已将其缩减为以下测试示例,并用我认为在每个阶段发生的事情对其进行了明确注释-请注意,我是一名学生,非常想确认我的理解(或其他):)publicstaticvoidmain(String[]args){try{booleanisRunning=true;//RawflowofinputdatafromtheconsoleInputStreaminputSt

java - 识别未被垃圾收集的对象的更好方法?

一言以蔽之我有一个程序随着时间的推移逐渐使用越来越多的内存。我正在使用jmap和jhat来尝试诊断它,但还不够准确。背景该程序是一个长期运行的服务器,由hbase数据存储支持,为其他一些东西提供节俭服务。然而,在运行几天后,它最终会达到分配的堆限制,并且几乎所有时间都花在垃圾收集上来回Swing。似乎在某处保存了大量数据的引用到目前为止我做了什么在摆弄jstat和jconsole之后,我最终使用运行进程的jmap进行堆转储,并通过jhat运行它,简单的数字加起来没有接近内存利用率jmap-F-dump:live,format=b,file=heap.dump12765jmap-F-du