草庐IT

OCR_SERVICE

全部标签

python - Google Cloud Vision - 数字和数字 OCR

我一直在尝试使用Python实现一个OCR程序,该程序读取具有特定格式XXX-XXX的数字。我使用了Google的CloudVisionAPI文本识别,但结果并不可靠。在30张高对比度1280x1024bmp图像中,只有少数图像输出正确,或者至少在结果中包含了正确的输出。该程序往往会省略一些数字、以非英语语言输出或潜入一些特殊字符。目标是至少连续输出正确的数字,如果结果中散布着其他垃圾也没关系。有没有办法帮助程序更好地识别数字,例如将结果限制为特定格式,或仅限于数字? 最佳答案 我无法告诉你为什么会这样,也许这与语言的阅读方式有关,

python - Google Cloud Vision - 数字和数字 OCR

我一直在尝试使用Python实现一个OCR程序,该程序读取具有特定格式XXX-XXX的数字。我使用了Google的CloudVisionAPI文本识别,但结果并不可靠。在30张高对比度1280x1024bmp图像中,只有少数图像输出正确,或者至少在结果中包含了正确的输出。该程序往往会省略一些数字、以非英语语言输出或潜入一些特殊字符。目标是至少连续输出正确的数字,如果结果中散布着其他垃圾也没关系。有没有办法帮助程序更好地识别数字,例如将结果限制为特定格式,或仅限于数字? 最佳答案 我无法告诉你为什么会这样,也许这与语言的阅读方式有关,

python - 如何使用 OCR 有效地从 PDF 文件目录中提取文本?

我有一个包含PDF文件(图像)的大目录,如何从目录中的所有文件中有效地提取文本?。到目前为止,我尝试:importmultiprocessingimporttextractdefextract_txt(file_path):text=textract.process(file_path,method='tesseract')p=multiprocessing.Pool(2)file_path=['/Users/user/Desktop/sample.pdf']list(p.map(extract_txt,file_path))但是,它不起作用……它需要很多时间(我有一些文档有600页)

python - 如何使用 OCR 有效地从 PDF 文件目录中提取文本?

我有一个包含PDF文件(图像)的大目录,如何从目录中的所有文件中有效地提取文本?。到目前为止,我尝试:importmultiprocessingimporttextractdefextract_txt(file_path):text=textract.process(file_path,method='tesseract')p=multiprocessing.Pool(2)file_path=['/Users/user/Desktop/sample.pdf']list(p.map(extract_txt,file_path))但是,它不起作用……它需要很多时间(我有一些文档有600页)

Python urllib2.HTTPError : HTTP Error 503: Service Unavailable on valid website 错误

我一直在使用亚马逊的产品广告API来生成包含给定图书价格的网址。我生成的一个网址如下:http://www.amazon.com/gp/offer-listing/0415376327%3FSubscriptionId%3DAKIAJZY2VTI5JQ66K7QQ%26tag%3Damaztest04-20%26linkCode%3Dxm2%26camp%3D2025%26creative%3D386001%26creativeASIN%3D0415376327当我单击链接或将链接粘贴到地址栏时,网页加载正常。但是,当我执行以下代码时出现错误:url="http://www.amazo

Python urllib2.HTTPError : HTTP Error 503: Service Unavailable on valid website 错误

我一直在使用亚马逊的产品广告API来生成包含给定图书价格的网址。我生成的一个网址如下:http://www.amazon.com/gp/offer-listing/0415376327%3FSubscriptionId%3DAKIAJZY2VTI5JQ66K7QQ%26tag%3Damaztest04-20%26linkCode%3Dxm2%26camp%3D2025%26creative%3D386001%26creativeASIN%3D0415376327当我单击链接或将链接粘贴到地址栏时,网页加载正常。但是,当我执行以下代码时出现错误:url="http://www.amazo

python - HTTP错误 : HTTP Error 503: Service Unavailable goslate language detection request : Python

我刚刚开始使用Python中的goslate库来检测文本中单词的语言,但在测试了7-8个输入后,我给出了用两种语言书写的单词的输入,阿拉伯语和英语。之后,它开始给我错误。Traceback(mostrecentcalllast):File"",line1,inexecfile("C:/test_goslate.py");File"C:/test_goslate.py",line12,inlanguage_id=gs.detect('الدولة')File"C:\Python27\lib\site-packages\goslate.py",line484,indetectr

python - HTTP错误 : HTTP Error 503: Service Unavailable goslate language detection request : Python

我刚刚开始使用Python中的goslate库来检测文本中单词的语言,但在测试了7-8个输入后,我给出了用两种语言书写的单词的输入,阿拉伯语和英语。之后,它开始给我错误。Traceback(mostrecentcalllast):File"",line1,inexecfile("C:/test_goslate.py");File"C:/test_goslate.py",line12,inlanguage_id=gs.detect('الدولة')File"C:\Python27\lib\site-packages\goslate.py",line484,indetectr

javascript - 请求 header 不是从 Service Worker 发送的

我正在尝试从ServiceWorker获取网络服务。此服务是一个使用基本Apache身份验证保护的JSP,因此我必须提供凭据以在请求header中进行身份验证。以下请求在主窗口中工作得很好:self.addEventListener('push',function(event){console.log('Receivedapushmessage',event);event.waitUntil(fetch(ONLINE_SITE_ENDPOINT,{method:'GET',mode:'cors',headers:{'Accept':'application/json','Authori

javascript - 请求 header 不是从 Service Worker 发送的

我正在尝试从ServiceWorker获取网络服务。此服务是一个使用基本Apache身份验证保护的JSP,因此我必须提供凭据以在请求header中进行身份验证。以下请求在主窗口中工作得很好:self.addEventListener('push',function(event){console.log('Receivedapushmessage',event);event.waitUntil(fetch(ONLINE_SITE_ENDPOINT,{method:'GET',mode:'cors',headers:{'Accept':'application/json','Authori