我一直在使用tesseract实现一个AndroidOCR工具,仅对数字进行ocr。到目前为止,它对普通数字字体的准确度相当高。然而,当涉及到7段数字(LCD上的数字)时,准确性非常糟糕。我尝试过裁剪我的图像、0到9的白名单以及一些图像处理都无济于事。关于如何提高准确性的任何想法?或者也许一些关于为tesseract训练特定7段数字的技巧肯定会对我有很大帮助。提前致谢。 最佳答案 您可以在以下位置找到7个fragment的训练数据:https://github.com/arturaugusto/display_ocr/tree/ma