Ubuntu上安装tesseract OCR软件识别图片中的汉字¶
安装tesseract¶
用apt安装tesseract软件
sudo apt-get install tesseract-ocr # 核心
sudo apt-get install tesseract-ocr-chi-sim # 中文包
sudo apt-get install tesseract-ocr-all # 所有语言包
注意,tesseract是软件核心,还要额外安装语言包。国内一般只用安装中文包tesseract-ocr-chi-sim。tesseract-ocr-all包含了很多语言,更占空间。
识别图片里的中文¶
tesseract -l chi_sim test.png rs.txt
rs.txt中便是识别出来的文字。
本文为kyleblog.cn原创,转载请注明出处:https://www.kyleblog.cn/posts/ubuntu_ocr
发布日期:2023-08-31
联系作者