KyleBlog.cn 文章 标签 关于
文章 标签 关于

Ubuntu上安装tesseract OCR软件识别图片中的汉字

安装tesseract

用apt安装tesseract软件

sudo apt-get install tesseract-ocr  # 核心
sudo apt-get install tesseract-ocr-chi-sim  # 中文包
sudo apt-get install tesseract-ocr-all # 所有语言包

注意,tesseract是软件核心,还要额外安装语言包。国内一般只用安装中文包tesseract-ocr-chi-sim。tesseract-ocr-all包含了很多语言,更占空间。

识别图片里的中文

tesseract -l chi_sim test.png rs.txt

rs.txt中便是识别出来的文字。

本文为kyleblog.cn原创,转载请注明出处:https://www.kyleblog.cn/posts/ubuntu_ocr

发布日期:2023-08-31 联系作者