要使用 Python 识别图片中的文字,推荐使用
Pillow (PIL)
配合
Tesseract OCR
引擎(通过
pytesseract
库),以下是详细步骤:
步骤 1:安装依赖
步骤 2:Python 示例代码
from PIL import Imageimport pytesseract# 设置 Tesseract 路径(Windows 需要指定安装路径)# pytesseract.pytesseract.tesseract_cmd = r'C:Program FilesTesseract-OCRtesseract.exe'# 打开图片image = Image.open('your_image.jpg')# 替换为你的图片路径# 识别文字(默认英文)text = pytesseract.image_to_string(image)# 识别中文(简体)# text = pytesseract.image_to_string(image, lang='chi_sim')print("识别结果:")print(text)
常见问题解决
预处理增强示例
from PIL import Image, ImageFilter# 打开图片并预处理image = Image.open('your_image.jpg')image = image.convert('L')# 转为灰度image = image.filter(ImageFilter.SHARPEN)# 锐化image = image.point(lambda x: 0 if x < 140 else 255)# 二值化# 识别文字text = pytesseract.image_to_string(image, lang='chi_sim')print(text)
替代方案:第三方 API
如果本地识别效果不佳,可使用在线 OCR API:
如何用Python从大量pdf 中提取表格中的数据进行分析
试试tabula,读取pdf后可转为pandas)(ps下次提问请先查看万能的Stackoverflow:Extracting Table contents from a collection of PDF files)
怎么用python读取txt文件里指定行的内容,并导入excel?
全文使用的是xlswriter模块写的,也有人使用xlrd与xlutils模块实现,不过还未进行验证import xlsxwriterworkbook = (D:\\Program Files\\subpy\\)#在指定目录下创建一个excleworksheet = _worksheet(students)#新建一个sheettitle_index = [A,B,C,D]#sheet中的区域li = [] #定义一个空列表blod = _format({bold:True})#定义exlce中写入的字体with open(D:\\Program Files\\subpy\\,r) as f1:#打开txt文档lines = ()#读取所有行内容n = -1#定义一个变量for x in lines:#逐行读取n=n+(x[:-1])#去掉回车符y= #以空格分字符for i in range(len(title_index)):#读取excle区域下标# for i,j in enumerate(title_index):content = y[i]#单个字符读取(n,i,content,blod)#分行分列写入#关闭excletxt文件可以用行号,用readlines读取出来的数据是一个列表,你可以使用:f = open(, r)line = ()line_need = line[行号-1]这样来取指定行
怎么把图片上的文字翻译,并转word?
原发布者:hocen343怎么把图片上的文字转换成word文字?2014-03-28人力资源第一平台人力资源研究现在办公时总会遇到各种各样的问题,比如常常有老师或者领导给你厚厚一摞文件让你录入电脑,做成word格式的。 这种情况常常让人关疼不已,因为这样打字对着电脑很可能一坐就是一天,那么有没有什么比较快捷的方式呢?或者你在网上发现了一些很有趣的文字,可惜它们是写在图片上的,不方便与好友分享,遇到这种情况你该怎么办呢?今天小编就给大家分享一种简单快捷的处理方式。 工具/原料OneNote工具方法/步骤1、把纸质文件转换为图片格式。 这里我们可以用扫瞄仪把纸张扫瞄成图片,如果没有,也没问题,用手机拍下来也行,只要拍得清楚就好。 我就是用手机拍下了一本书中的第33页(看过的人应该知道是哪本书),来给大家做下示范。 2、打开Office办公软件自带的OneNote工具。 随便新建一个笔记页面,以方便我们接下来的操作。 3、插入图片。 在菜单栏里点击【插入】,选择插入【图片】,找到我们需要转换的图片,插入。 4、处理,完成。 在我们插入的图片,右键,选择【复制图片中的文本】,可能提示正在转换,耐心等待一下,处理结束后,我们在右边空白处粘贴,即可把图片上的文字全部粘贴下来,这样我们就可以随意编辑了。














发表评论