python写爬虫的福音:图片验证码识别模块muggle_ocr
首先给一个官方文档的地址:
https://pypi.org/project/muggle-ocr/
模块的安装方法,很简单了,一条命令:
pip install muggle-ocr
下面是核心代码:
# 导入包
import muggle_ocr
# 初始化;model_type 包含了 ModelType.OCR/ModelType.Captcha 两种
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.OCR)
# ModelType.OCR 可识别光学印刷文本 这里个人觉得应该是官方文档写错了 官方文档是ModelType.Captcha 可识别光学印刷文本
with open(r"test1.png", "rb") as f:
b = f.read()
text = sdk.predict(image_bytes=b)
print(text)
# ModelType.Captcha 可识别4-6位验证码
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.Captcha)
with open(r"test1.png", "rb") as f:
b = f.read()
text = sdk.predict(image_bytes=b)
print(text)
就是这么简单,就是这么神奇!拿去,不谢!