python写爬虫的福音:图片验证码识别模块muggle_ocr

首先给一个官方文档的地址:

https://pypi.org/project/muggle-ocr/

模块的安装方法,很简单了,一条命令:

pip install muggle-ocr

下面是核心代码:

# 导入包
import muggle_ocr

# 初始化;model_type 包含了 ModelType.OCR/ModelType.Captcha 两种
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.OCR)
# ModelType.OCR 可识别光学印刷文本 这里个人觉得应该是官方文档写错了 官方文档是ModelType.Captcha 可识别光学印刷文本
with open(r"test1.png", "rb") as f:
b = f.read()
text = sdk.predict(image_bytes=b)
print(text)


# ModelType.Captcha 可识别4-6位验证码
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.Captcha)
with open(r"test1.png", "rb") as f:
b = f.read()
text = sdk.predict(image_bytes=b)
print(text)

就是这么简单,就是这么神奇!拿去,不谢!

发表评论

邮箱地址不会被公开。 必填项已用*标注