秒杀所有字体反爬 - 代码天地

秒杀所有字体反爬

企业开发 2023-08-08 18:05:04 阅读次数: 0

1，首先安装Python类库

安装支持Python版本的Tesseract库：安装方式如下：

pip install pytesseract

2，安装Tesseract-OCR
下载地址：https://digi.bib.uni-mannheim.de/tesseract/
3，3，设置环境变量。

需要添加俩个环境变量

1，path中添加C:\ProgramFiles(x86)\Tesseract-OCR（安装路径）

2，新建一个TESSDATA_PREFIX变量C:\ProgramFiles(x86)\Tesseract-OCR\tessdata

3，在pytesseract源码中将tesseract_cmd修改为：

tesseract_cmd=r’C:\ProgramFiles(x86)\Tesseract-OCR\tesseract.exe’

import numpy
import pytesseract
from PIL import Image, ImageDraw, ImageFont
from fontTools.ttLib import TTFont


def fontConvert(fontPath):     #将web下载的字体文件解析，返回其编码和汉字的对应关系
    font = TTFont(fontPath)  # 打开文件
    codeList = font.getGlyphOrder()[2:]
    print(codeList)
    im = Image.new("RGB", (1800, 1000), (255, 255, 255))
    dr = ImageDraw.Draw(im)
    font = ImageFont.truetype(fontPath, 40)
    count = 3
    arrayList = numpy.array_split(codeList, count)   #将列表切分成15份，以便于在图片上分行显示
    print(arrayList)
    for t in range(count):
        newList = [i.replace("uni", "\\u") for i in arrayList[t]]
        text = "".join(newList)
        text = text.encode('utf-8').decode('unicode_escape')
        dr.text((0, 50 * t), text, font=font, fill="#000000")
    im.save("sss.jpg")
    # im = Image.open("sss.jpg")      #可以将图片保存到本地，以便于手动打开图片查看
    result = pytesseract.image_to_string(im, lang="chi_sim")
    result = result.replace(" ", "").replace("\n", "")
    codeList = [i.replace("uni", "&#x") for i in codeList]
    return dict(zip(codeList, list(result)))

if __name__ == '__main__':
    filepath = '1.woff'
    print(fontConvert(filepath))

猜你喜欢

转载自blog.csdn.net/shiguanggege/article/details/116224897

秒杀所有字体反爬

猫眼字体反爬

字体反爬

字体反爬----字体加密

人人车字体反爬

猫眼电影字体反爬

汽车之家字体反爬破解实践

快手最新字体反爬

汽车之家 — 字体反爬破解实践

Python爬虫---猫眼字体反爬

关于字体反爬的思路(猫眼电影)

字体反爬之实习僧

爬虫之路: 字体文件反爬一

python爬虫之字体反爬

字体反爬之快手

字体反爬之猫眼电影

大众点评字体反爬解析

python爬虫字体反爬实习僧

js逆向案例-css字体反爬

字体反爬 -- 起点月票案例

Python爬虫编程12——字体反爬

字体反爬慢慢总结破解方式

字体反爬之实习seng

爬虫之路: 字体文件反爬二(动态字体文件)

Python爬虫 :字体加密和字体反爬

字体反爬破解学习--爬取实习僧

Python爬取猫眼电影：破解字体反爬

python爬虫---CrawlSpider实现的全站数据的爬取,分布式,增量式,所有的反爬机制

一个案例带你破解所有的反爬！以后碰到反爬再也不用担心了！

网站有反爬机制就爬不了数据？那是你不会【反】反爬

今日推荐

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

开源王者！全球最强的开源大模型Llama3发布！15万亿数据集训练，最高4000亿参数，数学评测超过GPT-4，全球第二！

为欧拉系统安装可视化界面(deepin）

MobaXterm中文版（MobaXterm-Chinese-Simplified）安装和使用

JS 网页全自动翻译 v3.4 发布，开放对 html 文件的翻译能力

这是Linus最忍不了的一集——虚幻引擎代码规范禁止使用脏话、禁止slave、master

与 Apollo 共创生态：观看7周年大会的心路历程

与 Apollo 共创生态：Apollo7周年大会的心得体会，干货满满

国内各种免费AI聊天机器人(ChatGPT)推荐(上)

周排行

一个电商SSH项目的笔记与总结

批量创建user用户

单点登录的实现方式

【前端3分钟】MVVM数据变更检测

Linux 中断学习总结

安卓手机微信不能打开App下载地址的问题微信跳转打开外部浏览器下载

HTML --盗版网页游戏

Mysql 悲观锁与乐观锁

linux下LCD驱动（一）-------LCD基础知识

Linux——设备树编译和反编译

每日归档

更多

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)