Diyibanzhu Downloader

第一版主网下载器,因为网址并不固定,所以不做域名匹配

יוצר
LanluZ
התקנות יומיות
3
סה"כ התקנות
226
דירוגים
0 0 1
גרסה
3.3.1
נוצר
18-06-2024
עודכן
18-06-2024
רישיון
GNU GPLv3
חל על
כל האתרים

Diyibanzhu-Download

第一版主网小说下载器


快速使用

脚本

  1. 浏览器安装 Tampermonkey 拓展插件
  2. 安装脚本

后处理程序

  1. 下载 Release 中的源码
  2. 下载 PaddleOCR-json 程序
  3. 下载 poppler 程序
  4. 解压 poppler 与 PaddleOCR-json 到本项目ocr文件夹下
       ├── ocr
       │   ├── api
       │   ├── data
       │   ├── main.py
       │   ├── PaddleOCR-json < PaddleOCR-json 程序目录
       │   ├── pdf.py
       │   ├── poppler < poppler 程序目录
       └── README.md
    
  5. 安装程序依赖pip install -r ./requirements.txt
  6. 将脚本下载得到的pdf文件放入ocr/data/pdf文件夹后运行main.py程序
  7. 输出文本在ocr/data/txt文件夹中

兼容性

PaddleOCR-json

  • 系统支持 Win7 x64 及以上。Linux的支持正在筹备。
  • 若 Win7 报错计算机中丢失 VCOMP140.DLL ,请安装 VC运行库
  • CPU必须具有AVX指令集。常见的家用CPU一般都满足该条件。

AVX支持的产品系列不支持
Intel酷睿Core,至强Xeon凌动Atom,安腾Itanium,赛扬Celeron,奔腾Pentium
AMD推土机架构及之后的产品,如锐龙Ryzen、速龙Athlon、FX 等K10架构及之前的产品

感谢

  1. Tampermonkey: 用户脚本管理器
  2. PaddleOCR-json: OCR离线图片文字识别命令行windows程序
  3. pdf2image: 将pdf转化为PIL图像的模块


该脚本仅供学习使用

预览

网站页面

详细预览见Github发布页