Greasy Fork is available in English.

Wenku Doc Downloader

对文档截图,合并为纯图片PDF。有限地支持(1)豆丁网(2)道客巴巴(3)360个人图书馆(4)得力文库(5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)安全文库网(11)人人文库(12)云展网(13)360文库(14)技工教育网(15)文库吧(16)中国社会科学文库(17)金锄头(18)自然资源标准。预览多少页,导出多少页。额外支持(1)食典通(2)JJG 计量技术规范,详见下方说明。

作者
JoyofFire
日安装量
43
总安装量
826,698
评分
266 16 8
版本
1.10.1
创建于
2021-11-22
更新于
2024-06-30
许可证
GPL-3.0-only
适用于

停止维护

已测试通过的环境:win10/11 | chrome >= 99 | tampermonkey稳定版

脚本原理是自动截图,不是黑客技术,不能预览就不能下载

野猫网(yemao.one)极有可能诈骗网站,与此脚本 无关,请防范诈骗

Wenku Doc Downloader 使用说明

0 目录

1. 重要提示

2. 图片下载合并器

3. 哪些做不到 ?

4. 为什么不能复制文字 ?

5. 为什么脚本没用 ?

6. 额外支持 / 其他工具

7. 适用于部分网站的书签脚本

8. 备注


1 重要提示

  • 付费文档和无法预览均不支持。你能预览多少页,就能得到多少页的PDF。
  • 百度文库不支持

2 图片下载合并器

  • 适用范围

    • 凡是用到【导出图片链接】的,都需要下载【图片下载合并器】以便把 urls.csv 转换为 PDF。
    • 推荐使用【图片下载合并器v2.1】。
  • 使用方法

    • 解压压缩包,得到一个文件夹。
    • 把从网页上下载得到的【urls.csv】复制(并覆盖)到该文件夹中。
    • 双击运行【启动器.bat】,等待程序结束,文件夹中出现【图片文档.pdf】。
  • 故障排查

    • 如果报错 RuntimeError: SSL is not supported,请下载【图片下载合并器v1】。
    • 请关闭网络代理。
    • 不支持 windows 7。
    • 不要用管理员运行。
    • 请用 Excel 或 记事本 打开 urls.csv,然后检查其中内容:
      • 是否存在空行 ?有的话删掉。
      • 是否存在格式奇怪的链接 ?如果复制该链接到浏览器无法打开,请删掉这条链接。

3 哪些做不到 ?

  • 不能导出 docxlsppt 等原文档格式。
  • 导出的 PDF 是纯图片的,文字无法复制。
  • 不能预览的页面无法导出:脚本的原理是自动截图,然后合并为 PDF,不是黑客技术。

4 为什么不能复制文字 ?

5 为什么脚本没用 ?

  • 为什么在同一个网站上有时有效,有时无效?

    • 因为不同文档类型的网页可能结构不同,难以100%覆盖,请自行解决或群内求助。
  • 为什么找不到按钮 ?

    • 按钮长这样👇 并且总是出现在网页左侧
    • wenku按钮区
    • 360浏览器必须使用【极速模式】而不是【兼容模式】
    • 肯定有效的浏览器:谷歌浏览器、Edge浏览器。
    • 可能无效的浏览器:QQ浏览器、油猴浏览器、2345浏览器、safari。
    • 使用的是 ViolentMonkeyTamperMonkey Beta 可能导致问题,请尝试使用 TamperMonkey
    • 在你需要起作用的网页上,同时运行了多个脚本,可能导致冲突,请暂时关闭其他脚本后刷新重试。
  • 为什么社会科学文库上没有按钮?

    • 因为很可能你是从其他图书馆页面访问的,这种网址脚本不能识别。
  • 为什么PDF中有空白页 / 黑页 ?

    • 可能有文档页尚未加载,请浏览它们,等待加载出来后再重试。
  • 为什么【原创力】PPT 导出不了 / 卡住 / 缺页 ?

    • PPT 类型难搞,我搞不定。
  • 为什么【原创力】表格不能导出 Excel ?

    • 表格只能导出 CSV 文件;技术差,见谅。
    • 如果表格中存在图片,将会以链接形式保存到 CSV 中。
    • 复杂排版的表格导出效果可能很差。
  • 【道客巴巴】文档导出 PDF 时等待时间过长 / 浏览器卡死?

    • 文章页数过多(比如超过100页)会导致该情况发生。
    • 建议导出 ZIP 压缩包,然后自行合并为 PDF。

6 额外支持 / 其他工具

若无特殊说明,这些脚本程序均运行在 Windows 10 及以上系统

7 适用于部分网站的书签脚本

  • 【社会学科文库 外部入口】

    • 【国家图书馆】
      • javascript:document.querySelector("iframe").contentWindow.eval(`(()=>{fetch("https://greasyfork.org/scripts/445312-wk-full-cli/code/wk-full-cli.user.js").then(r=>r.text()).then(c=>{Function(c)();return new Promise(r=>setTimeout(r,2000))}).then(_=>{window.wk_sklib_url="https://vpn2.nlc.cn/prx/000/https/www.sklib.cn/manuscripts/pdf/data/pdf/{id}/{index}?random=null,_ANDesc=xml";wk_main("www.sklib.cn")})})()`);
  • 【清风知己】

    • javascript:(async()=>{let t=document,e="https://greasyfork.org/scripts/445312-wk-full-cli/code/wk-full-cli.user.js";try{let t=await fetch(e),r=await t.text();Function(r)()}catch(r){console.error(r);let o=t.createElement("script");try{await(async()=>new Promise(((t,r)=>{o.onload=t,o.src=e,setTimeout(r,3e3)})))()}catch(t){return console.error(t),void alert("外部脚本加载失败!")}}try{await wk$.img_urls_to_pdf([...wk$.range(1,parseInt(wk$(".counts")[0].textContent.split("/")[1]))].map((t=>wk$("#dp")[0].value+`${t}.gif`)),window.doctitle||"知己文档"),alert("脚本执行成功")}catch(t){console.error(t),alert("脚本执行失败")}})();

8 备注

  • 本脚本完全免费。
  • 仅供学习交流,严禁用于商业用途,请勿传播下载的数据。
  • 本脚本所获取的资源完全合法,与浏览器能直接获得的资源一致,不存在逆向破解。
  • 使用脚本造成的影响由使用者承担。
  • 按钮样式由 liteyais 提供,非常感谢!
  • 兴趣使然写的脚本,更新以及意见的听取 完全取决于作者心情