Wenku Doc Downloader

对文档截图,合并为纯图片PDF。有限地支持(1)豆丁网(2)道客巴巴(3)360个人图书馆(4)得力文库(5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)安全文库网(11)人人文库(12)云展网(13)360文库(14)技工教育网(15)文库吧(16)中国社会科学文库(17)金锄头(18)自然资源标准。预览多少页,导出多少页。额外支持(1)食典通(2)JJG 计量技术规范,详见下方说明。

< Feedback on Wenku Doc Downloader

Question/comment

§
Posted: 2024-03-04

已经没有特殊方法了。
部分网站现在已经没有会员实际上只传输图片了,像doc88所谓的选中好像只是给你一个框,实际上并没有文字传过来。所谓复制脚本是伪造了数据调用了他们的API。
我劫持了canvas,就只调用了PutImage。
确实获取图片已经是最后的结果了。
除了好像百度文库尝试用div模拟文本。看DOM可以看到创建了大量元素。

JoyofFireAuthor
§
Posted: 2024-05-17

道客巴巴是有PDF数据传输到浏览器的,但是被加密了,然后实现了解密数据并渲染为canvas。

§
Posted: 2024-07-04

道客巴巴是有PDF数据传输到浏览器的,但是被加密了,然后实现了解密数据并渲染为canvas。

那大佬看看类似劫持canvas的思路能不能工作? 我写到一半的:https://greasyfork.org/zh-CN/scripts/488618-exportpdf

§
Posted: 2024-07-04
Edited: 2024-07-04

道客巴巴是有PDF数据传输到浏览器的,但是被加密了,然后实现了解密数据并渲染为canvas。

那大佬看看类似劫持canvas的思路能不能工作?
我写到一半的:https://greasyfork.org/zh-CN/scripts/488618-exportpdf

我调查过了,doc88其会调用canvas的ctx2d的PutImageData,并且其put的data就是一张包含文档内容的图片。。。
同时,完全没有调用FillText与StrokeText.
只能截截图了。

JoyofFireAuthor
§
Posted: 2024-07-05

道客巴巴是有PDF数据传输到浏览器的,但是被加密了,然后实现了解密数据并渲染为canvas。 那大佬看看类似劫持canvas的思路能不能工作?我写到一半的:https://greasyfork.org/zh-CN/scripts/488618-exportpdf 我调查过了,doc88其会调用canvas的ctx2d的PutImageData,并且其put的data就是一张包含文档内容的图片。。。同时,完全没有调用FillText与StrokeText. 只能截截图了。

道客巴巴的 .ebt 加密文件里有图像和文本数据,但是通过 wasm 解密生成文档页面的,我看不懂。相关文章:https://www.dslt.tech/article-4432-1.html

Post reply

Sign in to post a reply.