Greasy Fork is available in English.

Wenku Doc Downloader

对文档截图,合并为纯图片PDF。有限地支持(1)豆丁网(2)道客巴巴(3)360个人图书馆(4)得力文库(5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)安全文库网(11)人人文库(12)云展网(13)360文库(14)技工教育网(15)文库吧(16)中国社会科学文库(17)金锄头(18)自然资源标准。预览多少页,导出多少页。额外支持(1)食典通(2)JJG 计量技术规范,详见下方说明。

< Spätná väzba na Wenku Doc Downloader

Hodnotenie: Dobré - skript funguje

§
Pridaný: 09.12.2021
Upravený: 09.12.2021

下载百度文库文章时txt格式正常可以完整下载,pdf只有前两页有文章内容,剩下页面为空白,最后一页有显示百度的广告和相关推荐。

JoyofFireAutor
§
Pridaný: 09.12.2021
  1. 导出pdf时,是不是有页面没有加载好?如果有页面没有加载好,就会导致空白页。

  2. 广告问题,你可以试试先点一次“导出PDF”的橙色按钮,然后点取消,然后再点一次橙色按钮,看看广告是否消失。如果仍旧存在,请回复我网页链接,我来研究一下

§
Pridaný: 13.12.2021

问题2通过取消后再次点击橙色按钮已经解决。

PDF无法导出个人做了下操作:我需要下载的文档是“付费下载文档或成为VIP用户可继续阅读”,直接点击“展开文档”按钮会跳转到付费页面,但是我可以通过百度文库自带的页数跳转功能跳转到文档倒数第二页,通过这种操作就能把整个文档完整加载出来,完成加载后再次点击“展开文档”按钮会变为导出txt和pdf按钮。这样操作以后可以导出完整的txt,但导出pdf的话还是只有不收费的前两页。

JoyofFireAutor
§
Pridaný: 13.12.2021
  • ①VIP预览全文:你需要的文档一开始就是要求vip才能预览全文吗?我的脚本只对能预览的部分生效。
  • ②免费预览全文:还有一种情况,就是文档一开始是免费预览,但多次查看之后变成了vip专属,这种情况需要清空cookies,刷新页面就行了。
  • 如果你不确定是上述二者的哪种情况,可以把链接回复给我,我研究一下。
  • 【展开文档】按钮等同于点击【继续阅读】,所以如果它【继续阅读】就需要开VIP我这也没办法。
JoyofFireAutor
§
Pridaný: 13.12.2021

今天测试时发现大批文档不能免费预览全文了,可能是百度察觉到了什么,这种无法免费预览的文档确实没办法。

JoyofFireAutor
§
Pridaný: 13.12.2021

确认了。百度应该是对电脑端的文档进行了严格限制,原本免费预览的文档也不让预览了。但同一文档在手机端可以预览全文。我会尽快改进脚本,适配现在的状况。

§
Pridaný: 13.12.2021

既然是百度搞的鬼那也摸得办法,大佬加油(*´▽`)ノノ

JoyofFireAutor
§
Pridaný: 14.12.2021

现在问题解决了😃

§
Pridaný: 15.12.2021

不太行诶,试我之前发的那个网址还是导不出pdf

JoyofFireAutor
§
Pridaný: 15.12.2021

https://wenku.baidu.com/view/b249cb95ff4733687e21af45b307e87100f6f861.html

这个网址没问题啊,导出的文档:链接

要是你还有问题就加我QQ详细讨论一下:2690874578

§
Pridaný: 15.12.2021

绷不住了发现问题了,我一直按推荐的缩放118设置的,但设置118的时候只能显示前两页,后面试出来调到且只有调到90才能完全显示。但调成90也不能完全解决问题,它大小和A4不匹配,就导致一页摆不下会出现大段的空白,看起来像下图一样:

ps:用的是火狐,是不是游览器的锅?

JoyofFireAutor
§
Pridaný: 15.12.2021

感谢你的测试,作为一个用户却花这么多时间帮我测试脚本,找出问题,感激不尽。

问题可能是浏览器导致的,而且这个问题容易发生,还不好解决。所以缩放比例是建议自己调试。但有页面元素不受缩放控制,所以无法仅仅依靠调节缩放就让文档页与A4的一页完美适配。

这个问题目前没有解决办法,除了自己换浏览器和调试缩放比例以外(但对于用户来说太麻烦了)。还有一个方案:把你需要的网址反馈给我,我手动调节页面元素到适合的大小,然后导出pdf发给你。

我会考虑替代方案,比如想办法把页面元素(即文档的每一页)转换为png图片,然后拼合png为pdf,然后下载下来。这个方案可行性还不清楚,所以更新时间还不能确定。

§
Pridaný: 16.12.2021

试了下edge,感觉看起来比火狐的要舒服点。我能下到排版正常的完整txt文件就很满意了,PDF对我来说看起来差不多就行,不用麻烦你专门去导啦。
祝越做越好(*´▽`)ノノ

Pridať odpoveď

Aby ste mohli pridať odpoveď, prihláste sa.