DownloadAllContent

Lightweight web scraping script. Fetch and download main textual content from the current page, provide special support for novels

Отзив: Отлично - скриптът работи

A21RC

Публикуван на: 23.08.2023

大大，请教一个问题，对于分页的带有>>的分页标题，如何不输出或者在输出后批量删除？
现在很多小说网站都是章节内分页的，下载后在阅读器上又会自动索引标题后分成两个章节，阅读起来多有不便。
尝试过删除重复段落，但是这样会将正文的一些合理的重复段也一并删除，因此无法解决，求帮助。

hoothinАвтор

Публикуван на: 24.08.2023

有范例网站吗？

A21RC

Публикуван на: 24.08.2023

我是在axeslide.com碰到这个问题的，不过在笔趣阁的翻页倒是自动合并了。
研究了很久，发现分页标题还是可以通过word进行批量删除的。
此外，m.529c.com试了很多种解析方式，好像都抓不到正文的内容？
不过都是些小站，纯粹是萌新瞎折腾，哈哈。