DownloadAllContent

Lightweight web scraping script. Fetch and download main textual content from the current page, provide special support for novels

< Обсуждения DownloadAllContent

Отзыв: Нормальный — скрипт работает, но имеет существенные недостатки

https://www.ddxs.com/
该网站上的小说的目录有问题,目录上的最后几章标题前后回有乱码一样的繁体字符,但是点进去页面里的标题是正常的。如果改正则表达式匹配上就会连同繁体字一起下载下来;如果匹配不上走nextpage路径,则会在前一章标题的后面加上">>"。这边能否修改一下,读取下一页的标题去网页中读取,而不是直接在前一章标题的后面加上">>"。
谢谢!

Ответить

Войдите, чтобы ответить.