懒人小说下载器

通用网站内容抓取工具,可批量抓取小说、论坛内容等并保存为TXT文档

目前为 2021-12-17 提交的版本。查看 最新版本

作者
hoothin
评分
0 0 0
版本
2.5.2
创建于
2016-11-23
更新于
2021-12-17
大小
23.4 KB
兼容性
与 Firefox 兼容 与 Chrome 兼容 与 Opera 兼容 与 Safari 兼容
许可证
MIT
适用于
所有网站

起点以及其他知名小说站都推荐用这个脚本【小说】下载脚本,遇到没人愿意适配的垃圾站再考虑我的脚本

轻量级抓取脚本,用于下载网页中的主要内容,理论上适用于任何非Ajax写入正文的小说网站、论坛、贴吧等而无需为此写任何规则 脚本会自动检索页面中的主要内容并下载(省得复制完gal攻略还要手动逐条删除“某某某13级头衔水龙王发表于X年X月X日来自XX客户端”) 如果位于小说目录页会遍历所有章节并排序拼接后存为TXT文档

脚本Github


操作说明 - Usage

  • 打开小说目录页、论坛或贴吧内容页
  • 按下 CTRL+F9 或点击命令菜单
  • 关于配置项可配置
    • 以下功能需要通过油猴命令菜单进入
    • 自定义下载目录范围:如 https://xxx.xxx/book-**[20-99]**.html,https://xxx.xxx/book-**[01-10]**.html,意思为下载https://xxx.xxx/book-20.html到https://xxx.xxx/book-99.html,以及https://xxx.xxx/book-01.html到https://xxx.xxx/book-10.html,[1-10]则不补0
    • 通过章节选择器自定义下载:输入要下载的章节链接的css选择器即可,后面可以接上url替换码,例如这个站 po18,章节的选择器为 .l_chaptname>a ,但是通过url无法下载正文,正文是ajax通过articlescontent下载的,此时可后接 @@articles@@articlescontent(@@分隔) 将章节url中的articles替换为articlescontent, .l_chaptname>a@@articles@@articlescontent 即可适配该站。其中第一个articles可使用正则,例如 @@articles\d+@@$1content 代表将链接中的“articles1”“articles2”等替换为“1content”“2content”
    • 干扰码:填入干扰码的css选择器,如.mask,意为删除class为mask的元素
    • 按标题名重新排序:是则把目录页所有链接按标题名排序后存入txt,否则按页面位置顺序排列

测试网页 - Test case

donations

为啥要写这个脚本?

主要是 怠惰啊 因为我要下载驰星周的漂流街,却发现前人的轮子“【小说】下载脚本”不能用,又不想为这破站写规则,而且我就是看不上霸道总裁修仙穿越你咬我啊指不定它三天两头改个版呢。 这个脚本会自动去查找主要内容并下载,不需要写规则。当然如果你家网站广告内容比正文还多我也没办法。 遇到特殊网站还是建议用“【小说】下载脚本”。