小说下载器
一个可扩展的通用型小说下载器。
关于 404 小说文库项目
在这个 404 时代,由于种种原因,起点、晋江、刺猬猫、SF 等小说网站上的小说经常毫无征兆的消失。即使该小说已经入 V,即使你已经订阅了该小说。
这样的例子数不胜数。随便打开笔趣阁等转载网站,首发于起点,但现在起点上找不到该小说的情形比比皆是。像轻文轻小说这种整个网站都上天了的情况也不是没有。
如果小说消失时被笔趣阁等转载网站转载了,后来的读者尚且能一睹其风采,但如果小说发布的网站不是起点,小说也不够热,根本就没有转载网站转载,那后来者想一睹该小说的风采,就相当困难了。
404 小说文库项的目的是:保存这些质量上乘,但不够热门,没有被其他网站转载,彻底从互联网上消失的作品。
本脚本为 404 小说文库项目的组成部分之一,对于无登录墙的小说网站,如您同意,本脚本将会尝试将当前书籍详情页及目录页(如果存在)存档至互联网档案馆(archive.org),以备日后(被删除后)查看。
存档过程中将会搜集并上报您如下信息:IP 地址、User-Agent、Referer、当前书籍详情页 URL、当前书籍目录页 URL(如果存在)、当前小说下载器脚本版本、当前脚本管理器版本。除上述信息外,不会搜集您任何其他信息。
安装
本软件为油猴脚本,需先在浏览器安装脚本管理器(Greasemonkey、Violentmonkey、Tampermonkey),再安装本脚本。具体可参见:如何安装用户脚本。
本脚本地址:
使用方法
本脚本执行下载任务时将播放无声音频,以保证脚本后台运行时不被休眠。
如果本脚本支持该小说网站,当打开小说目录页时,网页右上角会出现下载图标,点击该图标即可开始下载。
如果你要下载的小说章节较多,等待时间可能较长,此时请耐心等待。
你通过右下角进度条了解当前下载进度,或者按下 F12,打开网页控制台查看当前下载状态。
下载完成后,本脚本将会自动下载一个 TXT 文档及 EPUB 文件。
TXT 文档请使用记事本或其它阅读软件进行阅读。
EPUB 文件请使用相应阅读器阅读。
常见问题
A:在反馈之前,请保证您当前运行的脚本版本为最新版,如不是最新版,请更新脚本。
如最新版脚本仍出现错误,请说明具体网址,有无特殊操作以及其他附加说明,并附上调试日志,协助开发者明确出错原因。调试日志为下载生成的 zip 文件中的 debug.log
文件。
如需反馈问题,请至本项目支持页面提交 issue, 对于 greasyfork 评论区的反馈跟进不及时敬请谅解。
A:请提交 issue 并附上以上信息,网站 URL,原创网站或转载网站,有无收费章节,有无如登录墙等额外限制,希望添加的理由等。开发者将视情况,酌情添加。
A:有的。Matrix 空间:#404-novel-project:bgme.me,Telegram 群组:https://t.me/+ZCngCQiJ_xo2NDI1 。
目前支持小说网站
特别提醒:如欲下载支持列表中网站的付费章节,请登录相应网站帐户,并确定已购买相应付费章节。未登录网站帐户,或未购买的付费章节,下载时将直接忽略,无法进行下载。
点击查看全部支持网站
| 站点 | 公共章节 | 付费章节 | 备注 |
| ------------------------------------------------- | -------- | -------- | ---------------------------------------------------------------------------------------- |
| [禁忌书屋](https://www.cool18.com/bbs4/index.php) | ✅ | ❎ | |
| [UU 看书网](https://www.uukanshu.com/) | ✅ | ❎ | |
| [亿软网](http://www.yiruan.la/) | ✅ | ❎ | 网站性能差,降低抓取频率,请耐心等待。 |
| [书趣阁](http://www.ishuquge.org/) | ✅ | ❎ | 网站性能差,降低抓取频率,请耐心等待。 |
| [星空中文](http://www.xkzw.org/) | ✅ | ❎ | |
| [乐文小说网](https://www.lewenn.net/) | ✅ | ❎ | |
| [266 看书](http://www.266ks.com/) | ✅ | ❎ | |
| [和图书](https://www.hetushu.com/index.php) | ✅ | ❎ | |
| [阁笔趣](http://www.gashuw.com/) | ✅ | ❎ | |
| [书书网](https://www.1pwx.com/) | ✅ | ❎ | |
| [八一中文网](https://www.81book.com/) | ✅ | ❎ | 抓取速度慢,请耐心等待。 |
| [御书阁](http://m.yushuge123.com/) | ✅ | ❎ | 部分文字被图片替换,请使用 HTML 版查看。 |
| [完本神站](https://www.wanben.info/) | ✅ | ❎ | |
| [得间小说](https://www.idejian.com/) | ✅ | ❎ | |
| [轻小说文库](https://www.wenku8.net/) | ✅ | ❎ | |
| [西方奇幻小说网](https://www.westnovel.com/) | ✅ | ❎ | |
| [棉花糖小说网](https://www.mht99.com/) | ✅ | ❎ | |
| [笔趣阁](https://www.xbiquge.tw/) | ✅ | ❎ | |
| [红叶书斋](https://www.007zw.com/) | ✅ | ❎ | |
| [哩哔轻小说](https://www.linovelib.com/) | ✅ | ❎ | 因需要基于邻近章节修复隐藏链接的章节,生成目录时间变慢,大约2分钟。 |
| [落秋中文](https://www.luoqiuzw.com/) | ✅ | ❎ | |
| [一笔阁](https://www.yibige.cc/) | ✅ | ❎ | |
| [腐书网](https://www.fushuwang.org/) | ✅ | ❎ | |
| [搜小说](https://www.soxscc.net/) | ✅ | ❎ | |
| [腐国度](https://www.fuguoduxs.com/) | ✅ | ❎ | |
| [书包网](http://www.shubaowa.org/) | ✅ | ❎ | |
| [恋上你看书](https://www.630shu.net/) | ✅ | ❎ | |
| [同人小说网](https://www.trxs123.com/) | ✅ | ❎ | |
| [同人圈](http://www.tongrenquan.org/) | ✅ | ❎ | |
| [精品小说网](http://www.jpxs123.com/) | ✅ | ❎ | |
| [256 文学](https://www.256wenku.com/) | ✅ | ❎ | |
| [笔趣阁小说网](http://www.biquge66.com/) | ✅ | ❎ | |
| [海棠小说网](http://m.haitangtxt.net/) | ✅ | ❎ | 部分文字被图片替换,请使用 HTML 版查看。
如需替换清理图片,请自行生成图片文字对照表。 |
| [笔趣阁](https://www.biquzw.la/) | ✅ | ❎ | |
| [25 中文网](http://www.i25zw.com/) | ✅ | ❎ | |
| [天域小说网](https://www.tycqzw.com/) | ✅ | ❎ | |
| [完本神站](https://www.wanben.org/) | ✅ | ❎ | |
| [燃文小说](https://www.ranwen.la) | ✅ | ❎ | |
| [望书阁](https://www.wangshugu.org/) | ✅ | ❎ | |
| [百合小说网](https://m.baihexs.com/) | ✅ | ❎ | |
| [全书斋](https://www.quanshuzhai.com/) | ✅ | ❎ | |
| [蔷薇后花园](https://houhuayuan.xyz/) | ✅ | ❎ | |
| [黑沼泽俱乐部](https://houhuayuan.xyz/) | ✅ | ❎ | |
| [神凑轻小说](http://www.shencou.com/) | ✅ | ❎ | |
| [爱下书小说网](https://www.aixiaxs.net/) | ✅ | ❎ | |
| [精彩小说网](https://jingcaiyuedu6.com/) | ✅ | ❎ | |
| [爱下电子书](https://www.aixdzs.com/) | ✅ | ❎ | |
| [笔趣阁](http://www.b5200.net/) | ✅ | ❎ | |
| [言情小说](https://www.yqxsge.cc/) | ✅ | ❎ | |
| [18 看书](https://www.18kanshu.com/) | ✅ | ❎ | |
| [笔下文学 333](http://www.bixia3.com/) | ✅ | ❎ | |
| [小说屋](http://www.xiaoshuowu.com/) | ✅ | ❎ | |
| [缤纷幻想](https://colorful-fantasybooks.com/) | ✅ | ❎ | |
| [弟子小说网](https://www.dizishu.com/xiaoshuo/) | ✅ | ❎ | |
| [新笔趣阁](https://www.ibiquge.la/) | ✅ | ❎ | |
| [69 书吧](https://www.69shu.com/) | ✅ | ❎ | |
| [笔下文学](https://www.ywggzy.com/) | ✅ | ❎ | |
| [飘天文学网](https://www.piaotia.com/) | ✅ | ❎ | |
| [红袖招](https://hongxiuzhao.me/) | ✅ | ❎ | |
| [38 看书](https://www.mijiashe.com/) | ✅ | ❎ | |
| [天天看小说](https://www.ttkan.co/) | ✅ | ❎ | |
| [精华书阁](https://www.xbyuan.com/) | ✅ | ❎ | |
| [全职小说网](http://www.quanzhifashi.com/) | ✅ | ❎ | 网站反爬较严,大量抓取可能导致封禁ip。 |
| [笔趣阁](https://www.42zw.la/) | ✅ | ❎ | |
| [新笔趣阁](http://www.boqugew.com/) | ✅ | ❎ | |
| [全本同人小说](https://www.qbtr.cc/) | ✅ | ❎ | |
| [鬼大爷网](https://b.guidaye.com/) | ✅ | ❎ | |
特殊权限说明
unsafeWindow
:用于获取自定义筛选函数、自定义保存参数等设置。
GM_info
/GM.info
: 获取并输出脚本运行环境。
GM_xmlhttpRequest
/GM.xmlHttpRequest
:用于跨域 HTTP 请求。
GM_setValue
/GM.setValue
、GM_getValue
/GM.getValue
、GM_deleteValue
/GM.deleteValue
: 用于统计模块,本地统计运行次数。
Token 填写
当前部分网站(如晋江文学城)需要手动填写登录 token。app 平台一般为 Android 平台,其他平台一般不能使用(但也可以实践看看)。
抓包软件和教程
这里列举出一些常用的工具以供参考。
- 抓包精灵(Android)
下载抓包精灵/NetCapture(可在 Google Play、酷安搜索到,其他软件也可以)并配置好设置。
可参考 @ll0yiya 的经验(https://github.com/404-novel-project/novel-downloader/issues/599#issuecomment-1866142314)。
- HttpCanary(Android)
可参考 https://blog.csdn.net/weixin_53891182/article/details/124739048 等资料。
在编写脚本时,作者使用的版本:https://fin.lanzoub.com/iGYv20vym1dc。
- eCapture(Android)
需要 Android 内核版本 5.4以上。
详细信息,建议参考 https://mp.weixin.qq.com/s/KWm5d0uuzOzReRtr9PmuWQ 等资料。
- Charles(Windows / MacOS / Linux)
官网: https://www.charlesproxy.com/
需要电脑,可搭配 Android 模拟器。
可参考 https://blog.csdn.net/qq_41631913/article/details/135748992。
注:本节脚本代码中的值均为编撰,仅为示意。
晋江文学城
该网站现提供 2 个方法以获取 token 。
- 脚本设置获取
注:user_key对于部分账号可能是必须的,如果你采用方法2,可以将两个一起抓取。
成功抓取 token 后,在脚本管理器中新建如下脚本(不要把该脚本代码和其他脚本代码合并,除非你完全理解脚本的意思)并保存:
// ==UserScript==
// @name auto inject tokenOptions
// @namespace http://tampermonkey.net/
// @version 0.1
// @description auto inject tokenOptions
// @author You
// @match *://*/*
// @grant none
// ==/UserScript==
(function () {
"use strict";
const tokenOptions = {
Jjwxc: "11111111_750afc84c839aaaaafccd841fffd11f1", //填入token,形如客户号+下划线'_'+字母与数字混合的字符串
};
window.tokenOptions = tokenOptions;
})();
如果你采用方法2,成功抓取 token 和 user_key 后,在脚本管理器中新建如下脚本(不要把该脚本代码和其他脚本代码合并,除非你完全理解脚本的意思)并保存:
// ==UserScript==
// @name auto inject tokenOptions
// @namespace http://tampermonkey.net/
// @version 0.1
// @description auto inject tokenOptions
// @author You
// @match *://*/*
// @grant none
// ==/UserScript==
(function () {
"use strict";
const tokenOptions = {
Jjwxc: {
token:"11111111_750afc84c839aaaaafccd841fffd11f1", //填入token,形如客户号+下划线'_'+字母与数字混合的字符串
user_key:"11ffffff-11ff-11ff-11ff-111111111fff",//填入user_key
}
};
window.tokenOptions = tokenOptions;
})();
[!CAUTION]
在设置中启用调试模式以后,日志可能会输出一些包含 token 的链接,这个设计的初衷是为了更快定位发生的问题。
请不要直接将该日志上传到互联网上,当且仅当从事维护的开发者需要此日志定位问题时再提供(可以通过重新登录之前抓取 token 设备上的晋江 app 以使原 token 失效)。
息壤中文网
该网站的 Android app 启动时会检测 root 和 VPN 代理, 因此可能需要一些额外的操作以越过;此外 header 数据的获取需要安装CA证书,建议具有一定相关知识的人士进行操作。
需要抓取的数据:登录息壤中文网 Android app 并随意浏览章节,在形如“https://android-api.xrzww.com/api/readWithEncrypt”的网址中转到 Request header(即请求头)页,header 中的 deviceIdentify 和 Authorization 即为需要抓取的数据(注意不要弄成 Response header(响应头))。
在脚本管理器中新建如下脚本(不要把该脚本代码和其他脚本代码合并,除非你完全理解脚本的意思)并保存:
// ==UserScript==
// @name auto inject tokenOptions
// @namespace http://tampermonkey.net/
// @version 0.1
// @description auto inject tokenOptions
// @author You
// @match *://*/*
// @grant none
// ==/UserScript==
(function () {
"use strict";
const tokenOptions = {
Xrzww: {
deviceIdentify: "webh517657567560", //填入 header中的deviceIdentify值
Authorization: "Bearer 453453453e03ee546456546754756756", //填入 header中的Authorization值
},
};
window.tokenOptions = tokenOptions;
})();
高阶使用技巧
启用调试功能
设置菜单中按击开启。
自定义筛选函数
如欲只下载部分章节,请在点击运行按钮前,按下 F12 打开开发者工具,在 window
下创建 chapterFilter
函数,具体格式如下:
declare enum Status {
pending = 0,
downloading = 1,
failed = 2,
finished = 3,
aborted = 4,
saved = 5,
}
interface ChapterAdditionalMetadate {
lastModified?: number;
}
declare class Chapter {
bookUrl: string;
bookname: string;
chapterUrl: string;
chapterNumber: number;
chapterName: string | null;
isVIP: boolean;
isPaid: boolean | null;
sectionName: string | null;
sectionNumber: number | null;
sectionChapterNumber: number | null;
chapterParse: BaseRuleClass["chapterParse"];
charset: string;
options: object;
status: Status;
retryTime: number;
contentRaw: HTMLElement | null;
contentText: string | null;
contentHTML: HTMLElement | null;
contentImages: attachmentClass[] | null;
additionalMetadate: ChapterAdditionalMetadate | null;
chapterHtmlFileName: string | number;
constructor(
bookUrl: string,
bookname: string,
chapterUrl: string,
chapterNumber: number,
chapterName: string | null,
isVIP: boolean,
isPaid: boolean | null,
sectionName: string | null,
sectionNumber: number | null,
sectionChapterNumber: number | null,
chapterParse: BaseRuleClass["chapterParse"],
charset: string,
options: object
);
init(): Promise<this>;
private parse;
}
declare class attachmentClass {
url: string;
name: string;
mode: "naive" | "TM";
headers?: {
[index: string]: string;
};
private defaultHeader;
status: Status;
retryTime: number;
imageBlob: Blob | null | void;
constructor(imageUrl: string, name: string, mode: "naive" | "TM");
init(): Promise<Blob | null>;
private downloadImage;
private tmDownloadImage;
}
interface chapterFilter {
(chapter: Chapter): boolean;
}
自定义筛选函数示例:
只下载该本小说前 100 章内容:
function chapterFilter(chapter) {
return chapter.chapterNumber <= 100;
}
只下载第一卷内容:
function chapterFilter(chapter) {
return chapter.sectionNumber === 1;
}
只下载章节名称中含有“武器”的章节:
function chapterFilter(chapter) {
return chapter.chapterName.includes("武器");
}
自定义保存参数
自定义保存参数允许您修改保存文件的样式,章节标题等内容。
使用方法大致同自定义筛选函数,即在 window
下创建 saveOptions
对象,具体格式如下:
declare class saveBook {
protected book: Book;
mainStyleText: string;
tocStyleText: string;
constructor(book: Book);
saveTxt(): void;
saveLog(): void;
saveZip(runSaveChapters?: boolean): Promise<void>;
addChapter(chapter: Chapter): void;
getchapterName(chapter: Chapter): string;
genSectionText(sectionName: string): string;
genChapterText(chapterName: string, contentText: string): string;
genSectionHtmlFile(chapterObj: Chapter): Blob;
genChapterHtmlFile(chapterObj: Chapter): Blob;
chapterSort(a: Chapter, b: Chapter): 0 | 1 | -1;
}
interface saveOptions {
mainStyleText?: saveBook["mainStyleText"];
tocStyleText?: saveBook["tocStyleText"];
getchapterName?: saveBook["getchapterName"];
genSectionText?: saveBook["genSectionText"];
genChapterText?: saveBook["genChapterText"];
genSectionHtmlFile?: saveBook["genSectionHtmlFile"];
genChapterHtmlFile?: saveBook["genChapterHtmlFile"];
chapterSort?: saveBook["chapterSort"];
}
自定义保存参数示例:
将章节名称格式修改为 第xx章 xxxx
:
const saveOptions = {
getchapterName: (chapter) => {
if (chapter.chapterName) {
return `第${chapter.chapterNumber.toString()}章 ${chapter.chapterName}`;
} else {
return `第${chapter.chapterNumber.toString()}章`;
}
},
};
window.saveOptions = saveOptions;
更改 ZIP 文档中章节 HTML 文件样式:
const saveOptions = {
mainStyleText: `p {
text-indent: 4em;
display: block;
line-height: 1.3em;
margin-top: 0.4em;
margin-bottom: 0.4em;
}`,
};
window.saveOptions = saveOptions;
txt 文档每个自然段前加两个空格
const saveOptions = {
genChapterText: (chapterName, contentText) => {
contentText = contentText
.split("\n")
.map((line) => {
if (line.trim() === "") {
return line;
} else {
return line.replace(/^/, " ");
}
})
.join("\n");
return `## ${chapterName}\n\n${contentText}\n\n`;
},
};
window.saveOptions = saveOptions;
保存章节时倒序排列
const saveOptions = {
chapterSort: (a, b) => {
if (a.chapterNumber > b.chapterNumber) {
return -1;
}
if (a.chapterNumber === b.chapterNumber) {
return 0;
}
if (a.chapterNumber < b.chapterNumber) {
return 1;
}
return 0;
},
};
window.saveOptions = saveOptions;
使用用户脚本自动注入自定义保存参数:
如您总是想使用某一自定义保存参数,你可以使用如下用户脚本(根据实际需要修改相应数值),自动向页面注入自定义保存参数。
// ==UserScript==
// @name auto inject saveOptions
// @namespace http://tampermonkey.net/
// @version 0.1
// @description auto inject saveOptions
// @author You
// @match *://*/*
// @grant none
// ==/UserScript==
(function () {
"use strict";
const saveOptions = {
getchapterName: (chapter) => {
if (chapter.chapterName) {
return `第${chapter.chapterNumber.toString()}章 ${chapter.chapterName}`;
} else {
return `第${chapter.chapterNumber.toString()}章`;
}
},
};
window.saveOptions = saveOptions;
})();
自定义筛选函数同理也可使用用户脚本自动注入。
自定义完成回调函数
interface customFinishCallback {
(): void;
}
自定义完成回调函数将在下载完成并生成 ZIP 文件后自动执行。
使用自定义完成回调函数可在下载完成后自动完成某些工作,例如:关闭当前窗口。
function customFinishCallback(book: Book) {
window.close();
}
window.customFinishCallback = customFinishCallback;
附录 完整的自定义脚本
// ==UserScript==
// @name Noveldownloader Settings
// @namespace http://tampermonkey.net/
// @version 0.1
// @description Noveldownloader Settings
// @author You
// @match *://*/*
// @grant none
// ==/UserScript==
(function () {
"use strict";
// token 设置开始
const tokenOptions = {
Jjwxc: {
token:"11111111_750afc84c839aaaaafccd841fffd11f1", //填入token,形如客户号+下划线'_'+字母与数字混合的字符串
user_key:"11ffffff-11ff-11ff-11ff-111111111fff",//填入user_key
},
Xrzww: {
deviceIdentify: "webh517657567560", //填入 header中的deviceIdentify值
Authorization: "Bearer 453453453e03ee546456546754756756", //填入 header中的Authorization值
},
};
//token 设置结束
// 章节过滤筛选开始
function chapterFilter(chapter) {
return chapter.chapterNumber <= 100;
}
//章节过滤筛选结束
//保存设置开始
const saveOptions = {
getchapterName: (chapter) => {
if (chapter.chapterName) {
return `第${chapter.chapterNumber.toString()}章 ${chapter.chapterName}`;
} else {
return `第${chapter.chapterNumber.toString()}章`;
} // 按 第i章 XXX 命名章节名字
},
};
//保存设置结束
if(saveOptions)
window.saveOptions = saveOptions;
if(tokenOptions)
window.tokenOptions = tokenOptions;
if(chapterFilter)
window.chapterFilter = chapterFilter;
})();
开发
git clone https://github.com/yingziwu/novel-downloader.git
将项目克隆至本地(访问 github 可能需要使用代理)。
yarn install
安装依赖。
- 继承
BaseRuleClass
类,实现 bookParse
、chapterParse
抽象方法,在 router/download.ts
文件中添加相应选择规则,在 header.json
文件 match
字段添加相应的匹配规则。
yarn run build
编译生成最终脚本文件 dist/bundle.user.js
。
License
AGPL-3.0
致谢
感谢 JetBrains 向本项目提供 WebStorm IDE。