Dynamic Page Code Scraper with Button

带有启动按钮的 JavaScript 动态页面代码爬取脚本

Autor
zzy.2004
Denně instalací
0
Celkem instalací
5
Hodnocení
0 0 0
Verze
0.1
Vytvořeno
15. 02. 2025
Aktualizováno
15. 02. 2025
Size
2,0 KB
Licence
MIT
Spustit na
všech stránkách

Dynamic Page Code Scraper with Button 代码发行说明

概述

Dynamic Page Code Scraper with Button-0.1.user.js 是一个用户脚本,主要用于动态页面的代码爬取,通过一个启动按钮来触发爬取操作。

功能特性

启动按钮

脚本会在页面上创建一个固定位置的按钮,按钮文本为“开始爬取页面代码”,其 CSS 样式确保它会固定在页面右上角,方便用户操作。

爬取与清理

  • 当用户点击按钮时,脚本会先移除按钮,然后克隆整个文档,避免对原始页面进行直接修改。
  • 接着,会移除克隆文档中所有与用户脚本相关的元素,确保获取到的页面代码是干净的,不包含脚本自身的干扰。

代码获取与保存

  • 脚本会获取清理后的页面 HTML 代码,并将其输出到控制台,方便用户查看。
  • 以页面标题作为文件名(如果没有标题则使用 page_code),将页面代码保存为 .html 文件。
  • 通过创建 Blob 对象和临时 URL,以及模拟点击下载链接的方式,将页面代码保存到本地。
  • 最后,释放临时 URL,避免内存泄漏。

错误处理

如果在获取或保存页面代码时出现错误,脚本会将错误信息输出到控制台,方便用户进行调试。

使用方法

  1. 确保你已经安装了支持用户脚本的浏览器扩展,如 Tampermonkey。
  2. Dynamic Page Code Scraper with Button-0.1.user.js 脚本添加到你的用户脚本管理器中。
  3. 访问任意网页,你会在页面右上角看到“开始爬取页面代码”按钮。
  4. 点击按钮即可开始爬取页面代码,并将其保存到本地。

兼容性

由于脚本使用了标准的 JavaScript 特性,理论上可以在任何支持 Tampermonkey 或类似扩展的现代浏览器上运行。

注意事项

  • 由于浏览器的安全限制,脚本只能保存用户访问的页面的代码,不能跨域爬取。
  • 该脚本仅用于学习和研究目的,请勿用于非法活动。