Greasy Fork is available in English.

怠惰者小説ダウンロードツール

軽量なWebスクレイピングスクリプト。ユニバーサルサイトコンテンツクロールツール、クロール、フォーラム内容など

スクリプトをインストール?
作者が勧める他のスクリプト

東方永頁機も気に入るかもしれません。

スクリプトをインストール
このスクリプトの質問や評価の投稿はこちら通報はこちらへお寄せください。
作者
hoothin
1日のインストール数
34
累計インストール数
166,881
評価
461 18 2
バージョン
2.8.3.14
作成日
2016/11/23
更新日
2024/10/26
互換性
Firefox への互換性あり Chrome への互換性あり Opera への互換性あり Safari への互換性あり
ライセンス
MIT
対象サイト
すべてのサイト

i

[ウェブページをハイライトまたはフォーマットするボックスにコードを入力し、単語数を数えます]

ウェブページのメインコンテンツをダウンロードするために使用される軽量のクロールスクリプト。理論的には、Ajax以外の新しいウェブサイト、フォーラム、ポストバーなどを作成するのに適しています。ルールを作成する必要はありません。

スクリプトはページのメインコンテンツを自動的に取得してダウンロードします(ギャルガイドをコピーした後、「XXクライアントからX年X月X日に公開された13レベルのタイトルWater Dragon King」を手動で削除する必要はありません)。 小説のカタログページにある場合は、すべての章をトラバースして並べ替え、TXTファイルとして保存します。

❤️Buy me a coffee if it helps you with PayPal.Me or Ko-fi.


手順

  • 小説のカタログページ、フォーラム、または投稿バーのコンテンツページを開きます
  • CTRL + F9を押すか、コマンドメニューをクリックします
  • SHIFT + CTRL + F9を押してディレクトリを無視し、現在のページのみをダウンロードします

img

レイジーマインド

この作業には7つのレベルがあり、最初のレベルが最も簡単で、7番目のレベルが最も困難です。

心の最初の層

CTRL + F9以上です。

心の第二層

チャプターリンクにxxチャプター、xxセクション、xxワードなどの特徴的な単語がない場合は、[カスタムダウンロード]をクリックし、「Windmill of the Gods」などのチャプター名を入力して、すべてのリンクにマークを付けることができます。目次の章と同じレベルでダウンロードしてください。ページに2つの章形式がある場合は、「神々の風車、風車の神々」など、複数の章の形式をマークできます。また、「神々の風車01!02!03、風車の神々!鉄のカーテン」などの除外マークを付けることもできます。これは、同じレベルのリンクに「神々の風車01」とマークが付けられていることを意味します。 02を含むアイテムと03を含むアイテムは除外されます。同時に、同じレベルで「Windmill Gods」リンクをマークし、「IronCurtain」を含むアイテムを除外します。

心の第3層

内側のページにテキストがないが、章のリンクが実際のコンテンツのリンクに関連している場合は、カスタムダウンロードを使用してリンクのコンテンツを置き換えることで実際のコンテンツを取得できます。たとえば、[the windmill of the gods @@ articles @@ articlescontent]の場合、章のURLの記事をarticlescontentに置き換えることができます。

心の第4層

リンクを直接置き換えて最終的なアドレスを取得できない場合は、通常のリンクに置き換えることができます。たとえば、[The windmill of the gods @@ articles(\ d +)@@ articlescontent_ $ 1b]、articles1を置き換えることができます。章のURLのarticles2 articlescontent_1b、articlescontent_2b

心の第5層

入力チャプターのcssセレクターは、チャプターリンクをより正確にマークできます。たとえば、 .l_chaptname> aは、クラスがl_chaptnameである要素の下のリンクを表します。 ダウンロードしたコンテンツに干渉コードが含まれている可能性があります。このとき、レイジーノベルダウンロード設定をクリックし、干渉コードのcssセレクターを入力して、干渉コードを削除してください。たとえば、 .mask、.ksamは、クラスがmaskまたはksamである要素を削除することを意味します。

心の第6層

内側のページの本文が内側のページの本文でない場合は、ページが読み込まれた後に処理されます。[カスタムダウンロード]をクリックし、カスタムコードを入力して内側のページを分析し、正しい結果を得ることができます。たとえば、[The windmill of the gods @@@@@@ var noval = JSON.parse(data.querySelector("#meta-preload-data ")。content).novel; noval [Object.keys(noval)[ 0]] .content;]、テキストを無視して、カスタムコード処理を通じてコン​​テンツを取得するためにリターンページのみを処理できます。コード内のデータを使用して、返されたページのドキュメントを取得します。最後の式の値は、最終的に書き込まれるコンテンツです。

心の第7層

テキストが暗号化されており、正しいコンテンツを取得するために復号化する必要がある場合は、ブラウザコンソールを開き、dacProcess関数をカスタマイズし、ページ内のWebサイト独自の復号化コードを呼び出して、キャプチャされた暗号化データを処理できます。たとえば、コンソール入力 dacProcess = data => {return decode(xxx);}は、Webサイトの復号化チャプターページを呼び出すことによって返されるデータを表します。次に、[カスタムダウンロード]をクリックします。カスタムダウンロード時にチャプターにマークを付ける必要があることに注意する必要があります。

構成アイテムについて

【オイルモンキーコマンドメニューから以下の機能を入力する必要があります】

  • カスタムディレクトリ:https://xxx.xxx/book-** [20-99] 。html、https://xxx.xxx/book- [01-10] 。html、これは、book-20.htmlをbook-99.htmlにダウンロードし、book-01.htmlをbook-10.htmlにダウンロードし、0を追加せずに [1-10] **を使用することを意味します。
  • チャプターセレクターのカスタマイズ:チャプターリンクのcssセレクターを入力するだけで、URL置換コードとカスタム処理コードを接続できます。
  • 干渉コード: .mask、.ksamなどの干渉コードのcssセレクターに入力します。これは、クラスがmaskまたはksamである要素を削除することを意味します。
  • タイトル名で並べ替える:はい、カタログページのすべてのリンクをタイトル名で並べ替えてtxtに保存します。そうしないと、ページの位置順に並べ替えられます。
  • ダウンロードスレッドの数:同時にダウンロードするスレッドの数。デフォルトは20で、制限のあるサイトでは減らすことができます。

完全な形式の説明

特定のチャプター名/CSSセレクター[セレクターの後に>>処理コードを追加するための着信アイテム]@@リンクの通常の一致がキャプチャされます@@対応する一致が生成されます置換URL*@@*クロールされた返されたコンテンツデータに従って最終的なテキストを処理して返します

カスタム例

  1. po18、チャプターセレクターは .l_chaptname> aです。入力してダウンロードした後、本文のコンテンツをダウンロードできないことがわかりました。 URL、本文はajaxですarticlescontent経由でダウンロードされます。このとき、 @@ articles @@ articlescontent(@@区切り)に従って、章のURLの記事をarticlescontentに置き換えることができます。要約すると、** .l_chaptname> a @@ articles @@ articlescontent **をこのサイトに適合させることができます。最初の記事は通常のルールを使用できます。たとえば、 @ articles(\ d +)@@ $ 1contentは、リンク内の「articles1」、「articles2」などを「1content」「2content」に置き換えることを意味します。
  2. pixiv、pサイト小説のチャプターセレクターは main> section ul> li> div> aで、置き換える必要はありません。リンクなので、2つの空白を残します。 6 @now😂があります。テキストはメタにあり、メタプリロードデータのコンテンツアイテムを抽出するようにコードをカスタマイズする必要があります。要約すると、** main> section ul> li> div> a @@@@@ var noval = JSON.parse(data.querySelector("#meta-preload-data ")。content).novel; noval [Object。 keys(noval)[0]]。content;** pステーションの小説をダウンロードできます。その中で、「data」はクロールされたWebページのドキュメントオブジェクトを表します。返されるテキストがプレーンテキストの場合は、 data.body.innerTextを使用して取得します。

テストページ

Buy me a coffee if it helps with PayPal.Me

donation

なぜこのスクリプトを書くのですか?

主にlazy 馳星周の漂流する通りをダウンロードしたいのですが、前任者の「[Fiction] Download Script」のホイールが利用できないことがわかり、この壊れたステーションのルールを書きたくないので🙃、私はただあなたを横切る圧倒的なXiuxian大統領を見下します私をかみます多分それは3日で2回改訂されるでしょう。一般的なルールのスクリプトを作成します。第一に、適応、変更、更新するために無数の新しいサイトを追跡する必要がなく、第二に、法的リスクを回避します。 このスクリプトは、メインコンテンツを自動的に検索し、ルールを記述せずにダウンロードします。もちろん、あなたのウェブサイトが本文よりも多くの広告を持っているなら、私はそれを助けることができません。 特別なウェブサイトに出会うときは、「[フィクション]ダウンロードスクリプト」を使用することをお勧めします。