RulateBookExtractor

The script adds a button to the site for downloading books to an FB2 file

Ili estas versioj de tiu ĉi skripto, kie la kodo estas ĝisdatigita. Montri ĉiujn versiojn

  • v1.5.1 2024/03/01
    • Добавлена обработка тега CENTER;
    • Чистка кода;
  • v1.5.0 2024/02/10
    • Добавлена обработка тегов H1, H2 и H3;
    • Добавлена статистика по неизвестным тегам и проблемным изображением в конце лога;
  • v1.4.0 2024/02/07
    • Добавлена проверка типа изображения;
    • Добавлена статистика загруженных изображений;
  • v1.3.0 2023/11/05
    • Добавлена возможность конвертирования WebP изображений;
  • v1.2.0 2023/11/03
    • Если автор не указан, то автором указывается владелец перевода;
    • Теперь в историю документа добавляется запись о создании файла;
    • Несколько незначительных улучшений;
  • v1.1.0 2023/09/18
    • Корректная обработка глав в которых нет переведенных фрагментов;
  • v1.0.1 2023/08/31
    • В случае обнаружения неизвестного HTML тега скрипт выдает предупреждение и продолжает работу. Содержимое такого тега преобразуется в обычный текст без форматирования;
    • Оптимизация кода;
    • Другие незначительные исправления;
  • v0.5.1 2023/08/28
    • В описание книги добавлена ссылка на источник;
    • Улучшена нормализация документа;
    • Исправлен алгоритм генерации id книги;
  • v0.5.0 2023/08/19
    • Добавлена обработка вложенных блоков DIV;
    • Добавлено определение даты последнего обновления книги;
    • Исправлена ошибка проявляющаяся при обработке списков;
    • Исправлена ошибка возникающая при досрочном закрытии диалога;
  • v0.4.3 2023/07/25
    • Исправлена ошибка анализа недоступных глав;
    • Добавлена обработка тегов SUB и SUP;
  • v0.4.2 2023/07/09
    • Добавлена обработка тега B;
  • v0.4.1 2023/07/09
    • Добавлена кнопка для выбора глав в конце списка
  • v0.4.0 2023/06/29
    • Добавлено определение жанров;
  • v0.3.0 2023/06/24
    • Более чистое название глав
  • v0.2.2 2023/06/24
    • Теперь при получении списка глав учитывается порядок сортировки;
  • v0.2.1 2023/06/23
    • Теперь удаляются ссылки сайта в конце глав (один конкретный вид ссылки);
    • Добавлена проверка на дубликаты в обложках (их грузилось больше, чем надо);
    • Добавлен маркер к элементам списка в теге UL;
    • Пара мелких исправлений в коде;
  • v0.2.0 2023/06/23
    • Добавлена поддержка массива обложек;
    • Добавлена поддержка тега UL;
    • Обновлен загрузчик для обхода проблем с загрузкой некоторых картинок;
    • Улучшен алгоритм нормализации документа;
  • v0.1.1 2023/06/22
    • Исправлена ошибка конвертации перечеркнутого текста;
    • Добавлена обработка таблиц в аннотации: извлечение содержимого без форматирования. Ошибка "Неизвестный HTML блок: TABLE";
    • Исправлена ошибка "Неизвестный HTML блок: DIV";
    • Исправлены мелкие недочеты;
  • v0.1.0 2023/06/20