ReadliBookExtractor

The script adds a button to the site for downloading books to an FB2 file

< Feedback on ReadliBookExtractor

Review: Good - script works

§
Posted: 18-06-2024
Edited: 18-06-2024

Благодарю за этот скрипт!

И хотел отметить, что в некоторых книгах появляется неучтённый элемент. Например:
https://readli.net/vazhnoe-yslovie/
Получение страницы 36/93... ok
Найден неизвестный элемент: STRIKETHROUGH

Последнее время во впроцессниках русские буквы с, р, а, о, е заменяются на схожие, но английские. При использовании TTS (текст в голос) это становится невозможно слушать.
Можно ли временно сделать автозамену таких букв внутри тегов <p> </p>? А то приходится через RegEx гонять в текстовом редакторе, что неудобно. (Ну или какую-то галочку для этого?)
Пример книги:
https://readli.net/zakonyi-roda-tom-4/
https://readli.net/skuchnaya-zhizn-odnogo-bon-hva/

Ox90Author
§
Posted: 23-06-2024

И хотел отметить, что в некоторых книгах появляется неучтённый элемент. Например: https://readli.net/vazhnoe-yslovie/ Получение страницы 36/93... ok Найден неизвестный элемент: STRIKETHROUGH

Исправлено в версии 0.7.1

Последнее время во впроцессниках русские буквы с, р, а, о, е заменяются на схожие, но английские. При использовании TTS (текст в голос) это становится невозможно слушать. Можно ли временно сделать автозамену таких букв внутри тегов

? А то приходится через RegEx гонять в текстовом редакторе, что неудобно. (Ну или какую-то галочку для этого?)

Я пока с трудом представляю себе как это можно реализовать так, чтобы не задеть "законную" латиницу, которая может встречаться в текстах, в том числе внутри тега <p>. Я подумаю как это можно решить меньшей кровью.

Благодарю за этот скрипт!

И вам спасибо за отзыв!

§
Posted: 23-06-2024

Я вообще использовал вот такую мозголомную конструкцию: ([ \s\>\"\«])([ёЁА-яaeocpAEOCP]{0,15})p([ёЁА-яaeocp]{0,15}[, \s\.\!\?\:\<\⁈\…\"\»])
Но, в принципе. Можно взять так:
0. Проверить, если произведение не закончено. (Возможно, для полностью выложенных там другая ситуация. Не проверял).
1. Выбрать текст между тегами p /p.
2. В нём - найти слово - (приблизительно, что я делал выше). (И, я в RegEx пропустил дефис, т.е. "-", а то в некоторых тегах он попадался. Потому слова с ним, на подобии всё-таки - пропускались).
3. Смотреть, чтобы оно не было полностью латиницей.
4. Замена лишь нужных букв. Учитывая их строчность.
(А вообще, даже если "законная" латиница пострадает, то ничего страшного. Для читателя внешне оно остаётся неизменным. А при произношении, даже если и станет слышно, то это малая утрата, учитывая, что множество русских слов будет звучать нормально).

Ox90Author
§
Posted: 23-06-2024
Edited: 23-06-2024

Конструкция действительно мозголомная. Попробую иначе, тем более, что в регулярках JS можно указывать границы слова.

Мне вот интересно, кому это надо? Это такая попытка автора книги вычислить источник слива? Надо будет заодно проверить на двойные и неразрывные пробелы.

§
Posted: 23-06-2024

Ну, на самом деле там всё просто )) Между знаками препинания и тегов ищет ру слова длиной меньше 15 симв, в которых есть искомые буквы.
А так, конечно, если есть возможность просто выбрать слово, то оно проще.

По поводу "кому надо". Я так подозреваю, что это сами авторы сайта так делают. Зачем - непонятно. Они впроцессники, из тех, что я читал, тупо сами скачивают с searchfloor, и с отставанием на главу выкладывают. Но, заменяют буквы.

Ox90Author
§
Posted: 25-06-2024

Замена латиницы на аналогичные по начертанию символы кириллицы реализована в версии 0.8.0. Эта функция опциональная и включается чекбоксом в диалоговом окне. Состояние чекбокса запоминается автоматически в локальном хранилище браузера.

Post reply

Sign in to post a reply.