The script adds a button to the site for downloading books to an FB2 file
< Opiniones de RulateBookExtractor
Спасибо за репорт. Исправлено в версии 1.5.1
В той же работе...Встречаются иногда изображения, которых нет, и которые вообще невидимы если читать с сайта, не просто пустое изображение, а будто там просто следующая строка идет сразу. И которые не скачиваются, а пишется «ошибка».
А в итоговый файл попадает [image XX]. А не [ссылка на картинку].
Почему бы не создать проверку на то, что является ли ссылка на картинку - ссылкой?
И если не является, то может, их не вставлять в итоговый текст вообще?
В общем, если в итоговый текст попадает не [ссылка] а [image XX], то пусть вообще ничего не попадает. Какой смысл вставлять [image xx]?
(Как пример - 49 глава…)
Почему бы не создать проверку на то, что является ли ссылка на картинку - ссылкой? И если не является, то может, их не вставлять в итоговый текст вообще?
Я специально не смотрел корректность всех ссылок, но вроде бы ссылки. В тех что проверял была корректная ссылка но на страницу с изображением вместо изображения с отдаваемым типом html/txt, либо заблоченные хостинги картинок. То есть в реальности тег img там есть. Тем не менее, вы правы, если ссылка изначально кривая, то есть смысл тупо пропускать такие "изображения" без упоминания их наличия. А вот если ссылка корректная, то пользователь может попытаться выгрузить произведение из под какого-нибудь vpn или tor. Я знаю пару хостингов, которые заблочены в России, но вполне себе доступны из других стран. На сайте вы можете вообще не догадываться, что картинка была. А скрипт покажет.
Какой смысл вставлять [image xx]?
Смысл есть. Читатель должен знать, что в оригинальном тексте было изображение, тем более, если в тексте есть на него отсылка. Иначе могут быть непонятки. С другой стороны, я могу сделать такое добавление опциональным. Не думал, что подобные пометки могут мешать. Решил, что это скорее наоборот на пользу - можно указать автору на наличие проблем.
В общем, я понимаю если [https://……….jpg] вместо картинки. Понятно что хоть куда-то ведет, или вело, или туда через тор заходить надо. Это все таки ссылка.
Но вот если между скобками даже ссылки нету, а просто порядковый номер изображения в файле…
И уж, если в самой читалке на сайте - от этого изображения нет и следа…
Просто погляди. По ссылке в первом сообщении фанфик.
В общем, да. Такие изображения, которые автор либо криво вставил, использовав кривую ссылку, либо наоборот, решил удалить изображение, но удалил не до конца…
Сделать чтоб была опция, чтоб такие «изображения» не оставляли следов. В которых даже ссылки нету.
Если же ссылка есть, но не рабочая. То пусть остаётся.
В общем, ИМХО… Две опциональные функции можно сделать…
1) Удаление из итогового файла следов изображений с кривыми ссылками, которые даже на ссылки не похожи (или вообще пустые) - по умолчанию лучше, чтоб было включено удаление. И человек мог их оставить, убрав галочку где надо.
2) А вот удаление ссылок на изображения, которые являются нормальными ссылками, пусть и не рабочими - по умолчанию выключено удаление. И человек мог их удалять, поставив галочку где надо.
Вот тут:
https://tl.rulate.ru/book/51290
«Найден неизвестный элемент: CENTER»