Тестовый FB2-файл для проверки работы конвертеров и eBook-ридеров
На страницу 1, 2, 3, 4, 5, 6, 7, 8, 9, 10  След.
 
Найти сообщения без ответов
Начать новую тему   Ответить на тему    Список форумов The-eBook -> Программное обеспечение
 

Нужен ли данный тест?
Нужен
81%
 81%  [ 75 ]
Не нужен
4%
 4%  [ 4 ]
Нужен, но не такой
6%
 6%  [ 6 ]
Не знаю
7%
 7%  [ 7 ]
Всего проголосовало : 92

Автор Сообщение

kaznelson
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 08.06.2007
Сообщения: 4589


Откуда: Москва

СообщениеДобавлено: 29.09.2010 10:53     Цитата

Данный файл предназначен для тестирования работы разнообразных конвертеров из FB2 во что угодно.

Также он пригодится для тестирования eBook-ридеров с нативной или благоприобретённой поддержкой FB2.

Цель создания теста - проверка отображения исходного материала в переконвертированной книге (ePub, PDF, mobi и т.п.).
Файл содержит различые стили, стихи, эпиграфы, сноски, таблицы, прозрачные и обычные картинки (в том числе и битые), и т.д., и т.п...

Файл невалидный, но это не является обязательным условием его существования - просто невалидных книг в рунете более чем дофига, и некоторые приёмы достаточно распространены, кочуя из книги в книгу.

Приветствуются любые предложения по проверке встречающихся в FB2-книгах стилей. Интересные и спорные моменты будут добавляться в тестовый файл.

Явные ошибки, излечиваемые FB2Fix, не интересны - только украшательства и оформительства, проходящие конвертеры as is.
_________________

    
    
Постоянная ссылка на _Test.fb2 (485 Кб в архиве)
_________________

    
    
Специализированный тест от Дотошного Рыжика:
    
    
Проверка PNG-картинок с прозрачностью (зеркало, 445 Кб в архиве)


Последний раз редактировалось: kaznelson (21.02.2015 12:51), всего редактировалось 26 раз(а)
 
Профиль Сообщение E-mail ^

kramola
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 24.06.2008
Сообщения: 4075



СообщениеДобавлено: 30.09.2010 03:07     Цитата

KAZNELSON

Большущее спасибо! ОЧЕНЬ полезная вешь.
 
Профиль Сообщение ^

GribUser
Fictionbook.Lib, FB2, Divide&Conquer

Fictionbook.Lib, FB2, Divide&Conquer



Зарегистрирован: 18.06.2003
Сообщения: 7297


Откуда: Мордор (северный Гандурас)

СообщениеДобавлено: 30.09.2010 08:59     Цитата

kaznelson писал(а):
Файл невалидный
Не стоит поощрять разработчиков к созданию наколенного искусственного интеллекта. Форматирование и прозрачность - это прекрасно, но стандартизируя невалидность вы (и те, кто ваше творение будет использовать) добром не кончите, в итоге даже добросовестный пользователь не сможет заранее понять, откроется некий файл или нет в некой программе. Тот самый случай, когда благие намерения приводят совсем не туда, куда вы рассчитываете - пользуйтесь валидным документом. Если вам очень хочется, в рамках валидности тоже можно сделать нечто весьма похабное, с пустыми строками в качестве имени автора и т.п., но в остальном невалидность - это медвежья услуга.
 
Профиль Сообщение E-mail ^

Дотошный Рыжик
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 04.02.2009
Сообщения: 2985


Откуда: Юго-Запад СССР

СообщениеДобавлено: 30.09.2010 10:23     Цитата

GribUser
+1
 
Профиль Сообщение ^

kaznelson
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 08.06.2007
Сообщения: 4589


Откуда: Москва

СообщениеДобавлено: 02.10.2010 10:58     Цитата

Добавил валидные вложенные секции с аннотацией. Они почти одинаковы с уже имевшимися невалидными, так что по сконвертированному можно судить о строгости конвертера.

Roman'ов, к примеру, честно выкинул невалидный текст; конвертер viktorz'а вывел вложения одинаково, зато съел аннотацию в теле книги; конвертер KiR'а вложенные секции вывел также одинаково, но не справился с пустыми секциями в ToC...

Также добавил честные и не очень ударения; гигантскую сноску; стих и цитата теперь оба с авторами.
_________________
Kobo Aura H2O, Kobo Glo HD, Kindle Paperwhite 2
 
Профиль Сообщение E-mail ^

Mike Sinkovsky
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 09.03.2007
Сообщения: 1066


Откуда: Пермь

СообщениеДобавлено: 02.10.2010 11:46     Цитата

Хороший тест.
Можно еще добавить сноски внутри сноски (можно несколько уровней), инлайн картинки, картинки в сносках, комментарии (ссылки внутри файла на body с типом comments - FBE такие создаёт).

Вообще правильное начинание - давно нужен acid тест для читалок и конверторов.
 
Профиль Сообщение ^

kaznelson
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 08.06.2007
Сообщения: 4589


Откуда: Москва

СообщениеДобавлено: 04.10.2010 19:26     Цитата

Обновил тестовый файл, реализовал идеи Mike Sinkovsky. Добавлено:
    Сноска в сноске (1 уровень);
    Картинки в сносках;
    Комментарий (один, в первой главе);
    Таблица в сносках;
    Цитата в сносках;
    Стихотворение в сносках.
Насчёт инлайн картинок не понял. Можно пример?


PS: Файл с двумя подчёркиваниями в имени - без сноски в сноске. Ибо мой любимый конвертер на этом валится. Wink
_________________
Kobo Aura H2O, Kobo Glo HD, Kindle Paperwhite 2
 
Профиль Сообщение E-mail ^

math64
Кандидат в члены клуба The eBook

Кандидат в члены клуба The eBook



Зарегистрирован: 20.03.2010
Сообщения: 329



СообщениеДобавлено: 04.10.2010 21:25     Цитата

Можно сделать скрипт, генерирующий файл, с включением и выключением проверок
_________________
intaj:iRiver Story,Digma s602,Onyx 60,M92;antaj:M92M,i62ML Aurora,T76ML Cleopatra,i86ML Moby Dick


Последний раз редактировалось: math64 (06.10.2010 18:32), всего редактировалось 2 раз(а)
 
Профиль Сообщение ^

Mike Sinkovsky
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 09.03.2007
Сообщения: 1066


Откуда: Пермь

СообщениеДобавлено: 05.10.2010 07:50     Цитата

kaznelson писал(а):
Насчёт инлайн картинок не понял. Можно пример?

Это обычно небольшая картинка прямо в тексте, типа иероглифа или кнопки какой.

[http://www.fictionbook.org/index.php/Элемент_image]
Цитата:
Элемент <image>
Картинка, иллюстрация в тексте.
Определены два типа картинок: обычные (imageType) и внутри текста (inlineImageType)

Атрибуты:
xlink:type (опциональный)
xlink:href - ссылка на собственно графические данные, обычно содержащиеся в элементе <binary>;
alt (опциональный);
title (опциональный, для inline недопустимый) - подпись к картинке;
id (опциональный, для inline недопустимый) - для ссылок на картинку.

Подчинен:
Может содержаться в следующих элементах:
Для обычных:
<body>
<section>.

Для inline:
<coverpage>
<p>
<v>
<subtitle>

<th> (с версии 2.1)
<td> (с версии 2.1)
<text-author> (с версии 2.1).
 
Профиль Сообщение ^

kaznelson
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 08.06.2007
Сообщения: 4589


Откуда: Москва

СообщениеДобавлено: 05.10.2010 08:41     Цитата

Mike Sinkovsky
Э, нет, я просил пример. Wink
Описание элементов есть, и даже в виде локального chm. Интересны именно особенности реализации, если есть отличия от стандартного варианта - {image l:href="#img.ext"/} в тексте и тело картинки в бинарниках.

PS: Впрочем, не надо. По общему принципу картинка в теле книги считается inline, если она заключена в тэг {p}. Сделал и выложил.
_________________
Kobo Aura H2O, Kobo Glo HD, Kindle Paperwhite 2
 
Профиль Сообщение E-mail ^

Mike Sinkovsky
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 09.03.2007
Сообщения: 1066


Откуда: Пермь

СообщениеДобавлено: 06.10.2010 02:49     Цитата

kaznelson писал(а):
я просил пример. Wink

Да нет у меня сейчас под рукой таких файлов, и возможности искать тоже нет. Но они точно в природе встречаются, хотя конечно нечасто.

kaznelson писал(а):
заключена в тэг {p}

Не только {р}, но и {v}, {subtitle}.
Например вместо классического:
Код:
<subtitle>* * *</subtitle>
видел:
Код:
<subtitle><image l:href="#div.png" /></subtitle>
 
Профиль Сообщение ^

kaznelson
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 08.06.2007
Сообщения: 4589


Откуда: Москва

СообщениеДобавлено: 06.10.2010 17:41     Цитата

Mike Sinkovsky
Сделал и в {subtitle}...
_________________
Kobo Aura H2O, Kobo Glo HD, Kindle Paperwhite 2
 
Профиль Сообщение E-mail ^

Roman
Developer

Developer



Зарегистрирован: 19.05.2007
Сообщения: 4350


Откуда: Деревня Израиловка

СообщениеДобавлено: 06.10.2010 18:45     Цитата

Забавно, теперь еще вставьте картинки с большими и маленькими буквами в именах файлов (даже можно две разные картинки с одинаковым именем файла где единственное различие в именах регистер одной буквы), PNG с прозрачностью (как 32, так главное 8 бит) , затем к имеджам можно еще задавать атрибюты alt и главное title , которые никто (по моему) сейчас не показывает, внутри таблиц можно использовать болд и италик (лучше всего даще вложеные один в другой, типа болд посреди текста который италик) и даже вставлять в таблицы инлайн картинки, можно добавить CSS стили, в poem можно добавить еще title, epigraph, subtitle (последних двух несколько - смотри XSD для poemType) а так же date в конце ... короче много чего...

А вообще идея очень "светлая" и не только для конвертеров а и для ридеров.

Единственное в чем не уверен это насчет невалидных, тут я согласен с Грибовым.

Posted after 8 minutes 55 seconds:

kaznelson писал(а):
Сделал и в {subtitle}...

Кстати, внутри title, точнее внутри парагрофов p внутри него тоже попадаются не только стили но и линки и инлайн имеджи.
_________________
FB2EPUB Converter


Последний раз редактировалось: Roman (06.10.2010 19:20), всего редактировалось 1 раз
 
Профиль Сообщение ^

kaznelson
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 08.06.2007
Сообщения: 4589


Откуда: Москва

СообщениеДобавлено: 06.10.2010 18:59     Цитата

Roman
Одна картинка с прозрачностью уже есть, если подкинете ещё в желаемом формате - вставлю, отчего ж нет. Только небольшие.
Насчёт остального тоже погляжу.

Валидность не обсуждается по той простой причине, что на данном этапе решается только один вопрос - а можно ли из дурно сделанного шлака получить приятно читаемую книгу?
_________________
Kobo Aura H2O, Kobo Glo HD, Kindle Paperwhite 2
 
Профиль Сообщение E-mail ^

Roman
Developer

Developer



Зарегистрирован: 19.05.2007
Сообщения: 4350


Откуда: Деревня Израиловка

СообщениеДобавлено: 06.10.2010 19:05     Цитата

kaznelson писал(а):
Одна картинка с прозрачностью уже есть, если подкинете ещё в желаемом формате - вставлю, отчего ж нет.

http://drop.io/yrm3b9y/asset/alphapng-zip
Одна и та же картинка с прозрачностью в 2-х версиях : 8 и 32 бит.

kaznelson писал(а):
Валидность не обсуждается по той простой причине, что на данном этапе решается только один вопрос - а можно ли из дурно сделанного шлака получить приятно читаемую книгу?

Я бы вообще тогда "разделил работу" один файл валидный, а другой - его версия со всякими "каками".
_________________
FB2EPUB Converter
 
Профиль Сообщение ^

GribUser
Fictionbook.Lib, FB2, Divide&Conquer

Fictionbook.Lib, FB2, Divide&Conquer



Зарегистрирован: 18.06.2003
Сообщения: 7297


Откуда: Мордор (северный Гандурас)

СообщениеДобавлено: 06.10.2010 19:18     Цитата

kaznelson писал(а):
на данном этапе решается только один вопрос - а можно ли из дурно сделанного шлака получить приятно читаемую книгу
Строго говоря, fb2 и используется чтобы отделить шлак (html, rtf, etc) от жестко структурированного предсказуемого XML. Так нет же, вместо того, чтобы заимплементить то, что формат поддерживает (прозрачность, стили, сноски в сносках, etc) люди тратят годы на создание алгоритмов, угадывающих формы человеческого дебилизма по косвенным признакам... И охота же кому-то энтропию повышать? Просто в очередь народ строится, чтобы fb2 в html превратить, разработать под него NN1.6 и всласть нагуляться по граблям, по которым разработчики оттоптались на заре глобализации сетей...

Последний раз редактировалось: GribUser (06.10.2010 19:27), всего редактировалось 1 раз
 
Профиль Сообщение E-mail ^

Дмитрий Шкарин
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 31.07.2009
Сообщения: 1925



СообщениеДобавлено: 06.10.2010 19:26     Цитата

Можно еще добавить:
1. Разные хитровыгнутые символы, типа старорусских, старославянских, украинских и т.д.
2. title в <image>
3. align в <td>
4. Несколько <body></body>
 
Профиль Сообщение ^

Roman
Developer

Developer



Зарегистрирован: 19.05.2007
Сообщения: 4350


Откуда: Деревня Израиловка

СообщениеДобавлено: 06.10.2010 19:31     Цитата

Дмитрий Шкарин писал(а):
1. Разные хитровыгнутые символы, типа старорусских, старославянских, украинских и т.д.

Можно, но при этом будет проверятся не конвертер, а поддержка фонтов вашим ридером.

Дмитрий Шкарин писал(а):
2. title в <image>

Уже писал выше.
_________________
FB2EPUB Converter
 
Профиль Сообщение ^

GribUser
Fictionbook.Lib, FB2, Divide&Conquer

Fictionbook.Lib, FB2, Divide&Conquer



Зарегистрирован: 18.06.2003
Сообщения: 7297


Откуда: Мордор (северный Гандурас)

СообщениеДобавлено: 06.10.2010 19:33     Цитата

Дмитрий Шкарин писал(а):
типа старорусских, старославянских, украинских и т.д.
И символы "умляута", ага, есть такие в юникоде - "умляут на предыдущий символ", вроде был и "умляут на следующий".

Posted after 1 minute 42 seconds:

Roman писал(а):
Можно, но при этом будет проверятся не конвертер, а поддержка фонтов вашим ридером.
Весьма, кстати, полезно. Я надысь игрался с киндлом - методом тыка выискивал, что он показывает, а что не показывает. Составил даже списочек символов кратенький в процессе:
Код:
<p>[—] – Длинное тире</p>
<p>[–] – короткое тире</p>
<p>[-] – минус</p>
<p>[ ] – неразрывный пробел</p>
<p>[©] – (c)</p>
<p>[®] – (r)</p>
<p>[²] – ^2</p>
<p>[³] – ^3</p>
<p>[¼] – 1/4</p>
<p>[½] – 1/2</p>
<p>[¾] – </p>
<p>[–] – EN DASH</p>
<p>[—] – EM DASH</p>
<p>[―] – HORISONTAL BAR</p>
<p>[‘] – одиночная левая</p>
<p>[’] – одиночная правая</p>
<p>[‚] – одиночная левая верх/низ</p>
<p>[‛] – одиночная правая верх/низ</p>
<p>[“] – двойная левая</p>
<p>[”] – двойная правая</p>
<p>[„] – двойная нижняя</p>
<p>[•] – булет</p>
<p>[∑] – сумма</p>
<p>[≤] – меньше-равно</p>
<p>[≥] – больше-равно</p>
<p>[≠] – не равно</p>
<p>[≈] – приблизительно равно</p>
<p>●/►/◦/•/○</p>
 
Профиль Сообщение E-mail ^

Дмитрий Шкарин
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 31.07.2009
Сообщения: 1925



СообщениеДобавлено: 06.10.2010 19:55     Цитата

GribUser писал(а):
И символы "умляута", ага, есть такие в юникоде - "умляут на предыдущий символ", вроде был и "умляут на следующий".

Знак ударения, как я понял, уже есть.

Posted after 5 minutes 27 seconds:

Roman писал(а):
Можно, но при этом будет проверятся не конвертер, а поддержка фонтов вашим ридером.

AlReader даже на PC ударения криво показывает, вместо ѣ показывает что-то неясное. CoolReader ударения показывает нормально, вместо ѣ показывает '?', align в таблице не понимает, да еще и заголовки глотает.
 
Профиль Сообщение ^
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов The-eBook -> Программное обеспечение Часовой пояс: GMT + 4
На страницу 1, 2, 3, 4, 5, 6, 7, 8, 9, 10  След.
Страница 1 из 10

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах

© The-eBook, 1999-2014. © Design by Prohorenkov
Syndicating News | Powered by phpBB © 2001, 2005 phpBB Group.
Хостинг предоставлен компанией DatForce     Яндекс.Метрика