Тестовый FB2-файл для проверки работы конвертеров и eBook-ридеров
Goto page 1, 2, 3, 4, 5, 6, 7, 8, 9, 10  Next
 
View unanswered posts
Post new topic   Reply to topic    The-eBook Forum Index -> Программное обеспечение
 

Нужен ли данный тест?
Нужен
81%
 81%  [ 74 ]
Не нужен
4%
 4%  [ 4 ]
Нужен, но не такой
6%
 6%  [ 6 ]
Не знаю
7%
 7%  [ 7 ]
Total Votes : 91

Author Message

kaznelson
Член клуба The eBook

Член клуба The eBook



Joined: 08 Jun 2007
Posts: 4551


Location: Москва

PostPosted: 29.09.2010 10:53     Quote

Данный файл предназначен для тестирования работы разнообразных конвертеров из FB2 во что угодно.

Также он пригодится для тестирования eBook-ридеров с нативной или благоприобретённой поддержкой FB2.

Цель создания теста - проверка отображения исходного материала в переконвертированной книге (ePub, PDF, mobi и т.п.).
Файл содержит различые стили, стихи, эпиграфы, сноски, таблицы, прозрачные и обычные картинки (в том числе и битые), и т.д., и т.п...

Файл невалидный, но это не является обязательным условием его существования - просто невалидных книг в рунете более чем дофига, и некоторые приёмы достаточно распространены, кочуя из книги в книгу.

Приветствуются любые предложения по проверке встречающихся в FB2-книгах стилей. Интересные и спорные моменты будут добавляться в тестовый файл.

Явные ошибки, излечиваемые FB2Fix, не интересны - только украшательства и оформительства, проходящие конвертеры as is.
_________________

    
    
Постоянная ссылка на _Test.fb2 (485 Кб в архиве)
_________________

    
    
Специализированный тест от Дотошного Рыжика:
    
    
Проверка PNG-картинок с прозрачностью (зеркало, 445 Кб в архиве)


Last edited by kaznelson on 21.02.2015 12:51; edited 26 times in total
 
View user's profile Send private message E-mail ^

kramola
Член клуба The eBook

Член клуба The eBook



Joined: 24 Jun 2008
Posts: 4075



PostPosted: 30.09.2010 03:07     Quote

KAZNELSON

Большущее спасибо! ОЧЕНЬ полезная вешь.
 
View user's profile Send private message ^

GribUser
Fictionbook.Lib, FB2, Divide&Conquer

Fictionbook.Lib, FB2, Divide&Conquer



Joined: 18 Jun 2003
Posts: 7297


Location: Мордор (северный Гандурас)

PostPosted: 30.09.2010 08:59     Quote

kaznelson wrote:
Файл невалидный
Не стоит поощрять разработчиков к созданию наколенного искусственного интеллекта. Форматирование и прозрачность - это прекрасно, но стандартизируя невалидность вы (и те, кто ваше творение будет использовать) добром не кончите, в итоге даже добросовестный пользователь не сможет заранее понять, откроется некий файл или нет в некой программе. Тот самый случай, когда благие намерения приводят совсем не туда, куда вы рассчитываете - пользуйтесь валидным документом. Если вам очень хочется, в рамках валидности тоже можно сделать нечто весьма похабное, с пустыми строками в качестве имени автора и т.п., но в остальном невалидность - это медвежья услуга.
 
View user's profile Send private message E-mail ^

Дотошный Рыжик
Член клуба The eBook

Член клуба The eBook



Joined: 04 Feb 2009
Posts: 2985


Location: Юго-Запад СССР

PostPosted: 30.09.2010 10:23     Quote

GribUser
+1
 
View user's profile Send private message ^

kaznelson
Член клуба The eBook

Член клуба The eBook



Joined: 08 Jun 2007
Posts: 4551


Location: Москва

PostPosted: 02.10.2010 10:58     Quote

Добавил валидные вложенные секции с аннотацией. Они почти одинаковы с уже имевшимися невалидными, так что по сконвертированному можно судить о строгости конвертера.

Roman'ов, к примеру, честно выкинул невалидный текст; конвертер viktorz'а вывел вложения одинаково, зато съел аннотацию в теле книги; конвертер KiR'а вложенные секции вывел также одинаково, но не справился с пустыми секциями в ToC...

Также добавил честные и не очень ударения; гигантскую сноску; стих и цитата теперь оба с авторами.
_________________
Kobo Aura H2O, Kobo Glo HD, Kindle Paperwhite 2
 
View user's profile Send private message E-mail ^

Mike Sinkovsky
Член клуба The eBook

Член клуба The eBook



Joined: 09 Mar 2007
Posts: 1066


Location: Пермь

PostPosted: 02.10.2010 11:46     Quote

Хороший тест.
Можно еще добавить сноски внутри сноски (можно несколько уровней), инлайн картинки, картинки в сносках, комментарии (ссылки внутри файла на body с типом comments - FBE такие создаёт).

Вообще правильное начинание - давно нужен acid тест для читалок и конверторов.
 
View user's profile Send private message ^

kaznelson
Член клуба The eBook

Член клуба The eBook



Joined: 08 Jun 2007
Posts: 4551


Location: Москва

PostPosted: 04.10.2010 19:26     Quote

Обновил тестовый файл, реализовал идеи Mike Sinkovsky. Добавлено:
    Сноска в сноске (1 уровень);
    Картинки в сносках;
    Комментарий (один, в первой главе);
    Таблица в сносках;
    Цитата в сносках;
    Стихотворение в сносках.
Насчёт инлайн картинок не понял. Можно пример?


PS: Файл с двумя подчёркиваниями в имени - без сноски в сноске. Ибо мой любимый конвертер на этом валится. Wink
_________________
Kobo Aura H2O, Kobo Glo HD, Kindle Paperwhite 2
 
View user's profile Send private message E-mail ^

math64
Кандидат в члены клуба The eBook

Кандидат в члены клуба The eBook



Joined: 20 Mar 2010
Posts: 329



PostPosted: 04.10.2010 21:25     Quote

Можно сделать скрипт, генерирующий файл, с включением и выключением проверок
_________________
intaj:iRiver Story,Digma s602,Onyx 60,M92;antaj:M92M,i62ML Aurora,T76ML Cleopatra,i86ML Moby Dick


Last edited by math64 on 06.10.2010 18:32; edited 2 times in total
 
View user's profile Send private message ^

Mike Sinkovsky
Член клуба The eBook

Член клуба The eBook



Joined: 09 Mar 2007
Posts: 1066


Location: Пермь

PostPosted: 05.10.2010 07:50     Quote

kaznelson wrote:
Насчёт инлайн картинок не понял. Можно пример?

Это обычно небольшая картинка прямо в тексте, типа иероглифа или кнопки какой.

[http://www.fictionbook.org/index.php/Элемент_image]
Quote:
Элемент <image>
Картинка, иллюстрация в тексте.
Определены два типа картинок: обычные (imageType) и внутри текста (inlineImageType)

Атрибуты:
xlink:type (опциональный)
xlink:href - ссылка на собственно графические данные, обычно содержащиеся в элементе <binary>;
alt (опциональный);
title (опциональный, для inline недопустимый) - подпись к картинке;
id (опциональный, для inline недопустимый) - для ссылок на картинку.

Подчинен:
Может содержаться в следующих элементах:
Для обычных:
<body>
<section>.

Для inline:
<coverpage>
<p>
<v>
<subtitle>

<th> (с версии 2.1)
<td> (с версии 2.1)
<text-author> (с версии 2.1).
 
View user's profile Send private message ^

kaznelson
Член клуба The eBook

Член клуба The eBook



Joined: 08 Jun 2007
Posts: 4551


Location: Москва

PostPosted: 05.10.2010 08:41     Quote

Mike Sinkovsky
Э, нет, я просил пример. Wink
Описание элементов есть, и даже в виде локального chm. Интересны именно особенности реализации, если есть отличия от стандартного варианта - {image l:href="#img.ext"/} в тексте и тело картинки в бинарниках.

PS: Впрочем, не надо. По общему принципу картинка в теле книги считается inline, если она заключена в тэг {p}. Сделал и выложил.
_________________
Kobo Aura H2O, Kobo Glo HD, Kindle Paperwhite 2
 
View user's profile Send private message E-mail ^

Mike Sinkovsky
Член клуба The eBook

Член клуба The eBook



Joined: 09 Mar 2007
Posts: 1066


Location: Пермь

PostPosted: 06.10.2010 02:49     Quote

kaznelson wrote:
я просил пример. Wink

Да нет у меня сейчас под рукой таких файлов, и возможности искать тоже нет. Но они точно в природе встречаются, хотя конечно нечасто.

kaznelson wrote:
заключена в тэг {p}

Не только {р}, но и {v}, {subtitle}.
Например вместо классического:
Code:
<subtitle>* * *</subtitle>
видел:
Code:
<subtitle><image l:href="#div.png" /></subtitle>
 
View user's profile Send private message ^

kaznelson
Член клуба The eBook

Член клуба The eBook



Joined: 08 Jun 2007
Posts: 4551


Location: Москва

PostPosted: 06.10.2010 17:41     Quote

Mike Sinkovsky
Сделал и в {subtitle}...
_________________
Kobo Aura H2O, Kobo Glo HD, Kindle Paperwhite 2
 
View user's profile Send private message E-mail ^

Roman
Developer

Developer



Joined: 19 May 2007
Posts: 4322


Location: Деревня Израиловка

PostPosted: 06.10.2010 18:45     Quote

Забавно, теперь еще вставьте картинки с большими и маленькими буквами в именах файлов (даже можно две разные картинки с одинаковым именем файла где единственное различие в именах регистер одной буквы), PNG с прозрачностью (как 32, так главное 8 бит) , затем к имеджам можно еще задавать атрибюты alt и главное title , которые никто (по моему) сейчас не показывает, внутри таблиц можно использовать болд и италик (лучше всего даще вложеные один в другой, типа болд посреди текста который италик) и даже вставлять в таблицы инлайн картинки, можно добавить CSS стили, в poem можно добавить еще title, epigraph, subtitle (последних двух несколько - смотри XSD для poemType) а так же date в конце ... короче много чего...

А вообще идея очень "светлая" и не только для конвертеров а и для ридеров.

Единственное в чем не уверен это насчет невалидных, тут я согласен с Грибовым.

Posted after 8 minutes 55 seconds:

kaznelson wrote:
Сделал и в {subtitle}...

Кстати, внутри title, точнее внутри парагрофов p внутри него тоже попадаются не только стили но и линки и инлайн имеджи.
_________________
FB2EPUB Converter


Last edited by Roman on 06.10.2010 19:20; edited 1 time in total
 
View user's profile Send private message ^

kaznelson
Член клуба The eBook

Член клуба The eBook



Joined: 08 Jun 2007
Posts: 4551


Location: Москва

PostPosted: 06.10.2010 18:59     Quote

Roman
Одна картинка с прозрачностью уже есть, если подкинете ещё в желаемом формате - вставлю, отчего ж нет. Только небольшие.
Насчёт остального тоже погляжу.

Валидность не обсуждается по той простой причине, что на данном этапе решается только один вопрос - а можно ли из дурно сделанного шлака получить приятно читаемую книгу?
_________________
Kobo Aura H2O, Kobo Glo HD, Kindle Paperwhite 2
 
View user's profile Send private message E-mail ^

Roman
Developer

Developer



Joined: 19 May 2007
Posts: 4322


Location: Деревня Израиловка

PostPosted: 06.10.2010 19:05     Quote

kaznelson wrote:
Одна картинка с прозрачностью уже есть, если подкинете ещё в желаемом формате - вставлю, отчего ж нет.

http://drop.io/yrm3b9y/asset/alphapng-zip
Одна и та же картинка с прозрачностью в 2-х версиях : 8 и 32 бит.

kaznelson wrote:
Валидность не обсуждается по той простой причине, что на данном этапе решается только один вопрос - а можно ли из дурно сделанного шлака получить приятно читаемую книгу?

Я бы вообще тогда "разделил работу" один файл валидный, а другой - его версия со всякими "каками".
_________________
FB2EPUB Converter
 
View user's profile Send private message ^

GribUser
Fictionbook.Lib, FB2, Divide&Conquer

Fictionbook.Lib, FB2, Divide&Conquer



Joined: 18 Jun 2003
Posts: 7297


Location: Мордор (северный Гандурас)

PostPosted: 06.10.2010 19:18     Quote

kaznelson wrote:
на данном этапе решается только один вопрос - а можно ли из дурно сделанного шлака получить приятно читаемую книгу
Строго говоря, fb2 и используется чтобы отделить шлак (html, rtf, etc) от жестко структурированного предсказуемого XML. Так нет же, вместо того, чтобы заимплементить то, что формат поддерживает (прозрачность, стили, сноски в сносках, etc) люди тратят годы на создание алгоритмов, угадывающих формы человеческого дебилизма по косвенным признакам... И охота же кому-то энтропию повышать? Просто в очередь народ строится, чтобы fb2 в html превратить, разработать под него NN1.6 и всласть нагуляться по граблям, по которым разработчики оттоптались на заре глобализации сетей...

Last edited by GribUser on 06.10.2010 19:27; edited 1 time in total
 
View user's profile Send private message E-mail ^

Дмитрий Шкарин
Член клуба The eBook

Член клуба The eBook



Joined: 31 Jul 2009
Posts: 1925



PostPosted: 06.10.2010 19:26     Quote

Можно еще добавить:
1. Разные хитровыгнутые символы, типа старорусских, старославянских, украинских и т.д.
2. title в <image>
3. align в <td>
4. Несколько <body></body>
 
View user's profile Send private message ^

Roman
Developer

Developer



Joined: 19 May 2007
Posts: 4322


Location: Деревня Израиловка

PostPosted: 06.10.2010 19:31     Quote

Дмитрий Шкарин wrote:
1. Разные хитровыгнутые символы, типа старорусских, старославянских, украинских и т.д.

Можно, но при этом будет проверятся не конвертер, а поддержка фонтов вашим ридером.

Дмитрий Шкарин wrote:
2. title в <image>

Уже писал выше.
_________________
FB2EPUB Converter
 
View user's profile Send private message ^

GribUser
Fictionbook.Lib, FB2, Divide&Conquer

Fictionbook.Lib, FB2, Divide&Conquer



Joined: 18 Jun 2003
Posts: 7297


Location: Мордор (северный Гандурас)

PostPosted: 06.10.2010 19:33     Quote

Дмитрий Шкарин wrote:
типа старорусских, старославянских, украинских и т.д.
И символы "умляута", ага, есть такие в юникоде - "умляут на предыдущий символ", вроде был и "умляут на следующий".

Posted after 1 minute 42 seconds:

Roman wrote:
Можно, но при этом будет проверятся не конвертер, а поддержка фонтов вашим ридером.
Весьма, кстати, полезно. Я надысь игрался с киндлом - методом тыка выискивал, что он показывает, а что не показывает. Составил даже списочек символов кратенький в процессе:
Code:
<p>[—] – Длинное тире</p>
<p>[–] – короткое тире</p>
<p>[-] – минус</p>
<p>[ ] – неразрывный пробел</p>
<p>[©] – (c)</p>
<p>[®] – (r)</p>
<p>[²] – ^2</p>
<p>[³] – ^3</p>
<p>[¼] – 1/4</p>
<p>[½] – 1/2</p>
<p>[¾] – </p>
<p>[–] – EN DASH</p>
<p>[—] – EM DASH</p>
<p>[―] – HORISONTAL BAR</p>
<p>[‘] – одиночная левая</p>
<p>[’] – одиночная правая</p>
<p>[‚] – одиночная левая верх/низ</p>
<p>[‛] – одиночная правая верх/низ</p>
<p>[“] – двойная левая</p>
<p>[”] – двойная правая</p>
<p>[„] – двойная нижняя</p>
<p>[•] – булет</p>
<p>[∑] – сумма</p>
<p>[≤] – меньше-равно</p>
<p>[≥] – больше-равно</p>
<p>[≠] – не равно</p>
<p>[≈] – приблизительно равно</p>
<p>●/►/◦/•/○</p>
 
View user's profile Send private message E-mail ^

Дмитрий Шкарин
Член клуба The eBook

Член клуба The eBook



Joined: 31 Jul 2009
Posts: 1925



PostPosted: 06.10.2010 19:55     Quote

GribUser wrote:
И символы "умляута", ага, есть такие в юникоде - "умляут на предыдущий символ", вроде был и "умляут на следующий".

Знак ударения, как я понял, уже есть.

Posted after 5 minutes 27 seconds:

Roman wrote:
Можно, но при этом будет проверятся не конвертер, а поддержка фонтов вашим ридером.

AlReader даже на PC ударения криво показывает, вместо ѣ показывает что-то неясное. CoolReader ударения показывает нормально, вместо ѣ показывает '?', align в таблице не понимает, да еще и заголовки глотает.
 
View user's profile Send private message ^
Display posts from previous:   
Post new topic   Reply to topic    The-eBook Forum Index -> Программное обеспечение All times are GMT + 4 Hours
Goto page 1, 2, 3, 4, 5, 6, 7, 8, 9, 10  Next
Page 1 of 10

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum

© The-eBook, 1999-2014. © Design by Prohorenkov
Syndicating News | Powered by phpBB © 2001, 2005 phpBB Group.
Хостинг предоставлен компанией DatForce     Яндекс.Метрика