Переносы для РЕБ 1100. Все плохо?
Goto page Previous  1, 2
 
View unanswered posts
Post new topic   Reply to topic    The-eBook Forum Index -> Book Designer
 
Author Message

Sergei L.
Активный участник форума

Активный участник форума



Joined: 18 Jun 2003
Posts: 209


Location: Израиль

PostPosted: 26.11.2004 20:03     Quote

Antikwar wrote:
Я тоже так делал, но в крупном шрифте (а он слишком крупный) дыры присутсвуют. А мелкий шрифт слишком уж мелкий. Попытки же поковырятся со шрифтами пока не дали положительного результата.

А чего с ними ковыряться? Smile Меня вполне устраивает Verdana. Идем сюда:http://www.the-ebook.org/e107/content.php?article.19,
скачиваем Verdana v.2, делаем все как написано, выбираем подходящий размер и все. Италика, болд, все работает.
 
View user's profile Send private message ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



PostPosted: 26.11.2004 22:49     Quote

Antikwar wrote:
Попробовал расставлять жесткие переносы для РЕБ, но они оказываются в самых неожиданных местах. То есть они конечно всегда в конце строки (шрифты я БД дал посмотреть) и страничка выглядит красиво, но вот только неправильно они расставлены и такие вещи как например "рак-ета" "холод-ильник" и "м-ама" не редкость. Читать такое очень трудно - всегда напрягаешься, пытаясь понять смысл слова. В результате читается все очень медленно. А без переносов РЕБ делает выключку по ширине страницы и в результате появляются большие дыры между словами. Левую выключку РЕБ не делает. Причем на французском языке такой проблемы нет, т.к. слова короткие, а вот на русском...
Вобщем не знаю что делать. Есть ли какая-нибудь возможноть расставлять грамотно переносы? Или же каки-либо другие варианты для комфортного чтения на РЕБ кроме самого мелкого шрифта?

"рак-ета" "холод-ильник" и "м-ама" - это реальные слова или просто примеры? Дело в том, что ляпсусы в переносах типа "м-ама" в BD вообще не допускаются: перенос после первой буквы запрещен наглухо. И ляпсусы типа "рак-ета" или "холод-ильник" тоже не допускаются. Если реальные, то возможны два варианта:
1. Что что-то не в порядке со шрифтом: либо из девайса извлечен не тот шрифт, либо не тот шрифт назначен для переносов.
2. Исходный файл был с неправильными переносами.
 
View user's profile Send private message ^

Antikwar
Кандидат в члены клуба The eBook

Кандидат в члены клуба The eBook



Joined: 21 Oct 2004
Posts: 345


Location: Москва

PostPosted: 27.11.2004 00:00     Quote

vvv wrote:
"рак-ета" "холод-ильник" и "м-ама" - это реальные слова или просто примеры? Дело в том, что ляпсусы в переносах типа "м-ама" в BD вообще не допускаются: перенос после первой буквы запрещен наглухо. И ляпсусы типа "рак-ета" или "холод-ильник" тоже не допускаются.

Просто примеры. Но было множество переносов так же резавших слух (вернее глаз). То есть действительно очень неграмотных.

vvv wrote:
1. Что что-то не в порядке со шрифтом: либо из девайса извлечен не тот шрифт, либо не тот шрифт назначен для переносов.
2. Исходный файл был с неправильными переносами.

Со шрифтами похоже все в порядке. По крайней мере переносы в середине строки не встречаются. А вот насчет исходного файла... Тут не знаю. Просто не помню какой файл. А! Вспомнил! Это был "Дэнс, дэнс, дэнс" Х. Мураками, взятый с Фикшнбук в формате "фб2.зип" и сделанный, как мне показалось очень грамотно. По крайней мере я наслаждался отсутсвием опечаток и хорошо работающими грамотными ссылками в тексте (сноски). Помню еще, что БД очень так лихо все сам разметил, даже руками править ничего не пришлось. Прямо удовольствие получил от процесса конвертации и залития в REB. Но вот что у него было с переносами...
 
View user's profile Send private message ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



PostPosted: 27.11.2004 01:28     Quote

Antikwar wrote:
vvv wrote:
"рак-ета" "холод-ильник" и "м-ама" - это реальные слова или просто примеры? Дело в том, что ляпсусы в переносах типа "м-ама" в BD вообще не допускаются: перенос после первой буквы запрещен наглухо. И ляпсусы типа "рак-ета" или "холод-ильник" тоже не допускаются.

Просто примеры. Но было множество переносов так же резавших слух (вернее глаз). То есть действительно очень неграмотных.

vvv wrote:
1. Что что-то не в порядке со шрифтом: либо из девайса извлечен не тот шрифт, либо не тот шрифт назначен для переносов.
2. Исходный файл был с неправильными переносами.

Со шрифтами похоже все в порядке. По крайней мере переносы в середине строки не встречаются. А вот насчет исходного файла... Тут не знаю. Просто не помню какой файл. А! Вспомнил! Это был "Дэнс, дэнс, дэнс" Х. Мураками, взятый с Фикшнбук в формате "фб2.зип" и сделанный, как мне показалось очень грамотно. По крайней мере я наслаждался отсутсвием опечаток и хорошо работающими грамотными ссылками в тексте (сноски). Помню еще, что БД очень так лихо все сам разметил, даже руками править ничего не пришлось. Прямо удовольствие получил от процесса конвертации и залития в REB. Но вот что у него было с переносами...

Давайте попробуем разобраться. Если еще раз такие "мамы" попадутся, пришлите мне исходный файл, html0-файл и rb-файл. И посторайтесь заметить положения "мам". А я посмотрю, откуда ноги растут.
Я уже как-то говорил, что полная алгоритмизация русских формальных переносов возможна только через соответствующий словарь. Но этот метод в BD не используется по причине громоздкости и медленности. Вместо этого используется алгоритм упрощенных переносов. Он позволяет исключить явные ляпы типа "рак-ета" или "м-ама", но полного соответствия формальной системе не обеспечивает
(например, в двухсложных словах). По статистике, которую я как-то собирал, процент ошибок алгоритма BD-шных переносов - 3-5%. Можно довести до 1-2%, но скорость обработки упадет в несколько раз: исключения обрабатываются долго...
 
View user's profile Send private message ^

Timo
Искушенный участник форума

Искушенный участник форума



Joined: 18 Jun 2003
Posts: 49


Location: Минск, Республика Беларусь

PostPosted: 27.11.2004 03:07     Quote

Shaman wrote:

А можно поподробнее об алгоритме?

Нет Very Happy.
Давно это было, не помню уже. Скачайте исходники ClearTXT на gribuser.ru. Да и про гугл не надо забывать.
http://www.dore.ru/perl/nntp.pl?f=1&gid=17&mid=61804
http://www.dore.ru/perl/nntp.pl?f=1&gid=17&mid=61882
 
View user's profile Send private message ICQ ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



PostPosted: 27.11.2004 03:18     Quote

Shaman wrote:
Timo wrote:
Antikwar wrote:

PS Эх, не существует видимо пока еще нормальных устройств для чтения. У наладонников экран маленький и работают от батарей мало. Думал, что купив REB заживу просто по-царски, ан нет - экран большой, живет долго, зато текст на нем форматирован ужасно. Знал бы заранее, не стал бы наверное покупать. А так сменил шило на мыло. Sad А всего-то хотелось - книжку почитать.


Хм... вот у меня reb1100. Шрифт - Verdana (кажется 10-го размера). все параграфы я форматирую как "justify". Заголовки - "center". И меня всё устраивает. Всё красиво (ну, почти всё Smile).

P.S. reb1100 поддерживает "мягкие" переносы. если вы готовы мирится с глюками (когда перенос на следующую страницу - остаток слова не показывается). А для расстановки переносов есть алгоритмический способ. И он неплохо работает. Я даже делал консольную утилитку для расстановки переносов в файлах формата fb2. Так вот - результат меня вполне устроил - получаются именно те "полуграмотные" переносы, которые вам нужны.
P.P.S.: алгоритм я выдрал из программы ClearTXT. Гранмерси GribUser'у.


А можно поподробнее об алгоритме?

Я как-то смотрел алгоритм переносов в ClearTXT, это известный алгоритм под названием "очень упрощенные переносы". Состоит из десятка строк и основан на анализе комбинаций "гласная-согласная-непонятно что". Главный недостаток - даже абсолютные исключения вообще не отрабатываются (например, может перенести две согласные буквы). Но используется во многих читалках из-за простоты и скорости. По моим оценкам, отклонение от формальных переносов - 10-15%.
В BD тоже используется алгоритм "гласная-согласная-непонятно что", но за счет отработки нескольких десятков исключений процент ошибок существенно ниже. Но быстродействие раза в два хуже. Ну и соответственно код - около сотни строк. Поэтому я его обзываю "не совсем упрощенные переносы" Very Happy

P.S. Но вышеупомянутые алгоритмы - просто шедевр по сравнению с тем, что я видел в какой-то телефонной читалке: там переносы делаются в любом месте слова. Зато текст - ну очень плотный. И народу нравится: говорят, что пару дней чтения - и уже глаз не режут, кажется, что так и должно быть...
Вообще все эти переносы - дело привычки. Мне тоже поначалу BD-шные ошибки в переносах в глаза бросались. А сейчас - нет. Только вот раньше влет все ошибки в переносах видел, а сейчас частенько сомневаюсь, ошибка ли или так и должно быть... Very Happy
 
View user's profile Send private message ^

aks
Guest









PostPosted: 29.11.2004 00:43     Quote

Antikwar wrote:
Попробовал расставлять жесткие переносы для РЕБ, но они оказываются в самых неожиданных местах.

У меня прекрасно с жесткими переносами. При верстке RB необходимо выбрать предпочитаемый шрифт, и бук-дизайнер сделает переносы именно для этого шрифта.
 
^

Antikwar
Кандидат в члены клуба The eBook

Кандидат в члены клуба The eBook



Joined: 21 Oct 2004
Posts: 345


Location: Москва

PostPosted: 29.11.2004 11:28     Quote

aks wrote:
У меня прекрасно с жесткими переносами. При верстке RB необходимо выбрать предпочитаемый шрифт, и бук-дизайнер сделает переносы именно для этого шрифта.

Похоже, вы не поняли предмет обсуждения. Переносы делаются для конкретного шрифта - проблема не в этом. Проблема в их несоответствии правилам русского языка.
 
View user's profile Send private message ^

Antikwar
Кандидат в члены клуба The eBook

Кандидат в члены клуба The eBook



Joined: 21 Oct 2004
Posts: 345


Location: Москва

PostPosted: 29.11.2004 11:42     Quote

vvv wrote:
Давайте попробуем разобраться. Если еще раз такие "мамы" попадутся, пришлите мне исходный файл, html0-файл и rb-файл. И посторайтесь заметить положения "мам". А я посмотрю, откуда ноги растут.

Ладно. В следующий раз обращусь. Просто у меня сейчас книжки на французском читаются, а в них переносы не особенно нужны.


vvv wrote:
Я уже как-то говорил, что полная алгоритмизация русских формальных переносов возможна только через соответствующий словарь. Но этот метод в BD не используется по причине громоздкости и медленности. Вместо этого используется алгоритм упрощенных переносов. Он позволяет исключить явные ляпы типа "рак-ета" или "м-ама", но полного соответствия формальной системе не обеспечивает (например, в двухсложных словах).

В общем, я когда сравнивал "Везель ридер" с "Пальмфикшн", то пришел к выводу, что работают они примерно одинаково (в плане переносов). Один изпользует базу, другой нет.


vvv wrote:
По статистике, которую я как-то собирал, процент ошибок алгоритма BD-шных переносов - 3-5%. Можно довести до 1-2%, но скорость обработки упадет в несколько раз: исключения обрабатываются долго...

На самом деле скорость обработки для той же REB обсолютно не важна - книга делается на компьютере, переносы делаются на этапе создания книги. Ну будет она делаться немного долше.
 
View user's profile Send private message ^

Antikwar
Кандидат в члены клуба The eBook

Кандидат в члены клуба The eBook



Joined: 21 Oct 2004
Posts: 345


Location: Москва

PostPosted: 29.11.2004 11:49     Quote

vvv wrote:
Вообще все эти переносы - дело привычки. Мне тоже поначалу BD-шные ошибки в переносах в глаза бросались. А сейчас - нет. Только вот раньше влет все ошибки в переносах видел, а сейчас частенько сомневаюсь, ошибка ли или так и должно быть... Very Happy

А вот с этим позволю себе не согласиться. Evil or Very Mad Не стоит привыкать к неправильному. Мне, например, по роду деятельности (полиграфия) желательно "узнавать" неправильные переносы. Это не моя задача, но уж если увидел, то лучше поправить - конечный результат лучше будет. А если я к неправильным привыкну? Rolling Eyes Да и просто нежелательно это (и так пишу неграмотно Embarassed )...
 
View user's profile Send private message ^
Display posts from previous:   
Post new topic   Reply to topic    The-eBook Forum Index -> Book Designer All times are GMT + 4 Hours
Goto page Previous  1, 2
Page 2 of 2

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum

© The-eBook, 1999-2014. © Design by Prohorenkov
Syndicating News | Powered by phpBB © 2001, 2005 phpBB Group.
Хостинг предоставлен компанией DatForce     Яндекс.Метрика