Создание и использование словарей (поиск в словарях)
На страницу 1, 2, 3 ... 63, 64, 65  След.
 
Найти сообщения без ответов
Начать новую тему   Ответить на тему    Список форумов The-eBook -> PocketBook -> PocketBook с экраном E-Ink
 
Автор Сообщение

acer1976
Гость









СообщениеДобавлено: 04.10.2009 14:06     Цитата

Скачал с сайта Букфаст.ру - "Подробная инструкция по конвертации словарей под PocketBook и необходимые для этого инструменты".
Скачал словарь с сайта дикт.пдапрайм.ру Города и столицы мира.
Делал все по инструкции, единственное конвертацию txt -> txt(UTF8), производил при помощи Shtirlitz IV.

Полученный файл *.dic закачал на Покет.

Далее, на мой взгляд странная работа словаря (запуск из приложений).
Например, в словаре есть желание найти город на букуву "м", набираю букву "м" - ничего не происходит. Набираю "мо" появляются города начинающиеся с "мо".
Набираю "а" также ничего не происходит, "р" ищет, появляются города на эту букву.

Такое ощущение, что по некоторым буквам ищет, а по некоторым не ищет.

Стандартный словарь, который в поставке с покетом работает корректно.

Вообще все словари (уже готовые в формате *.dic) скачанные с Букфаст.ру работают как выше было описано (т.е. не по всем буквам идет корректный поиск).

PocketBook 301+
Версия ПО Е301.12.7 (на 12.6 было также)
приложение словарь из последней прошивки.
Память устройства проверял.

Если так и задумано, то не есть респект. Если нет, в чем может быть дело?
Заранее спасибо за ответ.
 
^

Alex_None
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 20.04.2009
Сообщения: 1578


Откуда: Киев

СообщениеДобавлено: 05.10.2009 09:56     Цитата

acer1976 писал(а):
Вообще все словари (уже готовые в формате *.dic) скачанные с Букфаст.ру работают как выше было описано (т.е. не по всем буквам идет корректный поиск).

Если можно, на конкретных примерах
_________________
301+(32МБ) (301.14.2) -Это интересно!
 
Профиль Сообщение ^

kolosat
Заслуженный участник форума

Заслуженный участник форума



Зарегистрирован: 05.06.2009
Сообщения: 231


Откуда: Житомир, Україна

СообщениеДобавлено: 05.10.2009 12:33     Цитата

acer1976 писал(а):

Полученный файл *.dic закачал на Покет.

если можно выложите результат.
_________________
Читая книги электронные,
экономим бумагу тоннами!
 
Профиль Сообщение ^

acer1976
Гость









СообщениеДобавлено: 05.10.2009 19:27     Цитата

В качестве примера привожу работу словаря с Букфаст.ру - Большой юридический словарь для PocketBook.
открываю приложение словарь, открываю Большой юридический словарь.
Набираю - буква "а".
В моем понимании работы словаря, должны показаться слова начинающиеся с буквы "а".
Этого не происходит.

Затем набираю "н". Т.е. набрано "ан". В этом случае появляется список слов начинающийся с "ан".
"Аналитическая юриспруденция" и т.д.

На других буквах и сочетаниях букв ситация аналогичная, где-то идет поиск (как например слова начинающиеся с "ан"), где-то нет.

P.S. вообще удивительно, что до меня такое никто не обнаруживал. Т.е. либо все это воспринимают как должное, либо проблема с моим девайсом (в частности точно знаю, что у моего покета проблема с часами после суток простоя - сбрасываются часы и дата).
 
^

Alex_None
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 20.04.2009
Сообщения: 1578


Откуда: Киев

СообщениеДобавлено: 07.10.2009 10:34     Цитата

acer1976 писал(а):
Т.е. либо все это воспринимают как должное, либо проблема с моим девайсом (в частности точно знаю, что у моего покета проблема с часами после суток простоя - сбрасываются часы и дата).

Думаю, что все воспринимают как должное Wink
Такой уж функционал словаря
_________________
301+(32МБ) (301.14.2) -Это интересно!
 
Профиль Сообщение ^

velakara
Искушенный участник форума

Искушенный участник форума



Зарегистрирован: 10.09.2009
Сообщения: 47



СообщениеДобавлено: 09.10.2009 14:54     Цитата

Создание словарей - проблема с приставками

Mожно ли в принципе заставить файл morphems преобразовывать приставки (начало слова)?
Это необходимо для французских словарей: s'agissait, d'abandonner, l'exploration - здесь нужно обрезать начало.
Пробовал всеми способами - не работает, могу менять лишь окончания.
 
Профиль Сообщение ^

acer1976
Гость









СообщениеДобавлено: 10.10.2009 13:11     Цитата

Alex_None писал(а):
acer1976 писал(а):
Т.е. либо все это воспринимают как должное, либо проблема с моим девайсом (в частности точно знаю, что у моего покета проблема с часами после суток простоя - сбрасываются часы и дата).

Думаю, что все воспринимают как должное Wink
Такой уж функционал словаря


А что скажут по этому поводу уважаемые разработчики. Есть шанс реализовать вышеуказанные пожелания (адекватный поиск в словарях), либо необходимо писать пожелания в какую-то другую ветку?
 
^

Aardvark
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 12.11.2007
Сообщения: 1993


Откуда: Москва

СообщениеДобавлено: 10.10.2009 13:15     Цитата

Вероятно, разработчики решили, что слов на одну букву слишком много (список получится длинный), поэтому фильтрацию включают со второй буквы. Не баг, а фича, как говорится.
_________________
Onyx Boox M92SM
 
Профиль Сообщение ^

velakara
Искушенный участник форума

Искушенный участник форума



Зарегистрирован: 10.09.2009
Сообщения: 47



СообщениеДобавлено: 17.11.2009 12:34     Цитата

acer1976 писал(а):
В качестве примера привожу работу словаря с Букфаст.ру - Большой юридический словарь для PocketBook.
открываю приложение словарь, открываю Большой юридический словарь.
Набираю - буква "а".
В моем понимании работы словаря, должны показаться слова начинающиеся с буквы "а".
Этого не происходит.

Затем набираю "н". Т.е. набрано "ан". В этом случае появляется список слов начинающийся с "ан". .


Это значит, что в .dic словаре проблемы. Не все статьи исходника попали в скомпилированый словарь. Повреждения бывают разной тяжести - бывает, что не ищет аб... но уже открывает ат... Бывает, что обрезается все начало алфавита.

Глючит компилятор - особенно достают его (по моим наблюдениям) двойные фигурные скобки в исходном текстовом файле. Форматированием исходника (убрать скобки, ссылки etc.) можно добиться того, что получится работающий безглючный словарь.

Разработчики компилятора могли бы сделать его постабильнее (чтобы список заголовков не кромсался бы из-за каких-то странностей в тексте статей исходника).
 
Профиль Сообщение ^

DmitryZ
Кандидат в члены клуба The eBook

Кандидат в члены клуба The eBook



Зарегистрирован: 29.12.2006
Сообщения: 295



СообщениеДобавлено: 17.11.2009 22:46     Цитата

Со старым конвертером есть проблемы. Вот исправленная версия:
http://ifolder.ru/15036863
Просьба потестить, если найдете еще какие проблемы - пишите в этой теме (желательно сразу со ссылкой на исходник словаря).
 
Профиль Сообщение ICQ ^

iREn
Заслуженный участник форума

Заслуженный участник форума



Зарегистрирован: 18.03.2009
Сообщения: 239



СообщениеДобавлено: 22.11.2009 20:22     Цитата

Испанско-русский словарь http://www.fileden.com/files/2009/4/26/2419527/spa_rus_sadikov.dic
 
Профиль Сообщение ICQ ^

Rare Reader
Недавний участник форума

Недавний участник форума



Зарегистрирован: 13.11.2009
Сообщения: 14



СообщениеДобавлено: 23.11.2009 22:03     Цитата

DmitryZ писал(а):
Со старым конвертером есть проблемы. Вот исправленная версия:
http://ifolder.ru/15036863
Просьба потестить, если найдете еще какие проблемы - пишите в этой теме (желательно сразу со ссылкой на исходник словаря).

Если в имени исходного текстового файла используется кириллица, то конвертер вставляет в файл *.dic название словаря в кодировке Win1251, а надо - в UTF-8.

И еще вопрос по теме, в списке выбора словарей отображаются только первые 20 словарей (по алфавиту), остальные файлы игнорируются. Это ограничения прошивки? (Pocketbook 301+ v12.7)
 
Профиль Сообщение ^

velakara
Искушенный участник форума

Искушенный участник форума



Зарегистрирован: 10.09.2009
Сообщения: 47



СообщениеДобавлено: 25.11.2009 09:26     Цитата

DmitryZ писал(а):
Со старым конвертером есть проблемы. Вот исправленная версия:
http://ifolder.ru/15036863
Просьба потестить, если найдете еще какие проблемы - пишите в этой теме (желательно сразу со ссылкой на исходник словаря).


Новый конвертер устраняет кучу проблем - у меня пошли словари которые я уже отчаивался запустить.

Между тем не все гладко. Вот исходники двух русско-русских словарей : http://rapidshare.com/files/311855064/Ishodniki_-_to_check_the_new_con verter.rar

Побегаешь по странице текста и проблемы становятся видны.

В "Литературе", если твой указатель, например, на слове "его" список статей выглядит так:
Жаргонизмы ?
?. А. Есенина
Екклезиаст


То есть статьи раскалываюстя где-то по середине - кусок битого предложения выглядит как заголовок статьи. Смотришь на саму статью в исходнике - нет видимых проблем. На лигве все идет гладко.

То же самое наблюдалось и в случае старого конвертера в более острой форме (к этому добавлялось исчезновение из списка половины алфавита).
 
Профиль Сообщение ^

Rare Reader
Недавний участник форума

Недавний участник форума



Зарегистрирован: 13.11.2009
Сообщения: 14



СообщениеДобавлено: 25.11.2009 22:24     Цитата

Название любого словаря *.dic, которое отображает Pocketbook, можно исправить следующим способом:
1. Создаем текстовый файл, в нем пишем нужное название словаря.
2. С помощью программы wu8.exe от Alex_None конвертируем этот файл в UTF-8.
3. Открываем для просмотра в виде Hex сконвертированный файл с нужным названием.
4. Открываем словарь *.dic hex-редактором.
5. Начиная со смещения 0x40 побайтно заменяем нечитабельное название на нужное.
Есть ограничение на длину названия - максимум 31 символ (со смещения 0x80 идут уже другие данные). Название должно завершаться двумя нулевыми байтами (максимум по смещению 0x7e и 0x7f).
Пункт 2 можно сделать и обычным блокнотом, в этом случае при его просмотре в режиме Hex игнорируем первые 3 байта EF BB BF.

Добавлено спустя 36 минут 5 секунд:

Толковый словарь русского языка Ожегова и Шведовой (С.И.Ожегов, Н.Ю.Шведова. Толковый словарь русского языка. Издательство "Азъ";, 1992. OCR Конник М.В.): http://ifolder.ru/15158777

Толковый словарь русского языка под редакцией Д.Н. Ушакова: http://ifolder.ru/15158902
 
Профиль Сообщение ^

Antuan
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 30.09.2009
Сообщения: 11612


Откуда: Киев

СообщениеДобавлено: 26.11.2009 14:25     Цитата

Попытался конвертировать словарь Брокгауза, при конвертировании четыре раза выскакивает сообщение о том что мол размер статьи слишком велик, в результате работоспособной оказывается только вторая половина словаря. Как избежать такого, может надо как-то подправить те статьи которые оказались не по зубам конвертеру? Зачем вообще введено ограничение на размер словарной статьи?
Мучил вот этот словарь:
http://dict.pocketz.ru/files/Brz_Efn.zd
_________________
PB 360° (v.15.3) | PB Pro 602 Grey (v.2.2.1a fastdrv) | PB A7 (v.1.3.1583) - подарок от PocketBook.
 
Профиль Сообщение ^

Rare Reader
Недавний участник форума

Недавний участник форума



Зарегистрирован: 13.11.2009
Сообщения: 14



СообщениеДобавлено: 26.11.2009 21:10     Цитата

1. Новый толково-словообразовательный словарь русского языка под ред. Ефремовой: http://ifolder.ru/15174331
Некорректный поиск: набираем "прит", отображается "прыть", хотя есть слова на "прит", и они отображаются при простом листании словаря.
Исходник: http://www.alreader.com/dict/harvester/Efremova.zd

2. В исходнике http://dict.pdaprime.ru/file.php?n=ojogv.zd статься "стайка <= стая", а в словаре просто название статьи "стайка" без текста статьи. А если в исходнике *.xdrf http://downloads.sourceforge.net/xdxf/comn_dictd04_ozhegov.tar.bz2 статья в виде
<ar><k>стайка</k>
стайка
&lt;= стая</ar>
то она отображается правильно. Зато в этом словаре присутствуют ненужные разрывы строк, в результате чего нерационально расходуется место на экране.

3. Берем те же исходники, что и в п.2. Статья "Книга". Здесь наоборот - в первом варианте все правильно, а во втором - таких статей несколько - потеряна самая первая
("Книга - крупное подразделение литературного произведения, состоящее из многих глав").

4. При использовании старого конвертора, поле "Перевод" в словаре расположено сразу над виртуальной клавиатурой. При использовании нового - между ними еще пустое поле, высота которого почти как виртуальная клавиатура - занимает много лишнего места на экране.

Добавлено спустя 1 час 10 минут 1 секунду:

Rare Reader писал(а):
Есть ограничение на длину названия - максимум 31 символ (со смещения 0x80 идут уже другие данные). Название должно завершаться двумя нулевыми байтами (максимум по смещению 0x7e и 0x7f).

Длину названия можно увеличить, заменив в нем буквы кириллицы соответствующими буквами латиницы. В кодировке UTF-8 символ кириллицы занимает 2 байта, символ латиницы - 1 байт. У меня все мои словари отображаются в нужном виде (в том числе "Большой энциклопедический словарь" Wink.
 
Профиль Сообщение ^

xyz
Зрелый участник форума

Зрелый участник форума



Зарегистрирован: 23.09.2009
Сообщения: 28


Откуда: Новосибирск

СообщениеДобавлено: 27.11.2009 07:58     Цитата

Rare Reader писал(а):
...
Длину названия можно увеличить, заменив в нем буквы кириллицы соответствующими буквами латиницы. В кодировке UTF-8 символ кириллицы занимает 2 байта, символ латиницы - 1 байт. У меня все мои словари отображаются в нужном виде (в том числе "Большой энциклопедический словарь" ;).


Суррогатное представление в чужом алфавите трудно назвать "нужным видом" :(
_________________
PocketBook 360° + 4G
 
Профиль Сообщение ^

Rare Reader
Недавний участник форума

Недавний участник форума



Зарегистрирован: 13.11.2009
Сообщения: 14



СообщениеДобавлено: 27.11.2009 08:13     Цитата

Может я не очень понятно выразился, у меня отображается "Большой энциклопедический словарь" - 2-я и 3-я буквы с конца "ap" - это буквы латинского алфавита "эй" и "пи". Это выглядит гораздо менее суррогатным, чем "Большой энциклопедический словар", и тем более, "Большой энциклопедический словарр?#".
 
Профиль Сообщение ^

Rare Reader
Недавний участник форума

Недавний участник форума



Зарегистрирован: 13.11.2009
Сообщения: 14



СообщениеДобавлено: 27.11.2009 21:15     Цитата

Большой энциклопедический словарь (benc.dic) с bookfast.org не ищет словосочетания (нет в словаре), которые начинаются на: "великая", "сибирская", "гражданская", хотя есть "великие...", "сибирские...", "гражданские...". У всех так?
 
Профиль Сообщение ^

Alex_None
Член клуба The eBook

Член клуба The eBook



Зарегистрирован: 20.04.2009
Сообщения: 1578


Откуда: Киев

СообщениеДобавлено: 29.11.2009 20:23     Цитата

Rare Reader писал(а):
Большой энциклопедический словарь (benc.dic) с bookfast.org не ищет словосочетания (нет в словаре), которые начинаются на: "великая", "сибирская", "гражданская", хотя есть "великие...", "сибирские...", "гражданские...". У всех так?

Да, так. В новой версии конвертера дела со словарями обстоят несколько лучше (но еще далеко до идеала).
Вот новая версия Большого энциклопедического словаря
http://rapidshare.com/files/313884232/benc.dic

Posted after 3 hours 55 minutes 1 second:

Предлагаю новую 3-ю версию пака для создания/модификации словарей (7МБ).
http://rapidshare.com/files/314139280/DicConverter3_3.zip
или
http://ifolder.ru/15665685

В новую версию включен обновленный конвертер, все необходимые утилиты для конвертации, обучающее видео.

Также добавлена программа DicRename собственного производства, позволяющая легко давать новое имя уже существующему словарю.
Так что кто был недоволен именами типа FEng_Rus_full в списке словарей- теперь сможете обозвать такой словарь как вашей душе угодно Cool

Для работы программ wu8 и DicRename требуется библиотека .NET Framework 2.0 - 23МБ (файл dotnetfix.exe- скачать и установить)
_________________
301+(32МБ) (301.14.2) -Это интересно!


Последний раз редактировалось: Alex_None (26.12.2009 00:02), всего редактировалось 1 раз
 
Профиль Сообщение ^
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов The-eBook -> PocketBook -> PocketBook с экраном E-Ink Часовой пояс: GMT + 4
На страницу 1, 2, 3 ... 63, 64, 65  След.
Страница 1 из 65

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах

© The-eBook, 1999-2014. © Design by Prohorenkov
Syndicating News | Powered by phpBB © 2001, 2005 phpBB Group.
Хостинг предоставлен компанией DatForce     Яндекс.Метрика