Создание и использование словарей (поиск в словарях)
Goto page Previous  1, 2, 3, 4 ... 64, 65, 66  Next
 
View unanswered posts
Post new topic   Reply to topic    The-eBook Forum Index -> PocketBook -> PocketBook с экраном E-Ink
 
Author Message

Alex_None
Член клуба The eBook

Член клуба The eBook



Joined: 20 Apr 2009
Posts: 1578


Location: Киев

PostPosted: 04.01.2010 18:47     Quote

alexey2 wrote:
Господа, я вручную сделал на основе французско-русского словаря Lingvo10 текстовый файл с расширением txt в Unicod, очистил его, но дальше работа встала. Весь день потратил на то, чтобы попытаться сделать его в кодировке UTF 8 и переконвертировать в файл с расширением dic, но безрезультатно.
В связи с этим вопрос/просьба. Я готов выложить этот файл куда скажете. Сможете превратить его в *.dic? Куда мне этот файл выложить?

А в чём проблема-то? Есть пакет для конвертации. Единственное- там нет каталога с языковой информацией на французском... Что именно не получается.

Куда выложить? на любой файлообменник (рапида, ифолдер, депозит и т.п.)

Posted after 4 minutes 41 seconds:

Кстати, просьба к изготовителям dic словарей: если не жалко - поделитесь каталогами с языковой информацией для конвертера на pan2004(собака)bigmir.net - выложу в следующей сборке пака с указанием предоставившего Wink

Каталоги с русским, украинским, английским, ивритом (без морфем) уже есть
_________________
301+(32МБ) (301.14.2) -Это интересно!


Last edited by Alex_None on 04.01.2010 21:51; edited 2 times in total
 
View user's profile Send private message ^

Antuan
Член клуба The eBook

Член клуба The eBook



Joined: 30 Sep 2009
Posts: 11643


Location: Киев

PostPosted: 04.01.2010 18:52     Quote

alexey2
На любой файлообменник, например на http://www.filehoster.ru/
Выкладывать лучше в заарховированном виде.
Но ожидать результата лучше после 10-го числа, сейчас народ отдыхает, и от интернета в том числе.
_________________
PB 360° (v.15.3) | PB Pro 602 Grey (v.2.2.1a fastdrv) | PB A7 (v.1.3.1583) - подарок от PocketBook.
 
View user's profile Send private message ^

alexey2
Guest









PostPosted: 05.01.2010 00:45     Quote

Спасибо за быструю реакцию. Файл выложил в архиве здесь - http://www.filehoster.ru/files/ef9174

Quote:
А в чём проблема-то? Есть пакет для конвертации. Единственное- там нет каталога с языковой информацией на французском... Что именно не получается.


Предполагаю, основная проблема - мои кривые руки и отсутствие навыков к каким-либо операциям. Инструкцию я внимательно изучил и даже смог закачать в электронную книгу небольшой словарь (7 т. слов), выложенный в сети в *.zd, однако он слишком маленький.
Здесь же проблемы возникли на этапе перекодирования. Вначале я использовал Kaboom, но он мне сообщил "Subscript out of range". Когда я попытался в эту программу загружать те же txt, но сохраненные в windows 1251, то он писал File not found. Затем эту же операцию перекодирования попытался сделать через программу "Штирлиц" - что-то произошло, но потерялись accentes (наклонные палочки над гласными буквами). Я плюнул и попытался в таком виде пропустить файл через converter.exe. Файл с расширением *.dic создался, но весил 4 килобайта. После загрузки в электронную книгу он оказался пустым. Вкратце так.
Честно говоря, был бы крайне признателен, если бы кто-то а) довел до ума мой файл и б) рассказал бы в чем моя ошибка. Тогда бы я смог и другие словари Lingvo где-нибудь выложить.
 
^

Alex_None
Член клуба The eBook

Член клуба The eBook



Joined: 20 Apr 2009
Posts: 1578


Location: Киев

PostPosted: 05.01.2010 14:00     Quote

alexey2
конвертируйте win1251 в utf8 с помощью wu8.exe
Правда придется предварительно скачать и установить библиотеку .Net FrameWork (если у вас еще не установлена). Ссылки тоже в архиве пака.

wu8 конвертирует текстовые файлы любого размера быстро и просто.

Posted after 3 minutes 26 seconds:

Библиотека .Net FrameWork в любом случае пригодится- она используется многими программами...

Posted after 14 minutes 53 seconds:

Файл txt у вас и так уже в UTF-8, но что-то с ним не так вроде. Я сейчас на работе- не могу сравнить с внутренней структурой "правильных" txt файлов
_________________
301+(32МБ) (301.14.2) -Это интересно!
 
View user's profile Send private message ^

Antuan
Член клуба The eBook

Член клуба The eBook



Joined: 30 Sep 2009
Posts: 11643


Location: Киев

PostPosted: 05.01.2010 15:30     Quote

alexey2
Формат файла не верный. У Вас
Code:
abréaction
   f психол.
   абреакция; освобождение от напряжения, вызванного подавляемыми эмоциями

Должно быть
Quote:
abréaction{два пробела}f психол. абреакция; освобождение от напряжения, вызванного подавляемыми эмоциями

Кажется так, загляните в инструкцию.
Я смотрел программой Notepad++, ею же можно будет и отредактировать.
Кстати в ней есть два варианта UTF8, и они не равноценны.
Как будет время попробую довести до ума ваш словарь, но выложу в лучшем случае после 11-го числа.
_________________
PB 360° (v.15.3) | PB Pro 602 Grey (v.2.2.1a fastdrv) | PB A7 (v.1.3.1583) - подарок от PocketBook.
 
View user's profile Send private message ^

alexey2
Guest









PostPosted: 05.01.2010 17:02     Quote

Господа, до сегодняшнего дня я работал исключительно с Вордом, поэтому пока мой мозг не способен переварить рекомендации.
Quote:
конвертируйте win1251 в utf8 с помощью wu8.exe
Правда придется предварительно скачать и установить библиотеку .Net FrameWork


Эту Net FrameWork я скачал, распаковал, запустил wu8.exe - мелькнуло черное окно и пропало. Тот же результат, когда я в проводнике мышкой наложил мой второй txt (якобы win1251) на wu8.exe. Соответственно, когда после операции я посмортел в Total commander кодировку, она осталась win1251.

Quote:
Я смотрел программой Notepad++, ею же можно будет и отредактировать.


Ну превратить знаки абзацев в пробелы - не проблема. Я могу это сделать и в Ворде с помощью автоматической замены. А дальше что делать с файлом?
Если хотите, я могу выложить исходный очищенный файл (откуда возникли все txt). Он с расширением *.dsl.
 
^

Forkosigan
Член клуба The eBook

Член клуба The eBook



Joined: 11 Jun 2008
Posts: 4004


Location: Германия

PostPosted: 05.01.2010 17:05     Quote

Попробуйте этой программой.

http://www.mobileread.com/forums/attachment.php?attachmentid=42393&d=1 262518315

иструкция на видео
http://www.mobileread.com/forums/attachment.php?attachmentid=42394&d=1 262518373
_________________
Technical Manager (service, logistics, development)
Pocketbook-Europe
www.pocketbook.de
 
View user's profile Send private message ^

alexey2
Guest









PostPosted: 06.01.2010 02:02     Quote

Я уже ей пробовал и описал результат в посте - Mon Jan 04, 2010 11:45 pm. Надеюсь на то, что более опытные коллеги, когда у них найдется время, добьют мой файлик.
 
^

Forkosigan
Член клуба The eBook

Член клуба The eBook



Joined: 11 Jun 2008
Posts: 4004


Location: Германия

PostPosted: 06.01.2010 02:04     Quote

alexey2 wrote:
Я уже ей пробовал и описал результат в посте - Mon Jan 04, 2010 11:45 pm.

Прошу прощения, не заметил.
_________________
Technical Manager (service, logistics, development)
Pocketbook-Europe
www.pocketbook.de
 
View user's profile Send private message ^

Alex_None
Член клуба The eBook

Член клуба The eBook



Joined: 20 Apr 2009
Posts: 1578


Location: Киев

PostPosted: 06.01.2010 09:38     Quote

alexey2 wrote:
Эту Net FrameWork я скачал, распаковал, запустил wu8.exe - мелькнуло черное окно и пропало. Тот же результат, когда я в проводнике мышкой наложил мой второй txt (якобы win1251) на wu8.exe. Соответственно, когда после операции я посмортел в Total commander кодировку, она осталась win1251.

В Тотал Коммандере переходите в каталог с wu8 и текстовым файлом в кодировке win1251 и в командной строке набираете:
wu8 файл_в_кодировке_1251.txt новый_файл_с_кодировкой_utf8.txt

Это всё очень подробно описано в readme.txt ...
_________________
301+(32МБ) (301.14.2) -Это интересно!
 
View user's profile Send private message ^

alexey2
Guest









PostPosted: 06.01.2010 13:41     Quote

Alex_None вот так до меня лучше доходит.
Я получил файл txt с кодировкой UTF-8. Затем запустил конвертер.exe, создался файл с расширением *.dic размером 3 КБ (при том, что словарь Королева, закаченный в E-book, весит 1,8 МБ). После загрузки полученного файла в папку dictionaries, слов в нем не оказалось.
[/quote]
 
^

Alex_None
Член клуба The eBook

Член клуба The eBook



Joined: 20 Apr 2009
Posts: 1578


Location: Киев

PostPosted: 06.01.2010 15:19     Quote

alexey2
Если внимательно прочесть readme.txt, то можно узнать много нового и полезного =)
Для чего-то этот файл был же написан? Cool
_________________
301+(32МБ) (301.14.2) -Это интересно!
 
View user's profile Send private message ^

alexey2
Guest









PostPosted: 06.01.2010 16:04     Quote

Quote:
Если внимательно прочесть readme.txt, то можно узнать много нового и полезного =)


Вы можете мне не поверить, но я его читал очень внимательно. И написано там буквально следующее: "Если файл не в кодировке UTF8, то конвертируем файл из кодировки win-1251 (обычно) в UTF8 - используем один из двух вариантов:
а) с помощью программы Kaboom (см. видео).
В нашем случае получился файл с таким же именем Latin-Rus.txt, но уже в UTF8.
б) В качестве альтернативы можно использовать мою программу wu8.exe
Она конвертирует только из кодировки win-1251 в UTF8, при этом нет ограничений на размер файла (кроме системных и места на диске).
Имена исходного и результирующего файлов должны быть различны.
wu8 Latin-Rus.txt new.txt
Затем удаляем старый файл Latin-Rus.txt (в кодировке win-1251) и переименовываем полученный new.txt (UTF-Cool в Latin-Rus.txt".

Из того, что здесь написано я не смог прийти к выводу, что с wu8 нужно проделать те же манипуляции в total commander, что и с makezd. Скорее наборот, исходя из расположения материала в readme.txt логичнее предположить, что wu8 должна работать как и Kaboom, то есть иметь некую оболочку. Но ее нет, что и вызвало мои затруднения.
Я ни в коем случае не отказываю файлу readme.txt в гносеологическом потенциале и не исключаю, что он обладает высокой степенью эвристичности. Но предназначен он для людей, находящихся на более высокой ступени технического развития, чем я.
В связи с этим я возлагаю большие надежды на таких людей и готов ждать сколько нужно момента, когда у них найдутся время и силы, чтобы преобразовать файл с французским словарем в удобоваримый вид.
 
^

Charter
Член клуба The eBook

Член клуба The eBook



Joined: 29 May 2009
Posts: 50527


Location: Украина

PostPosted: 06.01.2010 16:07     Quote

alexey2 wrote:
Я ни в коем случае не отказываю файлу readme.txt в гносеологическом потенциале и не исключаю, что он обладает высокой степенью эвристичности.

Приятно вас почитать Laughing
_________________
PB 301+!!! sw.14.2,
PB 611, Boyue T62
 
View user's profile Send private message ^

Antuan
Член клуба The eBook

Член клуба The eBook



Joined: 30 Sep 2009
Posts: 11643


Location: Киев

PostPosted: 06.01.2010 19:12     Quote

alexey2
Итак, с кодировкой все в порядке, если вручную привести строки в нужный формат, то они конвертируются успешно, и так же успешно воспринимаются словарем.
Но... есть две проблемы.
Первая: нету файлов collates.txt, morphems.txt, keyboard.txt, для французского языка. Пока использовал английский вариант.
Вторая: простым поиском-заменой привести файл в понятный конвертеру вид не получится, надо писать скрипт или вордовский макрос.
Если есть люди которые могут сходу написать макрос или скрипт, я могу объяснить что надо сделать, а он это переведет в код, кстати, этот код возможно пригодится в дальнейшем, для конвертации других словарей.
_________________
PB 360° (v.15.3) | PB Pro 602 Grey (v.2.2.1a fastdrv) | PB A7 (v.1.3.1583) - подарок от PocketBook.
 
View user's profile Send private message ^

Alex_None
Член клуба The eBook

Член клуба The eBook



Joined: 20 Apr 2009
Posts: 1578


Location: Киев

PostPosted: 06.01.2010 19:25     Quote

alexey2
Учту ваши замечания =)
_________________
301+(32МБ) (301.14.2) -Это интересно!
 
View user's profile Send private message ^

alexey2
Guest









PostPosted: 07.01.2010 04:45     Quote

Antuan
Quote:
Вторая: простым поиском-заменой привести файл в понятный конвертеру вид не получится, надо писать скрипт или вордовский макрос.


С этой проблемой могут справиться добрые люди, обитающие на сайте http://wordexpert.ru/forum/.
По крайней мере по моей просьбе они нарисовали два хитрых макроса за два дня совершенно безвозмездно. Разумеется, на все их добрая воля, но можно попробовать. Если Вам не сложно, грамотно сформулируйте на их форуме задачу.
 
^

gun4fan
Искушенный участник форума

Искушенный участник форума



Joined: 18 Dec 2009
Posts: 50



PostPosted: 07.01.2010 08:38     Quote

Заметил странную вещь: при вызове словаря из режима чтения книги виртуальная клавиатура имеет полноформатный вид, видны все буквы и спецсимволы. При вызове словаря через Главное_Меню->Словарь - не видны две самые верхние строчки букв и спецсимволов (З, Э, Ы, @, % и т.д.)
Это у всех так или только у меня? Sad
_________________
PocketBook 301 plus (64Mb) v.14.2
 
View user's profile Send private message ^

izmail
Член клуба The eBook

Член клуба The eBook



Joined: 18 Mar 2009
Posts: 629


Location: Москва, Россия, Земля, Солнечная система, Млечный путь, Вселенная, Божественный промысел

PostPosted: 07.01.2010 09:48     Quote

У всех...
_________________
http://www.youtube.com/watch?v=NAICTQukZX8
лечение "стеклобоя" шаманской терапией
 
View user's profile Send private message ^

gun4fan
Искушенный участник форума

Искушенный участник форума



Joined: 18 Dec 2009
Posts: 50



PostPosted: 07.01.2010 14:24     Quote

izmail wrote:
У всех...


Понял. Благодарю...
_________________
PocketBook 301 plus (64Mb) v.14.2
 
View user's profile Send private message ^
Display posts from previous:   
Post new topic   Reply to topic    The-eBook Forum Index -> PocketBook -> PocketBook с экраном E-Ink All times are GMT + 4 Hours
Goto page Previous  1, 2, 3, 4 ... 64, 65, 66  Next
Page 3 of 66

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum

© The-eBook, 1999-2014. © Design by Prohorenkov
Syndicating News | Powered by phpBB © 2001, 2005 phpBB Group.
Хостинг предоставлен компанией DatForce     Яндекс.Метрика