Вы можете прислать нам новости или сообщить что-то очень важное заполнив форму.

Редактор:
Print Friendly, PDF & Email

ОРФОграфия

26 июля, 2014

© Some rights reserved, Tony FischerВ 2011 году статья «инструмент писателя» открыла новое направление для мотивирования внимательного ознакомления с интеллектуальным инструментом для создания книг. Впоследствии эта тема развивалась, потому что в действительности она значительно шире и касается не только крупных текстовых материалов.

Серьёзную творческую работу можно выполнять и в простом текстовом редакторе, но специализированные инструменты позволяют сосредоточиться на главном, а не второстепенном. Это экономит не только время, но и позволяет охватывать всю панораму текущей работы, даже если был сделан какой-то длительный перерыв или в какой-то момент появились новые факты, которые меняют большую часть изложения.

Денис Клепцов, генеральный директор компании «Информатик», неоднократно предлагал мне написать статью об их флагманском продукте ОРФО. Назвать эту систему программой для «проверки правописания» абсолютно не хочется, ибо довольно много существует альтернативных программ под общим названием «spell checker», которые сравнивают правильность написания слов и ничего более. От бесплатных, встроенных в программу для редактирования текста или на уровне операционной системы, до дорогих программ, которые «гарантируют» какое-то иное качество.

ОРФО изначально развивалась в виде серьёзного инструмента, помогающего отслеживать много параметров и что важно – управлять ими, а не только контролировать правильное написание слов. Изображать её как программу мне изначально было не интересно. Поэтому решил, что пора обозначить современный уровень проверки орфографии, как инструмента, на примере ОРФО, что будет полезно не только для потребителей, которые хотят знать «за что платят и что получают», но и для разработчиков, чтобы и они понимали «мощный инструмент – всегда прост в использовании», «понятен», иначе это «сложный» или «тяжёлый монстр», которого будут бояться, что повлияет на массовость потребителей.

Соответственно, статья появилась в разделе «колонка редактора», а не «обзоры продуктов».

Сейчас могу быть неточным в определении дат. Впервые познакомился с ОРФО в версии для DOS, когда работал в издательстве дизайнером. Это приблизительно после 1989 года. Долго уговаривал главного редактора приобрести программный продукт для распознавания ошибок, а она отказывалась, так как в штате был профессиональный корректор. Мои доводы были просты – корректор совмещает ещё и набор текста в компьютере, ибо авторы в большинстве случаев писали на бумаге, а мозг при такой работе у человека закипает через несколько часов и происходит, то, что называется «замыливание глаза». То есть, человек уже не видит, если слово написано по количеству и составу букв «врено» (верно), но переставлены две буквы местами, что уже ошибка в слове. Или буква «п» вдруг подменяет «л» и глазами это не распознать от усталости. Так было в издательстве «Коммерсантъ» после 1995 года, когда написали слово «лидер» в заголовке. Это был скандал! «Лидер в чём-то там»… Смешно и безумно неудобно получилось перед клиентом. Хорошо, что он подошёл к проблеме по-деловому, без истерики.

А ведь всего одна буква!

Корректор при наборе текста сразу отслеживал типовые ошибки от одного слова до абзацев. Потом вносились исправления редактором на другом компьютере, корректор повторно пробегал глазами и с помощью программы ОРФО и мне уже не удавалось находить грубые опечатки или ошибки на экране. В мою задачу входило создать дизайн макета, по плану редактора, исходя из количества знаков, и предоставить номера файлов всей группе по темам, чтобы текст автоматически попадал в программе Xerox Ventura Publisher for DOS в нужное окно. Всё это экономило время и силы.

Основной инструмент в полиграфии с 90-х годов это Macintosh. Компания Apple создала очень надёжный, а главное стабильный инструмент для длительной творческой работы. На обслуживание компьютера практически никто не тратил время. Именно по этой причине Macintosh стал профессиональным инструментом, хотя качество работы с цветом, шрифтами и скорость обработки графики были важной причиной выбора сами по себе. Мне до сих пор импонирует принцип – «включил и работай».

При том, что Macintosh используется в издательстве давно, основная доля по работе с текстом принадлежала «IBM совместимым компьютерам», где господствовал Microsoft и его главный продукт для зарабатывания денег – MS Office. С точки зрения отечественного потребителя – это доступный по деньгам вариант. Собрали компьютер сами, залили программами, и работа закипела! ОРФО оказался разделён на два отдельных продукта – в составе MS Office и более полный вариант продавался как самостоятельный продукт. Буквально до начала 10-х годов XXI века ОРФО отсутствовал на платформе Mac OS X, хотя к полиграфистам и издателям добавились писатели и журналисты, предпочитающие работу на компьютерах Apple, из-за стоимости владения в первую очередь, до главного козыря платформы – простоты использования.

Сейчас «ОРФО 2014» практически схож между версиями для Windows и Mac OS X. Различия заключены в особенностях операционных систем.

Снимок-экрана-2014-07-21-в-10.54.28

Вместе с основной программой поставляется незаменимый спутник пишущего человека: программный словарь «Русская коллекция» – синонимы, антонимы, паронимы, этимология, толковый словарь и словарь Даля, географические наименования и словарь иностранных слов в русском языке. Обычно здесь не хватает Wikipedia и «Грамота.ру», чтобы статьи отражались в том же окошке программы.

Снимок-экрана-2014-07-21-в-11.04.51

Например, как это работает в системном словаре Mac OS X, если установить дополнительный механизм по адресу ~/Library/Dictionaries. Кстати, в ОРФО все словари скрыты внутри контейнера программы, то есть она не делится словарями с системой Mac OS X, хотя сложно найти несколько различий между оболочками «Русской коллекции» и «Dictionary».

Снимок-экрана-2014-07-21-в-8.55.49

У разных программ и платформ метод подключения ОРФО различается. Если посмотреть версию для Mac OS X, то используется три различных метода – для MS Office и Adobe, а также все программы поддерживающие механизм Apple Cocoa, например, программы Scrivener, Writer Pro, Ulysses и так далее.

Настройки ОРФО в Mac OS X располагаются в System Preferences, что не очень удобно, так как окно строго регламентировано физическим размером, и разработчики будут зажаты этими обстоятельствами. С моей точки зрения настройки нужно вывести за эти рамки и сделать более наглядными, чтобы проще понимать механизм работы ОРФО.

Снимок-экрана-2014-07-21-в-8.56.13

Сейчас легче один раз установить по умолчанию набор правил в положение «проверять всё», а ошибки игнорировать в тексте глазами.

Кроме того, хочется, и это будет полезным, иметь возможность переключения «стиля настроек» из программы по «правому щелчку мыши». Например, быстро переключиться на стиль проверки орфографии без буквы «Ё», не имея желания или возможности залазить в системные настройки, что администратор системы в профессиональных условиях может ограничить. Это ещё один повод создать настройки программы за пределами System Preferences.

Снимок-экрана-2014-07-21-в-8.56.04

В мобильной жизни рабочее место – это условный инструмент. Всегда появляются или образуются слова, которых нет в словаре ОРФО, но их все равно нужно писать грамотно. Переходя с одного места на другое, пользуясь сетевым облаком для передачи данных, стало возможным работать с текстом на разных компьютерах. Например, в помещении удобнее иметь дело с большим экраном, а на кухне или в дороге – ноутбук незаменимая вещь. То есть, кроме документов должны передаваться пользовательские словари ОРФО, чтобы заново не обучать программу незнакомым словам.

Сейчас «Информатик» открыл собственное облако для передачи словарей между компьютерными местами, но изменения нужно отслеживать самостоятельно, а не автоматически. Кроме того, использование облака могло бы облегчить жизнь большому количеству потребителей ОРФО. По сути, нужна только одна галочка «использовать облако» и ничего более. В автоматическом режиме новые слова должны попадать в «Информатик», там их должны анализировать лингвисты и включать правильное написание в отдельный «облачный словарь», который довольно быстро вырастет в размерах, так как разные писатели используют собственный набор слов для описания каких либо событий или предметов.

«Орфографическое облако» надо создать как отдельный бренд и систему контроля легальности при использовании словарей. Программу сделать отдельной единицей, а все словари получать из облака. Сделать систему тарификации словарей – базовый, расширенный, узкоспециализированный, пользовательский и так далее. Позволить выбирать отдельные и пакетные предложения. Таким образом, программу можно будет украсть, а словари нет (теоретически).

Снимок-экрана-2014-07-21-в-8.55.58

Отдельно или с расширенными версиями ОРФО поставляются дополнительные словари, в фирменном определении – «тематические словники». Любой истинный фанат ОРФО (типа меня) обязательно приобретёт не только самую новую версию программы ещё до её официального выхода, но и словари к нему. И цена здесь… лично мне не жалко никаких денег, но массовый рынок так не рассуждает. Поэтому надо быть реалистами. Современное решение должно несколько отличаться от текущего маркетинга. ОРФО, по сути, вообще должен быть конструктором. Нужно покупать словари произвольно из… ОРФО. Они не должны теряться при выходе новой версии программы. Должна быть система «восстановления покупок». Должен быть приблизительный список количества слов из словаря и возможность расширять тематический словарный запас.

Сейчас в ОРФО отсутствует «система контроля названий». Скажем, чтобы каждый пишущий мог грамотно воспроизводить устойчивые словосочетания и названия. Например, в любом случае «Open Source» или «Aircraft Prototype Systems Division» писались бы безошибочно. Как вариант, чтобы ОРФО ещё предлагала отделять некоторые названия кавычками (« »), дабы не сбивать со смысла. А то в одном случае это сообщество «Open Source», в другом это открытый источник, который можно написать строчными буквами – open source.

Подобные названия компаний и устойчивых фраз также можно вынести в отдельный словарь или тематические словари.

Снимок-экрана-2014-07-21-в-12.05.19

Технически, объёмы словарей неизвестны, но количество распознаваемых слов огромно! ОРФО использует группы правил и шаблоны. Даже когда пользователь вводит новое слово, то оно хранится в каком-то изначально правильном формате, а различные формы, которые могут встречаться в тексте, распознаются ОРФО уже автоматически. Таким образом, физически компактные словари – это огромное богатство словоформ!

И, казалось бы, ОРФО проверяет текст по словарю. Что тут особо сложного? Но это не просто «spell checker». Программа подскажет, что нельзя написать «выполняет роль» из-за нарушения лексической сочетаемости, потому что «роль» можно «исполнять» или «играть». И далее огромный список подсказок – от устаревших слов, до разговорного стиля. ОРФО указывает на созвучность слов, на множество согласных идущих подряд, на которых можно споткнуться при чтении, на длинные и сложные для понимания предложения.

И вот тут появляется необходимость приучать к грамотности с помощью элементов игры. Создать систему баллов за грамотность, стиль изложения, обучение системы новым словам и так далее. Нужно поддерживать интерес к творчеству вместе с ОФРО, которое связано с изложением слов, созданию грамотных словоформ и прочему.

Бывает так, что человек знает, как правильно пишется слово, но постоянно спотыкается на одной и той же ошибке. Это вредная привычка, которую можно исправить в игровой форме. Например, среди моих привычек есть слово «не возможно», которое автоматически пишу раздельно.

ОРФО ищет ошибки, но она иногда пропускает известные правила или обстоятельства. Например, при включённой опции с буквой «Ё» пропускается слово «всё», или, как в примере выше, «не возможно» всё-таки пишется слитно, а программа может и пропустить ошибку.

Надо отдать должное, в версии 2014 года увеличилась точность проверки. В контрольном тексте на 3000 слов, который был проверен ранее ОРФО 2013, выявлены 3 дополнительные ошибки.

Для ОРФО есть ещё много места на рынке и направлений для развития. Основная задача – согласовать современные возможности, стиль жизни потребителей и расширить массовый рынок за счёт изменения интерфейса.

Ссылки по теме

Официальный сайт: www.informatic.ru

Официальная страница продукта: www.orfo.ru

Морфологические модули: www.informatic.ru/catalogue/developers

Аннотация

Статья о современных возможностях программ для проверки орфографии на примере ОРФО.

Послесловие

Бывают всякие симпозиумы медиков, пожарников, военных. Что-то я не помню ничего подобного у лингвистов, которых волнует развитие программ для проверки орфографии.

Доброе утро!

Честно говоря – знаю, что статья получилась скомканной.


 
 

Комментарии к сообщению “ОРФОграфия”

  1. Lecron:

    паронимы — первый раз слышу о таком понятии. Вот, блин, сколько всего еще не известно.

    «Программа подскажет, что нельзя написать «выполняет роль» из-за нарушения лексической сочетаемости, потому что «роль» можно «исполнять» или «играть».»
    роль — Толковый словарь Дмитриева
    10. Ролью называют устойчивую функцию какого-либо устройства.
    Пример: Не каждый фильтр выполняет все три роли.
    13. Если что-либо выполняет роль чего-либо, то это означает, что какой-либо объект используется в функции другого объекта.
    Пример: Майка, которую мы носим на себе весь день, выполняет роль полотенца.

    Т.е. если ОРФО анализирует контекст фразы, то возможно находит ошибки, но если считает это словосочетание ошибочным в независимости от контекста, то ошибается сама.
    Даже если не сравнивать авторитность составителя словаря и ОРФО, в данном случае «исполнять роль» просто будет резать слух.

    • Правильно сказать: не каждый фильтр решает все три задачи. Слово «роль» вообще не уместна по значению.

      • Lecron:

        Владимир, не спорьте с тем, у кого в школе по русскому был трояк. 😉
        Я лишь привел примеры из словаря, в составлении которого приняли участие кандидаты и доктора филологических наук (ссылка) из весьма уважаемого заведения (ссылка) Российской академии наук.
        Думаю их уровень значительно выше, чтобы наше мнение что-либо значило.
        Я лишь показал неоднозначность ОРФОвских рекомендаций и не более того.

      • Lecron:

        Роль шире задачи. Фильтр на объективе, может выполнять защитную роль — обеспечивать защиту от повреждения, от пыли и влаги (2 задачи), роль непосредственно оптического фильтра — режет ультрафиолет и окрашивает световой поток (2 задачи) и статусную роль — с таким фильтром ходят только лохи (1 задача).

        • Правильно: Фильтр на объективе, может выполнять защитную функцию.

          Роль — это образ.
          Функция — это работа производимая чем либо.
          Задача — этовопрос, проблема требующая решения.

          И так далее.

        • Фильтр на объективе, может выполнять защитную роль — обеспечивать защиту от повреждения, от пыли и влаги.

          Ошибка: роль не может обеспечивать. Это услуга, функция и так далее.

          Роль непосредственно оптического фильтра — режет ультрафиолет и окрашивает световой поток.

          Ошибка: роль не может резать, как и фильтр, он отсекает, фильтрует, суммирует, поляризует, сокращает в конце концов. Следовательно у фильтра есть задача, которую надо выполнить, решить.

          статусную роль — с таким фильтром ходтят только лохи

          «Статусная роль» возможна, если дается от рождения, потому что не противоречит создаваемому образу.

          • Lecron:

            Возможно был некорректный пример. Вот еще — Роли сервера
            Каждая роль подразумевает выполнение некоторых функций, реализующих определенные пользовательсвие задачи. При этом сервер может выполнять несколько ролей.

            Однако я не понимаю причины спора.
            Есть два источника, уровень компетентности которых превышает наш. Следовательно сравнить их между собой, определить кто из них компетентней, мы не можем. Следовательно любое из их утверждений потенциально ошибочно, без возможности доказать иное. А наш диалог, не более чем беседа о субъективности, отражающая сугубо личное мнение. Ну нравится вам считать, что фраза «выполняет роль» нарушает лексическую сочетаемость, я же не против, пишите как хотите (я вообще к грамарнаци не отношусь), просто не утверждайте ошибочность иного.

            • По сути, если у сервера есть роль файлового менеджера, то вполне нормально сказать: сервер исполняет или играет роль «файлового менеджера». И это наверно правильно в смысле создаваемого образа, потому что сервер может играть и другие роли.

              Может ли роль быть технической задачей? хм… Честно говоря, никогда не думал. Нужно время, чтобы это как то осознать, прочувствовать на языке.

              • Lecron:

                Я еще вижу различия между «выполняю» и «исполняю». В независимости от приложения этих слов. Первое характеризует общую направленность с некоторой неопределнностью, втрое более конкретно.
                А роль, это совокупность задач или функции, в количестве более одного, определенных общей направленностью.
                Например: Выполняя роль мастера на все руки, исполняю танец живота. Или, выполняя роль охранника, в данный момент исполняю задачи вышибалы, то есть вышвыриваю вас вон.
                На «исполняю» не получится заменить.

                Хотя может и наоборот. Роль, как образ, которому свойствены некоторые действия. Известный боксер, шикарно исполнил роль вышибалы, приведя заведение в состяние полного безлюдья.
                Уже на «выполняю» не получится заменить.

                Русский язык — такой русский язык. Конечно все можно перефразировать, но если в предложениях не менять ничего, кроме слов «исполняю» и «выполняю», сказанное будет верно, и звучать красиво и согласованно.
                Опять же, это мои личные отношения со словами и понятиями, далекое от академической точности.

  2. RAF:

    В отпуске разговаривал с учительницей русского на пенсии. Она уже не работает, но рассказала историю что волгоградские школьники из её бывшей школы успешно (!) сдали экзамены в местный университет и прошли по баллам в лидерах. При проверке документов в университете у них возникли проблемы из-за того, что в их школьных аттестатах было на написано что им выдан «аттестат о средним оброзовании». Капризный университет признал такие аттестаты недействительными (!) и кандидатам необходимо будет менять аттестаты, а пока надо срочно привести справки. Какие формалисты, явно перегнули! Нашли к чему придраться! Какое «оброзование» — такие же и должны быть аттестаты! Вон — в белорусском языке — как слышится — так и пишется — «малако». Просто, понятно и невозможно ошибиться!

    • Боюсь, это не более чем шутка, так как корочки напечатаны в типографии и там уже впечатано: «Аттестат о среднем (полном) общем образовании», далее номер, Выдан: и далее от руки – кому.



Вы можете прислать нам новости или сообщить что-то очень важное заполнив форму.