Информационное письмо
Образец оформления статьи
Анкета автора
18.04.2015

Применение дополнительных знаков при разработке веб-приложений для эвенского языка

Леонтьев Ньургун Анатольевич
Кандидат технических наук, доцент Северо-Восточный федеральный университет им. М.К.Аммосова г. Якутск, Россия
Протопопова Валентина Федоровна
Северо-Восточный федеральный университет им. М.К. Аммосова г. Якутск, Россия
Аннотация: В данной статье исследуется возможность применение дополнительных знаков эвенского языка при разработке веб-приложений. Рассматривается способы подключение шрифтов к веб-приложениям. Исследуется вопрос использования дополнительных диакритических знаков эвенского языка.
Ключевые слова: обработка документов, эвенский язык, веб-документ
Электронная версия
Скачать (494 Kb)

Сохранение культуры и языка коренных малочисленных народов является актуальной задачей в современном мире, использования языка начинает ограничиваться разговорным и письменным жанром, что выводит язык из обращения средствами информационных технологий. Использование новых информационных технологий позволить повысить шансы на сохранения языков малочисленных народов и позволить также более широко использовать в общении.

Эвенский язык является языком эвенов, которые проживают в Республике Саха (Якутия), Магаданской области, Камчатской области, Корякском автономном округе, Чукотском автономной области и в Хабаровском крае. Язык относится к северной группе тунгусо-манчжурских языков, в письменности используются буквы на основе кириллицы, с внедрением национальных знаков для звуков характерных эвенскому языку [1, 2].

Для сохранения языка разрабатывается проект электронного словаря, который позволить более широко внедрить информационные технологии в исследовании языка. В рамках создания электронного он-лайн словаря эвенского языка была исследована возможность применения дополнительных знаков стандарта Unicode, которые не поддерживаются шрифтами установленными по умолчанию.

Программная оболочка была создана авторами на языке PHP с использованием системы использования базы данных MySQL на веб-сервере Apache. База данных MySQL поддерживает кодировку UTF8 и поэтому при хранении данных потерь и преобразований не происходит (необходимо установить кодировку в свойство сравнения utf8_unicode_ci, что показывает на использование в сравнении кириллицы), что очень важно, так как эвенский язык использует расширенную кириллицу и систему дополнительных знаков, которая является неофициальной. Ввод знаков эвенского языка осуществляется через виртуальную веб-клавиатуру эвенского языка [3].

Для отображения знаков эвенского языка необходимо загрузить графическое представление дополнительных знаков. Для этого необходимо загрузить шрифт для поддержки знаков, например с сайта paratype.ru.

На рисунке представлены буквы и дополнительные знаки эвенского языка в стандарте Unicode c сайта компании Paratype. Код знаков написан в шестнадцатеричном виде.

Рис. 1. Буквы и дополнительные знаки эвенского языка

Рис. 1. Буквы и дополнительные знаки эвенского языка

Литературный эвенский язык используют только кириллический алфавит без диакритических знаков, что позволяет использовать кодировку UTF8 и стандарт Unicode для записи эвенского языка. Проблема в использовании двух видов записи, которые распространены в Республике Саха (Якутия) и других областях. Хотя они и являются равнозначными, но для обработки документов необходимо это различие учесть.

В таблице 1 приводится список знаков являющихся равнозначными.

Таблица 1. Список равнозначности символов эвенского языка в разных видах письменности 

 2.png

Загрузка шрифтов с дополнительными знаками производится используя веб-шрифты, в формате .eot (внедряемый OpenType), .svg (масштабируемая векторная графика), .ttf () и woff (Web Open Font Format). Существует проблема поддержки различными браузерами этих форматов, поэтому лучше прописывать в стиле CSS все данные форматы шрифта. Поддержку загружаемых шрифтов осуществляют последние версии веб-браузеров, так что необходимо вовремя обновлять браузеры.

Ниже приводится кроссбраузерный код для внедрения шрифта.

3.png

В зависимости от настроек браузера могут возникнуть проблемы с безопасностью браузеров FireFox и Internet Explorer. Такое предостережение дается в статье по адресу http://www.otlab.ru/web_fonts.html.

Для использования внедренного шрифта надо использовать код для каскадной стилевой таблицы CSS. 

4.png

С сайта Paratype можно загрузить три вида бесплатных шрифтов поддерживающий эвенский язык: PT Sans, PT Serif и PT Mono. Количество коммерческих вариантов шрифтов – более 60 штук. Другие производители также предлагают коммерческие шрифты для использования в веб-пространстве.

Недостатки существующего шрифта - нет графического представления некоторых знаков:

- знак с кодом F49A, F49B в виде перечеркнутой буквы О с чертой наверху (долгая гласная)

- кода F43A, F43B в виде буквы Y с чертой наверху (долгая гласная).

В словаре [4] для обозначения редуцированных гласных используются точка над гласной. Данные диакритические знаки отсутствуют в текущих графических шрифтах. Для вывода текста можно использовать соответствующие графические файлы с дополнительными знаками, но проблема ввода и точности их соответствия остается не решенным.

Сортировка средствами MySQL не позволяет правильно сортировать буквы в алфавитном порядке для эвенского языка. Для правильной сортировке надо разработать файл с правилами сортировки для MySQL.

В целом, поддержка литературного эвенского языка и его знаков осуществляется средствами информационных технологий, в том числе графическим представлением в шрифтах, поддержка диакритических знаков осуществлена не полностью. Для корректной работы необходимо доработать диакритические дополнительные знаки для графических шрифтов.

В дальнейшем планируется наполнение словаря эвенского языка и выставление его в широкий доступ, что послужить для сохранения эвенского языка и его представления в сети Интернет.

Список литературы:

  1. Булатова Н.Я. Язык сахалинских эвенов // СПб, Б.&К., 1995.115 с.
  2. Бурыкин А.А. Русско-эвенский разговорник // Магадан: Книж. изд-во, 1991. -134 с.
  3. Леонтьев Н.А., Протопопова В.Ф. Виртуальная веб-клавиатура эвенского языка на языке Javascript // Перспективы развития информационных технологий, Новосибирск – 2015, №23 - с.23-26
  4. Роббек В.А., Роббек М.Е. Эвенско-русский словарь // Новосибирск: Наука, 2004. -346 с.