Издательство ГРАМОТА - публикация научных статей в периодических изданиях
Pan-Art (входит в перечень ВАК)Педагогика. Вопросы теории и практики (входит в перечень ВАК)Филологические науки. Вопросы теории и практики (входит в перечень ВАК)Манускрипт (входит в перечень ВАК)

Архив научных статей

ИСТОЧНИК:    Филологические науки. Вопросы теории и практики (входит в перечень ВАК). Тамбов: Грамота, 2015. № 12. Ч. 2. С. 84-89.
РАЗДЕЛ:    Филологические науки
Порядок опубликования статей | Показать содержание номера | Показать все статьи раздела | Предметный указатель

Лицензионное соглашение об использовании научных материалов.

СПОСОБЫ ОПРЕДЕЛЕНИЯ ЯЗЫКА ТЕКСТА

Калегин Сергей Николаевич
Московский научно-исследовательский телевизионный институт


Аннотация. Цель данной статьи - представить современное состояние проблемы идентификации языка текста в виде обзора известных способов её решения с указанием их преимуществ и недостатков. Большинство этих способов могут использоваться как с применением компьютеров (машинной обработки), так и без них. Предлагаемый обзор наглядно показывает сильные и слабые стороны каждого метода с указанием условий его использования. Кроме того, в работе сделан акцент на математические способы определения языковой принадлежности текста. В завершении статьи автор предлагает свой вариант языковой идентификации текста.
Ключевые слова и фразы: способ определения языка, языковая идентификация текста, машинная обработка текста, определение языковой группы текста, языковая принадлежность текста, way of language identification, linguistic identification of the text, machine processing of the text, identification of linguistic group of the text, linguistic belonging of the text
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
  1. Анисимович К. В., Терещенко В. В., Рыбкин В. Ю., Аби Софтвер. Способ автоматического определения языка распознаваемого текста при многоязычном распознавании: патент № 2251737 РФ, G06K9/68 / Лтд. (CY). Опубл. 10.05.2005.
  2. Лапшин В. А., Пшехотская Е. А., Перов Д. В. Способ автоматизированного определения языка и (или) кодировки текстового документа: патент № 2500024 РФ, G06F17/00 / "Центр Инноваций Натальи Касперской" (RU). Опубл. 27.11.2013.
  3. Селезнев К. Обработка текстов на естественном языке [Электронный ресурс] // Открытые системы. 2003. № 12. URL: http://www.osp.ru/os/2003/12/183694/ (дата обращения: 31.10.2015).
  4. Al-Karmi, Abdel Naser, Shamsher S., Baldev Singh. Optical character recognition of handwritten or cursive text in multiple languages (Оптическое распознавание символов рукописного или курсивного многоязычного текста): патент № 6370269 США / International Business Machines Corporation (USA). Опубл. 09.04.2002.

Порядок опубликования статей | Показать содержание номера | Показать все статьи раздела | Предметный указатель

© 2006-2024 Издательство ГРАМОТА

разработка и создание сайта, поисковая оптимизация: krav.ru