Издательство ГРАМОТА - публикация научных статей в периодических изданиях
Pan-Art (входит в перечень ВАК)Педагогика. Вопросы теории и практики (входит в перечень ВАК)Филологические науки. Вопросы теории и практики (входит в перечень ВАК)Манускрипт

Архив научных статей

ИСТОЧНИК:    Альманах современной науки и образования. Тамбов: Грамота, 2016. № 12. С. 87-92.
РАЗДЕЛ:    Технические науки
Порядок опубликования статей | Показать содержание номера | Показать все статьи раздела | Предметный указатель

Лицензионное соглашение об использовании научных материалов.

ПРОГРАММНЫЕ СРЕДСТВА ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ

Рубайло Андрей Валерьевич, Косенко Максим Юрьевич
Челябинский государственный университет


Аннотация. В статье рассмотрены существующие инструменты, предназначенные для извлечения именованных сущностей из текстов на естественном языке. Проведено сравнение рассматриваемых инструментов с целью выявления наиболее подходящего из них для решения задачи извлечения именованных сущностей из неразмеченных русскоязычных текстов. Обоснована практическая эффективность Томита-парсера для решения задач по извлечению именованных сущностей из неразмеченных русскоязычных текстов.
Ключевые слова и фразы: извлечение именованных сущностей, обработка текста, обработка информации, автоматизация, Томита-парсер, Named Entity Recognition, GATE, PullEnti SDK, Eureka Engine, extraction of named entities, word processing, data processing, automation, Tomita-parser, Named Entity Recognition, GATE, PullEnti SDK, Eureka Engine
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
  1. Томита-парсер. Руководство разработчика [Электронный ресурс]. URL: https://tech.yandex.ru/tomita/doc/dg/concept/ about-docpage/ (дата обращения: 01.12.2016).
  2. Cunningham H., Maynard D., Tablan V. JAPE: a Java Annotation Patterns Engine. Second edition. Sheffield, 2000. 30 p.
  3. Eureka Engine [Электронный ресурс]. URL: http://eurekaengine.ru (дата обращения: 01.12.2016).
  4. General Architecture for Text Engineering [Электронный ресурс]. URL: http://www.gate.ac.uk/ (дата обращения: 05.12.2016).
  5. Hilbert M. The World’s Technological Capacity to Store, Communicate, and Compute Information // Science. 2011. Vol. 332. Iss. 6025. P. 60-65.
  6. PullEnti [Электронный ресурс]. URL: www.pullenti.ru (дата обращения: 04.12.2016).
  7. Tomita M. LR Parsers for Natural Languages // COLING: 10th International Conference on Computational Linguistics: Proceedings of COLING 84. California, 1984. P. 354-357.
  8. White paper: Cisco VNI Forecast and Methodology, 2015-2020 [Электронный ресурс]. URL: http://www.cisco. com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/complete-white-paper-c11-481360.html (дата обращения: 30.11.2016).

Порядок опубликования статей | Показать содержание номера | Показать все статьи раздела | Предметный указатель

© 2006-2024 Издательство ГРАМОТА

разработка и создание сайта, поисковая оптимизация: krav.ru