Pan-Art Педагогика. Вопросы теории и практики Филологические науки. Вопросы теории и практики Манускрипт

Архив научных статей

ВЫПУСК:    Альманах современной науки и образования. 2016. Выпуск 12
КОЛЛЕКЦИЯ:    Технические науки

Все выпуски

Лицензионное соглашение об использовании научных материалов.

ПРОГРАММНЫЕ СРЕДСТВА ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ

Рубайло Андрей Валерьевич
Челябинский государственный университет

Косенко Максим Юрьевич
Челябинский государственный университет


Дата поступления рукописи в редакцию: 17 января 2017 г.
Аннотация. В статье рассмотрены существующие инструменты, предназначенные для извлечения именованных сущностей из текстов на естественном языке. Проведено сравнение рассматриваемых инструментов с целью выявления наиболее подходящего из них для решения задачи извлечения именованных сущностей из неразмеченных русскоязычных текстов. Обоснована практическая эффективность Томита-парсера для решения задач по извлечению именованных сущностей из неразмеченных русскоязычных текстов.
Ключевые слова и фразы:
извлечение именованных сущностей
обработка текста
обработка информации
автоматизация
Томита-парсер
Named Entity Recognition
GATE
PullEnti SDK
Eureka Engine
extraction of named entities
word processing
data processing
automation
Tomita-parser
Reader Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
  1. Томита-парсер. Руководство разработчика [Электронный ресурс]. URL: https://tech.yandex.ru/tomita/doc/dg/concept/ about-docpage/ (дата обращения: 01.12.2016).
  2. Cunningham H., Maynard D., Tablan V. JAPE: a Java Annotation Patterns Engine. Second edition. Sheffield, 2000. 30 p.
  3. Eureka Engine [Электронный ресурс]. URL: http://eurekaengine.ru (дата обращения: 01.12.2016).
  4. General Architecture for Text Engineering [Электронный ресурс]. URL: http://www.gate.ac.uk/ (дата обращения: 05.12.2016).
  5. Hilbert M. The World’s Technological Capacity to Store, Communicate, and Compute Information // Science. 2011. Vol. 332. Iss. 6025. P. 60-65.
  6. PullEnti [Электронный ресурс]. URL: www.pullenti.ru (дата обращения: 04.12.2016).
  7. Tomita M. LR Parsers for Natural Languages // COLING: 10th International Conference on Computational Linguistics: Proceedings of COLING 84. California, 1984. P. 354-357.
  8. White paper: Cisco VNI Forecast and Methodology, 2015-2020 [Электронный ресурс]. URL: http://www.cisco. com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/complete-white-paper-c11-481360.html (дата обращения: 30.11.2016).
Все выпуски


© 2006-2025 Издательство ГРАМОТА