Лицензионное соглашение об использовании научных материалов.
|
ПРОГРАММНЫЕ СРЕДСТВА ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
|
Рубайло Андрей Валерьевич
Челябинский государственный университет
Косенко Максим Юрьевич
Челябинский государственный университет
|
Дата поступления рукописи в редакцию:
17 января 2017
г.
|
Аннотация.
В статье рассмотрены существующие инструменты, предназначенные для извлечения именованных сущностей из текстов на естественном языке. Проведено сравнение рассматриваемых инструментов с целью выявления наиболее подходящего из них для решения задачи извлечения именованных сущностей из неразмеченных русскоязычных текстов. Обоснована практическая эффективность Томита-парсера для решения задач по извлечению именованных сущностей из неразмеченных русскоязычных текстов.
|
Ключевые слова и фразы:
извлечение именованных сущностей
обработка текста
обработка информации
автоматизация
Томита-парсер
Named Entity Recognition
GATE
PullEnti SDK
Eureka Engine
extraction of named entities
word processing
data processing
automation
Tomita-parser
|
|
Открыть
полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
|
|
Список литературы:
- Томита-парсер. Руководство разработчика [Электронный ресурс]. URL: https://tech.yandex.ru/tomita/doc/dg/concept/ about-docpage/ (дата обращения: 01.12.2016).
- Cunningham H., Maynard D., Tablan V. JAPE: a Java Annotation Patterns Engine. Second edition. Sheffield, 2000. 30 p.
- Eureka Engine [Электронный ресурс]. URL: http://eurekaengine.ru (дата обращения: 01.12.2016).
- General Architecture for Text Engineering [Электронный ресурс]. URL: http://www.gate.ac.uk/ (дата обращения: 05.12.2016).
- Hilbert M. The World’s Technological Capacity to Store, Communicate, and Compute Information // Science. 2011. Vol. 332. Iss. 6025. P. 60-65.
- PullEnti [Электронный ресурс]. URL: www.pullenti.ru (дата обращения: 04.12.2016).
- Tomita M. LR Parsers for Natural Languages // COLING: 10th International Conference on Computational Linguistics: Proceedings of COLING 84. California, 1984. P. 354-357.
- White paper: Cisco VNI Forecast and Methodology, 2015-2020 [Электронный ресурс]. URL: http://www.cisco. com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/complete-white-paper-c11-481360.html (дата обращения: 30.11.2016).
|