ПРОГРАММНЫЕ СРЕДСТВА ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
Рубайло Андрей Валерьевич, Косенко Максим Юрьевич Челябинский государственный университет
Аннотация. В статье рассмотрены существующие инструменты, предназначенные для извлечения именованных сущностей из текстов на естественном языке. Проведено сравнение рассматриваемых инструментов с целью выявления наиболее подходящего из них для решения задачи извлечения именованных сущностей из неразмеченных русскоязычных текстов. Обоснована практическая эффективность Томита-парсера для решения задач по извлечению именованных сущностей из неразмеченных русскоязычных текстов.
Ключевые слова и фразы: извлечение именованных сущностей, обработка текста, обработка информации, автоматизация, Томита-парсер, Named Entity Recognition, GATE, PullEnti SDK, Eureka Engine, extraction of named entities, word processing, data processing, automation, Tomita-parser, Named Entity Recognition, GATE, PullEnti SDK, Eureka Engine.
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Tomita M. LR Parsers for Natural Languages // COLING: 10th International Conference on Computational Linguistics: Proceedings of COLING 84. California, 1984. P. 354-357.
White paper: Cisco VNI Forecast and Methodology, 2015-2020 [Электронный ресурс]. URL: http://www.cisco. com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/complete-white-paper-c11-481360.html (дата обращения: 30.11.2016).