Лицензионное соглашение об использовании научных материалов.
|
АПРИОРНАЯ ИНФОРМАЦИЯ КАК СПОСОБ РАЗРЕШЕНИЯ ОНТОЛОГИЧЕСКОЙ И ЯЗЫКОВОЙ ОМОНИМИИ
|
Антонов Егор Сергеевич
Московский государственный университет им. М. В. Ломоносова
|
Дата поступления рукописи в редакцию:
16 октября 2012
г.
|
Аннотация.
В статье рассматривается целесообразность использования априорной информации для разрешения языковой и онтологической омонимии именованных сущностей. На материале размеченного корпуса из 1700 англо-язычных новостных статей опробована стратегия выбора наиболее вероятного объекта с двумя настраиваемыми параметрами (минимальная вероятность соответствия, минимальное количество упоминаний в корпусе). Подобная стратегия позволяет достигнуть большой точности разрешения омонимии, однако ее применение не имеет смысла при большом количестве объектов онтологии из-за низкой полноты.
|
Ключевые слова и фразы:
распознавание именованных сущностей
разрешение омонимии именованных сущностей
онтология
априорная информация
географические объекты
новостные тексты
named entities recognition
disambiguation of named entities homonymy
ontology
a priory information
geographic objects
news texts
|
|
Открыть
полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
|
|
Список литературы:
- Антонов Е. С. Как найти миллион // RSDN Magazine. СПб.: K-Press, 2011. № 1. С. 60-68.
- Cucerzan S. Large Scale Named Entity Disambiguation Based on Wikipedia Data // Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Stroudsburg, PA: Association for Computational Linguistics, 2007. P. 708-716.
- Fader A., Soderland S., Etzioni O. Scaling Wikipedia-Based Named Entity Disambiguation to Arbitrary Web Text // Proceedings of the WikiAI 09 - IJCAI Workshop: User Contributed Knowledge and Artificial Intelligence: an Evolving Synergy. Pasadena, CA: IJCAI Organization, 2009. P. 21-28.
- Hoffart J., Yosef M. A., Bordino I., Fürstenau H., Pinkal M., Spaniol M., Taneva B., Thater S., Weikum G. Robust Disambiguation of Named Entities in Text // Proceedings of Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2011. P. 782-792.
- http://wiki.freebase.com/wiki/Main_Page
- http://www.wikipedia.org
|
|