МЕТОДЫ АВТОМАТИЗИРОВАННОГО СИНТЕЗА ТЕЗАУРУСОВ ПРЕДМЕТНЫХ ОБЛАСТЕЙ НА ОСНОВЕ АНАЛИЗА ТЕКСТОВ
Маркелов Константин Сергеевич, Нейман Андрей Борисович
Московский государственный технический университет радиотехники, электроники и автоматики (МГТУ МИРЭА)
Аннотация.Статья раскрывает понятие тезаурусов предметных областей, а также в ней рассматриваются методы анализа текстов, на основе которых автоматизированно строится словарь - тезаурус любой предметной области. В работе представлена структура алгоритма автоматизированного построения тезауруса, с помощью которой возможна реализация программно-алгоритмического обеспечения.
Ключевые слова и фразы: тезаурус, предметная область, искусственный интеллект, методы анализа текстов, статистический анализ, лингвистический анализ
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
Караулов Ю. Н. Лингвистическое конструирование и тезаурус литературного языка. М.: Наука, 1981. 366 с.
Караулов Ю. Н. Частотный словарь семантических множителей русского языка. М.: Наука, 1980. 207 c.
Филиппович Ю. Н., Прохоров А. В. Семантика информационных технологий: опыты словарно-тезаурусного описания / с предисловием А. И. Новикова. М.: Изд-во МГУП, 2002. 368 с.
Чугреев В. Л. Модель структурного представления текстовой информации и метод её тематического анализа на основе частотно-контекстной классификации: дисс. … к. техн. н. СПб.: ЛЕТИ, 2003. 185 с.
Шрейдер Ю. А. Информация в структурах с отношениями // Исследования по математической лингвистике, математической логике и информационным языкам. М.: Наука, 1972. С. 147-159.