Издательство ГРАМОТА - публикация научных статей в периодических изданиях
Pan-Art (входит в перечень ВАК)Педагогика. Вопросы теории и практики (входит в перечень ВАК)Филологические науки. Вопросы теории и практики (входит в перечень ВАК)Манускрипт (входит в перечень ВАК)

Архив научных статей

ИСТОЧНИК:    Филологические науки. Вопросы теории и практики (входит в перечень ВАК). Тамбов: Грамота, 2024. № 1. С. 132-138.
РАЗДЕЛ:    Филологические науки
Порядок опубликования статей | Показать содержание номера | Показать все статьи раздела | Предметный указатель

Лицензионное соглашение об использовании научных материалов.

https://doi.org/10.30853/phil20240020

Алгоритмы поиска фразеологизмов в лингвистическом корпусе с морфологической разметкой (индоевропейские языки)

Горожанов Алексей Иванович
Московский государственный лингвистический университет


Дата поступления рукописи в редакцию: 09.12.2023
Аннотация. Цель настоящего прикладного исследования – построить алгоритмы поиска фразеологизмов, совместимые с разработанной нами ранее моделью лингвистического корпуса с морфологической разметкой по правилам NLP-библиотеки spaCy. Научная новизна обусловлена тем, что впервые в русле корпусного подхода предлагается набор универсальных способов поиска фразеологизмов с минимальной долей ручного труда и с применением элементов сквозных цифровых технологий. В ходе исследования были описаны технические параметры подлежащих поиску фразеологизмов; изучены возможности авторского корпусного менеджера в рамках ручного и специального ручного запросов; разработаны и апробированы на материале репрезентативного корпуса текстов немецкоязычных СМИ два алгоритма для двухступенчатого поиска отдельных фразеологических единиц и их групп; приведены развернутые примеры результатов поисковых запросов. В результате доказывается состоятельность разработанных алгоритмов, экспериментально устанавливается, что погрешность при поиске лежит в допустимом диапазоне 0-14,8%.
Ключевые слова и фразы: корпусная лингвистика, корпусный менеджер, обработка естественного языка, фразеология, немецкий язык, corpus linguistics, corpus manager, natural language processing, phraseology, German language
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
  1. Бирюков А. А., Терещенко И. А. Перспективы применения технологии обработки естественного языка в рамках цифровой трансформации экономики РФ и построения цифрового общества // Информационное общество. 2023. № 2.
  2. Богуславская И. В. Предикатные конструкции с дистантным расположением компонентов: структура и семантика глагольно-именных предикативных сочетаний в немецком языке: автореф. дисс. … к. филол. н. СПб., 1997.
  3. Виноградов В. В. Об основных типах фразеологических единиц в русском языке // Виноградов В. В. Избранные труды. Лексикология и лексикография. М.: Наука, 1977.
  4. Голубкова Е. Е., Бухарова А. А. Загадки конструкции XYZ(W): корпусный подход // От слова к дискурсу: взаимодействие форм и (не)предсказуемость смыслов: тез. междунар. науч. конференции (г. Минск, 12-13 мая 2023 г.) / Минский государственный лингвистический университет. Мн.: МГЛУ, 2023.
  5. Гусейнова И. А. Актуальные вопросы современной немецкой лексикологии и фразеологии: учеб. пособие для студентов бакалавриата, обучающихся по направлению подготовки 45.03.02 Лингвистика. Казань: Бук, 2023.
  6. Давыдова М. А. Фразеологические единицы в теории и практике обучения РКИ на продвинутом этапе: узус и окказиональное употребление // Вестник Московского университета. Серия 19: Лингвистика и межкультурная коммуникация. 2023. № 4.
  7. Киселева Л. А. Натурморфные образы в славянской и тюркской эмотивной фразеологии: параллели и контрасты // Вестник Волгоградского государственного университета. Серия 2: Языкознание. 2023. Т. 22. № 1.
  8. Кротова Е. Б. Фразеологизмы-конструкции в корпусе: особенности поиска и анализа выдачи (на материале немецкого языка) // Лингвистика и методика преподавания иностранных языков. 2022. № 2 (17). https://doi.org/10.37892/2218-1393-2022-17-2-76-90
  9. Нефедова Л. А. Гендерно инклюзивная фразеология современного немецкого языка: симметрия фразеологизмов в свете гендера. М.: МПГУ, 2023.
  10. Никитина Т. Г. Библейские образы в устойчивых сравнениях славян: типы межъязыковых соответствий и их словарная репрезентация // Русин. 2023. № 71.
  11. Парина И. С. Применение корпусов параллельных текстов для исследования немецкой фразеологии в сопоставительном аспекте // Русская германистика: ежегодник Российского союза германистов (г. Коломна, 28-30 ноября 2019 г.) / Нижегородский государственный лингвистический университет им. Н. А. Добролюбова, Российский союз германистов. Коломна: ФЛИНТА, 2020. Т. XVII.
  12. Соколова Т. С., Старикова Г. Н. Фразеологические единицы с названиями времен суток и их производными как реализация номинативно-деривационного потенциала исходных слов // Вестник Томского государственного университета. Филология. 2023. № 82. https://doi.org/10.17223/19986645/82/8
  13. Титова О. В. Лексика, связанная с жилищем, во фразеологизмах и паремиях удмуртского языка // Вестник угроведения. 2023. Т. 13. № 2. https://doi.org/10.30624/2220-4156-2023-13-2-293-301
  14. Шанский Н. М. Фразеология современного русского языка. М.: ЛИБРОКОМ, 2012.
  15. Юсипова Д. Б. Корпусный подход к исследованию фразеологии: анализ фразеологизмов семантического поля Пространство // Вестник Московского государственного областного университета. Серия: Лингвистика. 2022. № 3-1. https://doi.org/10.18384/2310-712X-2022-3-38-45

Порядок опубликования статей | Показать содержание номера | Показать все статьи раздела | Предметный указатель

© 2006-2024 Издательство ГРАМОТА

разработка и создание сайта, поисковая оптимизация: krav.ru