Лицензионное соглашение об использовании научных материалов.
|
|
Геоинформационный веб-ресурс «Диалектный корпус бурятского языка»
|
Ринчинов Олег Сергеевич
Федеральное государственное бюджетное учреждение науки «Институт монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук» (ИМБТ СО РАН), г. Улан-Удэ
Абаева Юлия Догоржаповна
Федеральное государственное бюджетное учреждение науки «Институт монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук» (ИМБТ СО РАН), г. Улан-Удэ
|
Дата поступления рукописи в редакцию:
31 января 2023
г.
|
Аннотация.
Цель исследования - обеспечить открытый доступ к структурированным и аннотированным звуковым данным диалектного корпуса бурятского языка. Представление корпуса в Сети было решено выполнить в виде геоинформационной системы с привязкой данных к цифровой карте, так как при классификации бурятских диалектов территориальный принцип играет одну из ведущих ролей. Первоначально была составлена программа речевого корпуса и получены звукозаписи в исполнении дикторов - носителей диалектов. Записанный материал был подвергнут сегментации и аннотированию в программе ELAN. Следующим шагом была разработка программы, позволяющей перенести данные из файлов форматов ELAN в реляционную базу данных. Для представления данных в Интернете было разработано веб-приложение в виде интерактивной цифровой карты на основе Google Maps Platform. В результате был создан веб-ресурс, который предоставляет пользователям доступ к звуковым диалектным данным, представленным в аннотированном и структурированном виде и отображаемым по географическому принципу. Научная новизна заключается во вводе в научный и публичный оборот материалов принципиально нового вида, позволяющих получить информацию о современном звучании бурятских диалектов, а также проводить исследования современной бурятской диалектной речи.
|
Ключевые слова и фразы:
звуковой корпус
бурятский язык
диалект
аннотирование
геоинформационная система
sound corpus
Buryat language
dialect
annotation
geoinformation system
|
|
Открыть
полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
|
|
Список литературы:
- Бондарко Л. В., Скрелин П. А., Вольская Н. Б., Шерстинова Т. Ю. Электронные звуковые коллекции в Интернет // Электронные библиотеки. 2000. Т. 3. № 1.
- Бураев И. Д. Проблемы классификации бурятских диалектов // Проблемы бурятской диалектологии: сб. ст. Улан-Удэ: Изд-во Бурятского научного центра Сибирского отделения Российской академии наук, 1996.
- Ватлина Т. В., Лунькова Е. С. Пространственный анализ диалектного словообразовательного типа, функционирующего на территории Смоленской области // ИнтерКарто. ИнтерГИС. 2015. Т. 21.
- Владимиров В. Н. История и география: пути взаимодействия // Вестник Новосибирского государственного университета. Серия «История, филология». 2005. Т. 4. Вып. 2. История.
- Дырхеева Г. А. Литературный бурятский язык: история и проблематика // Вестник Бурятского научного центра Сибирского отделения Российской академии наук. 2014. № 1 (13).
- Жданова Е. А., Белых А. А. Географические информационные системы в лингвистических исследованиях // Интеллектуальные системы в производстве. 2014. № 2 (24).
- Кривнова О. Ф., Смирнова О. С. Интроспективная просодическая разметка письменного текста и его реальное озвучивание (сравнительный анализ на материале коллекции текстов Р. И. Аванесова) // Компьютерная лингвистика и интеллектуальные технологии: по мат. ежегод. междунар. конф. «Диалог» (г. Москва, 29 мая - 1 июня 2019 г.). М., 2019. Вып. 18 (25).
- Рассадин В. И. Присаянская группа бурятских говоров. Улан-Удэ: Изд-во Бурятского научного центра Сибирского отделения Российской академии наук, 1996.
- Рассказы о сновидениях: корпусное исследование устного русского дискурса / под ред. А. А. Кибрика и В. И. Подлесской. М.: Языки славянских культур, 2009.
- Функциональные требования к авторитетным данным: концептуальная модель: заключительный отчет, декабрь 2008 / под ред. Г. Е. Патона; пер. с англ. О. А. Лаврёновой. СПб.: Российская национальная библиотека, 2011.
- Andriyanets V., Daniel M., Pakendorf B. Discovering Dialectal Differences Based on Oral Corpora // Компьютерная лингвистика и интеллектуальные технологии: по мат. ежегод. междунар. конф. «Диалог» (г. Москва, 30 мая - 2 июня 2018 г.) / под общ. ред.: В. Селегей, И. М. Кобозева, Т. Е. Янко, И. Богуславский, Л. Л. Иомдин, М. А. Кронгауз, А. Ч. Пиперски. М.: Российский государственный гуманитарный университет, 2018. Вып. 17 (24).
- Kachkovskaya T. V., Kocharov D. A., Skrelin P. A., Volskaya N. B. CoRuSS - a New Prosodically Annotated Corpus of Russian Spontaneous Speech // Proceedings of the Tenth Conference on International Language Resources and Evaluation (LREC’16) (Portorož, May 23-28, 2016). Portorož: European Language Resources Association, 2016.
- Pennington R. Producing Time-Aligned Interlinear Texts: Towards a SayMore-FLEx-ELAN Workflow. 2014. URL: https://www.academia.edu/6474779/Producing_time_aligned_interlinear_texts_Towards_a_SayMore_FLEx_ELAN_workflow
- Wittenburg P., Brugman H., Russel A., Klassmann A., Sloetjes H. ELAN: A Professional Framework for Multimodality Research // Proceedings of LREC 2006, Fifth International Conference on Language Resources and Evaluation. 2006. URL: http://www.lrec-conf.org/proceedings/lrec2006/pdf/153_pdf.pdf
|
|