• Научная статья
  • 31 января 2023
  • Открытый доступ

Геоинформационный веб-ресурс «Диалектный корпус бурятского языка»

Аннотация

Цель исследования - обеспечить открытый доступ к структурированным и аннотированным звуковым данным диалектного корпуса бурятского языка. Представление корпуса в Сети было решено выполнить в виде геоинформационной системы с привязкой данных к цифровой карте, так как при классификации бурятских диалектов территориальный принцип играет одну из ведущих ролей. Первоначально была составлена программа речевого корпуса и получены звукозаписи в исполнении дикторов - носителей диалектов. Записанный материал был подвергнут сегментации и аннотированию в программе ELAN. Следующим шагом была разработка программы, позволяющей перенести данные из файлов форматов ELAN в реляционную базу данных. Для представления данных в Интернете было разработано веб-приложение в виде интерактивной цифровой карты на основе Google Maps Platform. В результате был создан веб-ресурс, который предоставляет пользователям доступ к звуковым диалектным данным, представленным в аннотированном и структурированном виде и отображаемым по географическому принципу. Научная новизна заключается во вводе в научный и публичный оборот материалов принципиально нового вида, позволяющих получить информацию о современном звучании бурятских диалектов, а также проводить исследования современной бурятской диалектной речи.

Источники

  1. Бондарко Л. В., Скрелин П. А., Вольская Н. Б., Шерстинова Т. Ю. Электронные звуковые коллекции в Интернет // Электронные библиотеки. 2000. Т. 3. № 1.
  2. Бураев И. Д. Проблемы классификации бурятских диалектов // Проблемы бурятской диалектологии: сб. ст. Улан-Удэ: Изд-во Бурятского научного центра Сибирского отделения Российской академии наук, 1996.
  3. Ватлина Т. В., Лунькова Е. С. Пространственный анализ диалектного словообразовательного типа, функционирующего на территории Смоленской области // ИнтерКарто. ИнтерГИС. 2015. Т. 21.
  4. Владимиров В. Н. История и география: пути взаимодействия // Вестник Новосибирского государственного университета. Серия «История, филология». 2005. Т. 4. Вып. 2. История.
  5. Дырхеева Г. А. Литературный бурятский язык: история и проблематика // Вестник Бурятского научного центра Сибирского отделения Российской академии наук. 2014. № 1 (13).
  6. Жданова Е. А., Белых А. А. Географические информационные системы в лингвистических исследованиях // Интеллектуальные системы в производстве. 2014. № 2 (24).
  7. Кривнова О. Ф., Смирнова О. С. Интроспективная просодическая разметка письменного текста и его реальное озвучивание (сравнительный анализ на материале коллекции текстов Р. И. Аванесова) // Компьютерная лингвистика и интеллектуальные технологии: по мат. ежегод. междунар. конф. «Диалог» (г. Москва, 29 мая - 1 июня 2019 г.). М., 2019. Вып. 18 (25).
  8. Рассадин В. И. Присаянская группа бурятских говоров. Улан-Удэ: Изд-во Бурятского научного центра Сибирского отделения Российской академии наук, 1996.
  9. Рассказы о сновидениях: корпусное исследование устного русского дискурса / под ред. А. А. Кибрика и В. И. Подлесской. М.: Языки славянских культур, 2009.
  10. Функциональные требования к авторитетным данным: концептуальная модель: заключительный отчет, декабрь 2008 / под ред. Г. Е. Патона; пер. с англ. О. А. Лаврёновой. СПб.: Российская национальная библиотека, 2011.
  11. Andriyanets V., Daniel M., Pakendorf B. Discovering Dialectal Differences Based on Oral Corpora // Компьютерная лингвистика и интеллектуальные технологии: по мат. ежегод. междунар. конф. «Диалог» (г. Москва, 30 мая - 2 июня 2018 г.) / под общ. ред.: В. Селегей, И. М. Кобозева, Т. Е. Янко, И. Богуславский, Л. Л. Иомдин, М. А. Кронгауз, А. Ч. Пиперски. М.: Российский государственный гуманитарный университет, 2018. Вып. 17 (24).
  12. Kachkovskaya T. V., Kocharov D. A., Skrelin P. A., Volskaya N. B. CoRuSS - a New Prosodically Annotated Corpus of Russian Spontaneous Speech // Proceedings of the Tenth Conference on International Language Resources and Evaluation (LREC’16) (Portorož, May 23-28, 2016). Portorož: European Language Resources Association, 2016.
  13. Pennington R. Producing Time-Aligned Interlinear Texts: Towards a SayMore-FLEx-ELAN Workflow. 2014. URL: https://www.academia.edu/6474779/Producing_time_aligned_interlinear_texts_Towards_a_SayMore_FLEx_ELAN_workflow
  14. Wittenburg P., Brugman H., Russel A., Klassmann A., Sloetjes H. ELAN: A Professional Framework for Multimodality Research // Proceedings of LREC 2006, Fifth International Conference on Language Resources and Evaluation. 2006. URL: http://www.lrec-conf.org/proceedings/lrec2006/pdf/153_pdf.pdf

Финансирование

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 20-012-00491.

Информация об авторах

Ринчинов Олег Сергеевич

д. ист. н.

Федеральное государственное бюджетное учреждение науки «Институт монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук» (ИМБТ СО РАН), г. Улан-Удэ

Абаева Юлия Догоржаповна

к. филол. н.

Федеральное государственное бюджетное учреждение науки «Институт монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук» (ИМБТ СО РАН), г. Улан-Удэ

Информация о статье

История публикации

  • Поступила в редакцию: 12 декабря 2022.
  • Опубликована: 31 января 2023.

Ключевые слова

  • звуковой корпус
  • бурятский язык
  • диалект
  • аннотирование
  • геоинформационная система
  • sound corpus
  • Buryat language
  • dialect
  • annotation
  • geoinformation system

Copyright

© 2023 Автор(ы)
© 2023 ООО Издательство «Грамота»

Лицензионное соглашение

Creative Commons Attribution 4.0 International (CC BY 4.0)