• Научная статья
  • 28 декабря 2021
  • Открытый доступ

Выявление ключевых слов тематического поля «Образование/Education»

Аннотация

Цель исследования - определить состав и особенности ключевой лексики тематического поля «Образование/Education» для русского и английского языков. В статье описываются этапы автоматизированного сбора корпуса новостных статей с сайтов образовательных онлайн-порталов “EDU-Inform” и “Education Today Magazine”. Значительное внимание уделяется лингвистическому анализу выявленной ключевой лексики. Научная новизна исследования заключается в междисциплинарном рассмотрении вопроса изучения ключевых слов и использовании инструментов компьютерного программирования для автоматической обработки текстов на естественном языке. В результате исследования была представлена визуализация тематического поля «Образование/Education» в формате облака слов для русского и английского языков.

Источники

  1. Арнольд И. В. Семантическая структура слова в современном английском языке и методика ее исследования. Л.: Просвещение, 1966.
  2. Ахманова О. С. Очерки по общей и русской лексикологии. М.: Государственное учебно-педагогическое Издательство Министерства Просвещения РСФСР, 1957.
  3. Глобина Л. В. Лексико-семантическое поле партитивной лексики в современном русском языке: автореф. дисс. … к. филол. н. Воронеж, 1995.
  4. Лысякова М. В. Лексико-семантические парадигмы: лингвистический статус, критерии разграничения // Russian Journal of Linguistics. 2005. № 7.
  5. Филин Ф. П. О лексико-семантических группах слов // Езиковедскиі изъследования в чест на академик Стефан Младенов. София: Бьлг. акад. на науките, 1967.
  6. Anandarajan M., Hill C., Nolan T. Practical Text Analytics. Maximizing the Value of Text Data. Advances in Analytics and Data Science. Springer Nature Switzerland, Cham, 2019.
  7. Grootendorst M. Keybert: Minimal keyword extraction with bert. 2020. URL: https://github.com/MaartenGr/KeyBERT
  8. Kaser O., Lemire D. Tag-cloud drawing: Algorithms for cloud visualization // Proceedings of the World Wide Web Workshop on Tagging and Metadata for Social Information Organization. Coleman, 2007.

Информация об авторах

Башмакова Анастасия Юрьевна

Тюменский государственный университет

Информация о статье

История публикации

  • Поступила в редакцию: 26 октября 2021.
  • Опубликована: 28 декабря 2021.

Ключевые слова

  • компьютерная лингвистика
  • извлечение ключевых слов
  • образование
  • облако слов
  • computational linguistics
  • keyword extraction
  • education
  • BERT
  • word cloud

Copyright

© 2021 Автор(ы)
© 2021 ООО Издательство «Грамота»

Лицензионное соглашение

Creative Commons Attribution 4.0 International (CC BY 4.0)