Выявление ключевых слов тематического поля «Образование/Education»
Аннотация
Цель исследования - определить состав и особенности ключевой лексики тематического поля «Образование/Education» для русского и английского языков. В статье описываются этапы автоматизированного сбора корпуса новостных статей с сайтов образовательных онлайн-порталов “EDU-Inform” и “Education Today Magazine”. Значительное внимание уделяется лингвистическому анализу выявленной ключевой лексики. Научная новизна исследования заключается в междисциплинарном рассмотрении вопроса изучения ключевых слов и использовании инструментов компьютерного программирования для автоматической обработки текстов на естественном языке. В результате исследования была представлена визуализация тематического поля «Образование/Education» в формате облака слов для русского и английского языков.
Источники
- Арнольд И. В. Семантическая структура слова в современном английском языке и методика ее исследования. Л.: Просвещение, 1966.
- Ахманова О. С. Очерки по общей и русской лексикологии. М.: Государственное учебно-педагогическое Издательство Министерства Просвещения РСФСР, 1957.
- Глобина Л. В. Лексико-семантическое поле партитивной лексики в современном русском языке: автореф. дисс. … к. филол. н. Воронеж, 1995.
- Лысякова М. В. Лексико-семантические парадигмы: лингвистический статус, критерии разграничения // Russian Journal of Linguistics. 2005. № 7.
- Филин Ф. П. О лексико-семантических группах слов // Езиковедскиі изъследования в чест на академик Стефан Младенов. София: Бьлг. акад. на науките, 1967.
- Anandarajan M., Hill C., Nolan T. Practical Text Analytics. Maximizing the Value of Text Data. Advances in Analytics and Data Science. Springer Nature Switzerland, Cham, 2019.
- Grootendorst M. Keybert: Minimal keyword extraction with bert. 2020. URL: https://github.com/MaartenGr/KeyBERT
- Kaser O., Lemire D. Tag-cloud drawing: Algorithms for cloud visualization // Proceedings of the World Wide Web Workshop on Tagging and Metadata for Social Information Organization. Coleman, 2007.
Информация об авторах
Информация о статье
История публикации
- Поступила в редакцию: 26 октября 2021.
- Опубликована: 28 декабря 2021.
Ключевые слова
- компьютерная лингвистика
- извлечение ключевых слов
- образование
- облако слов
- computational linguistics
- keyword extraction
- education
- BERT
- word cloud
Copyright
© 2021 Автор(ы)
© 2021 ООО Издательство «Грамота»