Methods of automatic detection and analysis of the discourse of the foreign agent community in the digital environment (a forensic linguistic aspect)
Abstract
The research aims to systematize the thematic parameters of the text corpus of foreign agents, a status assigned by the Ministry of Justice of the Russian Federation, using topic modeling. The article examines methods of automated analysis of online discourse that allow systematizing its key models and identifying patterns of morphosyntactic and lexical organization. Within the framework of the study, using a corpus of more than 2400 posts from the social network “VKontakte”, methods of contextualized topic modeling (BERT) were applied, and more than 60 thematic sets of lemmas were identified. The scientific novelty of the work lies in developing a comprehensive approach to the study of the discourse of the foreign agent community, which combines methods of topic modeling and linguostatistical analysis, as well as in introducing the term “foreign agent community” into linguistic usage. The results of the study showed that the discourse of foreign agents is characterized by a high correlation between parameters such as sentence length and lexical density, which can serve as one of the diagnostic features. In addition, the reactive nature of the studied discourse was confirmed, which is expressed in the synchronization of thematic peaks with external events.
Research materials
- Криминалистика: учебник / под ред. Т. А. Седовой, С. П. Кушниренко, В. Д. Пристанскова. М.: Юстиция, 2019.
- Захаров В. П., Богданова С. Ю. Корпусная лингвистика: учебник. Изд-е 3-е, перераб. СПб.: Изд-во С.-Петерб. ун-та, 2020.
References
- Вайцеховская А. А. Чужая речь в публикациях «Медузы»* // Вестник Волгоградского государственного университета. Серия 9: Исследования молодых ученых. 2022. № 20.
- Грицкевич Ю. Н. Фактор информации в политическом дискурсе // Вестник Псковского государственного университета. Серия: Социально-гуманитарные науки. 2014. № 4.
- Гурова А. С., Малыгина Л. Е., Слышкин Г. Г. Дискурс иноагентов: комизм как способ воздействия на сознание реципиента // Верхневолжский филологический вестник. 2022. № 4 (31).
- Дускаева Л. Р., Иванова Л. Ю. Лингвокреативность в создании паратекста телеграм-канала // Вестник Санкт-Петербургского университета. Язык и литература. 2023. Т. 20. № 1. https://doi.org/10.21638/spbu09.2023.103
- Землянский С. А., Аксёнов С. В., Лызин И. А., Берестнева О. Г. Тематическое моделирование в контексте медицинских текстов // Доклады Томского государственного университета систем управления и радиоэлектроники. 2021. Т. 24. № 4. https://doi.org/10.21293/1818-0442-2021-24-4-58-64
- Золина Г. Д. Языковые и жанровые особенности конфликта текста // Вестник Адыгейского государственного университета. Серия 2: Филология и искусствоведение. 2009. № 4.
- Кирина М. А. Сравнение тематических моделей на основе LDA, STM и NMF для качественного анализа русской художественной прозы малой формы // Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация. 2022. Т. 20. № 2. https://doi.org/10.25205/1818-7935-2022-20-2-93-109
- Коцюбинская Л. В. Понятие «информационная война» в современной лингвистике: новые подходы // Политическая лингвистика. 2015. № 4.
- Лингвистика информационно-психологической войны: монография / отв. ред. А. П. Сковородников. Красноярск: Сиб. федер. ун-т, 2017.
- Малыгина Л. Е., Гурова А. С. Метафоризация в дискурсе иноагентов как способ искаженного описания действительности // Медиалингвистика. 2023.
- Матвеева Н. В., Арутюнян Г. А. Классификация лиц, находящихся под иностранным влиянием (иноагентов) и её значение для совершенствования административного законодательства // Образование и право. 2024. № 3. https://doi.org/10.24412/2076-1503-2024-3-310-319
- Мифтахов Р. Л., Белоусов А. И. Особенности административно-правового статуса иностранных агентов в Российской Федерации // Юридический вестник Дагестанского государственного университета. 2023. Т. 46. № 2. https://doi.org/10.21779/2224-0241-2023-46-2-66-72
- Никулина Д. Е. Политический дискурс как объект лингвистического исследования // Филологические науки. Вопросы теории и практики. 2017. № 9-1 (75).
- Нисневич Ю. А. Информационно-коммуникационная стабилизация политической системы // Вестник Российского университета дружбы народов. Серия: Политология. 2006. № 6.
- Огнева В. В., Киселев С. А. Проблемные аспекты государственного регулирования деятельности политического института иностранных агентов в современной России // Известия Тульского государственного университета. Гуманитарные науки. 2023. № 1. https://doi.org/10.24412/2071-6141-2023-1-36-45
- Сковородников А. П., Копнина Г. А. Лингвистика информационно-психологической войны: к обоснованию и определению понятия // Политическая лингвистика. 2016. № 1.
- Тен Л. В. Тематическое моделирование в задаче автоматической рубрикации новостных текстов // Terra Linguistica. 2023. Т. 14. № 2. https://doi.org/10.18721/JHSS.14207
- Тишина Е. В., Калинина М. В. Язык ведения современных информационно-психологических войн (на материале оппозиционных изданий российских СМИ) // Вестник Южно-Уральского государственного университета. Серия: Лингвистика. 2024. Т. 21. № 4. https://doi.org/10.14529/ling240402
- Чижик А. В. Городские эмоции и цифровое участие: моделирование мотивации к использованию городских сервисов на основе анализа тональности постов в социальных сетях // International Journal of Open Information Technologies. 2024. Т. 12. № 12.
- Allam H., Davison C., Kalota F., Lazaros E., Hua D. AI-Driven Mental Health Surveillance: Identifying Suicidal Ideation Through Machine Learning Techniques // Big Data and Cognitive Computing. 2025. Vol. 9. № 1. https://doi.org/10.3390/bdcc9010016
- Awasthi A., Bdair M., Kumar A. N., Thapa S., Kumar B. R. NLP for Sentiment Analysis in Social Media Posts to Detect Suspicious Behaviour // 2024 International Conference on Intelligent Algorithms for Computational Intelligence Systems (IACIS), 23-24 August 2024. Hassan, India, 2024.
- Babakov N., Logacheva V., Panchenko A. Beyond plain toxic: building datasets for detection of flammable topics and inappropriate statements // Language Resources and Evaluation. 2024. Vol. 58. № 2. https://doi.org/10.1007/s10579-023-09682-z
- Karlsson K., Dalipi F. Exploring the Surveillance Technology Discourse: A Bibliometric Analysis and Topic Modeling Approach // Frontiers in Artificial Intelligence. 2024. Vol. 7. https://doi.org/10.3389/frai.2024.1406361
- Kolini F., Janczewski L. Clustering and Topic Modelling: A New Approach for Analysis of National Cyber Security Strategies. Malaysia, 2017.
- Kuang D., Brantingham P. J., Bertozzi A. L. Crime Topic Modeling // Crime Science. 2017. Vol. 6. https://doi.org/10.1186/s40163-017-0074-0
- Madrid-García A., Freites-Núñez D., Merino-Barbancho B., Pérez Sancristobal I., Rodríguez-Rodríguez L. Mapping Two Decades of Research in Rheumatology-Specific Journals: A Topic Modeling Analysis with BERTopic // Therapeutic Advances in Musculoskeletal Disease. 2024. Vol. 16.
- Orr M., Van Kessel K., Parry D. Ethical Thematic and Topic Modelling Analysis of Sleep Concerns in a Social Media Derived Suicidality Dataset // Proceedings of the 9th Workshop on Computational Linguistics and Clinical Psychology (CLPsych 2024). 2024.
- Rijcken E., Scheepers F., Zervanou K., Spruit M., Mosteiro P., Kaymak U. Towards Interpreting Topic Models with ChatGPT // The 20th World Congress of the International Fuzzy Systems Association. Daegu, Korea, 2023.
Author information
About this article
Publication history
- Received: June 27, 2025.
- Published: July 28, 2025.
Keywords
- лингвокриминалистический аспект
- иностранное влияние
- тематическое моделирование
- политический дискурс
- цифровая коммуникация
- forensic linguistic aspect
- foreign influence
- topic modeling
- political discourse
- digital communication
Copyright
© 2025 The Author(s)
© 2025 Gramota Publishing, LLC