• Научная статья
  • 25 ноября 2024
  • Открытый доступ

Разработка цифровой модели идентификации фейковых новостей: анализ лингвистических маркеров и контекстуальных особенностей

Аннотация

Цель исследования – установление критериев, позволяющих отграничить фейк от смежных лингвистических явлений на основе анализа частотности словоупотреблений, что послужит основой цифровой модели первичной идентификации фейковых новостей. Исследование набора N-грамм и полнознаменательных лексем в формате KWIC с учетом контекста позволило установить, что для фейковых новостей 2014-2021 гг. преобладающей тематикой является внешняя политика. Научная новизна исследования состоит в том, что совпадение контекстов и отсутствие уникальных лексем, установленное в рамках анализа, дало основания сделать вывод о сходстве нефейковых и фейковых текстов вследствие маскировки последних под типичные тексты медиадискурса, что усложняет процедуру их обработки. В результате исследования доказана гипотеза о выполнении неполнознаменательными словами такой дифференцирующей и идентифицирующей роли. Наличие подобных слов помогает скрыть ложный характер сообщения и блокировать критическое мышление читателя. Текстам фейковых новостей свойственны признак анонимности автора и наличие смыслового компонента «неопределенность», что на вербальном уровне выражается в уменьшении доли личных местоимений и преобладании безличных и неопределенно-личных конструкций.

Источники

  1. Баранов А. Н. Злоупотребление правом как лингвистический феномен // Язык. Право. Общество: сборник статей V международной научно-практической конференции (г. Пенза, 22-25 мая 2018 г.). Пенза: Пензенский государственный университет. 2018.
  2. Воронцов К. В. Фейковые новости и другие виды потенциально опасного дискурса: типология, подходы, датасеты, соревнования // Международная независимая открытая конференция по ИИ “OpenTalks.AI” (г. Москва, 3-5 февраля 2021 г.). М., 2021.
  3. Засорина Л. Н. Частотный словарь русского языка. М.: Русский язык, 1977.
  4. Кушнерук С. Л. Дискурсивный мир информационно-психологической войны: репрезентационная структура по данным корпуса // Политическая лингвистика. 2020. № 5 (83).
  5. Кушнерук С. Л., Курочкина М. А. Информационно-психологическая война в зарубежной медиакоммуникации: взгляд дискурсолога // Вестник Челябинского государственного университета. 2020. № 7 (441).
  6. Савчук С. О., Архангельский Т. А., Бонч-Осмоловская А. А., Донина О. В., Кузнецова Ю. Н., Ляшевская О. Н., Орехов Б. В., Подрядчикова М. В. Национальный корпус русского языка 2.0: новые возможности и перспективы развития // Вопросы языкознания. 2024. № 2.
  7. Эпштейн М. Н. Предлог «В» как философема. Частотный словарь и основной вопрос философии // Вопросы философии: научно-теоретический журнал. 2003. № 6.
  8. Allcott H., Gentzkow M. Social media and fake news in the 2016 election // Journal of Economic Perspectives. 2017. Vol. 31. No. 2.
  9. Anthony L. AntConc: Design and development of a freeware corpus analysis toolkit for the technical writing classroom // Proceedings of the International Professional Communication Conference (Limerick, 10-13 Jily 2005). Limerick, 2005.
  10. Choraś M., Demestichas K., Gielczyk A., Herrero A., Ksieniewicz P., Remoundou K., Urda D., Wozniak M. Advanced Machine Learning techniques for fake news (online disinformation) detection: A systematic mapping study // Applied Soft Computing. 2021. Vol. 101.
  11. Hassan N., Gomaa W., Khoriba G., Haggag M. Credibility detection in twitter using word n-gram analysis and supervised machine learning techniques // International Journal of Intelligent Engineering and Systems. 2020. Vol. 13.
  12. Kong S., Tan L., Gan K., Samsudin N. Fake news detection using deep learning // 2020 IEEE 10th symposium on computer applications & industrial electronics (ISCAIE) (Malaysia, 18-19 April 2020). Piscataway, 2020.
  13. Luhn H. P. A statistical approach to mechanized encoding and searching of literary information // IBM Journal of Research and Development. 1957. Vol. 1. No. 4.
  14. Monogarova A., Shiryaeva T., Tikhonova E. The words that make fake stories go viral: A corpus‐based approach to analyzing Russian Covid‐19 disinformation // Russian Journal of Linguistics. 2023. Vol. 27. No. 3.
  15. Saquete E., Tomás D., Moreda P., Martínez-Barco P., Palomar M. Fighting post-truth using natural language processing: A review and open challenges // Expert Systems With Applications. 2020. Vol. 141.
  16. Segalovich I. A fast morphological algorithm with unknown word guessing induced by a dictionary for a web search engine // Proceedings of the International conference of Machine Learning: Models, Technologies and Applications (MLMTA’03) (23-26 June 2003). Las Vegas, 2003. Vol. 2003.
  17. Wynne H., Wint Z. Content based fake news detection using n-gram models // Proceedings of the 21st International Conference on Information Integration and Web-based Applications & Services (Munich, 2-4 December 2019). Munich, 2019.

Информация об авторах

Ляшенко Дарья Игоревна

Южный федеральный университет, г. Ростов-на-Дону

Информация о статье

История публикации

  • Поступила в редакцию: 14 октября 2024.
  • Опубликована: 25 ноября 2024.

Ключевые слова

  • фейковые новости
  • смысловой компонент «неопределенность»
  • корпусная лингвистика
  • речевое воздействие
  • неполнознаменательные лексемы
  • fake news
  • semantic component “uncertainty”
  • corpus linguistics
  • speech impact
  • functional lexemes

Copyright

© 2024 Автор(ы)
© 2024 ООО Издательство «Грамота»

Лицензионное соглашение

Creative Commons Attribution 4.0 International (CC BY 4.0)