AUTOMATIZED CONTENT ANALYSIS OF COMMENTS IN THREE SUBJECT AREAS
Abstract
The research executed within the framework of applied linguistics is devoted to the analysis of subjective information in the user’s content. The author analyzes the comments in the Russian language from the three subject areas applying Van Rijsbergen's effectiveness measure as a criterion of efficiency. It is shown that the efficiency of the applied algorithm does not decrease while analyzing the fragments from the other subject areas. The researcher argues that the system recognizes positive comments better than negative.
References
- Брунова Е. Г. Составление лексикона для контент-анализа мнений // Теоретические и прикладные аспекты изучения речевой деятельности. Н. Новгород: НГЛУ им. Н. А. Добролюбова, 2013. Вып. 1 (8). С. 24-29.
- Брунова Е. Г., Бидуля Ю. В. Алгоритм с элементами формальной грамматики для контент-анализа мнений // Вестник Тюменского государственного университета. Серия «Физико-математические науки. Информатика». 2014. № 7. С. 242-250.
- Ермаков С. А., Ермакова Л. М. Методы оценки эмоциональной окраски текста // Вестник Пермского университета. 2012. Вып. 1 (19). С. 85-89.
- Куликов С. Ю. Автоматизация составления оценочного словаря широкой предметной области (опыт использования неспециализированного корпуса текстов) // Вестник Иркутского государственного технического университета. 2014. № 8 (91). С. 240-243.
- Лукашевич Н. В., Четверкин И. И. Извлечение и использование оценочных слов в задаче классификации отзывов на три класса // Вычислительные методы и программирование. 2011. Т. 12. С. 73-81.
- Оробинская Е. А., Кочуева З. А. Технологии Text Mining: Обзор методов и задач обработки смысловой информации // Вестник Херсонского национального технического университета. 2010. № 2 (38). С. 348-353.
- Пазельская А. Г., Соловьев А. Н. Метод определения эмоций в текстах на русском языке // Компьютерная лингвистика и интеллектуальные технологии: «Диалог-2011». М.: Изд-во РГГУ, 2011. Вып. 10 (17). С. 510-522.
- Полякова Е. В. Когнитивные особенности выражения моральных чувств «Любовь» и «Страх» в идиоматике русского и английского языков // Филологические науки. Вопросы теории и практики. Тамбов: Грамота, 2013. № 9 (27): в 2-х ч. Ч. 2. С. 157-163.
- Ganapathibhotla M., Liu B. Mining Opinions in Comparative Sentences // Proc. of the 22nd International Conference on Computational Linguistics. Manchester: Brighton, 2008. P. 241-248.
- Liu B. Sentiment Analysis and Subjectivity [Электронный ресурс] // Handbook of Natural Language Processing. 2010. URL: http://www.cs.uic.edu/~liub/FBS/NLP-handbook-sentiment-analysis.pdf (дата обращения: 27.09.2014).
- Manning Ch., Raghavan P., Schütze H. Introduction to Information Retrieval. Cambridge: Cambridge UP, 2009. 544 p.
- Pal J., Saha A. Identifying Themes in Social Media and Detecting Sentiments // International Journal of Statistics and Applications. 2011. Vol. 1. No. 1. P. 14-19.
- Pang B., Lee L. Opinion Mining and Sentiment Analysis // Foundations and Trends in Information Retrieval. 2008. Vol. 2. No 1-2. P. 1-135.
- Pang B., Lee L., Vaithyanathan S. Thumbs up? Sentiment Classification Using Machine Learning Techniques [Электронный ресурс] // Proc. of EMNLP. 2002. URL: http://www.cs.cornell.edu/people/pabo/papers/sentiment.pdf (дата обращения: 27.09.2014).
- Turney P. Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews // Proc. of the 40th Annual Meeting on Association for Computational Linguistics. Philadelphia: University of Pennsylvania, 2002. P. 417-424.
- Wiebe J., Bruce R., O’Hara T. Development and Use of a Gold-Standard Data Set for Subjectivity Classifications // Proc. of the 37th Annual Meeting of the Association for Computational Linguistics. Maryland: University of Maryland, 1999. P. 246-253.
- www.banki.ru (дата обращения: 26.10.2014).
- www.tripadvisor.ru (дата обращения: 26.10.2014).
Author information
About this article
Publication history
- Published: November 5, 2014.
Keywords
- прикладная лингвистика
- обработка естественного языка
- алгоритм
- контент-анализ мнений
- предметная область
- пользовательский контент
- applied linguistics
- processing natural language
- algorithm
- content analysis of comments
- subject area
- user’s content
Copyright
© 2014 The Author(s)
© 2014 Gramota Publishing, LLC