Филологи Пермского университета исследуют поведение пользователей соцсетей по их записям и комментариям. Учёные выявляют закономерности и связи между чертами личности и особенностями языка в текстах. В России такой метод изучения пользователей соцсетей применяется впервые.

В основе исследования лежит профиль пользователя «Вконтакте», включающий в себя пол, возраст, количество постов, «лайков», языковые и психологические особенности. Психологические параметры для исследования выявлялись при помощи опросника The Big Five Inventory, адаптированного на русский язык доктором психологических наук, профессором кафедры психологии развития ПГНИУ Сергеем Щебетенко. По результатам тестирования определялись значения пяти параметров: экстраверсии, доброжелательности, нейротизма, добросовестности и открытости.

«На первом этапе мы создали таблицу, в которой зафиксировали данные об отдельном пользователе по всем параметрам, кроме языковых. Самая большая трудность возникает при анализе текстов и определении языковых параметров. Кто-то в соцсетях пишет много – тысячи постов, а у кого-то их нет вообще. Из 1000 респондентов, которые прошли психологическое тестирование, после «просеивания» у нас осталось около 340 человек. Их тексты можно анализировать, с ними мы и работаем», – рассказывает доктор филологических наук, профессор кафедры теоретического и прикладного языкознания Константин Белоусов.

Сейчас ученые проводят языковой анализ – выбирают категории для классификации, пробуют разные подходы к изучению текстов. Для выделения отдельных слов из текстов и их классификации ученые используют собственную разработку – информационную систему Semograph. При анализе текстов учитываются не только слова, но и эмотиконы (смайлики) и текстовые параметры (например, жанры). Анализ ещё не окончен, но уже можно посмотреть некоторые закономерности на графе, визуализирующем связи и отношения отдельных параметров.

Например, учёные делают вывод, что женщинам, которые используют в своих записях в соцсетях обсценную лексику (мат), свойственна интроверсия, нейротизм и недоброжелательность. При этом использование обсценной лексики у мужчин не указывает на какую-то определенную характеристику. Интересна также взаимосвязь использования личных местоимений у интровертов и экстравертов: интроверты почти не используют местоимение «мы», сосредоточиваясь только на рассказах о себе («я»); экстраверты, напротив, обращаются ко всем местоимениям, в том числе и к социально маркированному местоимению «вы».

После того, как языковой анализ закончится, можно начать процедуру кластеризации – выделения определенных типов. Таким образом, каждый профиль можно будет отнести к какому-то определенному типу, а в будущем и предсказать его предпочтения.

«Исследований в области классификации пользователей соцсетей огромное количество. Потому что все хотят что-то продать в интернете. Проблема в том, чтобы нужный контент донести до нужных людей. Обычно все эти исследования работают с социальными параметрами, с психологическими, с активностью, но не с языком. Мы же хотим внедрить в этот анализ язык, чтобы более точно определять портрет определенного пользователя. Можно сказать, что в этом мы уникальны», – рассказывает Константин Белоусов.

В будущем ученые планируют на полученных данных обучить нейросеть, которая сможет анализировать профили в соцсетях, дополнять недостающие данные и относить отдельно взятый профиль к одному из типов.