Данните от социалните медии показват, че езикът, свързан с депресията, не се е увеличил след първоначалната пандемична вълна

Резюме: Използвайки AI за анализ на езика, свързан с депресията в социалните медии по време на първата вълна на пандемията COVID-19, изследователите откриха, че хората са по-устойчиви, отколкото се смяташе преди.

Източник: Университет на Алберта

Изследователи, анализирали езика, свързан с депресията в социалните медии по време на пандемията, казват, че данните показват, че хората са се научили да се справят, докато вълните продължават.

Изследовател от университета в Алберта Альона Фише и нейните сътрудници от Университета на Западен Онтарио предположиха, че езикът, свързан с депресията, ще нараства по време на всяка вълна от COVID-19. Но техните проучване показва, че не е така.

“Имаше голяма реакция в началото и след това хората някак си намериха новото си нормално”, казва Фише, асистент по компютърни науки и психология. “Това е послание за устойчивост, хората, които измислят как да продължат да продължат в условията на пандемия.”

За проучването изследователите насочиха вниманието си към онлайн платформи като Reddit и Twitter. Социалните медии са полезен инструмент за оценка на психичното здраве на ниво население, обяснява Фише, сътрудник на Институт за машинно разузнаване в Алберта и канадски стол CIFAR AI.

Изследователите първо идентифицираха ключови думи, като анализираха вида на езиковите плакати, използвани в дискусиите в Reddit. Самоидентификацията, открита в тези подредици и форуми, не се репликира в много други платформи за социални медии, обяснява Fyshe.

„По същество ние обучихме модел за машинно обучение, който може да разграничи езика на хората, които публикуват в нишка по темата за депресията, от хората, които не го правят“, казва Фише.

Използвайки тази информация и идентифицираните ключови думи, те насочиха вниманието си към Twitter. Те анализираха данни от четири града – Сидни, Мумбай, Сиатъл и Торонто – с различни вълни на COVID-19, за да могат да определят кои промени в езика се дължат на глобални тенденции и кои са местни. Те ограничиха данните до области с голям процент туитове на английски, за да могат да използват същата методология за анализ на всички данни.

Изследователите първо идентифицираха ключови думи, като анализираха вида на езиковите плакати, използвани в дискусиите в Reddit. Изображението е публично достояние

Резултатите бяха изненадващи, казва Фише. Като цяло, скокове в случаите на COVID-19 и различните вълни по време на пандемията не бяха отразени в данните. Всъщност единственият град с увеличаване на езика, свързан с депресията след първата вълна, беше Мумбай, който видя значителна втора вълна.

Fyshe казва, че методите за машинно обучение, използвани за изстъргване на подфоруми на Reddit за идентифициране на ключови думи и анализиране на данни от Twitter, могат да бъдат приложени към широк кръг от теми. Например, когато изследвали данни в Сиатъл, те открили силни реакции към движението Black Lives Matter.

„Това беше показателно за сериозна промяна в общото настроение – за какво говореха хората и как се чувстват хората за света, в който живеят.

За този език и новини за изследване на депресията

автор: Рос Нейц
Източник: Университет на Алберта
контакт: Рос Нейц – Университет на Алберта
Образ: Изображението е обществено достояние

Оригинално изследване: Свободен достъп.
Количествено определяне на езика, свързан с депресията в социалните медии по време на пандемията COVID-19”От Alona Fyshe et al. Международно списание за наука за данните за населението

Вижте също

Това показва загрижен изглеждащ млад мъж

абстрактно

Количествено определяне на езика, свързан с депресията в социалните медии по време на пандемията COVID-19

Въведение
Пандемията от COVID-19 имаше ясно въздействие върху психичното здраве. Социалните медии предоставят възможност за оценка на психичното здраве на ниво население.

Цели
1) Идентифицирайте и опишете езика, използван в социалните медии, който е свързан с дискурса за депресия. 2) Опишете връзките между идентифицирания език и разпространението на COVID-19 във времето в няколко географски региони.

Методи
Създаваме вграждане на думи въз основа на публикациите в Reddit / r / Depression и използваме това вграждане на думи, за да обучаваме представяния на активни автори. Ние противопоставяме тези автори срещу контролна група и извличаме ключови думи, които улавят разликите между двете групи. Ние филтрираме тези ключови думи за валидност на лицето и за съответствие с ограниченията на знаците на система за извличане на информация Elasticsearch. Извличаме всички геомаркирани публикации в Twitter от април 2019 г. до юни 2021 г. от Сиатъл, Сидни, Мумбай и Торонто. Туитовете се оценяват с BM25 с помощта на ключовите думи. Ние наричаме този резултат rDD. Сравняваме промените в средния резултат във времето с броя на случаите от началото на пандемията до юни 2021 г.

Резултати
Наблюдаваме модел на rDD във всички анализирани градове: Има увеличение на rDD близо до началото на пандемията, което намалява с течение на времето. Въпреки това, в Мумбай също виждаме увеличение в съответствие с втора вълна от случаи.

Заключения
Нашите резултати са в съответствие с други проучвания, които показват, че въздействието на пандемията върху психичното здраве е било най-високо първоначално и е последвано от възстановяване, до голяма степен непроменено от следващите вълни. Въпреки това, в данните от Мумбай наблюдавахме значително покачване на rDD с голяма втора вълна. Нашите резултати показват възможна неуловена хетерогенност в географските райони и сочат необходимостта от по-добро разбиране на това различно въздействие върху психичното здраве.