Туитове #Plandemic и #Scamdemic по време на пандемията от COVID-19

В скорошно проучване, публикувано в ПЛОС ПЪРВОизследователи анализираха дезинформацията за коронавирусна болест 2019 (COVID-19) в Twitter.

Проучвания: Анализиране на дезинформацията за COVID-19 в Twitter с помощта на хештаговете #scamdemic и #plandemic: Ретроспективно проучване. Кредит на изображението: rafapress / Shutterstock

Заден план

Широкото използване на социалните медии по време на пандемията от COVID-19 доведе до „инфодемия“ от дезинформация и дезинформация относно COVID-19, което доведе до потенциално фатални последици. Разбирането на мащаба и въздействието на тази невярна информация е от съществено значение за агенциите за обществено здравеопазване, за да оценят поведението на общото население по отношение на приемането на ваксини и нефармацевтичните интервенции (НПИ), като социално дистанциране и маскиране.

Относно изследването

В настоящото проучване изследователите оценяват туитовете, циркулиращи в Twitter, съдържащи хештаговете #Plandemic и #Scamdemic.

На 3 януари 2021 г. екипът използва Twint, инструмент за изписване на Twitter, за да събира туитове на английски език, съдържащи хештаговете #Plandemic или #Scamdemic, публикувани между 1 януари и 31 декември 2020 г. На 15 януари 2021 г. екипът впоследствие използва приложението Twitter софтуер за програмиране (API) за получаване на едни и същи туитове, като се използват съответните идентичности на туит. Екипът предостави описателна статистика за избраните туитове, като корелиращо съдържание на туитовете и потребителските профили, за да определи наличността на туитовете и в двата набора от данни, разработени в съответствие с кодовете на състоянието на Twitter API.

Анализът на настроенията на туитовете беше извършен чрез токенизиране на туитовете и тяхното почистване. Впоследствие лексемите бяха трансформирани в тяхната основна форма, използвайки техники за обработка на естествен език, включително лемматизиране, отделяне на основата и премахване на стоп думи. Библиотеката VADER на Python беше използвана за разпознаване и категоризиране на настроенията на туита като неутрални, положителни или отрицателни, а субективността на туита като субективна или обективна. VADER приложи базиран на правила анализ на настроенията със скала за полярност, варираща между -1 и 1.

Субективният анализ беше извършен с помощта на TextBlob, който обозначи всеки туит по скала от нула или обектив до единица или субективен. Смята се, че обективните туитове предоставят факти, докато субективните туитове съобщават мнение или убеждение. Екипът визуализира хистограма на резултатите от субективността за хештаговете #Plandemic и #Scamdemic. Библиотеката на Python също беше използвана за етикетиране на основната емоция, свързана с всеки туит, като страх, очакване, гняв, изненада, доверие, тъга, радост, отвращение, положителна или отрицателна.

Преобладаващите теми, обсъждани в туит библиотеката, бяха разпознати и беше приложен алгоритъм за машинно обучение. Този алгоритъм идентифицира клъстерите от туитове, използвайки представителна група от думи. Думите с най-висока тежест във всеки клъстер бяха използвани за дефиниране на съдържанието на всяка тема.

Резултати

Резултатите от проучването показват, че общо 420 107 туита включват хештаговете #Plandemic и #Scamdemic. Екипът премахна туитове, които бяха ретуитове, отговори, не на английски или дубликати, за да запази 227 067 туитове от приблизително 40 081 потребители. Почти 74,4% от общите туитове са публикувани от 78,4% от активните потребители на Twitter, докато 25,6% от туитовете са публикувани от 21,6% от потребителите, чийто акаунт е спрян до 15 януари 2021 г. Екипът отбеляза, че потребителите със спрени профили вероятно да туитвам повече. Потребителите, които са използвали и двата хештага, са имали 29,2% шанс да бъдат спрени в сравнение с 25,9% за туитове, използващи #Plandemic и 13,2% за туитове, използващи #Scamdemic.

Екипът установи, че повечето от потребителите са на възраст 40 и повече години. Освен това преустановените потребители включват предимно мъже и потребители на възраст 18 години и под и от 30 до 39 години. Почти 88% от активните потребители и 79% от спрените потребители туитираха от личните си акаунти. По-специално, обективност е показана от почти 65% от анализираните туитове.

Емоционалният анализ на туитовете разкри, че страхът е преобладаващата емоция, последвана от тъга, доверие и гняв. Емоциите като изненада, отвращение и радост бяха най-слабо изразените, докато спряните туитове бяха по-склонни да показват отвращение, изненада и гняв.

Цялостното настроение, изразено от туитовете, съдържащи хештагове #Plandemic и #Scamdemic, беше отрицателно. Общите средни седмични настроения бяха -0,05 за #Plandemic и -0,09 за #Scamdemic, където 1 и -1 означаваха напълно положителни и отрицателни настроения, съответно.

Най-често наблюдаваната тема в туит беше „жалби срещу мандати, въведени по време на пандемията COVID-19“, което включваше и оплаквания срещу маски за лице, затваряне и социално дистанциране. Това беше последвано от туитове с теми „омаловажаване на опасностите от COVID-19“, „лъжи и промиване на мозъци от политици и медии“ и „корпорации и глобален дневен ред“.

Като цяло резултатите от проучването показват, че свързаните с COVID-19 туитове показват цялостно негативно настроение. Докато няколко туитове изразяват гняв срещу ограниченията по време на пандемията, значителна част от туитовете също представят дезинформация.

.