WPROWADZENIE Jaki kryzys klimatyczny Cię zaangażuje...

1
Jaki kryzys klimatyczny Cię zaangażuje ? Czynniki interaktywności artykułów o klimaci e WYNIKI CEL PRACY METODY Antropogeniczny charakter i możliwe dramatyczne konsekwencje zmian klimatu nie budzą wątpliwości naukowców (IPCC, 2019). Natomiast medialne doniesienia związane z tematyką klimatu są często silnie nacechowane ideologicznie (Carvalho, 2007, Schäfer , 2012). Brakuje badań dotyczących cech tych treści w kontekście ich popularności. Komentarze, udostępnienia i „polubienia” postów na Facebook’u (najpopularniejszy portal społecznościowy wg Global Social Media Ranking 2019, b.d.) mogą pomóc odpowiedzieć na pytanie, jak pisać o zmianie klimatu tak, żeby zaangażować czytelnika. Podział na tematy metodami topic modelingu (LDA) (Blei i in., 2003). Stworzenie interpretowalnego klasyfikatora interaktywności (potencjału angażowania odbiorcy) artykułów dotyczących klimatu publikowanych w mediach społecznościowych. Interaktywność = + 4 × + 12 × ę + 1 (Pol, 2017) Słowa najczęściej pojawiające się w artykułach dotyczących raportu IPCC z października 2018 r. WPROWADZENIE DANE BIBLIOGRAFIA Sentyment (emocje) Istotniejszy jest sentyment lead’ów . 75% artykułów ma pozytywny wydźwięk emocjonalny (sentyment). Najczęściej występujące emocje: zaufanie, złość, oczekiwanie. miara zaangażowania Niska Wysoka Klasyfikator ( Klasa pozytywna: „Niska interaktywność”) Zrównoważona dokładność: 75% Czułość: 90% Specyficzność: 60% Najważniejsze dla klasyfikatora atrybuty i najbardziej interaktywny artykuł (por. zdjęcie): 1. Źródło 2. Kraj 3. Temat 4.Czytelność treści 5. Długość (liczba słów) 6. Czytelność lead’u 7. Sentyment lead’u The Guardian UK Food & Agriculture 13-15 lat edukacji 375 After College (0-29) 0.52 (max. pozytywny =1) Interpretacja Przykładowo: kiedy źródłem jest „Daily Mirror” lub „Russia Today” i temat to Economy and Gold” , a główna emocja w tekście to złość – szansa na artykuł z wysoką interaktywnością wynosi 82%. Analiza leksykalna W najmniej interaktywnych artykułach (< 20 centyla) konotacje słowa „oil” z deforestacją i alternatywą w postaci biopaliw. Najbardziej interaktywne: słowo „oil” kojarzone z energią, gospodarką, ew. sankcjami. Słowo „war” w obu grupach kojarzone z postacią Donalda Trumpa. Niska interaktywność Wysoka interaktywność Pozytywne nacechowanie emocjonalne większości artykułów może się wiązać z wyrażaną w nich ufnością (najczęściej występująca emocja –”trust”) lub ignorowaniem problemu (konotacje ze słowem „ oil ” w grupie wysokiej interaktywności). Duże znaczenie źródła i kraju pochodzenia dla interaktywności wskazuje prawdopodobnie na efekt popularności źródła. Bycie zrozumiałym okazało się znacznie ważniejsze dla klasyfikacji, niż nacechowanie emocjonalne treści. Emocje w lead’ach były ważniejsze dla zaangażowania internautów, niż emocje w zawartości artykułu. Być może oddaje to intuicję dotyczącą emocjonalnych haseł, które zachęcają do reagowania na artykuł. 9197 artykułów opublikowanych przez dziesięć serwisów informacyjnych w latach 2017 i 2018 na portalu Facebook w języku angielskim Czytelność ( readability ) Przeanalizowano dwie miary Flesch Readability Ease (Flesch, 1979), Dale-Chall Readability Ease (Chall & Dale, 1995) (Kenneth Benoit i in, 2018) . Wydźwięk emocjonalny (sentyment) Obliczono stosując metodę opartą na bag of words (Rinker., 2019) i wybrany na bazie dopasowania do danych leksykon. Klasyfikator drzewo decyzyjne Kryterium podziału jest wartość indeksu Gini’ego (Terry Therneau and Beth Atkinson, 2019). WNIOSKI Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of machine Learning research, 3(Jan), 993 1022. Chall, J. S., & Dale, E. (1995). Readability revisited: The new Dale-Chall readability formula. Brookline Books. Flesch, R. F. (1979). How to write plain English: A book for lawyers and consumers. Harpercollins. Global social media ranking 2019. (b.d.). Statista. Pobrano 31 marzec 2020, z https://www.statista.com/statistics/272014/global-social-networks-ranked-by-number-of-users/ IPCC, I. P. O. C. C. (2019). Special report on global warming of 1.5 C (SR15). Kenneth Benoit and Kohei Watanabe and Haiyan Wang and Paul Nulty and Adam Obeng and Stefan Müller and Akitaka Matsuo. (b.d.). quanteda: An R package for the quantitative analysis of textual data. Journal of Open Source Software. https://quanteda.io Rinker, T. W. (2019). Calculate Text Polarity Sentiment. Pol, com W. 46 02-724 W. (2017, styczeń 19). Measuring Engagement in Social Media. Sotrender Blog. https://www.sotrender.com/blog/2017/01/social-media-engagement/ Schäfer , M. S. (2012). Online communication on climate change and climate politics: A literature review. Wiley Interdisciplinary Reviews: Climate Change, 3(6), 527543. Terry Therneau and Beth Atkinson. (2019). rpart: Recursive Partitioning and Regression Trees. Anna Boros, II - gi rok studiów magisterskich na kierunku Kognitywistyka , Wydział Psychologii Uniwersytetu Warszawskiego klasy w drzewie decyzyjnym Czytelność Dla interaktywności istotniejsza jest czytelność Flesch’a. Dla interaktywności istotniejsza jest czytelność zawartości (nie lead’ów) artykułów. Z przejściem do wyższej klasy interaktywności, rośnie średnia czytelność artykułów . 69% artykułów może być zrozumiana bez problemu przez osoby po 13-15 latach edukacji. Podziękowania: Prof.dr hab. Andrzej Nowak, mgr Mikołaj Biesaga

Transcript of WPROWADZENIE Jaki kryzys klimatyczny Cię zaangażuje...

Page 1: WPROWADZENIE Jaki kryzys klimatyczny Cię zaangażuje ...psych.uw.edu.pl/wp-content/uploads/sites/98/2020/05/Anna_Boros_p… · Czynniki interaktywności artykułów o klimacie WYNIKI

Jaki kryzys klimatyczny Cię zaangażuje?

Czynniki interaktywności artykułów o klimacie

WYNIKI

CEL PRACY

METODY

Antropogeniczny charakter i możliwe dramatyczne

konsekwencje zmian klimatu nie budzą wątpliwości

naukowców (IPCC, 2019). Natomiast medialne

doniesienia związane z tematyką klimatu są często silnie

nacechowane ideologicznie (Carvalho, 2007, Schäfer,

2012). Brakuje badań dotyczących cech tych treści w

kontekście ich popularności. Komentarze, udostępnienia

i „polubienia” postów na Facebook’u (najpopularniejszy

portal społecznościowy wg Global Social Media

Ranking 2019, b.d.) mogą pomóc odpowiedzieć na

pytanie, jak pisać o zmianie klimatu tak, żeby

zaangażować czytelnika.

• Podział na tematy metodami topic modelingu (LDA)

(Blei i in., 2003).

S tw o r ze n i e i n t e r p re t o w a l n e g o k l a s y f i k a t o r a i n t e r a k t y w n o ś c i

(potencjału angażowania odbiorcy) artykułów dotyczących klimatu publikowanych w

mediach społecznościowych.

I n t e rak t ywno ść

𝑖𝑛𝑖𝑟𝑎𝑤 = 𝑝𝑜𝑙𝑢𝑏𝑖𝑒𝑛𝑖𝑎 + 4 × 𝑘𝑜𝑚𝑒𝑛𝑡𝑎𝑟𝑧𝑒 + 12 × 𝑢𝑑𝑜𝑠𝑡ę𝑝𝑛𝑖𝑒𝑛𝑖𝑎 + 1(Pol, 2017)

Słowa najczęściej pojawiające się w

artykułach dotyczących raportu

IPCC z października 2018 r.

WPROWADZENIE

DANE

BIBLIOGRAFIA

S e n t y m e n t ( e m o c j e )

• Istotniejszy jest sentyment lead’ów.

• 75% artykułów ma pozytywny wydźwięk

emocjonalny (sentyment).

• Najczęściej występujące emocje: zaufanie, złość,

oczekiwanie.

miara

zaangażowania

Niska

Wysoka

K l a s y f i k a t o r ( Klasa pozytywna:

„Niska interaktywność”)

• Zrównoważona dokładność: 75%

• Czułość: 90%

• Specyficzność: 60%

• Najważniejsze dla klasyfikatora

atrybuty i najbardziej interaktywny

artykuł (por. zdjęcie):

1. Źródło 2. Kraj 3. Temat 4.Czytelność

treści

5. Długość

(liczba słów)

6. Czytelność

lead’u

7. Sentyment

lead’u

The

Guardian

UK Food &

Agriculture

13-15 lat

edukacji

375 After College

(0-29)

0.52 (max.

pozytywny =1)

I n t e r p r e t a c j a

Przykładowo: kiedy źródłem

jest „Daily Mirror” lub

„Russia Today” i temat to

„Economy and Gold” , a

główna emocja w tekście to

złość – szansa na artykuł z

wysoką interaktywnością

wynosi 82%.

A n a l i z a l e k s y k a l n a

• W najmniej interaktywnych artykułach (< 20 centyla) konotacje słowa „oil” z deforestacją i alternatywą w

postaci biopaliw.

• Najbardziej interaktywne: słowo „oil” kojarzone z energią, gospodarką, ew. sankcjami.

• Słowo „war” w obu grupach kojarzone z postacią Donalda Trumpa.

Niska interaktywnośćWysoka interaktywność

• P o z y t y w n e n a c e c h o w a n i e e m o c j o n a l n e w i ę k s z o ś c i a r t y k u ł ó w m o ż e s i ę w i ą z a ć

z w y r a ż a n ą w n i c h u f n o ś c i ą ( n a j c z ę ś c i e j w y s t ę p u j ą c a e m o c j a – ” t r u s t ” ) l u b

i g n o ro w a n i e m p ro b l e m u ( k o n o t a c j e z e s ł o w e m „ o i l ” w g r u p i e w y s o k i e j

i n t e r a k t y w n o ś c i ) .

• D u ż e z n a c z e n i e ź r ó d ł a i k r a j u p o c h o d z e n i a d l a i n t e r a k t y w n o ś c i w s k a z u j e

p r a w d o p o d o b n i e n a e f e k t p o p u l a r n o ś c i ź r ó d ł a .

• B y c i e z ro z u m i a ł y m o k a z a ł o s i ę z n a c z n i e w a ż n i e j s z e d l a k l a s y f i k a c j i , n i ż

n a c e c h o w a n i e e m o c j o n a l n e t re ś c i .

• E m o c j e w l e a d ’ a c h b y ł y w a ż n i e j s z e d l a z a a n g a ż o w a n i a i n t e r n a u t ó w, n i ż

e m o c j e w z a w a r t o ś c i a r t y k u ł u . B y ć m o ż e o d d a j e t o i n t u i c j ę d o t y c z ą c ą

e m o c j o n a l n y c h h a s e ł , k t ó re z a c h ę c a j ą d o re a g o w a n i a n a a r t y k u ł .

• 9197 artykułów opublikowanych przez dziesięć serwisów informacyjnych w latach 2017 i

2018 na portalu Facebook w języku angielskim

Czy t e lnoś ć ( r e a d a b i l i t y )

Przeanalizowano dwie miary – Flesch Readability Ease (Flesch, 1979), Dale-Chall

Readability Ease (Chall & Dale, 1995) (Kenneth Benoit i in, 2018) .

Wydźw i ęk e m o c j o n a l n y ( s e n t y m e n t )

Obliczono stosując metodę opartą na bag of words (Rinker., 2019) i wybrany na bazie

dopasowania do danych leksykon.

K l a s y f i k a t o r – d r z e w o d e c y z y j n e

Kryterium podziału jest wartość indeksu Gini’ego (Terry Therneau and Beth Atkinson,

2019).

WNIOSKI

Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of machine Learning research, 3(Jan), 993–1022.

Chall, J. S., & Dale, E. (1995). Readability revisited: The new Dale-Chall readability formula. Brookline Books.

Flesch, R. F. (1979). How to write plain English: A book for lawyers and consumers. Harpercollins.

Global social media ranking 2019. (b.d.). Statista. Pobrano 31 marzec 2020, z https://www.statista.com/statistics/272014/global-social-networks-ranked-by-number-of-users/

IPCC, I. P. O. C. C. (2019). Special report on global warming of 1.5 C (SR15).

Kenneth Benoit and Kohei Watanabe and Haiyan Wang and Paul Nulty and Adam Obeng and Stefan Müller and Akitaka Matsuo. (b.d.). quanteda: An R package for the quantitative analysis of textual data. Journal of Open Source Software. https://quanteda.io

Rinker, T. W. (2019). Calculate Text Polarity Sentiment.

Pol, com W. 46 02-724 W. (2017, styczeń 19). Measuring Engagement in Social Media. Sotrender Blog. https://www.sotrender.com/blog/2017/01/social-media-engagement/

Schäfer, M. S. (2012). Online communication on climate change and climate politics: A literature review. Wiley Interdisciplinary Reviews: Climate Change, 3(6), 527–543.

Terry Therneau and Beth Atkinson. (2019). rpart: Recursive Partitioning and Regression Trees.

Anna Boros, II-gi rok studiów magisterskich na kierunku Kognitywistyka, Wydział Psychologii Uniwersytetu Warszawskiego

klasy w drzewie

decyzyjnym

Czy t e lnoś ć

• Dla interaktywności istotniejsza jest czytelność Flesch’a.

• Dla interaktywności istotniejsza jest czytelność zawartości (nie lead’ów) artykułów.

• Z przejściem do wyższej klasy interaktywności, rośnie średnia czytelność artykułów.

• 69% artykułów może być zrozumiana bez problemu przez osoby po 13-15 latach edukacji.

Podziękowania: Prof.dr hab. Andrzej Nowak, mgr Mikołaj Biesaga