Jordi Morales i Gras
Director de Network Outsight, SL
1. Cohesió social, anàlisi de xarxes i Twitter: una mirada sociològica
Durant la darrera dècada han aparegut una pluralitat d’enfocaments metodològics que faciliten l’anàlisi sociològica des del prisma de les interaccions establertes a espais d’internet com Twitter. Aquestes propostes cobreixen un ampli aspecte tècnic que van des de l’anàlisi semàntica (Schwerin et al., 2013; Hutu i Gilbert, 2014) fins a l’anàlisi estructural (Hansen et al., 2010; Cheong i Cheong, 2011), passant per tota classe d’anàlisis quantitatives (Pennacchiotti i Popescu, 2011; Lin i Kolcz, 2012) i qualitatives (Postill i Pink, 2012; Bonilla i Rosa, 2015).
La forta orientació empírica i matemàtica de les investigacions centrades en l’anàlisi d’interaccions en xarxes socials fa que tot sovint s’invisibilitzi la importància que tenen des del punt de vista de la teoria social. Tal com he defensat en altres ocasions (Morales i Gras, 2017), els entorns digitals comprenen només una part de la socialització humana, però permeten el seguiment d’allò que es pot considerar, per part de múltiples i diversos plantejaments cientificosocials, la unitat mínima d’anàlisi social: la interacció entre agents socials.
La cohesió social és un concepte analític fortament vinculat a la noció d’interacció social. El concepte va ser utilitzat per la segona generació d’analistes de xarxes socials (Festinger, 1950; Lewin, 1952) per a designar «el conjunt de forces que operen sobre un individu per fer-lo romandre a un grup». De llavors ençà, l’anàlisi de xarxes ha treballat amb diversos indicadors i conceptes operatius de cohesió social, a voltes més explicitats, i a voltes menys.
Un dels indicadors per a mesurar la cohesió en una xarxa és el concepte de densitat relacional —és a dir, la porció d’interaccions que es materialitzen de les possibles en la xarxa. Des d’aquest punt de vista, una xarxa més densa és més cohesiva. Un altre indicador important és el concepte de centralització de grau d’entrada —és a dir, el grau de concentració de les interaccions en una xarxa des del punt de vista del receptor de les interaccions. Aquelles comunitats més centralitzades ens remeten a modes de cohesió més verticals i a lideratges forts. Com que les xifres de densitat en comunitats de Twitter sempre són baixes, aquí ens fixarem sobretot en la centralització de grau d’entrada, per a observar diferències entre grups.
L’anàlisi del grau o la intensitat de cohesió de diferents comunitats pot resultar d’interès; però encara més interessant pot resultar d’observar els modes o les formes de cohesió que coexisteixen en una o diverses xarxes. L’algoritme Louvain Multinivell (Blondel et al., 2008) per a la detecció comunitària ens permet identificar els criteris utilitzats pels participants d’una xarxa a l’hora de relacionar-se entre si, articulant d’aquesta manera estructures socials i modes de legitimació de les mateixes (Morales i Gras, 2017).
En conseqüència, en aquesta anàlisi s’implementaran les següents proves a les dades:
- identificació de les xifres de densitat en les xarxes, per a poder conèixer el grau general de cohesió en la xarxa;
- identificació comunitària, per a poder identificar les estructures que deriven de les interaccions entre els agents en la xarxa i comprendre les diferències entre els esdeveniments estudiats;
- identificació de les xifres de centralització de grau d’entrada en les xarxes i en les comunitats, per a poder detectar diferències entre comunitats pel que fa als tipus de lideratge.
Addicionalment, s’analitzaran les interaccions entre els participants pertanyents a diferents comunitats, per a identificar quina de les dues xarxes articula modes de cohesió més exclusius i quines interseccions entre comunitats diferents són més fèrtils en les dues xarxes. Tot plegat s’estudiarà des de la perspectiva de l’homofília/heterofília intercomunitària —és a dir, la tendència dels participants de la xarxa a mantenir relacions endogrupals o exogrupals.
2. Els atemptats de Barcelona i Cambrils
El primer cas d’estudi és la setmana del 17 al 26 d’agost del 2017. El 17 es van produir els atemptats de Barcelona i Cambrils, i el 26 va tenir lloc la manifestació multitudinària de rebuig als atemptats, amb l’eslògan «No tinc por». La captura de dades de Twitter va estar funcionant durant tota la setmana, caracteritzada per tots dos esdeveniments.
Els atacs i les mostres de rebuig es van esdevenir enmig d’un moment polític molt convuls. Eren dies clau en previsió del referèndum d’independència previst pel Govern de la Generalitat per a l’1 d’octubre. D’una banda, el Govern català, el Parlament de Catalunya i l’independentisme en general treballaven per poder-lo dur a terme; de l’altra, el Govern espanyol, el Tribunal Constitucional i els polítics catalans antiindependentistes treballaven per impedir-lo. Tal com veurem, la configuració d’aquests dos «bàndols» és clau per a entendre els modes de cohesió que se solidifiquen en la xarxa, tot i que és molt important ressaltar que no són els únics que l’estructuren.
Es van capturar un total d’1.194.480 mencions establertes entre 394.148 usuaris, a partir de la monitorització simultània dels següents hashtags o etiquetes (figura 1), tant en català com en castellà.
Font: Elaboració pròpia.
La xarxa sintetitzada a partir de les mencions —arestes— i els usuaris —nodes— és d’una densitat molt baixa —és a dir, s’hi donen el 0,0006 % de les connexions possibles. L’algoritme Louvain multinivell per a la identificació de comunitats s’ha aplicat a una resolució de 0,5 punts, fet que ha propiciat l’emergència de set clústers amb més del 2 % dels nodes de la xarxa (figura 2). La qualitat de la partició és molt alta —Q = 0,75—, fet que indica la bona significació matemàtica dels clústers identificats.
Font: Elaboració pròpia.
Des d’un punt de vista formal, les xifres de centralització de grau d’entrada globals i parcials suggereixen comunitats força horitzontals (figura 3). Ens trobem davant de comunitats de lideratges compartits. L’excepció és la comunitat 6, constituïda fonamentalment al voltant de retuits a un únic usuari de Twitter.
Font: Elaboració pròpia.
En les taules 1 i 2 figuren els lideratges en grau d’entrada de cadascuna de les set comunitats abans esmentades. És en funció d’aquests lideratges que les podem classificar de la manera següent:
- Comunitat 1. Barça i futbol. La comunitat més gran —conté el 22,52 % dels nodes— aplega usuaris relatius al FC Barcelona i a altres equips de futbol.
- Comunitat 2. Esfera pública catalana. La segona comunitat —conté el 17,75 % dels nodes— congrega diversos actors institucionals i polítics catalans, i alguns mitjans fortament criticats per l’independentisme.[1]
- Comunitat 3. Músics, celebritats i periodistes. La tercera comunitat —conté el 15,49 % dels nodes— reuneix tothom que expressa solidaritat als seus referents de la música «llatina» mitjançant retuits.
- Comunitat 4. Institucions espanyoles. La quarta comunitat —conté el 12,36 % dels nodes— emergeix en paral·lel a la segona, incorporant significativament il·lustres catalans antiindependentistes.
- Comunitat 5. Esquerra espanyola. La cinquena comunitat —conté l’11,6 % dels nodes— congrega alguns dels referents més importants de l’esquerra espanyola contemporània i aconsegueix «retenir» l’exministre Zoido, a conseqüència d’haver-li demanat en massa la dimissió.
- Comunitat 6. Ajuntament de Madrid. La sisena comunitat —conté el 3,89 % dels nodes— creix al caliu de pocs retuits a l’Ajuntament de Madrid, i també a usuaris que fan humor burlant-se del Daesh.
- Comunitat 7. PSOE i Recortes Cero. La setena comunitat —conté el 2,47 % dels nodes— reuneix algunes de les personalitats més importants del socialisme espanyol, conjuntament amb un incòmode company de viatge: la marca blanca de la secta paracomunista UCE.[2]
3. La campanya electoral del 25 de desembre de 2017
El segon cas d’estudi correspon a la campanya electoral de les eleccions autonòmiques imposades pel Govern espanyol a Catalunya el 21 de desembre del 2017 i les jornades posteriors: del 4 al 26 de desembre del 2017.
Les eleccions van tenir lloc després de l’1 d’octubre i en plena intervenció de la Generalitat mitjançant l’article 155. Bona part dels membres de les llistes del Parlament eren a la presó o a l’exili, i la unitat d’acció independentista, palesada en l’anterior projecte de Junts pel Sí, s’havia desfet o, com a mínim, dissolt en gran manera. L’antiindependentisme, per la seva banda, també afrontava els comicis en candidatures separades. Malgrat la situació anòmala, es pot considerar que les eleccions van ser en bona part normals; protagonitzades per partits que pugnaven per la generació i ampliació del seu espai electoral.
En total, es van capturar 7.395.221 mencions entre 386.600 usuaris, a partir d’una estratègia de monitorització basada en la captura de les mencions a partits i candidats principals a Twitter.
La xarxa sintetitzada és més densa que l’anterior —s’hi donen el 0,003 % de les connexions possibles— a causa del seu major nombre de mencions i menor nombre d’usuaris. Tanmateix, segueix essent una xarxa de densitat molt baixa que possibilita la identificació de comunitats aïllades. L’algoritme Louvain multinivell per a la identificació de comunitats s’ha aplicat a una resolució d’1 punt, i s’han obtingut 7 clústers amb més del 2 % dels nodes de la xarxa (figura 4). La qualitat de la partició és acceptable —Q = 0,32—, fet que anticipa comunitats menys aïllades entre si.
Font: Elaboració pròpia.
Si observem les xifres globals i parcials de centralització de grau d’entrada (figura 5) ens trobem amb unes estructures força jeràrquiques. La comunitat amb els lideratges més forts és la 7, liderada per Xavier García Albiol i el PP català; la més horitzontal és la 4, liderada per Catalunya en Comú.
Font: Elaboració pròpia.
En les següents taules 3, 4 i 5 figuren els lideratges en grau d’entrada de cadascuna de les set comunitats. Tenen les característiques següents:
- Comunitat 1. La comunitat més gran —conté el 27,74 % dels nodes— agrupa els principals líders, partits i associacions de l’independentisme.
- Comunitat 2. La segona comunitat —conté el 19,35 % dels nodes— la lideren polítics de Ciutadans.
- Comunitat 3. Esquerra espanyola. La tercera comunitat —conté el 12,8 % dels nodes— congrega usuaris espanyols d’esquerres molt actius a Twitter, al voltant de la figura de Gabriel Rufián.
- Comunitat 4. Catalunya en Comú. La quarta comunitat —conté el 12,02 % dels nodes— reuneix els líders catalans i espanyols dels Comuns, d’EUiA i de Podemos.
- Comunitat 5. La cinquena comunitat —conté el 8,69 % dels nodes— la lideren els parlamentaris i exparlamentaris de la CUP i altres persones afins.
- Comunitat 6. La sisena comunitat —conté el 5,94 % dels nodes— la lideren el PSC, l’antiga Unió i diversos mitjans catalans.
- Comunitat 7. PP català. La setena comunitat —conté el 5,91 % dels nodes— congrega els principals usuaris del PP català i espanyol de la xarxa.
Font: Elaboració pròpia.
4. Anàlisi comparativa de les relacions entre clústers
Per a analitzar les relacions entre clústers en els dos casos plantejats, s’ha aplicat l’Índex E-I (Krackhardt i Stern, 1988) en totes les interseccions possibles entre clústers. L’indicador d’homofília expressa numèricament (en una escala de −1 a 1) el grau de preferència per a les relacions endogrupals (és a dir, −1 = homofília perfecta; totes les relacions s’estableixen entre nodes del mateix grup) o per a les exogrupals (1 = heterofília perfecta; totes les relacions s’estableixen entre nodes de grups diferents).
Cal tenir en compte que el procediment aplicat per a generar els grups —els clústers— és la maximització de les relacions intragrup i la minimització de les relacions entre grups; en conseqüència, és esperable trobar-nos amb xifres d’homofília molt altes. D’altra banda, és important emfatitzar que l’existència d’interaccions abundants no implica que siguin positives.
Pel que fa al primer cas d’estudi, la intersecció més fecunda entre les comunitats identificades es dona entre l’esfera pública catalana i l’esquerra espanyola. Els nodes relatius a aquestes dues comunitats són els que més relacions interclúster mantenen (taula 6).
Font: Elaboració pròpia.
En el segon cas d’estudi trobem un nombre molt elevat de diferències respecte al primer. En primer terme, les xifres són, en general, més allunyades de −1
—homofília perfecta—, cosa que indica una major tendència a les interaccions entre clústers (taula 7). Aquest fet pot estar propiciat per la similitud més gran entre els participants en la conversa. Pel que fa a les diferències en el volum d’interaccions entre clústers, cal destacar:
- El tipus d’interaccions més fecundes suggereixen major permeabilitat i capacitat de creixement entre els clústers de les esquerres —Esquerra espanyola – Catalunya en Comú, Esquerra espanyola – CUP i Catalunya en Comú – CUP. Cal destacar que ERC no es trobava en aquest clúster durant el període analitzat.
- Ciutadans està igualment vinculat a l’independentisme que al PP, fet que obre la porta a considerar la importància d’interaccions negatives, basades en retrets i insults —Ciutadans-Independentisme.
- L’Esquerra espanyola, liderada per Rufián però no per ERC, és l’únic agent que replica la seva posició estructural respecte a la xarxa anterior, i mostra preferència per la interacció amb les esquerres catalanes.
- El PSC, la comunitat més aïllada de la resta i la menys permeable. També la que té menys capacitat d’influir sobre les altres.
Font: Elaboració pròpia.
5. Conclusions principals
L’estudi presentat s’ha dut a terme a partir de les interaccions establertes entre usuaris de Twitter en dos períodes d’efervescència col·lectiva desigualment connotats: els atemptats a Barcelona i Cambrils i la setmana posterior durant l’agost del 2017 i la campanya electoral per a les eleccions al Parlament de Catalunya imposades pel Govern de l’Estat durant el desembre del mateix any.
El tipus d’anàlisi implementada s’ha basat en l’exploració estructural i ha obtingut els resultats següents:
- Igual nombre de participants però participació desigual, menys intensa en la conversa sobre els atemptats
Totes dues xarxes tenen un nombre similar de participants —xarxa 1 = 394.148; xarxa 2 = 386.600—, però nombres molt diferents d’interaccions registrades —xarxa 1 = 1.194.480; xarxa 2 = 7.395.221.
Derivada de la condició anterior, la densitat relacional de les dues xarxes és molt diferent, superior a la segona —xarxa 1 = 0,0006 %; xarxa 2 = 0,003 %. En tots dos casos, segueix sent baixa: la immensa majoria d’interaccions possibles no es materialitzen.
- Major horitzontalitat en la conversa sobre els atemptats que en la conversa de la campanya electoral
La segona xarxa no és només més densa, sinó que compta amb xifres més elevades de centralització de grau d’entrada. La conversa electoral és més jeràrquica i orientada als líders polítics que la conversa de condol generada al voltant dels atemptats. S’observen diferències entre comunitats, sobretot en la conversa sobre els atemptats.
- Les dues converses han fet emergir formes de cohesió diferents i que coexisteixen en la societat catalana
En totes dues xarxes s’han trobat set comunitats significatives que congreguen més del 2 % dels nodes. En la primera xarxa hi ha comunitats al voltant d’una diversitat de temes, d’entre els quals en destaquen de no polítics —esport, música i mitjans de comunicació. Entre els clústers que podem considerar polítics, s’hi distingeixen formacions que podem identificar com a modes de legitimació nacional(ista) diferents: l’esfera pública catalana i les institucions espanyoles. Es tracta de formes de relació que superen sobre manera les lògiques de partits, sobretot en el cas català. En la segona xarxa hi ha menys diversitat temàtica en la conformació de comunitats: totes són polítiques. Cada partit constitueix el seu propi espai electoral, el qual es tradueix en comunitats al voltant d’usuaris de partits polítics i candidats principals. Només s’observa una comunitat que transcendeix la lògica de partits: la comunitat independentista agrupa usuaris de Junts per Catalunya i d’ERC. En les interaccions dels usuaris de Twitter es pot interpretar que Junts pel Sí continuava viu aleshores.
- Les comunitats de la conversa electoral són més permeables, sobretot les de les esquerres catalanes i espanyola
Finalment, s’han observat diferències importants en les xifres d’homofília/heterofília intercomunitària. Les comunitats de la primera xarxa estan més aïllades i són més impermeables: cadascú expressa el condol i el rebuig als atacs a través de relacions amb un sol tipus d’usuari, de manera molt marcada. En la segona xarxa hi ha més espai per a la interacció entre usuaris de comunitats diferents, sobretot entre els clústers de les esquerres i entre clústers fortament enfrontats, com l’independentisme i Ciutadans.
Malgrat la proximitat en el temps dels dos esdeveniments, hem pogut veure com les diferències entre les dues xarxes són abundants i suggerents. El tipus d’anàlisi implementat és exploratori i, malgrat el fort component algorítmic i matemàtic que té, requereix un mode d’interpretació basat en la inducció. Des del punt de vista de la cohesió social, podem destacar unes quantes idees que se’n deriven, tant de la teoria social com dels resultats obtinguts:
- Tot i que reflecteixen aspectes diferents d’una mateixa societat, tant «estructurals» són els grups emergents en la primera com en la segona xarxa, precipitats tots dos per esdeveniments contingents que formen i reformen constantment la mateixa estructura social.
- En la societat catalana operen simultàniament diferents formes de cohesió, enteses com a modes d’articulació de les relacions intergrup i intragrup i com a formes de legitimació d’aquestes mateixes relacions. L’èxit social d’aquestes formes de cohesió i la capacitat que tenen de generar comportament social dependrà de la capacitat dels seus agents promotors de mantenir el relat al llarg del temps, tant de manera conscient com inconscient.
- Des de la perspectiva de l’anàlisi de xarxes socials i amb el tipus de material empíric aquí explorat, no és possible d’afirmar quines formes de cohesió són més potents, però sí que és possible conèixer en quins jocs relacionals s’incrusten i quines són les seves contraparts.
Referències
Blondel, Vincent; Guillaume, Jean-Loup; Lambiotte, Renaud; Lefebvre, Etienne (2008). «Fast Unfolding of Communities in Large Networks». Journal of Statistical Mechanics: Theory and Experiment, núm. 10.
Cheong F, Cheong C. (2011). Social media data mining: A social network analysis of tweets during the 2010-2011 Australian floods. Pacific Asia Conference on Information Systems 2011, p. 7-11.
Festinger, Leon (1950). «Informal social communication». Psychological Review, vol. 57, núm. 5, p. 271-282.
Hansen, Dereck; Shneiderman, Ben; Smith, Marc (2010). Analyzing social media networks with node XL: Insights from a connected world. San Francisco: Morgan Kaufmann Publishers.
Hutto, C. J.; Gilbert, Eric (2014). VADER: A parsimonious rule-based model for sentiment analysis of social media text [en línia]. Barcelona: International AAAI Conference on Weblogs and Social Media. <https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&cad=rja&uact=8&ved=2ahUKEwi2gq7t4tHoAhUs5eAKHcN-B1gQFjACegQIBRAB&url=https%3A%2F%2Fwww.aaai.org%2Focs%2Findex.php%2FICWSM%2FICWSM14%2Fpaper%2Fdownload%2F8109%2F8122&usg=AOvVaw3Nhm_ptH5xQQGvSyVZcWqc>.
Krackhardt, D; Stern, R (1988). «Informal networks and organizational crises: An experimental simulation». Social Psychology Quarterly [Washington: American Sociological Association], vol. 51, núm 2, p. 123-140.
Lewin, Kurt (1952). Field theory in social science: Selected theoretical papers. Londres: Tavistock Publications.
Lin, J.; Kolcz, A. (2012). Large-scale machine learning at Twitter [en línia]. SIGMOD ’12: Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data.. <https://doi.org/10.1145/2213836.2213958>, p. 793-800.
Morales i Gras, Jordi (2017). Soberanías enredadas: Una perspectiva reticular, constructural y agéntica hacia los relatos soberanistas vasco y catalán contemporáneos en Twitter [en línia]. Universidad del País Vasco / Euskal Herriko Unibetsitatea. <https://addi.ehu.es/handle/10810/22686>.
Pennacchiotti, Marco; Popescu, Ana-Maria (2011). A machine learning approach to Twitter user classification [en línia]. Barcelona: International AAAI Conference on Weblogs and Social Media. <https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&ved=2ahUKEwjwmsWH4NHoAhULmBQKHQZMA0UQFjACegQIBxAB&url=https%3A%2F%2Fwww.aaai.org%2Focs%2Findex.php%2FICWSM%2FICWSM11%2Fpaper%2Fdownload%2F2886%2F3262&usg=AOvVaw16_-N2oslzngYS_Z9dw-Bk>.
Postill, John; Pink, Sarah (2012). Social media ethnography: The digital researcher in a messy web [en línia]. Media International Australia, vol. 145, núm. 1, p. 123-134. <https://doi.org/10.1177/1329878X1214500114>.
Schwartz, H. Andrew; Eichstaedt, Johannes; Kern, Margaret; Dziurzynski, Lukasz; Ramones, Stephanie; Agrawal, Megha; Shah, Achal; Kosinski, Michal; Stillwell, David; Seligman, Martin; Ungar, Lyle (2013). Personality, gender and age in the language of social media: The open-vocabulary approach [en línia]. PLOS ONE, vol. 8, núm. 9. <https://doi.org/10.1371/journal.pone.0073791>.
[1]. Les crítiques a El País per publicar fotografies de les víctimes mortals menors d’edat i pel seu polèmic editorial «Parar la CUP» van atraure el mitjà antiindependentista i de matriu estatal al clúster.
[2]. La Unificación Comunista de España està considerada des del 1990 una secta per part del centre sanitari de salut mental Atenció i Investigació de Socioadiccions.