Traiter le discours des bibliothèques sur les réseaux sociaux numériques par l’analyse de données textuelles et l’analyse de réseaux

Résumé

Cet article propose de présenter la méthodologie utilisée lors d’une recherche en cours sur la réappropriation du réseau social numérique Twitter par les bibliothèques et médiathèques municipales françaises. L’objectif est de parvenir à dégager la façon dont le discours des bibliothèques à l’intention des usagers s’organise et se structure sur Twitter. Notre méthodologie se traduit par une typologisation manuelle des tweets publiés par un panel de bibliothèques, suivie par une analyse des données textuelles de ces tweets – grâce aux logiciels Tropes et IRaMuTeQ. Le recours à une représentation visuelle sous la forme de graphes – grâce au logiciel Gephi – des résultats de cette dernière analyse s’est révélée particulièrement pertinente pour appuyer et faciliter leur interprétation. Au-delà de leur intérêt heuristique, nous souhaitons également mettre en avant, à travers cette présentation, les bénéfices que pourraient tirer les bibliothèques des analyses de données textuelles.

Index

Mots-clés

bibliothèques, réseaux sociaux numériques, analyse de données textuelles, analyse de réseaux

Texte

À l’instar de nombreuses autres organisations, les bibliothèques doivent impérativement communiquer pour être pérennes. L’enjeu, pour ces dernières, est de communiquer efficacement à propos de leurs services, programmations, ressources, activités et missions, et, in fine, susciter de l’engagement1 auprès des publics qu’elles touchent. Parmi les supports communicationnels les plus utilisés par les bibliothèques pour répondre à cet enjeu, on peut compter les affiches, les magazines et les programmes imprimés. Cependant, depuis le début des années 1960 le développement du numérique provoque des changements au sein des bibliothèques (Chevry, Pébayle et Slouma, 2016). Elles ont ainsi connu tour à tour le site Internet qui permet la diffusion d’informations auprès d’une audience à la fois nombreuse et distante, et le Web social qui autorise plus d’interactions avec cette même audience.

Toutefois, les sites Internet institutionnels, qui étaient jusque-là considérés comme le principal mode d’accès à distance aux services et aux informations des bibliothèques, voient leur pertinence remise en cause tant les usagers ne semblent plus aujourd’hui s’y intéresser. Par conséquent, ils ne peuvent plus garantir la communication entre les bibliothèques et les usagers (Kouakou, 2014). Les réseaux sociaux numériques (RSN) sont désormais les plateformes les plus fréquentées et les plus utilisées par les internautes (Kouakou, 2014). Il est d’ailleurs aussi démontré que les usagers sont plus intéressés par les informations diffusées sur ces médias plutôt qu’aucun autre (Izuagbe et al., 2019). Au vu de ces éléments, la présence des bibliothèques sur les réseaux sociaux numériques se révèle être d’autant plus importante et nécessaire. Les bibliothèques ont donc dû repenser leur stratégie communicationnelle en ligne et aller chercher les usagers là où ils se trouvent pour maintenir le contact avec eux, poursuivre leurs missions et valoriser leurs services. On observe donc depuis une dizaine d’années que l’usage des outils de réseaux sociaux numériques tend à se développer chez les bibliothèques pour multiplier et améliorer les échanges et les interactions avec les publics (Audouard, 2018 ; Gaillard, 2018 ; Georges, 2010 ; Kouakou, 2015). Ces dispositifs sont finalement devenus centraux dans la stratégie communicationnelle en ligne des bibliothèques (Harrison et al., 2017).

Les réseaux sociaux numériques permettent d’envisager de nombreuses possibilités et de nouvelles façons de valoriser les collections et les services, de toucher de nouveaux publics, de créer du lien social, d’impliquer les lecteurs dans la documentarisation ou la collecte de documents numériques, de partager toutes sortes d’informations (Al-Daihani et Abrahams, 2016 ; Georges, 2010 ; Harrison et al., 2017 ; Kouakou, 2014, 2015 ; Slouma et Chevry Pébayle, 2017). Les bibliothèques souhaitent instaurer à l’aide de ces dispositifs « une meilleure relation entre institutions et usagers » (Chevry Pébayle et Rondot, 2018, p. 81). « Ainsi se dessine, derrière l’utilisation croissante des RSN, l’existence d’une congruence (Candel, 2007) entre fonctionnalités supposées d’un dispositif technique et objectifs communicationnels et médiationnels d’une institution culturelle. » (Chevry Pébayle et Rondot, 2018, p. 81-82).

Dans une de nos recherches en cours, nous nous intéressons à l’usage que font les bibliothèques municipales françaises de la plateforme Twitter qui est, avec Facebook, l’un des réseaux sociaux numériques les plus utilisés par les bibliothèques pour leur communication avec les usagers (Al-Daihani et Abrahams, 2016). Le développement de cette étude s’articule autour de deux questionnements essentiels ; à savoir, « de quoi parlent les bibliothèques municipales françaises sur Twitter ? » et « comment le disent-elles ? ». L’objectif est de parvenir à dégager la façon dont le discours des bibliothèques à l’intention des usagers s’organise et se structure sur Twitter.

Nous proposons ici de présenter, non pas les résultats de cette recherche2, mais la méthodologie qui a été la nôtre pour répondre à ces questionnements. D’un point de vue opératoire, notre méthodologie se traduit, dans un premier temps, par une typologisation manuelle des tweets publiés par un panel de bibliothèques municipales françaises qui est complétée, dans un second temps, par une analyse des données textuelles des discours produits dans ces tweets – grâce aux logiciels Tropes et IRaMuTeQ. Cette dernière étape a notamment fait l’objet d’une représentation visuelle sous la forme de graphes pour appuyer et faciliter notre interprétation des résultats obtenus – grâce au logiciel Gephi. Par cette mise en exergue graphique des structures et des contenus discursifs des tweets étudiés, ce procédé s’est effectivement révélé pertinent pour répondre à nos objectifs.

1. Matériel et méthodes

1.1. Terrain

La recherche dont nous présentons ici la méthodologie s’intéresse à l’usage que font les bibliothèques des réseaux sociaux numériques et plus particulièrement à leur production de contenus sur ceux-ci ; en d’autres termes, leur discours. À cette fin, le terrain de recherche retenu est Twitter 3 auquel les bibliothèques ont souvent recours pour répondre à de multiples enjeux et besoins communicationnels et promotionnels (Al-Daihani et Abrahams, 2016 ; Del Bosquet et al., 2012 ; Gunton et Davis, 2012 ; Milestein, 2009 ; Shulman et al., 2015). D’ailleurs, plusieurs chercheurs semblent s’accorder pour dire que les bibliothèques devraient utiliser Twitter pour interagir plus avec leurs usagers4 – et non pas seulement l’utiliser pour diffuser de l’information – afin de tirer le meilleur bénéfice de cette plateforme (Cole, 2009 ; Cuddy et al., 2010 ; Del Bosque et al., 2012 ; Dickson et Holley, 2010 ; Gaillard, 2015 ; Gunton et Davis, 2012 ; Milstein, 2009 ; Sewell, 2013).

« L’interaction entraîne l’interaction, et plus l’on répond, commente, met en favori, retweete, plus on peut obtenir en retour du contact, de l’engagement, des nouveaux followers et de l’intérêt pour l’institution, ses collections et ses services. » (Gaillard, 2015).

Une telle entreprise d’étude du discours des bibliothèques nécessite la constitution préalable pour analyse d’un corpus des tweets 5 des profils en question. Pour constituer ce dernier nous avons décidé de restreindre notre sélection aux profils de bibliothèques (ou médiathèques)6 qui remplissent les critères suivants : (1) la bibliothèque est française ; (2) la bibliothèque est municipale ; (3) la bibliothèque a un profil Twitter qui lui est propre ; (4) la bibliothèque a un profil Twitter actif depuis au moins un an au 30 juin 2020 ; (5) la bibliothèque a un profil Twitter qui a été actif en 2020 avant le 16 mars 2020. Nous avons finalement sélectionné aléatoirement les profils Twitter de 13 bibliothèques qui répondent à ces exigences (tableau 1).

Tableau 1. Informations sur les profils Twitter des bibliothèques retenues

Profils Twitter	Dénomination	Commune (code département)
@BibBeaune	Gaspard Monge	Beaune (21)
@BibHavel	Václav Havel	Paris (75)
@biblideols	Eugène Hubert	Déols (36)
@bibliolocmine	-	Locminé (56)
@BibMolleges	-	Mollégès (13)
@bibvaugirard	Vaugirard	Paris (75)
@Italiebib	Italie	Paris (75)
@LaMejanes	La Méjanes	Aix-en-Provence (13)
@media_hyeres	Saint-John Perse	Hyères (83)
@mediateyran	-	Teyran (34)
@mediatheque_dz	Georges-Perros	Douarnenez (29)
@MediathequeC	Isidore Rollande	Châteaurenard (13)
@MMSenlis	-	Senlis (60)

1.2. Échantillonnage

Cette sélection une fois faite, nous avons extrait, le 30 juin 2020, les publications des profils Twitter précédemment cités7 – grâce à l’extension Twlets (navigateur Google Chrome) qui permet d’exporter ces données sous la forme d’un tableur. Précisons que Twitter n’autorise l’extraction que de 3200 publicationspar profil. Twlets impose donc une restriction d’extraction à hauteur de cette autorisation ; il nous a donc été impossible de récolter la totalité des publicationsdes profils @BibHavel (4226 au 30 juin 2020) et @media_hyeres (4772 au 30 juin 2020)8. Nous avons extrait 15 584 publications de cette manière (tous profils confondus) ; le tableau 2 précise le nombre de publicationsrécoltées pour chacun des profils étudiés (colonne « Extractions »). Nous avons écarté trois types de publicationsde cette première extraction. Les publicationspostées pendant la période de confinement et de post-confinement due à la pandémie de Covid-19 ont été écartées en premier car nous souhaitions étudier des contenus produits en temps « normal » (avant le 16 mars 2020), les publications faites pendant cette période pouvant certainement répondre à des logiques inhabituelles. Les retweets 9 ont ensuite été écartés car ils ne constituent pas une publication originale. Enfin, nous avons écarté les commentaires mis en réponse à d’autres publications. Garder ces différentes publications aurait alors constitué un biais évident dans nos analyses et les conclusions qui en auraient découlé. Le corpus ainsi constitué est composé de 8991 tweets (tableau 2, colonne « Corpus »).

C’est finalement au sein de ce corpus que nous avons sélectionné des échantillons (pour un total de 2632 tweets [tableau 2, colonne « Échantillons »]) afin de mener à bien nos analyses et notre recherche. Analyser un échantillon a ceci d’intéressant que cela permet de produire des résultats à partir d’effectifs moindres. Il faut toutefois, pour que ces résultats soient statistiquement significatifs, que l’échantillon analysé comptabilise un nombre suffisant d’éléments pour être représentatif – de plus, l’échantillon doit être prélevé aléatoirement au sein de la population étudiée. Calculer la taille idéale minimale d’un tel échantillon à partir d’une population dont la taille est connue se fait selon la formule suivante :

Tableau 2. Nombre de publications par extraction, corpus et échantillon des profils étudiés (30 juin 2020)

Profils Twitter	Extractions	Corpus	Échantillons	Rapport corpus/extraction
@BibBeaune	2169	1185	291	0,55
@BibHavel	3197	1706	314	0,53
@biblideols	665	600	235	0,9
@bibliolocmine	867	790	259	0,91
@BibMolleges	80	77	65	0,96
@bibvaugirard	2531	1411	303	0,56
@Italiebib	638	84	70	0,13
@LaMejanes	152	114	89	0,75
@media_hyeres	3242	1603	311	0,49
@mediateyran	741	646	242	0,87
@mediatheque_dz	226	204	134	0,9
@MediathequeC	444	385	193	0,87
@MMSenlis	264	186	126	0,7
Total	15 584	8991	2632

1.3. Typologie

Au-delà de l’intérêt heuristique, réaliser une typologie du discours des bibliothèques aiderait ces dernières à mieux déterminer quelles sont les catégories de publications les plus efficaces en termes de portée et d’engagement de l’auditoire. À travers l’analyse de ces publications discriminées, les bibliothèques pourraient ainsi être en mesure d’optimiser non seulement leur communication, mais aussi leurs services, leurs programmations, etc.

Nous avons donc catégorisé manuellement chacun des tweets qui constituent nos échantillons. D’autres chercheurs, comme Audouard et al. (2018) ou Stvilia et Gibradze (2014, 2017), ont déjà proposé des typologies de tweets de bibliothèques. Parce qu’elle nous semble plus détaillée et parce qu’elle a été élaborée sur la base d’un échantillon bien plus large, nous avons retenu pour socle de référence la typologie de Stvilia et Gibradze (2014, 2017), et ce, sans écarter la possibilité d’avoir à créer des catégories ad hoc si cela s’avérait nécessaire ; la typologie de référence s’étant toutefois montrée suffisante, cette éventualité ne s’est pas présentée. Cette typologie avait été structurée sur la base de l’analyse des tweets publiés par les bibliothèques universitaires de six universités publiques américaines membres de l’Association des universités américaines (Association of American Universities [AAU]). Elle s’articule autour de neuf types de tweets ; à savoir, « événement » (event), « ressource » (resource), « développement de la communauté » (community building), « état du service » (operations update), « soutien aux études » (study support), « personnel » (staff), « enquête » (survey), « club » (club) et « question et réponse » (Q&A) (tableau 3).

Tableau 3. Typologie des tweets de bibliothèques universitaires selon Stvilia et Gibradze (2014, 2017)

Catégories	Définitions
Événement (event)	Cette catégorie inclut les tweets qui concernent les événements qui sont généralement hébergés par les bibliothèques (ateliers, animations, projections, inaugurations, expositions, conférences, etc.).
Ressource (resource)	Cette catégorie inclut les tweets qui concernent les ressources mises à disposition par les bibliothèques (catalogue, ressources numériques, abonnements, blog, etc.). Cette catégorie inclut aussi les ressources trouvées sur le Web que les bibliothèques souhaitent partager.
Développement de la communauté (community building)	Cette catégorie inclut les tweets qui font la promotion des bibliothèques comme lieux où l’on peut recevoir de l’aide pour ses recherches, où l’on peut faire une sortie, se réunir, se divertir, etc. Cette catégorie inclut aussi les encouragements et les félicitations envers les usagers (pour, par exemple, la réussite aux examens) ou envers les bibliothèques elles-mêmes (pour, par exemple, l’obtention d’un label).
État du service (operations update)	Cette catégorie inclut les tweets qui font le point sur les mises à jour du service des bibliothèques (heures et jours d’ouverture, fermetures exceptionnelles, maintenances, problèmes techniques, etc.). Cette catégorie concerne aussi les aménagements des différents espaces.
Soutien aux études (study support)	Cette catégorie inclut les tweets qui font la promotion des bibliothèques comme lieux d’étude et qui fournissent de nombreux services d’aide et de soutien aux études.
Personnel (staff)	Cette catégorie inclut les tweets qui présentent les membres du personnel des bibliothèques. Cette catégorie présente aussi les derniers recrutements et/ou les offres d’emplois.
Enquête (survey)	Cette catégorie inclut les tweets qui diffusent des enquêtes auprès des communautés d’usagers. Cette catégorie inclut aussi les recrutements de volontaires pour tester de nouveaux services.
Club (club)	Cette catégorie inclut les tweets qui présentent les groupes et les clubs hébergés par les bibliothèques (groupes de jeux, clubs de lecture, etc.).
Question et réponse (Q&A)	Cette catégorie inclut les tweets qui répondent aux questions habituelles sur le service et le fonctionnement des bibliothèques (horaires d’ouverture et de fermeture, modalités d’emprunt, tarifs, etc.).

Par exemple, la typologisation des tweets des bibliothèques nous a permis dans un premier temps de dégager la répartition globale (figure 1) ou détaillée (figure 2) des publications des organisations observées. On constate notamment, sur la répartition globale, que la communication des bibliothèques sur Twitter repose sur trois piliers ; à savoir, les tweets « événement » (41,6 %), les tweets « ressource » (31,7 %) et les tweets « développement de la communauté » (17,9 %). À eux trois, ces types de tweets occupent 91,2 % du volume total des contenus directement publiés par les bibliothèques sur Twitter10. Quant à la répartition détaillée, on peut y apprécier les variations qui existent d’une bibliothèque à une autre. On voit notamment que, sur les treize profils étudiés, huit profils enregistrent une publication majoritaire de tweets « événement » (@biblideols, @bibliolocmine, @BibMolleges, @LaMejanes, @mediateyran, @mediatheque_dz, @MediathequeC, @MMSenlis), quatre autres profils enregistrent une publication majoritaire de tweets « ressource » (@bibbeaune, @BibHavel, @bibvaugirard, @media_hyeres) et, enfin, un dernier profil enregistre une publication majoritaire de tweets « développement de la communauté » (@Italiebib).

Figure 1. Répartition moyenne des tweets publiés par les bibliothèques municipales selon leur type (en pourcentage)

Figure 2. Répartitions des tweets publiés par les bibliothèques municipales selon leur type (en pourcentage)

1.4. Analyse de données textuelles

Nous avons souhaité accompagner la typologisation des tweets par une analyse de son contenu textuel11. Cette méthode est de plus en plus utilisée dans les recherches sur les bibliothèques (Al-Daihani et Abrahams, 2016).

Au-delà d’un cadre de recherche académique, les données textuelles extraites des médias sociaux sont souvent utilisées – de façon plus ou moins sophistiquée – par les organisations pour, d’une part, analyser les discours produits par les usagers et, d’autre part, appuyer la prise de décision stratégique (Abrahams et al., 2015). Les bibliothèques pourraient tirer avantage de cette méthode (Zhang et Gu, 2011), que ce soit en analysant les discours produits par leurs usagers, par d’autres bibliothèques ou par elles-mêmes. En effet, les renseignements et les conclusions issus de telles analyses peuvent être exploitables comme autant d’aides à la prise de décision stratégique, que ce soit pour optimiser une communication en ligne, une offre de services ou autre.

Pour analyser les données textuelles produites, nous utilisons les logiciels Tropes et IRaMuTeQ. Si Tropes peut sembler relativement primaire comme outil d’analyse sémantique, c’est justement sa simplicité d’utilisation qui pourrait faire sa force dans le cadre d’un usage professionnel par des bibliothécaires qui ne seraient pas formés à ce genre de méthodologies.

Tropes et IRaMuTeQ réalisent des analyses qui reposent sur des lemmes et les éventuelles connexions entre ceux-ci. Toutefois, il existe quelques subtilités de fonctionnement entre ces deux logiciels qu’il nous semble important de relever car elles peuvent être source de légères variations dans les données et résultats présentés (tableaux 4 et 5). Tropes réalise ses analyses sur les « Références » présentes dans un texte ainsi que les éventuelles « Relations » entre celles-ci. « Les Références représentent le contexte. Elles regroupent, dans des classes d'équivalents, les principaux substantifs du texte que vous analysez. » et « Les Relations indiquent quelles Références sont fréquemment reliées (c'est-à-dire rencontrées à l'intérieur d'une même proposition), dans le texte analysé. » (Molette et Landré, 2018). IRaMuTeQ,quant à lui, réalise ses analyses sur des « formes » présentes dans un texte ainsi que les éventuelles « cooccurrences » entre celles-ci. « Le logiciel fait une lemmatisation […] à l’aide de ses dictionnaires et peut ainsi regrouper les formes au singulier et au pluriel sous une même forme, les verbes conjuguées sous la forme infinitive. » (Baril et Garnier, 2015, p. 8). Une autre différence en termes de traitement des corpus est à noter, IRaMuTeQ considère les verbes dans son analyse et les restitue dans son fichier exportable pour la mise en graphe sous Gephi alors que Tropes les traite aussi mais ne les inclut pas dans son fichier exportable pour la même destination. Cette différence de traitement est intéressante dans le cadre d’une lecture croisée et complémentaire des résultats.

Il convient également d’exposer les limites de ces logiciels. Les résultats des analyses réalisées par Tropes ou IRaMuTeQ sont plus significatifs à mesure que les corpus analysés se densifient. Or, dans le cas des tweets, ceux-cisont limités à un maximum de 280 caractères, ce qui peut être un biais. C’est pourquoi nous réalisons nos traitements sur des compilations de tweets que nous pouvons discriminer en fonction de la typologie et/ou du profil.

Avec les résultats bruts obtenus, nous pouvons dans un premier temps procéder à une lecture quantitative de ceux-ci. Tous les lemmes et toutes les connexions sont classés selon leur nombre d’occurrences. En d’autres termes, nous pouvons déjà dégager de ces données les lemmes les plus employés dans les tweets et leurs associations les plus marquées, ce qui revient en quelques sortes à extraire les caractéristiques textuelles diagnostiques des tweets de notre corpus, et ce, selon leur type. Dans un deuxième temps, nous pouvons ensuite faire une lecture plus qualitative de ces résultats. L’analyse sémantique discriminée des corpus permet ainsi de révéler les cohérences entre le sens dominant dégagé du contenu textuel des tweets analysés et les thématiques induites par la typologie qui leur est associée. Pour des raisons pratiques de lecture, les résultats présentés à titre d’exemple ne présentent que les dix références/formes et les dix relations/cooccurrences les plus importantes – selon différentes variables – pour les tweets « événement » (tableaux 4 et 5).

Par exemple, la lecture croisée des analyses textuelles des tweets « événement » nous révèle une composition qui s’articule principalement autour de constructions ayant pour base les références « samedi », « exposition », « médiathèque » ou « bibliothèque », « atelier », « lecture », « découverte » ou « découvrir » et « livre » (tableaux 4 et 5)12. Cette base discursive est fréquemment complétée et précisée par d’autres indications. Ces indications sont notamment spatiales et sont induites par l’utilisation des références « pays » qui agrègent en une catégorie des noms de pays et de villes (tableau 4). Ces derniers peuvent renvoyer au lieu de l’événement ou bien à son thème (comme une exposition sur le Japon). Ces indications sont également temporelles puisqu’on observe une utilisation marquée des références « mois » qui regroupent les différents mois de l’année (tableau 4). Il s’agit donc d’un complément de date. Au vu de ces résultats, nous pouvons donc interpréter que la majorité des tweets « événement » font la promotion d’expositions, d’ateliers et de lectures publiques. Ces événements se produisent principalement au sein des bibliothèques, plutôt le samedi, et leur entrée est libre et gratuite (cf. relations « entrée > libre », « libre > gratuité » et « entrée > gratuité », et cooccurrences « entrée/libre », « samedi/gratuit » et « gratuit/libre »). Plusieurs événements, notamment les lectures, s’adressent aux enfants (cf. relations « enfants > années » et « livre > petit »).

Tableau 4. Exemple des références et relations des tweets « événement » (Tropes)

Tweets « événement »
Références par fréquence (nombre d’occurrences)	mois* (483), pays* (313), samedi (223), médiathèque (167), littérature* (139), exposition (125), lecture* (111), années (107), atelier (103), bibliothèque (101)
Références par nœuds voisins (nombre de liens uniques connectés)	samedi (83), exposition (66), médiathèque (59), atelier (55), lecture* (54), bibliothèque (48), découverte* (38), années (36), livre (36), mercredi (34)
Références par degrés (nombre de liens connectés)	samedi (115), exposition (77), médiathèque (77), lecture* (66), atelier (64), bibliothèque (61), découverte* (44), années (42), livre (42), concours* (38), mercredi (38)
Relations par poids (nombre d’occurrences)	entrée > libre† (57), libre > gratuité† (29), samedi > mars (26), enfants > années (24), livre > petit† (23), samedi > décembre (22), atelier > écriture (21), bibliothèque > bouches-du-rhône (20), samedi > janvier (20), samedi > juin (20), samedi > octobre (20), semaine > mardi (19), semaine > samedi (19), entrée > gratuité† (18), rendez-vous > samedi (18), gratuité > inscription† (18), mardi > samedi (18), samedi > février (18)

Tableau 5. Exemple des références et relations des tweets « événement » (IRaMuTeQ)

Tweets « événement »
Formes par fréquence (nombre d’occurrences)	samedi (204), médiathèque (135), venir (98), atelier (86), bibliothèque (81), exposition (81) , lecture (77), gratuit (73), partir (69), livre (66), libre (66)
Formes par degrés (nombre de liens connectés)	samedi (115), bibliothèque (38), médiathèque (32), venir (30), découvrir (19), atelier (16), gratuit (15), exposition (14), livre (12), douarnenez (12), lecture (12)
Cooccurrences par poids	samedi/médiathèque (10), entrée/libre (9.8), samedi/gratuit (5.5), samedi/15h30 (5.3), gratuit/libre (4.9), samedi/atelier (4.3), venir/médiathèque (4.3), samedi/partir (4.3), 17h/samedi (3.9), place/rester (3.7), samedi/lecture (3.7), samedi/janvier (3.7)

1.5. Analyse de réseaux

Enfin, pour faciliter la lecture des données précédemment récoltées, nous avons souhaité représenter graphiquement ces dernières, plus particulièrement sous la forme de graphes, puisque la présence de relations et de cooccurrences entre des lemmes le permettait. Cette mise en forme visible nous a paru nécessaire pour optimiser l’interprétation des données produites car, comme le disait Bertin :

« Les données ne fournissent pas l’information nécessaire à la prise de décision. Ce qu’il est nécessaire de voir ce sont les relations que l’ensemble des données construit. […] la graphique peut faire découvrir les relations d’ensemble. C’est son but. […] c’est un système de signes, rigoureux et simple, que chacun peut apprendre à utiliser et qui permet de mieux comprendre. Il permet donc de mieux décider. » (Bertin, 2017, p. 1).

Les fichiers exportés à partir de Tropes et d’IRaMuTeQ permettent chacun de créer un type de graphes différent (grâce au logiciel Gephi qui est spécialisé dans l’analyse et la visualisation de réseaux). Les nœuds (ou sommets) y représentent les références/formes et les liens (ou arrêtes) y représentent les relations/cooccurrences. Chacun de ces graphes a été décliné sous deux formes ; à savoir, une forme qui met évidence la fréquence des références/formes (taille des nœuds proportionnelle au nombre d’occurrences des références/formes qu’ils représentent) et une forme qui met en évidence le degré de connexion des références/formes entre elles (taille des sommets proportionnelle au nombre de liens qui les connectent avec d’autres sommets). L’épaisseur des liens est proportionnelle aux cooccurrences des sommets qu’ils connectent. Pour des raisons pratiques de lecture, les graphes proposés à titre d’exemple sont des versions simplifiées avec un nombre réduit de sommets et d’arrêtes (figures 3 et 4).

Les fichiers GEXF13 exportés de Tropes permettent la création de graphes orientés qui mettent en réseau toutes les références et les relations extraites des corpus étudiés (figure 3). Précisons que dans un graphe orienté, les cooccurrences peuvent être bilatérales. Un des avantages de ce type de graphes est de fournir un réseau complet de toutes les références et relations qui composent un corpus. Toutefois, leur lecture se complexifie à mesure qu’ils se densifient. L’intérêt d’utiliser Tropes pour produire ce genre de graphes est que ce logiciel précise le domaine conceptuel auquel les références appartiennent. Dans la figure 3, les références appartenant à un même domaine conceptuel sont représentées par des sommets de même couleur.

Figure 3. Exemples de graphes orientés des références et des relations des tweets « événement »

Le graphe de gauche met l’emphase sur la fréquence des références et celui de droite sur leur degré de connexion

Les fichiers GraphML14 exportés d’IRaMuTeQ permettent la création de graphes non- orientés qui traduisent graphiquement une analyse des similitudes sous la forme d’un « arbre maximum » de toutes les formes et cooccurrences extraites des corpus étudiés (figure 4).

« L’objectif de l’ADS est d’étudier la proximité et les relations entre les éléments d’un ensemble, sous forme d’arbres maximum : le nombre de liens entre deux items évoluant "comme le carré du nombre de sommets" (Flament et Rouquette, 2003, p. 88), l’ADS cherche à réduire le nombre de ces liens pour aboutir à "un graphe connexe et sans cycle" (Degenne et Vergès, 1973, p. 473). » (Marchand et Ratinaud, 2012, p. 688).

Un des avantages de ce type de graphes est de simplifier la lecture des données récoltées tout en mettant en avant les cooccurrences les plus fortes. Un autre de leurs avantages est de permettre la détection de communautés de lemmes. Ces communautés sont constituées de lemmes fortement cooccurrents ; les différentes communautés sont reliées entre elles par des liens plus faibles. Dans la figure 4, les lemmes au sein d’une communauté sont représentés par des sommets de même couleur.

Figure 4. Exemples d’arbres maximum des formes et des cooccurrences des tweets « événement »

Le graphe de gauche met l’emphase sur la fréquence des formes et celui de droite sur leur degré de connexion

Conclusion et perspectives

Dans cet article, nous avons présenté la méthodologie que nous appliquons dans nos recherches actuelles sur l’usage des réseaux sociaux numériques par les bibliothèques municipales françaises. À travers cette présentation, nous avons également souhaité mettre en avant les bénéfices que pourraient tirer les bibliothèques des analyses de données textuelles. En effet, les renseignements et les conclusions issus de telles analyses peuvent être exploitables comme autant d’aides à la prise de décision stratégique, que ce soit pour optimiser une communication en ligne, une offre de services ou autre. Plus généralement, Audouard et al. (2018) et Sandhu (2015) insistent sur l’importance et les enjeux, pour les bibliothèques, d’exploiter, pour les premiers, les données métriques fournies par les réseaux sociaux numériques et, pour le second, de se former à l’extraction de données et aux outils de Big Data. Par exemple, Shulman et al. (2015) ont analysé le réseau social Twitter de deux bibliothèques universitaires américaines pour y identifier les usagers les plus influents afin de les « recruter » pour améliorer la diffusion de l’information auprès du reste des usagers.

Pourtant, si chercheurs, bibliothèques et autres praticiens des sciences de l’information et de la communication ont proposé plusieurs modèles et conseils pour répondre à cet enjeu dans un cadre « traditionnel » (hors ligne), peu de recherches ont en revanche cherché à y répondre dans le cadre des réseaux sociaux numériques. Il y a donc un réel besoin, pour les bibliothèques, en termes de modèles aussi bien théoriques que pratiques et opérationnels pour diffuser une information efficace sur ces plateformes (Stvilia et Gibradze, 2014). C’est pourquoi, partant de ce principe, et au-delà de l’intérêt heuristique de notre recherche, nous souhaitons aussi dépasser le cadre académique pour proposer à terme une méthodologie opérationnelle que les bibliothèques pourraient utiliser afin d’optimiser leur communication en ligne.

À cette fin, nous envisageons à terme de mener une recherche- action en bibliothèque où nous proposerions, entre autres, des formations à l’analyse de données extraites des réseaux sociaux numériques, et ce, notamment sur la base de nos travaux actuels et à venir.

1 Nous entendons ici par « engagement » la propension des publics à interagir avec une bibliothèque, que ce soit de manière physique (en s’y rendant…

2 Bien que le but de cet article ne soit pas de présenter les résultats de l’étude que nous évoquons, nous en présenterons tout de même quelques-uns…

3 Si nous avons retenu ici Twitter, la méthodologie que nous présentons est tout à fait applicable à d’autres réseaux sociaux numériques comme…

4 À cette fin, Del Bosque et al. (2012) encouragent les bibliothèques à recourir aux fonctionnalités qui ont fait la particularité de Twitter ; à…

5 Messages écrits – et visibles publiquement – sur le réseau social numérique Twitter.

6 Pour des raisons pratiques, nous n’emploierons dans cet article que le terme de bibliothèque pour faire référence à la fois aux bibliothèques et…

7 Lorsque nous parlons de publications, nous faisons référence aux tweets, retweets et commentaires confondus. Ici nous ne souhaitons étudier que les…

8 Twlets a toutefois réussi à extraire 3242 publicationspour le profil @media_hyeres ; nous ne sommes pas en mesure d’expliquer cela.

9 Tweets qui sont repartagés sur le réseau social numérique Twitter.

10 Pour rappel, nous excluons de ce calcul les retweets et les commentaires.

11 Les liens hypertextes présents dans les tweets ont été retirés de l’analyse.

12 Les références marquées d’un astérisque (*) renvoient à des regroupements conceptuels et catégoriels de lemmes. Les relations marquées d’un obèle…

13 Le format Graph Exchange XML est un langage qui permet de décrire les structures en réseaux complexes ainsi que les données et attributs qui leur…

14 Le format GraphML est un langage qui permet de décrire les structures en réseaux complexes ainsi que les données et attributs qui leur sont…

Bibliographie

ABRAHAMS Alan S., FAN Weiguo, WANG Alan G., ZHANG Zhongju (John) et JIAO Jian, 2015, « An integrated text analytic framework for product defect discovery », Production and Operations Management, vol. 24, n° 6, p. 975-990.

AL-DAIHANI Sultan Melfi et ABRAHAMS Alan, 2016, « A Text Mining Analysis of Academic Libraries' Tweets », The Journal of Academic Librarianship, vol. 42, n° 2, p. 135-143.

AUDOUARD Marie-Françoise, RIMAUD Mathilde et WIART Louis, 2018, Des tweets et des likes en bibliothèque. Enquête sur la présence de quatre bibliothèques de lecture publique sur les réseaux sociaux numériques, Villeurbane, Presses de l’enssib.

BARIL Élodie et GARNIER Bénédicte, 2015, Utilisation d’un outil de statistiques textuelles. IRaMuteQ 0.7 alpha 2 - Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires.

BERTIN Jacques, 2017, La graphique et le traitement graphique de l’information, Bruxelles, Zones sensibles.

CHEVRY PÉBAYLE Emmanuelle et SLOUMA Maher, 2016, « Facebook et les médiathèques : entre appropriation des professionnels et réception des usagers », ESSACHESS – Journal for Communication Studies, vol. 9, n° 2, p. 125-139.

CHEVRY PÉBAYLE Emmanuelle et RONDOT Camille, 2018, « Affiches publicitaires numérisées et réseaux sociaux numériques : enjeux stratégiques et sémiotiques pour les bibliothèques », Études de communication, vol. 51, n° 2, p. 79-94.

COLE Sonja, 2009, « 20 ways for librarians to use Twitter », Library Journal, vol. 134, n° 11, p. 25.

CUDDY Colleen, GRAHAM Jamie et MORTON-OWENS Emily G., 2010, « Implementing Twitter in a health sciences library », Medical Reference Services Quarterly, vol. 29, n° 4, p. 320-330.

DEL BOSQUE Darcy C., LEIF Sam A. et SKARL Susie, 2012, « Libraries atwitter: Trends in academic library tweeting », Reference Services Review, vol. 40, n° 2, p. 199-213.

DICKSON Andrea et HOLLEY Robert P., 2010, « Social networking in academic libraries: The possibilities and the concerns », New Library World, vol. 111, n° 11-12, p. 468-479.

GAILLARD Romain, 2015, « Twitter en bibliothèque. Comparatif des statistiques et des pratiques », Bulletin des bibliothèques de France, [en ligne] URL : https://bbf.enssib.fr/contributions/twitter-en-bibliotheque, consulté le 22 décembre 2020.

GAILLARD Romain, 2018, « Élaborer et mettre en œuvre une stratégie digitale : identité et marque sur les réseaux sociaux », in ACCART J.-P. (dir.), Personnaliser la bibliothèque : construire une stratégie de marque et augmenter sa réputation, Paris, Presses de l’Enssib, p. 147-158.

GEORGES Fanny, 2010, « Pratiques informationnelles et identités numériques », Études de communication, n° 35, p. 105-120.

GUNTON Lyndelle Robyn et DAVIS Kate, 2012, « Beyond broadcasting: Customer service, community and information experience in the Twittersphere », Reference Services Review, vol. 40, n° 2, p. 224-227.

HARRISON Amanda, BURRESS Rene, VELASQUEZ Sarah et SCHREINER Lynette, 2017, « Social Media Use in Academic Libraries: A Phenomenological Study », The Journal of Academic Librarianship, vol. 43, n° 3, p. 248-256.

IZUAGBE Roland, IFIJEH Goodluck., IZUAGBE-ROLAND Edith I., OLAWOYIN Olajumoke Rebecca et OGIAMIEN Lilofa Osamenfa, 2019, « Determinants of perceived usefulness of social media in university libraries: Subjective norm, image and voluntariness as indicators », The Journal of Academic Librarianship, vol. 45, n° 4, p. 394-405.

KOUAKOU Kouassi Sylvestre, 2014, « Réseaux sociaux numériques : quels enjeux pour les bibliothèques ? », Cahiers de la Documentation, n° 2, p. 26-33.

KOUAKOU Kouassi Sylvestre, 2015, « Adoption des réseaux sociaux numériques par les bibliothécaires des universités ivoiriennes : Une approche par l’UTAUT », Les Cahiers du numérique, vol. 11, n° 2, p. 167-202.

MARCHAND Pascal et RATINAUD Pierre, 2012, « L’analyse de similitude appliquée aux corpus textuels : les primaires socialistes pour l’élection présidentielle française (septembre-octobre 2011) », in Actes des 11es Journées internationales d’Analyse statistique des Données Textuelles(JADT), Liège, p. 687-699.

MILSTEIN Sarah, 2009, « Twitter for libraries (and librarians) », Computers in Libraries, vol. 29, n° 5, p. 17-18.

MOLETTE Pierre et LANDRÉ Agnès, 2018, Tropes (version 8.5) [logiciel]. Tropes. https://www.tropes.fr/

SANDHU Gurdish, 2015, « Re-envisioning library and information services in the wake of emerging trends and technologies », in KATARIA J., ANBU K. J. P., RAM S. et GARTNER R. (dir.), The 4th International Symposium on Emerging Trends and Technologies in Libraries and Information Services, Noida, p. 153-160.

SEWELL Robin R., 2013, « Who is following us? Data mining a library's Twitter followers », Library Hi Tech, vol. 31, n° 1, p. 160-170.

SLOUMA Maher et CHEVRY PÉBAYLE Emmanuelle, 2017, « Le lien social dans les bibliothèques universitaires à l’ère des réseaux sociaux numériques », Les Cahiers du numérique, vol. 13, n° 2, p. 123-146.

SHULMAN Jason, YEP Jewelry et TOMÉ Daniel, 2015, « Leveraging the Power of a Twitter Network for Library Promotion », The Journal of Academic Librarianship, vol. 41, n° 2, p. 178-185.

STVILIA Besiki et GIBRADZE Leila, 2014, « What do academic libraries tweet about, and what makes a library tweet useful? », Library & Information Science Research, vol. 36, n° 3-4, p. 136-141.

STVILIA Besiki et GIBRADZE Leila, 2017, « Examining Undergraduate Students’ Priorities for Academic Library Services and Social Media Communication », The Journal of Academic Librarianship, vol. 43, n° 3, p. 257-262.

Notes

1 Nous entendons ici par « engagement » la propension des publics à interagir avec une bibliothèque, que ce soit de manière physique (en s’y rendant par exemple) ou bien de manière numérique (par des activités, entre autres, de lecture, de consultation, de marquage, de partage ou encore de commentaires sur les réseaux sociaux numériques).

2 Bien que le but de cet article ne soit pas de présenter les résultats de l’étude que nous évoquons, nous en présenterons tout de même quelques-uns à titre illustratif.

3 Si nous avons retenu ici Twitter, la méthodologie que nous présentons est tout à fait applicable à d’autres réseaux sociaux numériques comme Facebook.

4 À cette fin, Del Bosque et al. (2012) encouragent les bibliothèques à recourir aux fonctionnalités qui ont fait la particularité de Twitter ; à savoir, la messagerie privée, la mention nominative pour interpeler directement quelqu’un dans un tweet (en écrivant @ suivi du nom d’un profil) et le hastag (« mot-dièse » en français) pour ajouter des mots-clés cliquables (en écrivant # suivi d’un mot-clé) dans un tweet (ce qui permet d’avoir un suivi de l’ensemble des tweets avec le même hashtag).

5 Messages écrits – et visibles publiquement – sur le réseau social numérique Twitter.

6 Pour des raisons pratiques, nous n’emploierons dans cet article que le terme de bibliothèque pour faire référence à la fois aux bibliothèques et aux médiathèques municipales.

7 Lorsque nous parlons de publications, nous faisons référence aux tweets, retweets et commentaires confondus. Ici nous ne souhaitons étudier que les tweets, c’est-à-dire les messages originaux postés sur Twitter.

8 Twlets a toutefois réussi à extraire 3242 publicationspour le profil @media_hyeres ; nous ne sommes pas en mesure d’expliquer cela.

9 Tweets qui sont repartagés sur le réseau social numérique Twitter.

10 Pour rappel, nous excluons de ce calcul les retweets et les commentaires.

11 Les liens hypertextes présents dans les tweets ont été retirés de l’analyse.

12 Les références marquées d’un astérisque (*) renvoient à des regroupements conceptuels et catégoriels de lemmes. Les relations marquées d’un obèle (†) renvoient à des regroupements conceptuels et catégoriels de relations.

13 Le format Graph Exchange XML est un langage qui permet de décrire les structures en réseaux complexes ainsi que les données et attributs qui leur sont associés.

14 Le format GraphML est un langage qui permet de décrire les structures en réseaux complexes ainsi que les données et attributs qui leur sont associés.

Illustrations

docannexe/image/123/img-1.png

Figure 1. Répartition moyenne des tweets publiés par les bibliothèques municipales selon leur type (en pourcentage)

docannexe/image/123/img-2.png

Figure 2. Répartitions des tweets publiés par les bibliothèques municipales selon leur type (en pourcentage)

docannexe/image/123/img-3.png

Figure 3. Exemples de graphes orientés des références et des relations des tweets « événement »

Le graphe de gauche met l’emphase sur la fréquence des références et celui de droite sur leur degré de connexion

docannexe/image/123/img-4.png

Figure 4. Exemples d’arbres maximum des formes et des cooccurrences des tweets « événement »

Le graphe de gauche met l’emphase sur la fréquence des formes et celui de droite sur leur degré de connexion

docannexe/image/123/img-5.png

Citer cet article

Référence électronique

Ugo Roux, « Traiter le discours des bibliothèques sur les réseaux sociaux numériques par l’analyse de données textuelles et l’analyse de réseaux », PasserelleSHS [En ligne], 1 | 2021, mis en ligne le 18 octobre 2021, consulté le 15 juillet 2026. URL : https://ouest-edel.univ-nantes.fr/passerelleshs/index.php?id=123

Auteur

Ugo Roux

IMSIC - Aix-Marseille Université

Autres ressources du même auteur

Droits d'auteur

Creative Commons - By-Sa-Nc 4.0

Autres articles in : Articles thématiques

Alexandre Vergos
18 octobre 2021 - « Étudier et représenter les réseaux des familles aristocratiques aux XI^e-XII^e siècles : le comté de Melgueil »
Stéphanie Urban
18 octobre 2021 - « La Réforme catholique à Angoulême (1588-1655) : individus et réseaux entre interactions et confrontations »
Ségolène Mathieu et Léa Renucci
18 octobre 2021 - « Expérience partagée des réseaux de savoirs »
Amaena Guéniot
18 octobre 2021 - « Réencastrer la production en réseaux »
Pauline Gomont
18 octobre 2021 - « Parrainages et compérages chez les peintres dijonnais de la première moitié du XVII^esiècle »
Julie Delclaux
18 octobre 2021 - « Réseau social et système socio-écologique dans la mise en œuvre d’une politique publique : le cas d’une gestion locale du réseau écologique »
Laurent Beauguitte
18 octobre 2021 - « Théorie des graphes et analyse de réseau en géographie : histoire d’un lien faible (1950-1963) »