Étiquettes

, , , , ,

1’039’819 tweets géolocalisés en Suisse, écrits par 65’221 comptes Twitter,  récoltés du 18 février au 31 août 2017 : que nous apprennent-ils sur notre pays ou sur ceux qui les écrivent ?

Twitter met à disposition les tweets* publics via une Application Programming Interface (API), accompagnés d’environ 80 champs de métadonnées, que nous avons examinés en détail dans le cadre d’un projet exploratoire quantitatif. Cela nous a permis de fixer trois questions de recherche :

  1. Dans quelle mesure le système d’identification automatique des langues par Twitter permet-il d’obtenir une image réelle de la diversité linguistique de la Suisse?
  2. Comment peut-on exploiter les deux types de géolocalisations* de Twitter dans le contexte suisse ?
  3. Est-il possible de définir un tweet suisse à partir des données de notre échantillon?

Les premiers résultats ont été présentés le 15 décembre lors d’une session de poster [Poster_helvetweet_Zuber_Motisi_20171214]. Ce billet traitera plus spécifiquement de la troisième question.

 

Définitions de la nationalité d’un tweet

Depuis l’apparition de Twitter en 2006, de nombreuses études ont traité des tweets, la plupart du temps par thématique, mais également par nationalité. Voici quelques projets qui nous ont particulièrement intéressés :

  • Depuis 2009, le projet TrISMA en Australie a identifié manuellement et suit près de 4 millions de comptes australiens, en se basant sur les fuseaux horaires déclarés et les réseaux constitués (abonnés-abonnements*) (Bruns et al., 2014).
  • En Autriche, ce sont les comptes liés à la politique qui ont été étudiés : en partant d’une liste de mots (noms des partis politiques ou de politiciens, sujets politiques d’actualité), les tweets écrits par des twittos* actifs dans ce domaine ont été récupérés et les liens entre eux identifiés (Ausserhofer, Maireder, 2013).
  • En Grande-Bretagne, la British library récupère et archive des tweets liés à des événements particuliers (Meikle, 2013).
  • En Hollande, des comptes Twitter mentionnant un des 38’000 mots hollandais retenus ont été récupérés, puis comparés par l‘Utrecht Data School à une liste de comptes de référence contenant « ij » dans le nom, ce qui serait typiquement hollandais (Potting, 2016).
  • En Italie, les ‘Trending topics’ propres à l’Italie ont été récupérés et analysés (Marchetti, Ceccobelli, 2016).
  • En Suède, un étudiant a cherché à repérer automatiquement le genre des twittos suédois. Pour cela, il a extrait les abonnés de trois comptes connus dans le pays, puis les a trié manuellement, en enlevant les comptes d’entreprises, ou dont les tweets n’étaient pas en suédois (Matérne, 2017).

 

A partir de ces expériences internationales, comment définir la « suissitude » des tweets ? Peut-on récupérer ou s’inspirer de leur méthodologie ?

  • La localisation ne concerne qu’un petit nombre de personnes : 1 à 2% des tweets sont géolocalisés, soit en moyenne 5’416 par jour sur notre récolte. Il y aurait donc entre 270’000 et 540’000 tweets en Suisse chaque jour, mais comment les retrouver parmi les 500 millions de tweets au total ?
  • La langue n’est pas un critère pour repérer les tweets suisses, car à part le romanche (non différencié par l’algorithme de Twitter), aucune autre langue n’est typiquement suisse. De plus, le tiers de nos tweets sont reconnus en anglais.
  • Récupérer les tweets sur des sujets ou hashtags est complexe en Suisse à cause du multilinguisme.
  • Les personnalités politiques sont souvent actives sur Twitter, car cela représente une tribune ouverte pour eux. Ils sont suivis par des journalistes, des experts des domaines traités ou des citoyens. En 2014, 81 parlementaires fédéraux avaient un compte Twitter (Rauchfleisch, Metag, 2016).
  • Les 184 lieux signalés par les fuseaux horaires dans 71% de nos tweets couvrent le monde entier : c’est donc impossible de s’y référer pour retrouver les tweets suisses

Répartition des tweets selon le fuseau horaire des comptes. Source de la carte

Pour une définition des tweets suisses

Comme on le constate d’après les expériences internationales, il est difficile de trouver une seule manière d’aborder la Twittosphère*. Pour la Suisse, pays multilingue, touristique, accueillant beaucoup d’étrangers et situé géographiquement au milieu d’autres, la tâche est encore plus compliquée.

D’autre part, si les tweets sont nombreux, leur contenu et leurs métadonnées ne sont pas toujours significatifs. La Bibliothèque nationale suisse n’archive actuellement pas les tweets. Au vu de l’évolution de Twitter, la Bibliothèque du Congrès américaine a renoncé à archiver la totalité des messages, préférant cibler des événements ou thèmes particuliers (Osterberg, 2017). Avec l’émergence de nouveaux réseaux sociaux se pose la question du choix : pourquoi utiliser et analyser Twitter ?

Notre rapport présentera plus précisément les résultats de notre exploration, évoquant des pistes potentielles pour de futures recherches.

Agnes-A Motisi-Nagy et Tania Zuber-Dutoit

 

Pour les curieux qui souhaitent vérifier si leurs tweets sont géolocalisés, un site permet de les tester en ligne : http://geosocialfootprint.com

* les mots suivis d’un astérisque sont définis par Twitter : https://help.twitter.com/fr/glossary

Références

AUSSERHOFER, Julian et MAIREDER, Axel, 2013. National politics on Twitter: Structures and topics of a networked public sphere. In : Information, Communication & Society [en ligne]. avril 2013. Vol. 16, n° 3, p. 291‑314. [Consulté le 29 décembre 2017]. DOI 10.1080/1369118X.2012.756050. Disponible à l’adresse : http://www.tandfonline.com/doi/abs/10.1080/1369118X.2012.756050.

BRUNS, Axel, BURGESS, Jean et HIGHFIELD, Tim, 2014. A ‘big data’approach to mapping the Australian Twittersphere. In : Advancing Digital Humanities [en ligne]. S.l. : Springer. p. 113–129. [Consulté le 28 novembre 2017]. Disponible à l’adresse : https://eprints.qut.edu.au/82986/1/A%20Big%20Data%20Approach%20to%20Mapping%20the%20Australian%20Twittersphere.pdf. https://eprints.qut.edu.au

LATZER, Michael, BÜCHI, Moritz, FESTIC, Noemi et JUST, Natascha, 2017. Internetanwendungen und deren Nutzung in der Schweiz 2017 : Themenbericht aus dem World Internet Project  –  Switzerland 2017 [en ligne]. Zürich. Universität Zürich. [Consulté le 2 janvier 2018]. Disponible à l’adresse : http://mediachange.ch/media/pdf/publications/Anwendungen_Nutzung_2017.pdf.

MARCHETTI, Rita et CECCOBELLI, Diego, 2016. Twitter and Television in a Hybrid Media System. In : Journalism Practice [en ligne]. 3 juillet 2016. Vol. 10, n° 5, p. 626‑644. [Consulté le 2 janvier 2018]. DOI 10.1080/17512786.2015.1040051. Disponible à l’adresse : https://doi.org/10.1080/17512786.2015.1040051.

MATÉRNE, Hanna, 2017. Gender Inference on Twitter in Swedish Contexts : Master’s thesis [en ligne]. Gothenburg : Chalmers University of Technology. [Consulté le 29 décembre 2017]. Disponible à l’adresse : publications.lib.chalmers.se/records/fulltext/250449/250449.pdf.

MEIKLE, James, 2013. British Library adds billions of webpages and tweets to archive. In : The Guardian [en ligne]. London, 4 avril 2013. [Consulté le 2 janvier 2018]. Disponible à l’adresse : http://www.theguardian.com/technology/2013/apr/05/british-library-archive-webpages-tweets.

OSTERBERG, Gayle, 2017. Update on the Twitter Archive at the Library of Congress. In : Library of Congress Blog [en ligne]. 26 décembre 2017. [Consulté le 3 janvier 2018]. Disponible à l’adresse : http://blogs.loc.gov/loc/2017/12/update-on-the-twitter-archive-at-the-library-of-congress-2.

POTTING, J., 2016. Completeness in Twitter datasets : A critical review on Twitter research methodologies [en ligne]. Master thesis. Utrecht : Utrecht University. [Consulté le 28 novembre 2017]. Disponible à l’adresse : http://dspace.library.uu.nl/handle/1874/338956. Utrecht University Repository

RAUCHFLEISCH, Adrian et METAG, Julia, 2016. The special case of Switzerland: Swiss politicians on Twitter. In : new media & society [en ligne]. 2016. Vol. 18, n° 10, p. 2413–2431. [Consulté le 29 décembre 2017]. DOI 10.1177/1461444815586982. Disponible à l’adresse : http://journals.sagepub.com/doi/pdf/10.1177/1461444815586982.

Image à la une et infographie: freepik

Publicités