Le classement des informations

Publié le 12 avril 2018

Face à l’abondance des données disponibles sur le web, les algorithmes des moteurs de recherche et des réseaux sociaux numériques trient et de hiérarchisent les informations de manières différentes.

AUTEURS

Dominique Cardon

Sociologue, professeur à Sciences Po/Medialab - Auteur de : A quoi rêvent les algorithmes : Nos vies à l'heure des Big data - Seuil, 2015

Les moteurs de recherche procèdent en deux temps. Ils commencent par extraire du web l’ensemble des pages qui correspondent le mieux aux mots clés de l’utilisateur en cherchant une correspondance entre la requête de l’internaute et le contenu des pages. Cependant, le nombre de pages du web répondant aux mots-clés de l’utilisateur peut être considérable. Aussi, la deuxième opération que réalisent les moteurs de recherche consiste-t-elle à hiérarchiser ces sites afin de produire un classement qui ne fera apparaître que quelques liens sur la première page de résultats. Le principe mis en œuvre pour ce classement considère que les pages qui doivent être les mieux classées sont celles qui ont reçu le plus de liens hypertextes venant d’autres pages du web qui ont, elles-mêmes, reçus beaucoup de liens hypertextes venant d’autres pages, etc. Les sites qui apparaissent ainsi en tête des classements sont donc ceux qui ont été le plus cités par d’autres pages du web. À ce principe général qui a donné naissance à l’algorithme du PageRank de Google en 1999, les moteurs de recherche ont ajouté de nombreux autres paramètres : la fraicheur de l’information, la qualité globale du site, la vitesse de chargement de la page et des techniques de personnalisation, notamment en fonction de la localisation de l’internaute qui fait la requête. Les moteurs de recherche développent aujourd’hui des méthodes de plus en plus complexes à partir de techniques d’apprentissage automatique qui intègrent, pour une part du classement, le comportement des internautes. En cliquant sur le 1er, le 3ème ou le 10ème lien des résultats du moteur de recherche, l’internaute donne une information sur la pertinence des informations à l’algorithme qui va alors « apprendre » de cette information une procédure pour réviser ses règles de classement.

Le classement des informations sur les réseaux sociaux fonctionne sur un principe très différent.

Le classement des informations sur les réseaux sociaux, notamment sur le fil d’actualité de Facebook, fonctionne sur un principe très différent. En choisissant les « amis » auxquels ils s’abonnent, les internautes construisent un espace informationnel personnalisé. Les informations qui leur seront montré dans leur fil d’actualité seront issues des activités de publication, d’appréciation et de partage de leurs abonnés. Les algorithmes des réseaux sociaux procèdent ensuite à un filtrage des informations selon des méthodes différentes, changeantes et assez secrètes. Sur Facebook, l’algorithme du fil d’actualité privilégie les informations issues de l’activité des « amis » avec lesquelles l’internaute à un niveau d’engagement fort comme, par exemple, ceux dont il like ou commente fréquemment les publications. À l’inverse, les publications des amis qui reçoivent peu d’attention de la part de l’internaute ont moins de chance d’apparaître dans son fil d’actualité. Par ailleurs, Facebook optimise le fil d’actualité avec des techniques d’apprentissage dont l’objectif est de faire rester le plus longtemps l’utilisateur sur Facebook. En fonction des liens cliqués par les utilisateurs Facebook, l’algorithme sélectionne les informations dont il prédit qu’elles feront rester l’utilisateur le plus longtemps sur la plateforme. En privilégiant ainsi les informations qui retiennent l’attention, ce mécanisme permet de faire entrer dans le fil d’actualité de l’internaute des informations très populaires, comme des vidéos humoristiques ou des informations drôles et déconcertantes (et parfois de “fausses informations”) qui ont reçu beaucoup de visites même si elles n’ont pas été partagé par beaucoup d’amis de l’utilisateur.

Pour aller plus loin

  • « Want to be on the top? Algorithmic power and the threat of invisibility on Facebook”
    Bucher (Taina), New Media & Society, vol. 14, n°7, 2012, pp. 1164-1180..
  • The Algorithmization of the Hyperlink
    Helmond (Anne), Computational Culture, n°3, 12 novembre 2013
  • « The Filter Bubble. What the internet is Hiding from You »
    Pariser (Eli), New York, The Penguin Press, 2011.

Ajouter une ressource

Participer vous aussi au développement de la transparence des algorithmes et des données en ajoutant des ressources

Commentaires

Les commentaires pour cette ressource sont désactivés.