Algorithme de recommandation : Qu’est-ce que c’est ? Comment ça fonctionne ?

-
4
 m de lecture
-

Quand Youtube nous recommande des vidéos répondant à nos préoccupations du moment, quand Amazon suggère des articles à même de nous intéresser, qu’est ce qui est à l’œuvre ? Les algorithmes de recommandation. Des systèmes d’une grande sophistication qui visent à personnaliser toujours plus l’expérience utilisateur. Au risque d'engendrer des effets de polarisation pas toujours désirables. Et de soulever des questions relatives au croisement à grande échelle d’informations nous concernant et relevant de diverses sources…

Lorsque des sociétés comme Amazon, Google ou Facebook ont investi le secteur d’Internet et marqué leur territoire là où des dizaines de milliers de start-ups avaient mordu la poussière, elles ont eu affaire à une problématique particulière : Comment fidéliser le visiteur ? Comment faire en sorte qu’il soit tenté de revenir, et dans le cas des sites d’information ou de streaming, qu’il reste le plus longtemps possible.

Tandis qu’ils défrichaient ce territoire vierge, les géants du Web ont inventé des méthodes inédites de séduction d’un visiteur par le biais d’algorithmes de recommandation.

Ces algorithmes ont été développés dans l’objectif de :

  • rendre l’expérience utilisateur la plus agréable possible ;
  • présenter au visiteur un contenu le plus approprié à ce qu’il souhaite découvrir ;
  • accroître les performances de plusieurs indicateurs clés (durée de visionnement de vidéo, temps de lecture, panier moyen, etc.) ;
  • filtrer les informations de façon à s’adapter à chacun.

Le mot-clé essentiel ici est : personnalisation. Pour un média tel que Facebook, cela relève du tour de force. Plus de deux milliards d’usagers bénéficient d’un fil d’actualité unique et mis à jour à chaque seconde.

Observons aussi le cas de YouTube. Le n°1 de la vidéo en ligne stocke des milliards de vidéos et en accueille de nouvelles, jour après jour. Pourtant, lorsque vous vous connectez à YouTube, cette plateforme ne vous recommande que quelques dizaines de clips, avec une sélection qui change à chaque visite mais s’acharne – pas toujours de façon très subtile, il est vrai – à vous proposer un programme en mesure de vous interpeller. Comment Youtube procède-t-il pour vous proposer des contenus à même de vous faire revenir et découvrir toujours plus de vidéos ? Principalement en combinant les thèmes qui semblent vous concerner à un moment donné et ceux d’autres internautes qui présentent un profil similaire au vôtre.

Tous les grands acteurs du numérique ont rapidement saisi les opportunités offertes par le vaste réservoir de données offertes par les internautes. De nos jours, ces algorithmes de recommandation sont mis en œuvre par un très grand nombre de sites Web. Ils sont conçus pour identifier à tout moment de nouveaux contenus les plus appropriés. Les exemples les plus connus étant :

  • les posts ou les suggestions d’amis de Facebook, Instagram ou Twitter ;
  • les produits recommandés par Amazon ou Alibaba ;
  • les clips proposés par YouTube ou TikTok ;
  • les articles mis en avant par des sites d’actualités ;
  • les destinations et activités suggérées par des sites de voyage comme Booking et TripAdvisor.

L’efficacité de cette approche est indéniable. Ainsi, chez Netflix, 80 % des films les plus visionnés sont issus des algorithmes de recommandation.

Comment opèrent les algorithmes de recommandation ?

Comment les géants du Web procèdent-ils pour ainsi cibler toujours davantage chacun d’entre nous ? Leurs algorithmes de recommandation utilisent des techniques de filtrage en vue d’identifier des modèles. Les principaux mécanismes mis en œuvre sont les suivants.

Le filtrage collaboratif

Le filtrage collaboratif (collaborative filtering) est un des algorithmes de recommandation les plus utilisés et les plus performants. Il repose sur cette prémisse : si deux personnes ont aimé des contenus identiques par le passé, il est probable qu’elles apprécieront les mêmes choses dans le futur.

L’avantage du filtrage collaboratif est qu’il n’est absolument pas directif. Il se fonde uniquement sur l’historique de l’usager. Cette approche a cependant pour défaut de réduire la diversité du contenu présenté à l’internaute. Les utilisateurs ne sont pas exposés à des perspectives différentes, mais essentiellement à des informations alignées sur leurs convictions existantes.

Content-based

L’approche content-based analyse un ensemble de contenus sans prendre en compte les habitudes d’autres utilisateurs. Elle se concentre sur les similarités à des fins de recommandation. Le sujet d’un contenu est identifié en répertoriant les mots les plus importants puis en les comparant aux mots d’autres articles.

La popularité

Avec ce type d’algorithme, il est supposé que si vous fréquentez un site particulier, vous êtes à même d’apprécier les pages qui obtiennent le plus de visites. En clair, il recommande les contenus les plus populaires. L’avantage d’un tel algorithme est qu’il est possible de l’appliquer à de nouveaux usagers du site.

Les risques de la polarisation

Les algorithmes de recommandation offrent maints avantages pour les utilisateurs, car habituellement les recommandations personnalisées se révèlent pertinentes. Cependant, ils peuvent avoir maints revers et certains ont des conséquences sociétales.

Ainsi, le nombre de personnes professant des opinions extrêmes sur des sujets tels que la politique ou le réchauffement climatique a sensiblement augmenté. Or, cette « polarisation », peut sembler dangereuse, car en mesure d’affaiblir l’esprit critique ou plus simplement la capacité à s’extraire des sentiers battus.

Dans un même ordre d’idée, la SACEM a révélé que 99 % des morceaux les plus écoutés sur Spotify ne concernent que 10 % du catalogue. Plus inquiétant, 20 % des morceaux ne sont jamais proposés au public.

Le souci majeur est lié au croisement de données et à l’intégration d’informations externes à la plate-forme. Qui n’a pas été surpris de faire une recherche Google sur les grands pianistes de jazz pour voir ensuite YouTube proposer des vidéos en relation avec ce thème ou Facebook suggérer de s’inscrire à des groupes d’aficionados de la chose ? 

Autant de facteurs à même de nourrir ce facteur de polarisation mais qui témoignent aussi d’une intrusion toujours plus large dans la vie privée de chacun. Et donc, à même de susciter la mise en place de garde-fous appropriés.

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?