Blog

Système de recommandation et éthique

20 novembre 2023

De nos jours, les systèmes de recommandation jouent un rôle prépondérant dans nos vies. Que ce soit sur les plateformes de streaming, les sites de e-commerce ou encore les réseaux sociaux, ces systèmes sont omniprésents. Ils semblent nous connaître presque mieux que nous-mêmes, anticipant nos besoins et nos préférences afin de nous présenter des recommandations (ultra) personnalisées.
Pourtant, derrière l’utilisation de ces algorithmes sophistiqués se cachent des questions éthiques fondamentales.

Crédit photo : Freepik

Comprendre les Systèmes de Recommandation

1) LES DONNÉES
Les systèmes de recommandation sont une forme spécifique de filtrage de l’information, visant à présenter des éléments d’information (films, musique, livres, articles, images, pages Web, etc) susceptibles d’intéresser l’utilisateur. L’objectif principal de ces systèmes est d’aider les utilisateurs à prendre des décisions informées dans un monde où L’abondance d’informations est devenue la norme.
Les données exploitées par les systèmes de recommandation sont essentiellement de deux types : les données liées aux utilisateurs et les données liées aux contenus.
Les données des utilisateurs peuvent être leurs données personnelles (âge, civilité, données sociodémographiques), leurs données de navigation sur des sites internet, leurs données de contextualisation, leurs données transactionnelles,…
Les données des contenus concernent plutôt la description, les caractéristiques (par exemple le genre ou la durée d’un film), l’utilisation et/ou la consultation de ce contenu, les évaluations…

2) LES ALGORYTHMES
Il existe principalement trois types d’algorithmes pour les systèmes de recommandation.
– Recommandations basées sur la popularité : ces systèmes recommandent des éléments en se basant sur leur popularité générale. Une chanson très populaire sera donc recommandée à un grand nombre d’utilisateurs, indépendamment de leurs préférences individuelles.
– Recommandations basées sur le contenu (Content-based Filtering) : ces systèmes analysent les caractéristiques des éléments, comme les mots-clés d’un article, le(s) genre(s) d’un film ou les produits similaires à un achat précédent. L’objectif est de recommander des éléments semblables à ceux que l’utilisateur a déjà appréciés ou consommés.
– Recommandations collaboratives (Collaborative Filtering) : ces systèmes se basent sur les données liées au comportement de l’utilisateur ainsi que sur celles d’autres utilisateurs similaires. Si deux utilisateurs ont les mêmes préférences en matière de musique par exemple, un système de recommandation collaborative peut recommander à l’un ce que l’autre a déjà apprécié.

Maintenant que nous avons une compréhension de base des systèmes de recommandation, il est temps de se plonger plus en détail dans les questions éthiques qu’ils soulèvent.

Enjeux éthiques

Un des enjeux éthiques évident est le respect de la vie privée des utilisateurs. Ainsi, bien que les données soient le plus souvent anonymisées, le croisement des informations collectées et stockées à propos d’un utilisateur unique (âge, civilité, ville de résidence, catégorie socioprofessionnelle, historique de navigation,…) amène une connaissance presque totale de ce dernier. L’exploitation de ces données est donc discutable : a-t-on réellement besoin de ces données intrusives pour construire un système de recommandation pertinent ?

En 2012, une étude menée par Facebook, en partenariat avec l’université de Cornell, sur près de 700 000 personnes a montré l’impact de ces systèmes sur la vie des utilisateurs, notamment sur leur santé mentale. Au cours de cette étude d’une semaine, un groupe se voyait confronté à un fil d’actualité dépourvu de mots ou expressions à connotation positive, tandis qu’un autre ne visualisait que du contenu positif. Outre la problématique éthique soulevée par une telle étude (tous les consentements ne semblent pas avoir été récoltés…), les résultats sont assez probants : le contenu émotionnel des mises à jour de statut par les utilisateurs du premier groupe est jugé plus négatif que celui du deuxième groupe.

Prenons un autre exemple de problématique éthique : la manipulation des opinions à travers la recommandation de contenu. Les sociétés connues telles que Cambridge Analytica (disparue en 2018) ou l’Internet Research Agency (IRA) influencent largement l’opinion publique en manipulant les systèmes de recommandation : influence des intentions de vote, critiques d’opposants politiques, propagande politique, théorie du complot…

Cependant, même sans actions extérieures de la part de sociétés, les systèmes de recommandation se heurtent à des problèmes éthiques. Parmi eux, nous pouvons citer le problème de fixation. Pour l’expliquer, prenons l’exemple de vidéos de football ou de basketball sur YouTube. Plus vous allez regarder des vidéos de football, plus l’algorithme va vous recommander des vidéos de football (en effet, un bon algorithme de recommandation est un algorithme qui vous propose du contenu susceptible de vous intéresser). Au fur et à mesure, les vidéos de football seront par conséquent très largement majoritaires parmi vos recommandations, aux dépens de la diversité. Si l’on considère maintenant des contenus politiques, cela peut amener à des comportements ou opinions extrémistes et fermés, ainsi qu’à polariser les utilisateurs.

Comment rendre éthique les systèmes de recommandations ?

Tout d’abord, le respect des données personnelles est un point essentiel. Limiter l’usage de ces données et avoir une totale transparence vis-à-vis de l’utilisateur lors de leur exploitation semblent être des prérequis fondamentaux.

Ensuite, il paraît crucial de sécuriser les bases de données : si les données ne sont pas sécurisées, les algorithmes ne le seront pas. Il faudrait se doter d’une base de données de sources fiables, sans biais racistes, sexistes et sans campagne de désinformation ou de manipulation. Une initiative pour rendre les systèmes de recommandation éthique et construire une telle base de données existe : le Projet Tournesol*. A travers la fédération d’un grand nombre de contributeurs, comparant des contenus comme le ferait un algorithme de recommandation, l’objectif de Tournesol est de comprendre les préférences humaines lorsqu’il s’agit de recommander tel ou tel contenu et donc, à terme, d’identifier les vidéos jugées bénéfiques pour l’utilité publique. Ces vidéos seraient à recommander au plus grand nombre et pourraient constituer une base de données saine.

Finalement, pour se prémunir du problème de fixation, il semble pertinent d’insérer une part de hasard dans les recommandations, voire des propositions de contenu à l’opposé des habitudes de l’utilisateur, afin d’ajouter plus de diversité. Nous pourrions également imaginer construire des “métriques éthiques” : en plus des habituels métriques de performance, qui permettent d’évaluer la pertinence des algorithmes, une métrique de diversité permettrait de contrôler la diversification et la découvrabilité de l’algorithme (c’est-à-dire la capacité de l’algorithme à ne pas enfermer et restreindre l’utilisateur dans ses préférences uniquement).

Conclusion

En conclusion, l’éthique doit être placée au coeur de chaque étape de développement d’un système de recommandation. Un travail sur l’anonymisation des données doit être systématique, de même qu’un consentement explicite de l’utilisateur lors de l’exploitation de ses données personnelles. De plus, la constitution de bases de données saines ainsi que l’ajout de diversité parmi les recommandations permettraient aux utilisateurs d’être confrontés à des informations plus claires, plus précises, plus fiables, mais également plus variées.

Envie de construire un système de recommandation éthique ? D’identifier les clients les plus appétents à une offre grâce à ces algorithmes ? Les Data Scientist et Experts en Marketing de Know Your People sont là pour vous aider.
N’hésitez pas à nous contacter !

* https://tournesol.app/