L’algorithme de filtrage collaboratif en cinq atouts

par ‘Jan 18, 2018’Analyse de données, Banque et assurance, E-commerce, Média, Personnalisation

Le filtrage collaboratif  est un algorithme de recommandation, c’est-à-dire un algorithme qui consiste à prédire les articles (quels qu’ils soient, des livres, des films, des articles de presse, etc.) que des utilisateurs apprécieront dans le futur. Le filtrage collaboratif repose sur l’exploitation de « la sagesse de la foule » (traduction de l’expression anglaise consacrée : « wisdom of the crowd »).  L’idée est que pour prédire ce qu’une personne va aimer dans le futur, et qu’il est donc pertinent de lui recommander, l’algorithme n’utilise pas uniquement l’historique de cet utilisateur, mais toutes les informations existantes dans le système concernant les autres utilisateurs.  Pour faire simple, ces algorithmes permettent de détecter les utilisateurs qui ont des goûts similaires pour exploiter ces informations à des fins de recommandations. Par exemple s’il s’avère qu’Alice, Bob et Martin ont aimé par le passé des livres similaires et qu’Alice achète, ou donne un avis favorable sur le dernier livre de Paul Auster (celui du reste qui vient de recevoir le Prix du Livre étranger 2018 France Inter/Le Journal du Dimanche), il est très probable que Bob et Martin l’aiment aussi et il est pertinent de le leur recommander.

 

telecharger-media-et-personnalisation-gagnante

 

De quoi a-t-on besoin pour mettre en place un algorithme de filtrage collaboratif, simplement de profils utilisateurs, c’est-à-dire de l’historique de l’avis des utilisateurs sur des articles. Cet avis peut prendre la forme d’une « vue » ou d’un partage (d’une page web par exemple), d’un achat (d’un livre par exemple), d’une note (sur un film dans une plate-forme de films), etc.

Il existe de nombreuses approches de filtrage collaboratif.  Concentrons-nous sur une approche qui est intuitive à comprendre : le filtrage collaboratif par « recherche de plus proche voisin ». En deux mots, cette approche consiste à mesurer la similarité entre les profils utilisateurs en utilisant votre mesure préférée (Pearson, Jacquart, cosine, etc), typiquement plus deux utilisateurs ont vu/acheté/noté de la même façon, plus ils seront proches selon cette mesure. Je vous épargne les subtilités de ces mesures, mais cela pourra faire l’objet d’un prochain article si vous insistez.  Ensuite pour chaque utilisateur, il suffit de dénicher (c’est-à-dire de choisir une méthode de scoring) dans les profils des utilisateurs les plus proches, les articles qu’il va aimer avec une forte probabilité.

Notez que ces techniques de recommandation sont très différentes de celles qui reposent sur l’exploration du contenu des articles. Vous pouvez en apprendre plus sur les déférences dans notre livre blanc.

Quoi qu’il en soit, le filtrage collaboratif a de nombreux atouts et pour de nombreuses applications.

 

5-avantages-filtrage-collaboratif-1200px-628px

 

Atout numéro 1 : la performance de la personnalisation

Tout d’abord, le filtrage collaboratif permet de faire des prédictions précises en utilisant non seulement l’historique d’un utilisateur, mais celles de tous les utilisateurs d’un système. En profitant de toute cette information, il est alors possible de capturer des informations « cachées » sur les utilisateurs. Par exemple, le fait que Bob et Martin ont une forte probabilité d’aimer le dernier livre de Paul Auster est une information qui n’est pas présente dans leurs profils.

 

Atout numéro 2 : le « multi-linguisme »

Un des atouts majeurs du filtrage collaboratif est le fait qu’il peut s’appliquer à un très large éventail de contextes : des langues différentes, des applications différentes (des livres, des annonces immobilières, des articles de journaux, des films, des vêtements, etc.) Tout simplement, car on ne s’intéresse pas au contenu des profils, le filtrage collaboratif exploite « seulement » les similarités entre profils : dès qu’il est possible d’identifier que Alice, Bob et Martin se ressemblent, il n’est pas nécessaire de savoir en quoi ils sont similaires, mais uniquement de profiter de connaître ces informations. En conséquence, cette méthode est assez universelle.

 

Atout numéro 3 : la flexibilité

On peut tout faire et s’adapter à tous les secteurs avec le filtrage collaboratif. On peut modifier à l’envi les mesures de similarités, la prise en compte des avis, le contenu à recommander et l’information à exploiter, etc., et s’adapter ainsi au e-commerce, au média en ligne, etc.

 

telecharger-temoignage-newsletter-personnalisée-ouest_france

 

Atout numéro 4 : le passage à l’échelle

Compte tenu du volume colossal de contenus qui ne cesse d’augmenter et du nombre massif et croissant d’utilisateurs en ligne, les capacités de passage à l’échelle d’un algorithme sont cruciales. Passer à l’échelle veut dire être capable de rester performant à mesure que le système grandit. Le filtrage collaboratif est une méthode idéale pour réduire la dimension du problème et continuer de fournir des résultats pertinents en temps réel, même en présence de millions d’utilisateurs.

 

Atout numéro 5 : le dynamisme

Enfin, la prise en compte du dynamisme est une propriété cruciale en particulier dans les secteurs « dynamiques » eux-mêmes comme les médias en ligne.  Avec une méthode de filtrage collaboratif, il est aisé de prendre en compte les changements d’intérêts des utilisateurs au cours du temps. Imaginons un site d’articles de sports et qu’Alice s’intéresse uniquement au hand-ball durant l’année,  clairement les utilisateurs similaires à Alice seront également intéressés par le hand-ball. Imaginons maintenant qu’à la faveur des Jeux olympiques, elle s’intéresse aussi au kayak et au volley-ball, l’algorithme lui identifiera naturellement des profils différents et le tout reviendra à la normale automatiquement et sans aucune interaction d’Alice, à l’issue des JO.

 

Pour conclure le filtrage collaboratif est une approche simple à appréhender et qui permet de concevoir des outils de personnalisation pertinents, performants et capables de s’adapter à un très grand nombre de secteurs. N’hésitez plus, adoptez-le en visitant mediego.com.

CEO et cofondatrice de Mediego, Anne-Marie a eu auparavant une carrière académique (ancienne directrice de recherche à INRIA) dans le domaine de l'informatique. Elle saura vous apporter des connaissances techniques et vous transmettre sa passion pour les algorithmes de recommandation.

Anne-Marie Kermarrec

CEO, Mediego

À lire ensuite