Data Science

Aujourd’hui, il n’est pas évident de s’y retrouver sur le sujet de l’algorithmie. Mais d’ailleurs, qu’est-ce que c’est exactement un algorithme ? A quoi ça sert ? Et dans quel cadre faut-il l’utiliser ?

Tout d’abord une définition, et je trouve celle du Larousse correcte : « Un Algorithme est un ensemble de règles opératoires dont l'application permet de résoudre un problème énoncé au moyen d'un nombre fini d'opérations. Un algorithme peut être traduit, grâce à un langage de programmation, en un programme exécutable par un ordinateur ».
Si on essaye de répondre aux 2 autres questions, je dirai que la mise en place d’un algorithme permet de se simplifier la vie (gain de temps, règle de gestion, automatisation, prévisions, …).

Son utilisation est au final la partie la plus délicate à appréhender. Elle se traduit en 3 étapes :

A quel besoin métier répond-il ? La difficulté est de bien définir la problématique et d’identifier le périmètre d’intervention. C’est une étape qu’il ne faut pas négliger car c’est bien celle-ci qui va diriger les étapes suivantes. Il est donc nécessaire d’avoir un bon échange entre le métier, la technique et les producteurs experts en Data Science. La traduction du besoin est un élément essentiel afin que les équipes se comprennent, délivrent un bon algorithme et exploitent opérationnellement celui-ci. Très souvent, une négligence sur cette étape engendre beaucoup de temps et d’énergie passés pour au final une non-utilisation de l’algorithme et beaucoup de frustration.

Viens ensuite, la réalisation de l’algorithme. Plusieurs méthodes s’offrent à nous. Cela dépend du besoin, de la complexité, et des outils à dispositions. Pour des besoins simples et cadrés, il n’est pas nécessaire d’utiliser des solutions de Data Sciences à tout prix. Un bon requêteur peut parfois faire l’affaire. Pour une optimisation des programmes créés, bien évidemment, même le simple programme peut se faire via les outils existants. Quand on arrive à des besoins plus complexes, nous voyons une tendance des experts à n’utiliser que des techniques de Machine Learning et/ou les dernières méthodes à la « mode » (Random Forest, Réseaux de neurones, Régression pénalisée, …). Nous sommes les 1ers à les utiliser, mais attention, ces méthodes et techniques ne répondent pas toujours de manière simple au besoin exprimé et parfois il est difficile de maîtriser et d’expliquer le résultat obtenu. A la question, que vous nous préconisez-vous ? Nous allons répondre, au-delà du pré requis de réponse au besoin, qu’il faut mixer les techniques et méthodes. Utiliser des méthodes traditionnelles et des nouvelles méthodes. Une bonne vieille régression logistique continue de faire le job et est aujourd’hui complétement maîtrisé par les Data Scientists, elle a aussi le gros avantage de présenter une équation facilement compréhensible par les équipes.

L’exploitation de l’algorithme est devenue une étape indispensable à la création de performance. Cela ne veut pas dire qu’il ne faut plus essayer de nouveaux modèles dans le cadre de projet R&D, mais il est nécessaire d’exploiter certains algorithmes pour prouver l’utilité et la création de valeur. Dans cette partie, nous pouvons de nouveau distinguer 3 phases : Une phase de test afin de valider que l’algorithme fonctionne et apporte de la valeur. Une phase d’implémentation dans le ou les SI afin d’apporter cette couche d’intelligence à travers les outils de l’entreprise. Et une phase de mesure pour confirmer les tendances du test, calculer la création de valeur et valider la pérennité de l’algorithme.

Ces 3 phases sont indispensables pour obtenir le fruit des investissements liés aux algorithmes. Comme d’habitude, nous continuons de privilégier le pragmatisme et la communication au sein de ce type de projet. L’ennemi de l’algorithme est le temps de mise en place. Très souvent parce que les étapes n’ont pas été bien réalisées, on se retrouve avec des retards de livraison, des questionnements et des remises en cause qui suivent…
Pour terminer, le besoin identifié chez nos clients & prospects vient surtout sur les étapes 1 et 3 en accompagnement conseil, et sur l’étape 2 quand il existe un manque de ressource.
Bref, pour éviter d’être déçus, soyez méthodiques ou faites vous accompagner dans les premières étapes de ce type de projet.
Le développement de l’Intelligence Artificielle ouvre de nouvelles perspectives aux acteurs du marketing. Et ceux-ci ne s’y trompent pas car près de 70% des marques envisagent d’utiliser l’IA pour personnaliser les offres et l’expérience clients. Toutefois la question se pose légitimement de savoir jusqu’où nous devons faire confiance aux modèles pour prendre des décisions à notre place. Nous allons essayer de vous donner quelques clés sur le sujet.

Apprentissage supervisé et non supervisé

Un premier point important à prendre en compte lorsque l’on traite de sujets d’Intelligence Artificielle est de savoir si le modèle que l’on va mettre en place va reposer sur un apprentissage supervisé ou non. En effet, le « mythe de l’IA », comme on pourrait l’appeler, repose sur le principe que la machine va analyser de manière totalement autonome les données qu’on lui met à disposition pour trouver des solutions à un problème que potentiellement on ne lui aurait pas poser ! De manière plus pragmatique, les modèles d’apprentissage non supervisé permettent essentiellement aujourd’hui de définir des groupes d’individus homogènes ayant des caractéristiques communes. Ce système va alors souvent permettre de créer des systèmes de recommandation pertinents (Netflix fait ça très bien par exemple pour vous recommander les films et séries les plus susceptibles de vous intéresser en se basant sur les films et séries vus par des individus qui vous ressemblent).
Dans la majorité des cas, ce sont donc plutôt les modèles supervisés qui vont être utilisés. Dans ce cadre, un Data Scientist va devoir guider la machine. En particulier, il va devoir définir les résultats attendus sur un volume important de données d’apprentissage afin que l’algorithme apprenne et puisse reproduire les mécaniques de décision qu’il aura apprises sur un nouveau jeu de données. Dans ce cas, l’humain joue donc un rôle important dans l’apprentissage du modèle et dans son exploitation future.

L’IA doit servir la stratégie et non pas la remplacer

En conséquence, on comprend bien que l’IA est bien souvent guidée par nos choix d’apprentissage et les données qu’on va lui mettre à disposition. On peut même aller plus loin en considérant que la stratégie marketing doit guider les actions des Data Scientists afin de concevoir les modèles les plus utiles aux experts marketing dans l’atteinte de leurs objectifs.
Plus généralement, il est même intéressant d’envisager l’apport de la Data Science (au sens large) à la stratégie marketing. En effet, bien souvent, on va pouvoir nettement augmenter la performance des dispositifs en mettant en place un process analytique pertinent reposant sur différents allers-retours entre stratégie et analyse. Aujourd’hui, la data doit accompagner la stratégie, et la stratégie doit guider la recherche de la performance. A titre d’exemple, on peut imaginer le process suivant :
1. Construction d’une segmentation adaptée
2. Identification des priorités stratégiques grâce à la matrice de passage
3. Définition des priorités opérationnelles par segment
4. Construction des modèles prédictifs adaptés à chaque cible (segment) et chaque problématique (attrition, recommandation, cross-sell…)
5. Test & Learn et mesure de la performance
6. Adaptation des modèles et des dispositifs
Bref, un équilibre fin à trouver entre les inputs de la stratégie à la Data Science et de la Data Science à la stratégie ! Et où les modèles IA supervisés ou non permettront de gagner en performance tout en ouvrant la voie à de nouveaux champs de recherche.

Ce sont des sujets qui vous intéressent ? Nous sommes là pour en parler avec vous. Notre pragmatisme et notre discours vulgarisé seront les clés de la réussite de votre prochain projet d’IA.
Chaque jour ou presque le sujet de l’avenir de notre planète est au centre des débats. En particulier, la notion d’empreinte carbone est un indicateur récurrent dans la mesure de l’impact écologique de nos activités humaines.

Lorsque vous envoyez des emails commerciaux à vos clients, les serveurs mails de votre entreprise stockent l’email avant de l’envoyer. Comme tout serveur, ils consomment de l’électricité et plus ils sont chargés, plus ils chauffent et plus ils nécessitent d’électricité pour refroidir.
On estime actuellement qu’un email simple a une empreinte carbone de 4g de CO2. Une entreprise envoyant régulièrement des newsletters à ses clients va donc vite voir son empreinte carbone augmenter. A titre d’exemple, si vous envoyez 1 million d’emails, 2 fois par semaine, l’empreinte carbone de votre animation clients sera de 416 tonnes sur une année. Soit plus de 200 allers-retours Paris-New York pour un passager !

Vous l’aurez compris, l’animation clients a donc un impact fort sur l’empreinte carbone de votre entreprise. Pour la réduire, il est donc fondamental d’optimiser ces ciblages marketing.

Comment peut-on réduire son empreinte carbone grâce à la Data Science ?
Pour ce faire, nous vous recommandons 2 outils analytiques simples :
- La segmentation clients :
Il existe de nombreux types de segmentations (segmentation transactionnelle, segmentation relationnelle, segmentation 360°…), mais toutes ont le même point commun : elles permettent de créer des groupes de clients homogènes sur lesquels nous allons pouvoir mettre en place un plan d’animation différencié.
Bien souvent, lors de la mise en place d’une segmentation, nous recommandons de faire le bilan du plan d’animation de l’année précédente pour bien comprendre les spécificités de chaque segment. En particulier, cette analyse va permettre de déterminer la pression commerciale optimale à appliquer à chaque segment.
Ce premier outil, si vous ne l’avez pas encore mis en place, va donc vous permettre en passant d’une logique d’envois de masse à une logique d’envois segmentés de baisser le nombre moyen d’emails envoyés. De la même façon, si vous avez déjà une segmentation existante, gardez en tête que celle-ci a une durée de vie et qu’elle peut être challengée ou modifiée via d’autres axes discriminants.

- Le scoring :
En termes de scoring, nous travaillons de plus en plus sur 2 niveaux de ciblage : le score de repoussoir et le score d’appétence.
Le premier, le score de repoussoir, va permettre d’isoler les clients qui ont une forte probabilité de ne pas ouvrir vos prochaines newsletters. Pourquoi les cibler, si on pressent dès aujourd’hui que l’email n’aura pas d’impact ? Ce premier type de score va donc réduire considérablement les volumétries d’envois. A ce jour, les scores de repoussoir que l’on a construit pour nos clients ont permis de réduire la volumétrie d’envois de l’ordre de 20 à 30% des volumes initiaux.
En parallèle, sur les potentiels ouvreurs, tous les messages n’ont pas le même niveau d’intérêt. Il est donc préférable, à ce niveau, de construire les scores d’appétence adéquats permettant de cibler les clients réellement intéressés par le message envoyé. Cela va vous permettre de combiner une diminution des volumes d’envois avec une hausse des performances commerciales (souvent de l’ordre de 15 à 25%). En conclusion : faire plus avec moins… d’empreinte carbone !

Bien évidemment, nous sommes conscients que ces sujets analytiques, et la Data Science en général, peuvent être perçus comme investissement important. Chez KYP, nous avons pris l’habitude de nous engager sur ces sujets d’accompagner nos clients dans la mesure du ROI et de la création de valeur.

Comme vous avez pu le lire, il peut être assez simple de réduire votre empreinte carbone tout en développant le potentiel commercial de votre base de données. Nous nous tenons à votre disposition pour tout échange sur ce sujet d’actualité et sur la mise en place d’actions analytiques concrètes ! Contribuez à réduire votre empreinte carbone tout en étant en phase avec vos valeurs et/ou celle de votre entreprise.
Chaque année la construction d’objectifs challengeant tout en restant atteignables et leur suivi sont un défi pour les managers. Notamment pour les entreprises avec une multitude de points de ventes, souvent regroupés de façon intuitive.

La Data Science peut vous aider !

Step 1 : Identifier les pools de points de ventes qui partageront les mêmes objectifs

Les méthodes de clustering vont d’abord vous permettre d’associer les points de ventes les plus semblables selon des axes de consommation (CA, recrutement, trafic, valeur des clients rattachés…) et de caractéristiques magasins (surface, nombre d'employés, emplacement, services spécifiques, zones de chalandises…).

Step 2 : Chiffrer ces objectifs

Les méthodes de prévision vont ensuite vous permettre d’estimer les objectifs par typologie de magasins et par mois en fonction des saisonnalités de consommation et les phénomènes exogènes identifiés. Ces objectifs peuvent prendre plusieurs formes : CA, Trafic, recrutement, collecte email,...

Step 3 : Suivre le taux de réussite

A l’aide de tableaux de bord synthétiques mensuels et sur mesure par point de vente, les managers pourront suivre au plus près la part de réalisation de ces objectifs dans le temps, identifier les plus performants et partager les best practices, détecter rapidement les magasins sous performants et les accompagner.

Vous avez un besoin similaire ? N’hésitez pas à nous solliciter !
L’identification d’un client à une adresse est depuis de nombreuses années une clé d’unicité et de contact. Au fil des années, nous avons même cherché à aller plus loin dans l’identification d’un individu en prenant en compte les statuts de prospects et de suspects.

A chacun son combat avec son niveau de maturité, ses priorités et ses moyens !

Il est évident que les problématiques ne sont pas les mêmes entre un Retailer qui gère un programme relationnel omnicanal depuis plus de 20 ans et un annonceur qui vient de démarrer un CRM. Néanmoins, il existe à chaque niveau des actions qui vont contribuer à améliorer la connaissance client, et surtout la relation client (le pouvoir de communiquer juste avec son client : l’impact relationnel, voire émotionnel). Dans chacun des cas, il est nécessaire de créer un « Socle Analytique » qui sera la base de tout projet d’analyse, de mesure et de performance.

Le Socle Analytique comprend un ensemble d’analyses plus ou moins simples permettant de mesurer le capital client d’une BDD en focusant sur les volumétries, la qualité, la diversité, la disponibilité et la volatilité des données. Ça ne vous rappelle rien ? Ah oui, ça y est, ça ressemble aux fameux 4 « V » du Big Data ! En effet, nous sommes bien sur ces théories, mais à un niveau moindre ! Car, on peut faire beaucoup de choses sans entrer dans un projet d’envergure multi-source complexe. Connaître les basiques de sa BDD n’a jamais demandé un effort colossal auprès des Directions SI, Marketing, Etudes… Comme à notre habitude, nous préconisons de valider un premier périmètre qui est facile à maîtriser, et de l’agrandir de manière itérative. Mais au final, qu’est-ce que les basiques ? Les basiques doivent répondre à des questions simples telles que : Combien ai-je de clients en BDD ? Combien sont actifs ? Sont-ils contactables ? Quel est le poids de mes meilleurs clients ? etc. L’idée est aussi de voir comment cela évolue dans le temps.

Une fois cet exercice fait, ce constat, il est opportun de travailler ou de continuer les efforts sur la qualité de la donnée d’identification. On retrouve ainsi l’adresse postale, l’email et le téléphone (fixe et mobile). Il faut ainsi compter sur des spécialistes du marché, expert en DQM (Data Quality Management). Leur expertise permet de restructurer la donnée et ensuite d’identifier des doublons, de capter les déménagés, de trouver les nouvelles adresses… Ce travail est primordial pour maximiser l’unicité des clients dans une BDD. Ce travail permet aussi d’identifier la notion de foyer. Nous n’arriverons pas à un résultat 100% fiable (cela se mesure grâce au taux de matching), mais toute action créera de la valeur. A noter tout même que ce travail de DQM, quand il n’existe pas à l’origine, peut-être réalisé avant le socle analytique. Le but est d’avoir une information sur sa BDD le plus fiable possible.

Mais au final, quel est l’intérêt d’avoir la notion de foyer ? Et bien tout d’abord, c’est le fait d’avoir le choix de parler un individu ou à un ensemble d’individus, de créer de la cohérence dans les messages (éviter d’envoyer 2 fois le même mail, et qui plus est avec une offre différente), et de personnaliser l’offre pour une ou plusieurs personnes, donc au final, de mieux identifier les besoins du foyer. N’est-ce pas là l’objectif principal de toute enseigne ou marque ? Nous disons oui ! Car par la meilleure compréhension de habitudes de consommation mais aussi grâce à la meilleure compréhension de l’habitat, de l’environnement dans lequel vivent les individus, on arrivera à améliorer la relation clients/marque. Cela génère une multitude d’actions prescriptrices plutôt que réactives grâce à l’analytique ou si on utilise un mot plus précis, la Data Science. Bien évidemment, en rappel, tout cela doit-être fait avec le consentement des clients, sans intrusion, et dans le respect de la vie privée. Ce qui complexifie parfois le plan d’animation, car il doit s’adapter à la multiplication des groupes / sous-groupes avec des contenus différents. Pour finir, comme le ROI reste notre fer de lance, il est fondamental de préparer avec attention vos cibles et votre mécanique de mesure afin de pouvoir démontrer la performance, et donc par conséquent la création de valeur.

Quoiqu’il arrive, l’enjeu des enseignes pour toujours mieux communiquer, en qualité avec ces clients tourne autour de 3 briques : l’Identification, la Qualification et la Personnalisation.
KYP rejoint 1% for the planet

Chez Know Your People, nous cherchons toujours à prendre soin de ceux qui nous entourent, que ce soit nos clients, nous collaborateurs ou tout simplement l’environnement. Au travers de nos activités extraprofessionnelles, nous avons un rapport étroit à la nature. Que ce soit Guillaume lorsqu’il surfe les vagues du sud-ouest, Samuel lorsqu’il fait de la plongée, ou moi-même lors de mes entrainements pour le triathlon, nous essayons, à notre niveau, d’être attentif à l’environnement et à ne pas laisser de déchets derrière nous.

Récemment, nous avons pris la décision de donner une nouvelle impulsion à cet engagement en rejoignant le réseau 1% for the Planet.
Souvent nos clients s'interrogent sur la qualité et la pertinence des données socio-démographiques collectées sur leurs clients. Et bien souvent leur constat est que leur base de données n'est pas assez riche en données socio-démographiques et comportementales.



Pourquoi ce choix ?

Ce choix part d’un constat assez simple : l’environnement est le parent pauvre de la philanthropie. Il représente 3% des sommes allouées, et seulement une faible partie provient des entreprises. Or le rôle de 1% for the Planet est justement de connecter, promouvoir et certifier les entreprises soutenant les associations environnementales, créant un mouvement global engagé dans la protection de la planète.

Le mouvement a été lancé en 2001 par Yvon Chouinard, fondateur de Patagonia et Craig Mathews de Blue Ribbon Flies, dont les entreprises respectives étaient déjà philanthropes depuis de nombreuses années, sans que cela n'affecte négativement leur business. Ils ont décidé de créer ce réseau pour convaincre plus d'entreprises à s'engager pour la protection de l’environnement. L’objectif de 1% for the Planet est d’augmenter la philanthropie environnementale, en créant une communauté d’entrepreneurs philanthropes, à la résonance grandissante et à l’impact sur le terrain plus efficace. Et aujourd’hui, le réseau regroupe plus de 1300 membres donateurs et 3500 ONG engagées dans la préservation de l’environnement.

Nous nous sommes donc engagés, à partir de cette année, à reverser 1% de notre chiffre d’affaires à des associations agréées par 1% for the Planet qui défendent des causes qui nous sont chères.
Quand le prédictif s’invite dans les stratégies marketing 2/2

Comme nous vous l’évoquions le mois dernier, Il existe trois paramètres importants à prendre en compte avant de se lancer dans l’aventure du marketing prédictif :
  • La matière première : les data
  • La problématique : la variable ou le phénomène à expliquer
  • L’exploitation du modèle créé

Mais qu’en est-il de cette phase de modélisation à proprement parler ? Alors que le mois dernier nous vous expliquions la partie fonctionnelle du marketing prédictif, nous vous proposons ici de vous expliquer la manière dont nous travaillons sur les méthodes de scoring et de modélisation. Cette méthodologie d’analyse éprouvée repose sur 6 étapes clés :
1. La compréhension des données disponibles : Au travers d’un diagnostic analytique, nous définissons les variables utiles à l’analyse. Il s’agit de répondre aux questions suivantes : est-ce que toutes vos données sont exploitables ? Certaines ne présentent-elles pas des biais ? Sont-elles suffisamment renseignées ? Quelles sources de données sont disponibles ? Nous allons jusqu’à définir une stratégie de data collect.

2. La construction de la variable cible : la première question est bien de savoir ce que l’on cherche à faire d’un point de vue CRM (lutter contre l’attrition, améliorer les ciblages,…). Au travers d’une phase d’analyse exploratoire des données et d’interviews avec le métier, nous construisons les règles de gestion permettant de définir cette variable. Notre premier objectif est d’impliquer notre interlocuteur dans la compréhension globale de la démarche analytique.

3. La construction des agrégats utiles : cette phase est majeure, elle est la plus longue dans la construction du modèle. Elle représente 60 à 70% du temps de réalisation. En lien avec la variable cible, il est nécessaire de transformer certaines données, d’en combiner d’autres. Bref trouver les agrégats les plus pertinents issus de vos données brutes pour expliquer la variable cible. Des analyses croisées entre données brutes et variable cible nous permettent de trouver les agrégats à construire.

4. La réalisation d’un échantillonnage pertinent : en modélisation statistique, il ne faut pas réaliser votre modèle sur toute la population. Deux explications à cela : des millions de lignes de données à analyser qui peuvent prendre beaucoup de temps sans améliorer les modèles et la nécessité d’avoir une population test pour valider les modèles. Plusieurs méthodologies d’échantillonnage existent, il faut être vigilant lors de la construction de l’échantillon de travail à ce que cet échantillon soit représentatif statistiquement de votre population globale.

5. La modélisation ou la réponse à la problématique : la modélisation repose sur 2 grands éléments, le choix du type de modèle à appliquer et la réalisation du modèle (le calcul des coefficients) à proprement parler. Aujourd’hui les outils de Machine Learning ont grandement contribué à avancer dans cette problématique car ils trouvent à notre place le modèle le plus performant. Attention toutefois à s’assurer de la pertinence du modèle tant à court terme qu’à moyen terme.

6. La mesure des résultats et la validation du modèle : une première étape de validation de cette pertinence va reposer dans la mesure des résultats obtenus au travers de la confrontation des résultats entre la population d’apprentissage et la population test, en particulier par l’utilisation des matrices de classement. Ceci va nous permettre d’éprouver la qualité du modèle et donc d’en valider la pertinence.
C’est par la maitrise de ces 6 étapes que l’on réussit à mettre en œuvre des modèles pertinents et robustes.

L’objectif final est bien de vous accompagner dans l’exploitation du modèle au travers d’un plan d’actions opérationnel. La mesure des résultats confirmera la création de valeur.

Prêts pour l’aventure prédictive ?
Quand le prédictif s’invite dans les stratégies marketing 1/2

Le prédictif, un mot que l’on entend de plus en plus souvent… Sommes-nous prêts aujourd’hui à développer une vraie stratégie analytique autour des modèles prédictifs ?
Les techniques de statistiques prédictives ne sont pas nouvelles. Depuis plus de 20 ans, nous construisons des algorithmes afin de créer des modèles prédictifs robustes et performants qui améliorent toujours un peu plus l’expérience client.

Il existe trois paramètres importants à prendre en compte avant de se lancer :
  • La matière première : les data
  • La problématique : la variable ou le phénomène à expliquer
  • L’exploitation du modèle créé

Sur le premier point, notre bac à sable s’est très largement agrandi avec l’arrivée des data digitales. Si jusqu’à il y a encore quelques temps, les modèles prédictifs étaient construits à partir des données CRM classiques (transactionnelles, comportementales, socio démographiques), nous avons aujourd’hui accès à des données complémentaires qui viennent caractériser les comportements des consommateurs (données de navigations, sociales, et plus généralement les données digitales). L’enjeu aujourd’hui, est de pouvoir croiser les data de ces deux mondes (CRM & Digital). Les méthodes de réconciliation sont prêtes et les acteurs sur le marché proposent leur service à une qualité de matching qui devient intéressante (d’un point de vue statistique). Il ne reste plus qu’à définir la question à laquelle on souhaite répondre. Et c’est précisément ce point qu’il ne faut pas négliger !

Nous sommes convaincus que la construction de la « variable à expliquer » est un point majeur à la création de valeur future. Il est donc nécessaire de prendre le temps de définir une problématique qui soit réalisable et en adéquation avec la stratégie marketing. Que cherchons-nous à faire ? Réduire l’attrition ? Identifier l’appétence ? Maximiser la conversion ? Autant de sujet intéressant et d’actualité, mais qui restent généralistes et qui demandent à être préciser. Parle-t-on de contacts, de clients ou de prospects ? Intégrons-nous tous les segments de clients ou réalisons un focus sur une cible en particulier ? Vous l’aurez compris, il existe des filtres à intégrer dans la définition de la population à étudier. Ensuite, à nous de détecter les moments de vie et les cibles où nous maximiserons la conversion.

Le troisième point est peut-être le plus important. Il est indispensable d’utiliser / de tester / d’exploiter l’algorithme créé. Souvent nous remarquons qu’il existe de beaux scorings dans les entreprises, mais qui ne sont pas ou peu utilisés. Pour quelles raisons ? Juste parce qu’il existe encore une barrière de langage entre les dataminers / datascientists et le métier. Ou tout simplement parce que les équipes en place n’ont pas créé le modèle et donc n’en maîtrise pas les tenants et aboutissants. Sans oublier que les modèles prédictifs ont une durée de vie et qu’il est nécessaire, selon nous, de valider la véracité et la pérennité des algorithmes créés régulièrement. En d’autres termes, il ne s’agit pas de créer en one shot un score, mais il faut veiller à son application et sa performance dans le temps.
Un accompagnement dans les plans d’actions et la mesure des résultats peut-être nécessaire. L’objectif de performance peut alors augmenter de 15% à 20% avec un bon score, sur une bonne population, sur une bonne offre.
En d’autres termes, c’est un super outil prédictif, à vous, à nous de l’utiliser dans les meilleures conditions.
Contactez-nous pour faire le point !
AVIS D'EXPERTS : LE BIG DATA, PAR QUEL BOUT LE PRENDRE ?

Bon nombre d’experts se positionnent sur le sujet avec des convictions fortes et parfois opposées. Comment faire la part des choses entre ceux qui nous disent que cela va tout changer et les autres qui nous soutiennent que cela reste de l’analyse de données ? Quels sont les réels changements ? Sur quoi devons-nous être vigilants ? Comment ne pas tomber dans un projet sans fin sous le seul prétexte d’être présent sur le sujet ? Avec quelle organisation et quels profils ?

Notre vision reste le pragmatisme et l’itération du projet !

Tout d’abord, essayons d’en donner une définition : « Le principe des Big Data est de faire converger des données diverses et variées et de les exploiter à des fins de connaissance, de performance et d’usages. »

A chacun son niveau de maturité dans l’exploitation de la data et sur l’apport d’une telle démarche dans la stratégie de l’entreprise. Nous partageons l’avis de certains experts qui vont parler de SmartData. Car même si nous croyons à la puissance de la data dans sa plus pure exploitation, il existe encore un écart entre la réalité des projets mis en œuvre et les contraintes opérationnelles imposées aux équipes (budget, quickwins et ROI). Nous ne pouvons malheureusement pas tous allouer un budget R&D conséquent pour faire face à cette nouvel ère digitale ultra ciblée et connectée.

Mais, la question est bien de savoir comment nous continuons à avancer sur le sujet afin de ne pas être en retard dans les rendez-vous futurs que nous aurons avec les consommateurs.

L’offre KYP sur le sujet du Big Data est de vous faire gravir la montagne par étape et avec ambition. Grâce à notre passé ROiste, nous mesurerons l’apport de chacune de ces étapes au sein de votre marque/enseigne.

Pour cela, nous restons attentifs aux indicateurs des « V » du Big Data, car cela peut avoir un réel impact dans l’organisation, la réalisation et l’interprétation. Nous connaissons tous les « V » de : VOLUME, VARIETE, VELOCITE et VERACITE. A partir du moment où nous détectons l’activation d’un de ces « V », nous faisons appel à des experts internes et externes pour mesurer les enjeux du projet et mener à bien l’étape sur laquelle nous nous engageons.
N’oublions pas le « V », de VALIDITE qui à notre sens répond à la significativité et la robustesse des algorithmes (ce qui reste un éléments fondamental de la data intelligence). Et pour terminer le « V » de VALEUR, car après tout, c’est bien cette question qui est le nerf de la guerre (Valeur sur le business & Valeur sur l’intelligence créée).

Ce qui est certain, c’est que nous devons tous avancer dans cette course de la DATA INTELLIGENCE et qu’il faut commencer par un point de départ. Celui-ci est-il évident pour vous ? Nous serions ravis de pouvoir échanger avec vous sur le sujet.