docudoo

La gestion de la clientèle et la réduction du churn : Enjeux et stratégies dans le marché concurrentiel

 

INTRODUCTION

 

Le marché actuel de la relation marketing se trouve en croissante évolution. La concurrence devient de plus en plus rude au niveau de tous les secteurs d’activités. Les entreprises se précipitent pour fidéliser sa clientèle.

 

Le client peut être défini comme étant celui qui achète un produit ou un bien, s’abonne à un service auprès d’une société donnée. La clientèle est donc un élément essentiel du fonds de commerce de toute entreprise voulant faire un profit dans son domaine d’activité. Une entreprise peut pourtant perdre une partie ou la totalité de sa clientèle à tout moment, ce départ des clients est appelé « churn ».

 

Churn est le mot dérivé de change and turn et il exprime le départ du client, l’interruption du contrat entre l’entreprise et le client. Le contrat peut concerner un achat de bien, une location, un abonnement à un service. Le churn peut être interne et peut aussi être externe. Il existe des facteurs, des raisons qui poussent les clients à quitter un produit ou une entreprise. Sachant que toute entreprise se forge à trouver des moyens pour satisfaire sa clientèle, conquérir de nouveaux clients et fidéliser les clients existants. Le churn vise plutôt ces clients déjà existants dans l’entreprise. L’insatisfaction au niveau de diverses attentes favorise le départ du client qui s’exprime par différentes formes de rupture. Les clients peuvent émettre des réclamations sans quitter l’entreprise mais ce cas est rare. Les mécontentements s’expriment plutôt par le départ des clients de l’entreprise ce qui mettra en péril la conquête de nouveaux clients par l’entreprise ayant ainsi une image négative.

 

La satisfaction de la clientèle et sa fidélisation sont donc deux impératifs à apprendre. Le costumer relationship management a été mis en place en vue d’aider les entreprises dans la gestion de sa relation client, leur apprend la valeur de la clientèle et ce qu’il faut faire pour garder sa clientèle au lieu de se précipiter à en chercher de nouveaux. Dans le CRM, le client est le roi, et devrait se trouver au sommet de toutes préoccupations. Le système CRM est alors perçu comme étant un nouveau outil qui est important pour la mise en place d’une relation personnalisée avec chaque client de l’entreprise, peu importe le canal de communication utilisé par l’entreprise. Divers outils peuvent être mis en place pour mettre en œuvre le CRM, l’internet est devenu un élément nécessaire dans la réalisation du système mais l’entreprise n’est pas obligée de l’appliquer.

 

La connaissance client s’avère donc plus qu’indispensable à l’entreprise, les informations recueillies sont organisées en vue de mener à bien toutes opérations d’analyse permettant d’atteindre un certain objectif. Les bases de données sont donc classées d’une manière à organiser au mieux la relation client.

 

En rapport avec cette gestion de la clientèle, le taux de churn permet de prévenir à l’avance, de prédire à l’avance le churn au cours d’une période donnée. La réduction du taux de churn au minimum est donc l’objectif principal pour les entreprises. Pour réussir à prédire ce churn et à fidéliser le maximum de clientèle, des modèles d’indicateurs marketing ont été mis an place, ces modèles permettent une analyse de la régression de ce taux de churn. Les techniques de modélisation sont la régression (linéaire et logistique, les réseaux neurones et les arbres de décision. Ces techniques sont basées sur des données recueillies suivant des informations personnelles sur le client, des réclamations reçues et des réponses aux attentes, on parle alors de data mining.

 

Dans cette optique, plusieurs questions se posent : « Peut-on exactement prévoir à l’avance le taux de churn et le modèle mis en œuvre par l’entreprise permet-il suffisamment à gérer ce churn, quels sont les techniques pouvant être utilisés pour avoir un churn plus ou moins réduit ?

 

Notre étude sera divisé en cinq grandes parties pour mieux répondre à ces questions, une approche théorique sur la relation client en générale est nécessaire afin de mesurer ce taux de churn car les facteurs qui poussent les clients à partir doivent être détectés scrupuleusement. Ensuite, il est important, avant d’analyser les modèles d’indicateurs de faire une analyse des bases de données sur les clients car tous les travaux devraient être basés sur ces données. Surgiront ensuite les problèmes majeurs rencontrés au niveau de la clientèle, des techniques de modélisation. Les solutions seront axées sur la perte de la clientèle, savoir ce sue les entreprises devraient tenir compte.

 

 

 

 

 

 

 

SOMMAIRE

 

INTRODUCTION

 

PARTIE I/ Délimitation et approche théorique

Sect1/ Les concepts se rapportant à la relation entreprise-clients

A-Définitions des notions

-La relation client

-La notion de « churn » et le taux de churn

1/ Définition des notions

2/ Les causes d’arrêt déterminées par le taux de churn

2.1- L’abandon

2.2-Switch

2.3-le churn interne :

 

B-/La valeur de la clientèle pour l’entreprise

1/La définition du client

2/Du marketing transactionnel au marketing relationnel

3/Le système de gestion de la relation client

4/La valeur client proprement dite

 

C/ Les facteurs engendrant la perte de la clientèle

 

1/ Les impératifs devant être respectés pour éviter la perte de la clientèle

-La qualité de service : une qualité complète

-La satisfaction de la clientèle

 

2/ les relations entre la fidélité et la rétention des clients

 

3/ Les raisons de déperdition et de défection de la clientèle

D-Customer Relationship Management

1-Utilité du CRM

2-La mise en place du CRM

3-Les outils CRM

4-La démarche CRM

5-Les différents types de CRM

 

Sect2: La connaissance client

A/La relation d’apprentissage

B/Collecte de données auprès des clients

1-Les informations collectées : besoins et réclamations des clients

2-Les moyens de collecte

3-L’enquête par questionnaire

3.1.La phase préparatoire de l’enquête

3.2.Confection des questionnaires

C/Organisation et exploitation des données

1-Définition des notions

a-Le fichier client

b-Les bases de données

c-Le data mining

d-La segmentation

2-Exploitation proprement dite

 

 

D/Le knowledge discovery

1-La construction d’un datawarehouse

2-La phase de formatage

3-le data mining

1-Le concept de data mining

2-Utilité pratique du data mining

3-Les techniques du data mining

3.1/ Les régressions :

a/ La régression linéaire

b/ La régression logistique

3.2/ Les réseaux de neurones

3.3/ Les arbres de décision

 

PARTIE II : Churn prediction

 

A/La mise en place du modèle prédictif

1-Délimitation du concept de prédiction

2-La construction du modèle prédictif

3-Le modèle prédictif appliqué au churn

3.1-Mise en œuvre technique

3.1-Les autres hypothèses théoriques en présence

B/ Les problématiques se rapportant aux techniques de modélisation et les problèmes de l’entreprise face à sa clientèle

 

PARTIE III : Les solutions proposées

1-Solutions avancées pour la perte de clientèle

2-Solutions proposées aux problèmes du churn prediction

PARTIE I/ Délimitation et approche théorique

 

Sect1/ Les concepts se rapportant à la relation entreprise-clients

La relation entreprise-client est une relation qui se base sur diverses théories que l’entreprise devrait mettre en pratique pour pouvoir répondre aux besoins de la clientèle. Le fait est que les théories sont mises en place pour servir de modèle à toute entreprise. La clientèle est un élément essentiel du fonds de commerce mais elle peut la quitter à tout moment. C’est contre cette perte de clientèle que toutes les entreprises se battent en adoptant des théories communes qui permettent de mettre en valeur la clientèle. Les concepts se rattachant à cette relation  sont nombreux mais on peut se résumer sur le concept de la valeur de la clientèle, la perte de la clientèle et le Costumer Relationship Management qui englobe toutes les théories. Une définition des notions s’avère ainsi importante.

A-Définitions des notions

Dans notre champ d’étude, les notions importantes qui nécessitent une définition sont la relation client, churn et le taux de churn.

 

1/ La relation client

Le concept de relation client est un concept trop large pour arriver à une définition. Il est donc impossible d’en donner une définition précise. Pour mieux appréhender la notion de relation client, la définition des politiques qu’elle englobe serait plus intéressante. Il existe quatre politiques en matière de relation client : la politique de conquête,  la politique de fidélisation, la politique d’abandon et la politique de rationalisation.

La politique de conquête ou de reconquête concerne les anciens clients de l’entreprise, il s’agit de les convertir en clients actifs par le biais de nouveaux arguments convaincants et puissants. Quant à la politique de fidélisation, elle nécessite beaucoup d’efforts de la part de l’entreprise, il s’agit d’intensifier et de pérenniser une relation commerciale. La politique d’abandon consiste à délaisser une partie des clients, ceux qui ne sont pas rentables pour l’entreprise. La politique de rationalisation concerne les clients qui sont réguliers mais peu lucratifs, le but étant de chercher leur rentabilité.

 

2/ La notion de « churn » et le taux de churn

 

1/ Définition des notions

Le mot « attrition » est le mot dérivé de change and turn. En réalité, l’attrition exprime l’interruption d’un contrat entre une entreprise et un client, ce qui signifie qu’il exprime le taux de déperdition des clients appartenant à une entreprise ou les clients d’un produit. Le taux de churn montre le pourcentage de clients qui ont quitté l’entreprise au cours d’une période donnée, la période est en générale fixée en une année. Ce pourcentage est calculé par rapport au nombre total de clients qui ont existé au début de cette période.

La fidélisation présente un impact sur la rentabilité, une fois cette information connue, le taux de churn est une donnée très importante. En d’autre terme, le taux de churn permet de mesurer la part des clients perdus et la part des clients fidèles. On peut également considérer son opposé, qui exprime la durée moyenne pendant laquelle le client est resté fidèle au service. Ainsi, un taux d’attrition de 20% par mois signifie que les clients restent fidèle pendant 1/20% = 5 mois en moyenne.

La churn prediction permet donc d’anticiper le risque d’infidélité, l’entreprise se prépare à l’avance et cherche des solutions en vertu du taux de churn obtenu au cours d’une période donnée. Le but final est de fidéliser les clients déjà existants, le risque de churn est connu d’avance et l’entreprise se forge à trouver des offres qui répondent au mieux aux attentes des clients risquant de partir.

 

2/ Les causes d’arrêt déterminées par le taux de churn

 

Lorsqu’on parle d’arrêt, on parle du délaissement par le client du produit ou du bien, un changement émane donc du client en quittant l’entreprise. Les causes de l’attrition sont regroupées en trois catégories par le taux de churn :

L’abandon : Le client n’a plus besoin du produit ou du service par l’évolution ou le changement de son activité. Le client se passe alors du produit.

Switch (passage à la concurrence): Le client découvre des offres plus intéressantes auprès des entreprises directement concurrentes, il opte pour le produit de cette dernière et se détache de celui de l’autre. On parle ici de churn active/ deliberate, le client change tout simplement de fournisseur. Les causes peuvent être l’une des causes précitées au niveau de la perte de la clientèle en générale.

 

le churn interne : Ici, le changement se caractérise au sein même de l’entreprise, il ne le quitte pas mais opte pour une autre offre, un autre produit, le churn concerne ici le produit et non l’entreprise puisque le client reste un client de l’entreprise même. On parle alors de cannibalisation ou phagocytage des offres.

 

On peut également regarder l’attrition d’une autre manière, le contrat peut être rompu totalement, annulé d’une manière officielle. Pourtant, il peut ne pas être rompu officiellement mais les clients n’achètent plus le produit depuis un certain temps prolongé, l’utilisation du produit n’est pas active, l’interruption est donc simulée. L’interruption du contrat peut aussi être partielle, cela veut dire que les clients n’utilisent qu’une partie des produits, leur utilisation du produit n’est donc pas effectif, le contrat est dans ce cas annulé partiellement.

Si telles sont les causes d’attrition des clients, on peut également parler de la manière pour le client de quitter l’entreprise. Le client peut partir de manière brusque, il décide de quitter l’entreprise, l’attrition est dans ce cas définitive, les domaines d’application de cette attrition définition sont ceux de l’assurance, de la téléphonie, de la télévision payante et de l’abonnement de presse. Le client peut quitter l’entreprise de manière plus discrète en se détachant petit à petit du contrat, dans ce cas d’attrition, l’identification est difficile. L’attrition est alors relative puisque les activités sont en baisse au fil du temps, cette forme d’attrition se rencontre toutefois dans les domaines de la banque, de l’internet ou de la consommation en générale.

 

La détermination du taux d’attrition est donc crucial l’entreprise et le permet de faire face à la concurrence. La gestion de la relation client a montré divers impératifs devant être respectés par les entreprises pour diminuer le taux d’attrition. Le client tient une place prépondérante dans le marketing de toute société, et pour déterminer le taux d’attrition, une meilleure connaissance et une meilleure relation avec le client est plus que nécessaire. Ces informations sont requises à l’aide du data mining. De même, les plaintes émanant des clients sont à maîtriser par l’entreprise, la gestion  de ces plaintes doit suivre les nouvelles technologies pour que l’écoute et la réponse aux attentes de la clientèle puissent contribuer à leur rétention.

 

B/La valeur de la clientèle pour l’entreprise

 

1/La définition du client

 

Dans un premier temps, il est nécessaire de distinguer le client du consommateur. Les clients peuvent être définis comme étant ceux qui achètent à une entreprise, que ce soit des personnes pour consommer ou des entreprises pour transformer, intégrer ou revendre. Les consommateurs quant à eux sont des personnes qui, au final, consomment les biens et les services. D’après ces définitions donc, le terme consommateur désigne le consommateur final qui n’est pas forcément un client. Le client peut être un distributeur ou un détaillant qui entre en contact direct avec l’entreprise, il passe une commande à la firme, ensuite cette dernière va procéder à la livraison et recevoir paiement.

Généralement, les entreprises ont tendance à ne prendre en considération que les clients directs et mésestiment les consommateurs, cependant, dans l’étude de l’attrition des clients, le terme client devrait englober aussi bien les clients directs que les consommateurs finaux. Même si le consommateur ne se situe qu’à l’extrémité de la chaîne de valeur, il est nécessaire de lui accorder une attention particulière, les clients directs ne doivent pas non plus être négligés. En effet, de nombreuses entreprises ont cessé d’exister en raison de non considération des consommateurs au bénéfice des clients directs. On peut en déduire que les deux personnes peuvent se confondre et c’est ce qui se produit lorsque c’est le consommateur final lui-même qui est amené à entrer en contact direct avec l’entreprise. Ce qui est certain c’est que les clients sont des acheteurs  de produits de l’entreprise, or ces acheteurs ne consomment pas forcément eux-mêmes.

 

3/Le passage actuel au marketing relationnel

 

Les entreprises sont progressivement passées de stratégies de marketing dit transactionnel ou centré produit  à des stratégies de marketing dit relationnel ou orienté client .Le marketing évolue aujourd’hui vers une véritable prise en compte du client, fondée sur une relation individualisée, consentie et de longue durée. Le client ne s’envisage alors plus seulement dans la conquête et dans l’immédiateté d’une réponse en termes d’achat, mais sur le long terme dans une relation prenant en compte la gestion d’un cycle de vie du client et favorisant la proximité. En effet, le marketing relationnel a pour but d’attirer les clients et de les fidéliser au moyen d’une politique de relation continue et personnalisée privilégiant la qualité du contact.

En parallèle avec le marketing opérationnel, le concept de marketing one to one a également fait son apparition. Il s’agit d’une technique en direction de chaque client pris individuellement dans le but de lui proposer une offre personnalisée qui réponde à ses aspirations personnelles, les entreprises, quelles que soient leurs secteurs d’activité, concentreront leurs efforts sur le service et la gestion de la relation client. L’entreprise accompagne donc le client au quotidien, le conseille, susciter sa confiance, son attachement, et anticipe ses désirs.

 

3/Le système de gestion de la relation client

Actuellement, le client est de plus en plus rationnel et averti, le client n’est plus perçu comme simple acheteur mais comme porteur d’une relation rentable que l’entreprise doit essayer d’entretenir le plus longtemps possible. L’objet du système est la gestion du cycle de vie client, elle englobe l’ensemble des activités et des processus que doit mettre en place une entreprise pour interagir avec ses clients afin de leur fournir des produits et des services adéquats au bon moment. Les entreprises actuelles ont de plus en plus recours au système. L’idée du concept est de mettre le client au centre de l’entreprise dans l’objectif  d’améliorer la rentabilité et de le fidéliser en vue d’accélérer la performance commerciale, il s’agit de gérer la relation client au plus près dans la construction de l’avenir de l’entreprise. Le client, avec ses besoins spécifiques, est placé au centre des opérations commerciales d’entreprise.

Les Objectifs fondamentaux de la gestion de la relation client sont d’acquérir de nouveaux clients profitables, conserver les meilleurs clients et parvenir à leur vendre davantage. La recherche de nouveaux clients à notre époque s’avère de plus en plus difficile et onéreux, c’est la raison pour laquelle il est nécessaire de fidéliser les clients déjà conquis. En effet, actuellement, le principe est mieux vaut fidéliser que conquérir car il coûte plus cher d’acquérir un client ou de chercher à élargir ses parts de marché par une politique conquérante que d’en conserver un. Le coût d’acquisition des clients c’est-à-dire le prix qu’il faut dépenser pour acquérir un nouveau client permet d’ailleurs d’évaluer la santé financière de l’entreprise. La GRC regroupe deux grands processus qui sont la vente et le service au client. Le processus de la vente consiste dans la répartition des territoires commerciaux, le partage des informations commerciales, la recherche d’informations sur le client en vue de renforcer la relation entre ce dernier et l’entreprise,  la valorisation des actions commerciales à destination des cibles à fort potentiel, la gestion du retour d’informations commerciales , l’augmentation de la productivité du service commercial puis la mise à disposition d’une base de connaissance marketing et des produits. En ce qui concerne le processus dans le service, il consiste dans l’offre d’une assistance dans la résolution des problèmes, la gestion des traitements des demandes, la gestion des interventions sur site, ainsi que l’anticipation des besoins futurs de services. La GRC répond ainsi à des besoins stratégiques en permettant l’établissement d’informations sur la clientèle à propos de leurs besoins et ce qu’elle apporte pour l’entreprise, elle permet d’évaluer l’impact des moyens commerciaux utilisés, elle permet de prévoir les opportunités de développement  en matière de marketing, elle permet également de répondre à des questions organisationnelles se rapportant à la détermination si l’information nécessaire pour servir efficacement le client est bien partagée.

 

4/La valeur client proprement dite

 

Il est à préciser que a valeur des clients est à distinguer de la valeur pour le client. La valeur client concerne à la fois la valeur  client passé, la valeur client future, la valeur client potentielle qui permet d’étudier le potentiel de développement d’une relation avec un client,  et la valeur client compétitive c’est-à-dire la valeur du client en fonction de sa satisfaction. Mesurer une valeur client reviendrait donc non seulement à déterminer d’une part les profits passés réalisés par l’entreprise sur ses clients mais également et d’autre part les profits futurs que ces derniers vont engendrer. Actuellement, les entreprises cherchent toujours à savoir ce que leur coûtent et ce que leurs rapportent les clients, s’ils sont fidèles ou s’ils sont ponctuels. Elles se soucient également du coût de recrutement de nouveaux clients. L’analyse de la rentabilité par produit et par centre de profit pour maîtriser la rentabilité globale a été abandonnée. La notion de valeur actualisée du client sert à mesurer le capital client. Au moyen de cette notion, l’entreprise peut évaluer le chiffre d’affaires prévisionnel ou la marge devant être réalisé sur plusieurs années auprès d’un même client. Le capital client est obtenu à partir de la somme sur une période du chiffre d’affaire et de la marge réalisée par le client, à laquelle on impute des coûts engendrés par ce même client sur cette période ainsi que le coût d’acquisition en début de période.  Le calcul de la valeur client met en évidence la nécessité de suivre le chiffre d’affaires et la marge du client dans le temps. Les efforts commerciaux, financiers ou de service ainsi que le marketing doivent être pris en considération pour calculer le retour sur investissement par groupe de clients. Les coûts d’acquisitions quant à eux comprennent notamment les avantages sur le prix du produit et les frais de mise en service. Le coût d’acquisition permet de mettre en évidence s’il est moins couteux ou plus cher de retenir son client au lieu d’en prospecter de nouveaux. L’objectif principal de la valeur client est d’augmenter la valeur de chacun de ces clients. Dans ce contexte, la gestion de la relation client retrouve sa raison d’être qui est de gérer le client par segment de valeur et accroître sa valeur par les leviers appropriés.

 

C/ Les facteurs engendrant la perte de la clientèle

 

Comme il a été dit, les clients constituent un élément constituant le fonds de commerce d’une entreprise, c’est un élément important. Une entreprise qui perd un client voit une diminution dans son fonds de commerce. Ce qui provoque une perte en générale et les concurrents en profitent. Les causes ne peuvent être déterminées si on ne connaît pas les impératifs qui s’imposent à une entreprise pour conquérir et conserver sa clientèle. Ces impératifs peuvent être regroupés au nombre de deux : la qualité du service et la satisfaction du client, ces deux impératifs sont complémentaires.

 

1/ Les impératifs devant être respectés pour éviter la perte de la clientèle

 

La concurrence est actuellement au cœur de tous les soucis des entreprises. La bataille nécessite beaucoup d’efforts. La compétence ne suffit pas à faire face à la concurrence, l’entreprise doit être excellente et cette excellence se traduit par l’inexistence des réclamations émanant des clients. Il ne doit pas y avoir de défaut d’accueil ni de bouche à oreille négatif. Le fait est que le client a le choix et il devient de plus en plus exigeant. Pour répondre aux exigences des clients et pour éviter leur départ, l’entreprise doit adopter une bonne qualité de service et favoriser une satisfaction de la clientèle pour assurer leur fidélisation.

 

 

 

 

La qualité de service : une qualité complète

 

La qualité de service est devenue un élément clé qui différencie deux concurrents pour conquérir et fidéliser le client. Ce qui constitue pour l’entreprise une source de profit. Mais quels sont les composants de la qualité de service ? La qualité de service donne l’image de l’entreprise, la place de l’entreprise dans l’esprit du client. De même, la qualité de service montre la performance du personnel chargée de la communication, la nature de l’environnement de la société détermine aussi la qualité des on service, son emplacement, sa décoration et son équipement. Egalement, le mode d’organisation interne de l’entreprise démontre son service et aussi et surtout la satisfaction du client, y-a-t-il un écart entre les attentes et les performances.

En somme, la qualité de service est le résultat de comparaison entre les attentes du client c’est-à-dire ce qui devrait être fourni et sa perception quant à la performance de l’entreprise. Pour l’entreprise, ce qui est à éviter, c’est l’écart entre la demande du client et la réponse à sa demande, la réduction au minimum de cet écart permet ainsi d’acquérir de nouveaux clients et de conserver les clients à long terme, ceux qui sont anciens à l’entreprise. Or, la perception du client est toujours difficile du fait que des facteurs propres aux clients peuvent intervenir. Un auteur affirme : « un service de bonne qualité est le jugement que porte sur ce service un client satisfait dans une situation donnée » (EIGLIER et LANGEARD 1983).

Une qualité de service doit recevoir une qualité complète, une qualité totale qui devrait concerner toute l’entreprise, tous ses composants. La satisfaction des besoins du client doit être une priorité pour toute l’entreprise. L’adoption des méthodes et principes adéquates doit être consacrée pour mobiliser les composants de l’entreprise. Des règles ont été définies par Kotler et Dubois en ce qui concerne la qualité en générale :

-la qualité concerne toute l’activité de l’entreprise, non seulement les produits,

-la qualité est celle qui est saisie, vue et ressentie par le client,

-l’implication du personnel renforce la qualité du service

-la qualité requiert des partenaires de haut niveau,

-la qualité s’améliore au fur et à mesure.

 

La satisfaction de la clientèle

 

La satisfaction de la clientèle est une des impératifs que l’entreprise doit se consacrer. La clientèle doit être satisfaite du service offert par l’entreprise pour assurer sa fidélité, autrement, il quitte l’entreprise. La satisfaction dépend de chaque client, on peut parler ici du marketing one-to-one, les clients ont des attentes différentes donc quelque chose qui satisfait un tel client peut déplaire à tel client.

Par définition, la satisfaction se traduit par un sentiment comportant des éléments affectifs et cognitifs, elle se place après un ensemble d’achat fait par le client. La notion de satisfaction est ambigüe et selon Dufer (1986, cité par J. Dufer et J.L. Moulins, 1989) : « la satisfaction est un état psychologique résultant de l’utilité d’un bien et une évaluation caractérisant un certain niveau de réalisation ». La satisfaction répond aux attentes de chaque client, cela peut découler d’une attente en ce qui concerne la performance, ou une attente par rapport aux efforts et aux coûts nécessités pour l’obtention d’un produit ou d’un service ou tout simplement, une attente ayant un lien avec l’aspect social. Le client se sent satisfait lorsque ses attentes sont honorées après la consommation du produit par exemple.

La satisfaction du client est difficile à mesurer de plus que chaque client possède des attentes qui lui sont particulières. Ce qui est à retenir est que l’insatisfaction de la clientèle conduit à sa perte. Lorsque les clients sont insatisfaits, ils envoient dans la plupart des cas des réclamations qui devront être prises en compte par l’entreprise afin de les retenir au lieu de conquérir des nouveaux clients qui ne seront même pas des clients à long terme. Le problème est que les clients, lorsqu’ils sont insatisfaits, 5% seulement font une réclamation, le reste quitte tout de suite l’entreprise et va vers les autres concurrents. De par ces impératifs, il ne reste plus qu’à savoir quelles sont les raisons qui poussent les clients à quitter l’entreprise, il ne s’agit pas encore de mesurer le taux de déperdition, il s’agit juste de faire un constat et un état des lieux.

 

2/ les relations entre la fidélité et la rétention des clients

 

Pour connaître les raisons de départ des clients, il faut savoir qu’il existe des clients qui sont à risques, qui sont infidèles. La fidélité entre donc en ligne de jeu, les clients fidèles sont ceux qui ont déjà entretenus une relation durable avec l’entreprise, ils préfèrent émettre des réclamations que de quitter l’entreprise, contrairement aux clients de passage. Les clients fidèles ne sont pas attirés facilement par les autres entreprises concurrentes. Pour assurer alors une fidélisation de la clientèle, les entreprises emploient la politique de la rétention, elle s’utilise particulièrement dans la gestion des réclamations. La fidélité et la rétention sont deux notions distinctes mais qui sont liées. La rétention permet ainsi à l’entreprise de retenir le maximum de clientèle. Par opposition à la fidélité, la rétention concerne le maintien en activité d’une clientèle existante et c’est le taux d’attrition qui permet de mesurer cette rétention, une notion qui sera étudiée dans les autres sections, la rétention peut être considérée comme la suite d’une mauvaise fidélisation. La fidélité quant à elle, n’indique que la propension d’un client à faire un choix à répétition au sein d’une même entreprise. Leur liaison réside dans le fait qu’une meilleure fidélité maximise la rétention.

 

3/ Les raisons de déperdition et de défection de la clientèle

 

Comme il a été vu auparavant, une mauvaise qualité de service ne permet pas de retenir un maximum de clientèle, les clients s’enfuient rapidement, surtout ceux qui ne sont pas concernés par la fidélisation. Lorsque le service est défectueux, les clients s’empressent vers d’autres entreprises ou le service paraît plus meilleur, que ce soit en ce qui concerne le personnel ou le service en général. Par cette mauvaise qualité de service, les clients quittent l’entreprise puisqu’ils sont insatisfaits. Si telles sont les principales raisons, les causes sont nombreuses. Le client peut quitter l’entreprise dès qu’il ressente une sensation de ne pas exister au sein de l’entreprise, personne ne s’occupe de lui du fait qu’il ne fait des achats  que rarement, le personnel n’écoute pas ses réclamations. Cela peut arriver aussi quand les livraisons sont toujours en retard. Plusieurs petits soucis forment un grand mécontentement en plus de l’insuffisance de communication.

Le client préfère contracter envers d’autres entreprises concurrentes lorsque ces plaintes ne sont même pas considérées, les mêmes erreurs reviennent. Un client dont on n’écoute pas n’a pas de raison de rester en tant que client de cette société. Dès fois, les clients sont insatisfaits sans que l’entreprise se rende compte puisque la plupart des clients ne manifestent pas son mécontentement, le produit ne répond pas à ses attentes, le service n’a pas la qualité qu’il recherche, il ne dit rien, il part. Dans ce cas, l’entreprise devrait posséder des moyens pour détecter la cause, par exemple, l’application des sondages ou tout autre moyen. Une entreprise ayant une équipe vigilante ne peut jamais réussir à détecter l’insatisfaction des clients. La perte de la clientèle peut aussi avoir pour cause le changement des besoins et des attentes des clients et que l’entreprise ne suit pas cette évolution. Le client est aussi attiré par le coût des produits, un concurrent offre un prix plus bas pour le même produit, le client change d’entreprise et va vers ce dernier.

 

Face à cette perte de la clientèle, les entreprises se sont empressées à chercher comment mesurer cette perte et pas quel moyen le minimiser. Il existe actuellement un taux appelé taux d’attrition qui permet de prévoir cette perte et de la maîtriser à l’avance.

 

D-Customer Relationship Management

1/ Le concept de CRM

Le CRM ou Costumer Relationship Management est l’ensemble de la relation avec les clients ou prospects, il se concrétise à travers des logiciels. Le CRM a trouvé son origine dans les différentes théories qui ont pu démontrer que la fidélisation des clients est plus rentable que la conquête des clients. On peut définir le CRM comme étant une approche globale visant à apporter la bonne réponse aux attentes du client ou du prospect, au bon moment, à travers le bon canal, au bon niveau de coûts.

 

2/ Utilité du CRM et sa mise en œuvre

  • Utilité

D’une manière générale, un logiciel de CRM permet de connaitre pendant un laps de temps court les transactions réalisées avec un client ; les coordonnées des personnes responsables de la relation avec ce client au sein de l’entreprise ; les coordonnées des contacts client ; les actions entreprises pour démarcher le client (réunions, conférences téléphoniques…) ; les actions organisées pour poursuivre la relation avec le client ; les éventuelles transactions futures avec ce client et la probabilité qu’elles soient réalisées. L’évolution actuelle des logiciels de CRM permet à l’ordinateur d’afficher tous les renseignements sur un client qui appelle, c’est le cas du call center.

Le CRM accélère la performance commerciale, gouverne la relation client au plus près et fonde l’avenir même de l’entreprise. Le retour de l’entreprise sur son investissement est rapide, il permet d’augmenter les marges, le montant des commandes, le nombre de clients, et aussi de faire chuter le coût commercial et de favoriser la satisfaction client.

Historiquement, divers éléments informatiques ont été mis en œuvre dans le but de servir au mieux l’entreprise et sa gestion, il s’agit des PGI (Progiciels de Gestion Intégrée), des ERP (Enterprise Ressource Planning). Au fil du temps, les valeurs de l’entreprise ont été vues d’un autre angle et sont devenues immatérielles allant des brevets innovants et en passant par les marques, les fournisseurs et les clients, les nouvelles technologies ont permis à toute entreprise de garder leur croissance en dépit de l’accroissement de la concurrence. La politique mise en place au niveau du CRM place le client au centre de toutes les décisions de l’entreprise, il s’agit de localiser les mauvais et les bons clients.

Au niveau même du CRM, les outils déployés par l’entreprise leur permettent de réduire le taux de churn des clients appelé en d’autre terme «le taux de déperdition des clients pour une entreprise». Cette diminution du taux de churn fait augmenter la fidélisation des meilleurs clients. Une connaissance rapprochée des clients permet dans la pratique de découvrir plusieurs types de comportement parmi les bons clients. Le système CRM est donc employé dans la gestion des nouvelles conquêtes en vue de les transformer en clients fidèles, ce qui nécessite beaucoup d’effort de la part des intervenants de l’entreprise.

  • Mise en œuvre

Mais la mise en œuvre du système CRM n’est pas chose facile, la gestion des services  de base doit être observé par l’entreprise comme le SAV, la logistique, la qualité produit,…Tout l’emplacement de ce système exige des gros investissements et des grands changements au niveau de l’organisation. Le lancement du système est donc conditionné non seulement par l’actionnement des services de base mais aussi et surtout par l’acceptation du comité de direction de l’entreprise. Cette acceptation concerne le chemin vers le « MANAGEMENT de la RELATION CLIENT ». Ce chemin crée un état d’esprit, une sorte de culture qui pousse l’entreprise à se concentrer spécialement sur les clients. L’esprit implanté en matière de CRM se focalise sur le dialogue, celui avec le client et celui en interne, entre les employés et l’employeur. Les outils seront placés à tous les points de contact entre les parties, des capteurs permettront de récupérer l’information et de réagir correctement à tous les signaux. Dans la plupart des cas, les capteurs sont considérés comme gênants pour les parties, au contraire, ils permettent d’enrichir le dialogue et la connaissance, de vivifier l’extraction de l’information. De plus, avec les nouveaux outils du data-mining  l’information permettra de découvrir de nouveaux segments, de nouveaux filons, des voies sans issues.

 

2-La mise en place du CRM

Pour la mise en place d’un système CRM, il existe une procédure à suivre :

  • SFA : Sales Force Automation

SFA constitue l’ensemble des outils qui sont entre les mains des commerciaux, ces outils permettent de structurer les données sur les clients, aussi, ils augmentent la productivité des vendeurs. SFA permet l’intégration des informations commerciales dans le système d’informations de l’entreprise. Pour sa validité, le système d’information doit compter avec la ressource humaine. La réussite d’un projet d’automatisation de la force de vente repose sur la compétence humaine et sur la performance marketing.

 

  • Informatisation du service marketing

Le développement des nouvelles technologies, des outils d’analyse, permet au service marketing de maîtriser son marché et de confectionner des listes pour la force de vente. L’étape n’est pas difficile à établir mais l’entreprise est obligée de revoir toute son organisation et plus précisément les bases de données. L’automatisation du marketing favorise la meilleure connaissance des différents segments de clientèle et la mensuration des résultats.

  • Automatisation du service client

Il s’agit d’une classification automatique des réclamations des clients ou des plaintes déposées par eux. L’automatisation concerne surtout les SAV, le service avant vente et le service après vente. Il existe des outils qui permettent d’automatiser le service client comme le call center et les sites internet.

A travers ces étapes, la satisfaction du client est assurée par l’entreprise.

 

3-Les outils CRM

Le CRM nécessite donc des outils d’automatisation permettant de gérer au mieux la relation client. Ces outils sont les centres d’appels, l’analyse de données, la gestion des forces de ventes, la gestion du service au client et l’e-business.

Les outils qui dominent le marché CRM peuvent donc être divisés en trois positions, ceux qui tendent vers la gestion des services et du support client, un segment important dans la création même du concept du CRM, ceux qui sont destinés à la gestion des ventes qui constitue presque la moitié du total de l’offre CRM, ceux qui sont dédiées à la gestion des actions marketing. La gestion de la relation client qui est constituée par les outils traditionnels depuis 1999 s’est mise en recul par rapport aux outils œuvrant à la gestion de la relation client self service.

Avec la mondialisation, les nouvelles technologies comme l’internet ont attiré beaucoup plus de techniciens qui se sont précipités vers l’utilisation de l’internet en tant que canal de relation avec le client. Les offres de gestion de la relation client ont évolué avec les nouvelles technologies web, le portail internet a pris de l’ampleur, ce dernier constitue une véritable plateforme en matière de gestion de relation client. Les avantages procurés par le canal internet sont plus élevés par rapport aux outils traditionnels en matière de CRM, l’internet constitue ainsi un outil CRM en self service.

  • Les centres d’appels

Les centres d’appels concernent les appels téléphoniques, il s’agit d’une organisation d’automatisation de ces appels, entrants et sortants, dans la relation avec les clients. L’intégration dans le système d’information est assurée par les technologies CTI (Couplage Téléphonie/ Informatique). L’objectif est le fait de pouvoir identifier un client dès qu’il appelle, le système fait que tous les renseignements concernant le client soient visibles sur l’ordinateur de l’agent qui reçoit l’appel, ce qui facilite la satisfaction du client puisque son comportement est plus ou moins déterminé. Mais même si l’internet et les e-mails sont efficaces et rapides comme moyens, il existe d’autres moyens comme le téléphone et le face à face. Dans la plupart des cas, les centres d’appels sont créés par les entreprises pour répondre aux questions en provenance des clients.

  • La personnalisation et le commerce électronique

Un site de commerce électronique permet la mise œuvre de toutes les opérations commerciales, comme les commandes et les paiements. La connaissance de la clientèle est personnalisée de manière à faciliter l’interaction entre l’entreprise et le client. Aussi, une fois les renseignements sur tel ou tel client sont complets, les offres sont plus ou moins adaptées aux attentes du client.

  • Service offert sur le web

Dans la majeure partie des cas, le client demande les services par téléphone et c’est le plus pratique mais il arrive que certaines commandes sont satisfaites à travers le site web qui relie l’entreprise à sa clientèle. Le fait est que le site web renferme différents outils technologiques très avancés.

 

 

4-La démarche CRM

La démarche suit une réorganisation au niveau même de l’entreprise, partant de la collecte d’informations avec une conception d’une base de données client, en passant par la prise en compte de la culture d’entreprise, et se termine à la relation client elle-même.

  • La collecte des informations et la conception d’une base de données client

La collecte des informations concernant les clients permet à l’entreprise de les connaître avec plus ou moins de précision, cette connaissance aide dans la mise en place d’une stratégie. L’entreprise met donc en place un fichier client qui est complet avec des coordonnées mises à jour. Ce fichier permet aussi d’indiquer les commandes passées par les clients et de prendre en compte leurs appels pour une aide ou une plainte.

  • La prise en compte de la culture entreprise

La culture entreprise est un concept très important qui déterminera la réussite ou pas de celle-ci. Elle concerne plus précisément les salariés, il faut inculquer en eux le même esprit, un esprit qui prendra en compte de la réussite de l’entreprise. Ce qui tend à dire que les salariés doivent tous avoir un esprit tourné vers le client, ceci est prioritaire par rapport à l’achat des divers équipements informatiques et des progiciels.

  • La relation client

Une fois que l’entreprise dispose d’un fichier client qui lui permet de connaître sa clientèle, la relation client est établie, une relation qui instaure une culture au niveau de l’entreprise même. C’est cette démarche là qui contribue à la mise en place d’une relation client, et l’informatique est un outil de plus pour faciliter ce travail de relation.

Les différents termes rencontrés au niveau de cette démarche seront analysés postérieurement d’une manière plus approfondie.

 

5-Les différents types de CRM

On peut distinguer deux activités en matière de CRM, les activités offensives et les activités de soutien. Le CRM offensif consiste à adopter des solutions qui tiennent une base de données à jour sur les clients existants. Le revenu client s’accroît grâce aux informations recueillies et à travers des actions qui sont destinés à améliorer l’émission de l’information comme l’e-mailing ou les campagnes marketing par exemple. Le CRM de soutien est un moyen qui consiste à prendre en charge les clients, qua ce soit en matière de qualité que quantité. Le but de l’entreprise est d’offrir aux clients les meilleurs produits et services qui puissent exister pour assurer leur fidélisation. Le service accueil est devenu une structure constituant une véritable force de vente, un moyen irréprochable de fidélisation.

La recherche d’une interaction au niveau de l’organisation de l’entreprise consiste à mettre en place des outils interactifs. L’ensemble de la chaîne clients dispose d’une interface graphique qui permet d’obtenir dans un intervalle de temps court toutes les informations nécessaires utiles pour gérer d’une manière efficace la relation avec la clientèle et les prospects, on parle alors de CRM interactif. Le CRM interactif ne peut quant à lui se détacher des programmes analytiques puissants, il doit s’y appuyer. Les programmes analytiques permettent d’analyser en backoffice les données produites par les outils CRM interactifs, on parle alors de CRM analytique. Le principal atout de ce dernier est qu’il permet à l’entreprise de faire des analyses comportementales comme la segmentation par exemple.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sect2/ LA CONNAISSANCE CLIENT

Avant de faire une quelconque churn prediction, il est plus que nécessaire de connaître les clients. La connaissance des clients est importante dans le fait que le taux de churn au cours d’une période donnée en dépend. Pour connaître sa clientèle, une entreprise se doit de collecter des données sur chaque client pour qu’elle puisse savoir les variables permettant de déterminer le taux de churn possible, et ensuite chercher dès le départ une solution qui pourrait conduire le client en risque de partir à rester en tant que clientèle de l’entreprise.

 

A/ La relation d’apprentissage

1/ Les principes de la relation d’apprentissage

Par définition et comme son nom l’indique, la relation d’apprentissage est la relation qui existe entre une entreprise et son client et qui se fonde sur une collecte d’information régulière et suivie du client. L’existence de cette relation d’apprentissage permet à l’entreprise de répondre et de satisfaire d’une manière précise les besoins particuliers à chaque client. A mesure que la relation d’apprentissage s’intensifie, le client y trouve des avantages accrus et va se trouver en présence d’une barrière à la sortie qui va favoriser la fidélité de la clientèle.

Pour l’entreprise le but est double, l’établissement de la relation va permettre d’augmenter la satisfaction et éventuellement le recours au service grâce à un service plus performant et d’autre part, il va limiter les risques d’attrition en établissant une barrière à la sortie de plus en plus élevée pour le client qui envisagerait de changer de fournisseur de produit ou de service.

La pratique de la relation d’apprentissage se fait généralement sur internet par une personnalisation du compte client.

2/ Domaine d’application de la relation d’apprentissage

La relation d’apprentissage trouve application dans divers domaines, dans de nombreux secteurs d’activité. Mais l’élaboration de la relation d’apprentissage est facilitée dans les secteurs d’activité en ligne comme dans le commerce ou le marketing en ligne. Un investissement est donc demandé de la part de l’entreprise mais également de la part des clients puisque l’élaboration de cette relation promet une satisfaction au client. La relation d’apprentissage n’est donc pas limitée dans le cadre de l’internet mais son application est facile dans le commerce ou le marketing en ligne. Des investissements entrent donc en compte.

Des formulaires en ligne sont complétés par le client, des informations sont requises des clients.

BCollecte de données auprès des clients

Connaître le client n’est pas chose facile, cela doit être précédé d’une descente sur le terrain, il s’agit d’approcher les clients, connaître ses besoins, ses critiques, ses convenances. Pour mieux approcher ses clients, les opérateurs d’une entreprise lancent des enquêtes qui permettent d’obtenir les besoins de chaque client. Sachant qu’une fois les besoins du client sont respectés par une entreprise, le taux de churn est réduit dans l’avenir.

Les moyens pour collecter des informations sont plusieurs, elles peuvent être recueillies par une discussion face à face avec le client, par téléphone, par e-mail, par des questionnaires qui nécessitent une descente sur terrain. Chaque moyen de collecte peut présenter des avantages mais aussi des inconvénients mais ce qui importe est le fait de retirer des informations tangibles venant de client pour prévenir le pire, le pire est de voir partir ses clients au jour le jour à cause de l’insatisfaction qu’on n’a jamais pu détecter à l’avance par manque d’informations.

 

1/ Les moyens de collecte d’informations auprès des clients

Les moyens de collecte des données peuvent être confectionnés à distance ou en face à face. Les moyens de retirer des informations venant des clients sont plusieurs, par téléphone, par e-mail ou par le biais d’une boite à question. Ces techniques peuvent être bénéfiques chacune à sa manière mais peuvent aussi présenter des inconvénients pour la collecte.

Il peut exister deux catégories de client, ceux qui s’expriment mieux à distance,  c’est-à-dire, en l’absence d’une face à face et ceux qui préfèrent émettre ses réclamations directement auprès des responsables de l’entreprise. Chaque entreprise aussi a sa propre manière de collecter des données. Par exemple au téléphone, le service client peut demander à une personne ce qu’elle pense d’un nouveau produit ou du service de l’entreprise, le client pourrait répondre à toutes les questions comme il pourrait refuser ou ne répondre que certaines. L’inconvénient de cette technique se trouve dans le fait que le client peut perdre patience, il n’a pas beaucoup de temps par exemple, et sur ce, les informations ne seront acquises que partiellement. De même, l’entreprise peut envoyer une série de question à l’adresse mail de chaque client de manière à connaître chaque besoin et chaque point de vue, ce qui est important pour prédire le départ d’un client. Cette méthode est quant à elle bénéfique puisque le client peut prendre son temps pour répondre aux questions et les informations sont facilement acquises et en totalité, mais il arrive que le client ne répond jamais au mail, ce qui conduit à un manque d’information.

Le fait de collecter des données lors d’une discussion directe avec la clientèle semble bénéfique pour la collecte des données mais en réalité, certains clients seront probablement gênés de tout dire. Parler de ses besoins ou de ses convenances ne vont pas poser des problèmes mais faire des critiques ou émettre des réclamations vont plutôt être difficile tant pour le responsable de l’entreprise que le client auquel on pose les questions. La collecte des données à l’oral semble être difficile mais cette difficulté peut être diminuée si on soumet aux clients des questionnaires d’enquête écrits. L’objectif est de retirer des informations sur tout ce qui concerne le client, que ce soit par rapport à son âge, à sa situation familiale ou financière, à ses préférences personnelles pour un produit ou pour un service. Ces informations permettront de confectionner une base de données qui constituerait un fondement au churn prediction. Il s’agit donc de collecter des données au début de toute relation avec le client pour pouvoir prédire la fidélité de chaque client pour ensuite chercher une solution de vaccin contre ce départ probable.

Pour collecter des informations auprès des clients, l’enquête par des questionnaires est le meilleur moyen. En plus, c’est la technique la plus utilisée de tous les chercheurs, de toutes les entreprises qui veulent fidéliser sa clientèle. L’enquête par le biais des questionnaires nécessite également des méthodes car le but est de soutirer des variables déterminants.

 

2/ L’enquête par le biais des questionnaires : meilleur moyen de collecter des données

Le but dans la collecte de données est d’obtenir des réponses puisque ces dernières constituent la base de toute prediction. Les réponses ne peuvent être obtenues que par le fait de poser des questions. Les réponses données lors d’une enquête par questionnaires seront le fondement de toute décision, c’est donc un outil efficace pour une collecte de données rapide. Il n’y a pas de formules d’enquête par questionnaires préétablies mais il existe des règles de base que chaque entreprise devrait respecter.

Dans la mise en œuvre d’une enquête par questionnaires, les objectifs doivent être déterminés à l’avance, par exemple dans notre étude, le but est de retirer des données qui permettront de déterminer le taux de churn. En plus des objectifs, l’entreprise doit disposer d’une méthodologie et d’une planification précise. L’enquête par questionnaires nécessite inévitablement des investissements que ce soit en matière de temps qu’en matière d’argent.

L’enquête peut être prise de deux façons par les répondants, ils peuvent avoir une conception positive comme ils peuvent avoir une conception négative. Les clients peuvent penser que l’enquête est faite à l’encontre de leur satisfaction ou pour lancer une quelconque critique mais dans le sens opposé, ils apprécient puisqu’ils pensent que l’enquête est élaborée dans le but de les satisfaire.

 

 

2-1- La préparation fondamentale de l’enquête par l’entreprise

En premier lieu, les objectifs sont à définir, l’entreprise s’interroge sur le taux de churn, la meilleure manière de connaître ce taux nécessite une enquête qui va dans ce sens la, c’est-à-dire, les questions posées doivent donner comme réponse les éléments qui sont utiles pour déterminer le taux de churn. Si les réponses aux questions ne correspondent pas aux éléments demandés pour le taux de churn, mieux vaut arrêter l’enquête et adopter une autre forme d’interrogation.

En second lieu, l’objectif d’aboutir à des réponses déterminant le taux de churn doit être clair et connu de tous les acteurs de l’entreprise ; les clients sont aussi en droit de savoir l’objectif final de toutes les tonnes de questions qu’on leur pose. Le problème le plus fréquemment rencontré est que les intervenants n’ont pas la même vision de l’enquête puisque l’objectif n’est pas clair, chacun conçoit sa propre interprétation. L’objectif devient différent pour chacun donc il est difficile de l’atteindre. Avant de se jeter dans le projet, tous les intervenants de l’entreprise doivent se mettre entièrement d’accord pour la conception de l’objectif, celui d’obtenir des informations de la part des clients permettant ainsi de déterminer si tel ou tel client risque de quitter l’entreprise.

Une fois l’objectif ciblé, faire entrer d’autres objectifs serait un obstacle pour l’enquête puisqu’à chaque objectif, un questionnaire. Le but est donc de donner à chaque objectif une importance, poursuivre deux objectifs dans une seule enquête entraînerait des confusions que ce soit à l’égard de l’entreprise qu’à l’égard des clients interviewés. De plus, l’objectif doit tendre vers un résultat opérationnel. Dans le churn prediction, le but est d’aboutir à des données qui serviront de bases aux techniques de modélisation qui à leur tour détermineront le taux de churn au cours d’une période donnée. L’objectif est donc opérationnel puisqu’une fois les données acquises, le taux de churn peut être détecté à l’aide des techniques de modélisation. Des améliorations peuvent donc être entreprises par l’entreprise après la réception des données ou après détermination du taux. Ce qui conduit à affirmer que l’objectif de l’enquête est opérationnel.

 
 

2-2- Confection des questionnaires

En principe, les questionnaires sont faits dans le but d’obtenir des résultats fiables. Le choix de l’échantillon est donc crucial pour ceux qui élaborent les questionnaires. Le choix porte sur le nombre des clients à interroger, sur la catégorie des clients. Dans notre étude, toutes les catégories de clients sont souhaitées pour répondre aux questions car l’objectif touche tous les clients.

D’une manière générale, afin de faire une bonne sélection, l’entreprise doit savoir sur quelle catégorie de clientèle porte l’enquête, des clients actuels ou des clients à conquérir. L’entreprise doit également se poser la question sur la zone géographique cible par exemple. L’âge et le sexe des personnes objets de l’enquête sont aussi des éléments déterminants surtout pour le churn prediction. Les clients interrogés constituent ce que l’on appelle la population mère. Il est alors important de répartir au niveau de cette population mère les clients cibles, ceux qui sont déterminants pour les résultats, un quota est élaboré suite à cette répartition et ceux qui ne sont pas dans le quota sont écartés de l’étude. Cette élimination se fait soit au moment de l’interview qui peut être faite à l’initiative de l’enquêteur ou par le biais du système de gestion d’appels ; soit après l’enquête au moment du traitement des données.

Concernant le nombre de clients à interroger, cet élément est déterminant. Les résultats sont fiables en fonction du nombre d’individus interrogés. Plus l’échantillon est énorme, plus les résultats sont fiables. Certes, interroger 1000 clients au lieu de 500 engendre des gros investissements pour l’entreprise mais rien n’est perdu puisque les résultats sont deux fois plus fiables.

 

 

C/ Organisation et exploitation des données

Les informations concernant les clients sont donc requises après l’enquête perpétrée par les intervenants de l’entreprise. Ceci s’applique dans le cadre naturel d’une relation client-entreprise. Sont aussi parmi les données d’informations les réclamations des clients, surtout dans le cadre du churn prediction. Les données sont donc volumineuses, ce qui nécessite une bonne organisation et une exploitation réfléchie puisque les résultats attendus ne sont as acquis facilement, cela nécessite des techniques.

Pour maîtriser l’organisation et l’exploitation des données clients, il est important d’établir des fichiers clients et des bases de données. Les données sont classées de manière à faciliter les recherches pour ainsi obtenir les meilleurs résultats en matière de connaissance client.

Seront donc étudiés dans cette partie les différentes étapes pour cette meilleure gestion des fichiers clients et bases de données sans oublier de définir les notions.

1/ Définitions des notions :

Les notions qui entrent en compte en matière d’exploitation des données sont plusieurs : les fichiers clients, les bases de données, le data mining, les scoring et les segmentations. Toutes ces notions méritent d’être définies.

1-1- Le fichier client

Le fichier client peut être défini comme étant un assemblage classé d’informations concernant les clients d’une entreprise qu’ils soient des clients actuels ou des clients potentiels. En réalité, le fichier client est remplacé de nos jours par les bases de données puisque la gestion des fichiers se fait dans le cadre d’un système informatique, ceci dans le but d’obtenir une efficacité meilleure.

En tout cas, les fichiers et tous les différents traitements informatiques sont régis par une loi, celle n°78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés. La convention du 28 janvier 1981 fait partie de ces règlements qui doivent être respectés en Europe en matière de fichiers ou traitements informatiques. Les termes de cette convention se penchent vers le respect de la vie privée de l’Homme, dans notre cas, les données venant des clients ne doivent pas dénigrer leur identité humaine et leurs libertés. Le traitement doit tenir compte de l’intérêt général et de l’intérêt de la société tout en préservant l’intérêt du client interrogé ou qui lance des plaintes. De même, la mise à jour du fichier est importante sinon il perd toute sa valeur et toute son autonomie.

1-2- Les bases de données

Regroupement structuré de toutes les données recueillies lors des différentes enquêtes, calculées ou conçues sur tel ou tel client. La réalisation des informations recueillies doit suivre les règlements posés par la loi sur l’informatique et les libertés. Les bases de données sont connues sous le sigle de BDD, sa gestion obéit à des logiques en fonction des attentes des utilisateurs.

La notion de base de données sera étudiée plus profondément dans les parties suivantes.

1-3- Le data mining

Si on considère littéralement le concept de « data mining », il s’agit d’une extraction de données, d’une fouille de données. En principe, les données sont stockées à travers un système informatique qu’on appelle dataware, dans un entrepôt de données appelé warehouse. Une définition de Séan Kelly explique au mieux le datamining : « le datamining est un processus qui applique dans le but de découvrir des modèles au sein des données, et il est reconnu pour être particulièrement puissant pour identifier les clients qui partagent les mêmes caractéristiques ». La conception du data mining nécessite des systèmes informatiques puissants puisque l’étude des données implique des calculs, des synthèses et des interprétations.

Une analyse profonde du concept nécessite toute une partie pour mieux l’analyser.

1-4- Le scoring

Le scoring est une technique, il s’agit d’évaluer le prospect par le biais des scores. Ce qui est étudié dans le scoring est la détermination de la valeur des différentes catégories de clientèle, les renseignements concernant les clients sont trouvés dans des fichiers. Divers critères sont pris en compte en matière de scoring : les mails, les relances, les commandes passées par des clients, les modalités de paiement, les moyens des clients pour le paiement.

1-5- La segmentation

La segmentation portant sur le client consiste à la division des clients en groupes homogènes répartis selon divers critères à savoir leurs besoins, leurs préférences, leurs actions face à des actions marketing. A partir de la segmentation de la clientèle, l’entreprise peut sélectionner des segments-cibles et adapter la stratégie marketing adoptée à chaque cible. La firme doit donc tout d’abord déterminer qui sont ses clients, rechercher les informations à propos de ces derniers c’est-à-dire leurs attentes vis-à-vis de l’entreprise et leurs comportements pour pouvoir ensuite les classer et décider comment agir par rapport à chaque classe. La segmentation est ainsi indispensable dans l’établissement d’une stratégie marketing d’où l’importance de la segmentation des clients pour l’entreprise.

 

Au point de vue technique, pour élaborer une segmentation, il faut d’abord construire un échantillon représentatif de la population. Une seconde étape consiste dans la sélection et la mise en forme des variables les plus pertinentes, les variables seront alors analysées une par une en vue d’en déterminer la corrélation. Un tableau sera établis une fois l’analyse effectuée. A partir de ce tableau seront mis en évidence les facteurs principaux de différenciation des clients. Dans une troisième étape, une typologie permettra de regrouper les individus les plus proches. Puis dans la dernière étape, il sera procéder à la description des groupes au moyen des variables les plus significatifs. Une fois les démarches de l’analyse effectuées, l’entreprise obtient des portraits robots de chacun des groupes qui mettent en évidence leurs points saillants. La segmentation a pour avantage de permettre la compréhension de la structure de la clientèle, l’établissement d’un cadre pour fixer les objectifs et les stratégies marketing ainsi que l’évaluation de l’efficacité des investissements marketing. La stratégie de l’entreprise va alors varier en fonction des groupes de clients.

La segmentation sera ensuite complétée par le positionnement. Ce dernier consiste à donner à un produit une position spécifique dans l’esprit des clients de façon à ce qu’il se distingue clairement des produits concurrents. En raison de la présence actuelle d’une concurrence rude sur le marché, l’entreprise doit en effet différencier son produit par rapport à un autre sinon elle risque de voir sa marque ignorée d’où, la firme devra investir plus dans les publicités qui sont non seulement lourdes mais également moins efficaces. L’être humain fait son choix en fonction de critères dont les uns sont plus déterminants que d’autres, l’analyse de ce qui détermine le choix de l’homme lors des sélections relève plutôt de la psychologie.

2/ L’exploitation proprement dite

Afin de parvenir à l’objectif attendu, l’exploitation et l’organisation des informations reçues lors de la collecte doivent aboutir à l’organisation des bases de données. L’organisation des bases de données peut se faire par plusieurs moyens comme la classification par e-mail.

2-1- La classification des données par e-mail

La méthode de collecte d’adresses e-mails s’appelle la coregistration, elle permet de profiter de l’inscription d’un internaute à un site pour lui proposer un second abonnement à une newsletter tierce. Mais ce qui est important dans notre étude est le fait de classer les e-mails des clients. Il existe donc une procédure à suivre pour mener à bien l’organisation de ses bases de données qui sont les e-mails.

Les moyens qui sont destinés à communiquer avec la clientèle peuvent être plusieurs et au choix pour l’entreprise, l’e-mailing constitue l’un de ses moyens, un moyen qui évolue avec les nouvelles technologies de la mondialisation. De plus, l’e-mailing n’engendre que peu de frais. Pour assurer son efficacité, les messages doivent être envoyés à la bonne personne, à la clientèle visée. Donc, pour pouvoir constituer un fichier client, il va falloir collecter les adresses des clients pour pouvoir faire une personnalisation et pour ne pas se tromper d’adresse. Ce qui est important est d’avoir un objectif à long terme,  le mode de collecte d’adresses importe peu tant que l’objectif est assuré. Les bases de données sont dès lors enrichies et les renseignements recueillis aident énormément dans la réponse aux besoins de la clientèle. La collecte des adresses e-mails des clients doit être faite avec une certaine stratégie déterminée à l’avance par l’entreprise elle-même.

Il existe ainsi des techniques qui permettent d’enrichir les bases de données électroniques comme la mise en place sur le site web de la société des jeux en ligne ou des livres pouvant être téléchargées sur le web par exemple, la base de données pourrait s’enrichir efficacement.

La base de données unique est encore un modèle peu privilégié dans le monde marketing actuel, ce qui serait idéal est que chaque entreprise disposerait d’une base de données clients qui serait capable de voir en ensemble précis les renseignements sur tel ou tel client. La réalité est pourtant loin de cet idéal puisque les divers canaux qui ont été déjà énumérés ci-dessus comme le web, les centres d’appel, les points de vente,…

La plupart des entreprises n’utilise pas encore la BDD (base de données) clients centralisée, le problème qui constitue un frein se trouve dans le fait que les investissements lors de la mise en place engendrent des coûts élevés, de plus, l’entreprise doit procéder à un changement organisationnel.

2-2- La classification automatique des courriels électroniques

La classification de tous les courriels venant des clients, que ce soit des précisions, des commandes, des réclamations, doit se faire automatiquement lorsqu’il s’agit de courriels électroniques. Dans le fait ou l’entreprise propose des adresses électroniques à sa clientèle pour que cette dernière puisse communiquer avec elle, les courriels doivent être gérés quant à eux d’une manière efficace, sinon, l’entreprise se trouverait dans des situations irrémédiables. Le fait est que le client ne supporterait jamais s’il ne reçoit pas de réponse à sa demande pendant un délai raisonnablement acceptable. C’est pour éviter ce désagrément des clients que les logiciels de gestion de courriels électroniques ont été mis en place. Le but de ces logiciels sont parfois les mêmes et possèdent les mêmes caractéristiques qui sont la réception des courriels, le routage automatique par mots clés, l’utilisation des patrons de réponse qui sont destinés aux questions  les plus fréquemment posées, l’accès à des bases de données, le correcteur orthographique, l’intégration du service à la clientèle, l’historique et l’archivage des messages.

Malgré l’existence de plusieurs options, la réponse automatique à des courriels électroniques n’est pas suffisamment assurée surtout pour les entreprises qui reçoivent un grand volume de courriels. Pour se faire, certains logiciels disposent des modules de réponse au texte libre. Les méthodes sont d’ailleurs variées, ce sont des algorithmes nécessitant une bonne base de connaissance puisque la construction se fera manuellement, on peut citer quelques méthodes comme les réseaux neurones qui seront analysés au sein même de notre étude, le classifieur bayesien, la prise de décision de règles, etc.

Les courriels sont reçus de trois manières à travers trois catégories : les courriels simples contiennent des messages simples, il n’y a donc pas de problèmes en matière de réponses, dans les courriels complexes, les messages sont complexes que le système va proposer quelques réponses en suggestion. Il existe aussi des courriels inconnus dont les messages ne sont pas reconnus par le système, donc il ne peut pas apporter de réponse.

 

 

 

 

 

 

 

 

D/ Le knowledge discovery

En matière d’informatique de gestion, auparavant, les applications ayant été crées n’étaient dédiée qu’au traitement des données liées à l’activité de l’entreprise, on parlait d’informatique de production ou d’informatique opérationnelle. Les systèmes de production de l’époque étaient caractérisé par une activité constante, les données étaient modifiés et interrogés constamment par les utilisateurs qui par exemple recherchaient des coordonnées de clients ou passaient une commande, il fallait conserver la cohérence des données. Notre ère quant à elle est marquée par la prépondérance de l’informatique décisionnelle. En effet, les acteurs de la vie de l’entreprise qui sont emmenés à prendre des décisions doivent pouvoir accéder en tout temps aux données de l’entreprise, doivent pouvoir les traiter pour en extraire des informations pertinentes afin de prendre les meilleures décisions. Il n’y a pas modification constante ou enregistrement de nouvelles données comme pour les systèmes de production, les utilisateurs vont interroger le système d’information et poser des questions qui nécessiteront beaucoup plus de temps. Le système opérationnel n’est cependant pas suffisant pour satisfaire aux besoins de ces organes décisionnels, les bases de données sont souvent trop volumineux et trop complexes pour qu’elles puissent être appréhendées facilement par les utilisateurs potentiels. Pour que l’utilisateur puisse effectuer les requêtes qu’il souhaite, deux contraintes s’imposent lors de l’établissement du système d’exploitation des données, il ya l’impératif de la simplicité du modèle des données d’un coté et de l’autre il ya la performance malgré l’importance en volume des données.    Développer des systèmes d’informations orientés vers la décision s’est donc avéré nécessaire d’où l’avènement du knowledge discovery. Ce dernier est un ensemble de techniques qui permet de déterminer des généralités à partir de grands ensembles de données. Différentes méthodes, formalismes, et outils peuvent être mis en œuvre pour modéliser, stocker et utiliser les informations au sein des bases de données. A partir de ces techniques, on peut dégager et décrire les régularités qui ressortent de ces données.

Les techniques du knowledge discovery peuvent être regroupées en deux catégories différentes, il y a celles qui servent à vérifier des hypothèses, un algorithme permettra alors de vérifier si les données à disposition sont compatibles avec les prévisions effectuées. Les techniques de l’autre catégorie quant à elles à permettront   de faire des hypothèses à partir d’un algorithme que l’on construit. Les résultats de l’application de ces techniques  seront ensuite transformés puis interprétés en fonction du but recherché. A partir du knowledge discovery, il est possible de déterminer qui seront les clients susceptibles  d’être intéressés par un produit particulier et ce qui est à l’origine du churn.

 

 

 

 

 

 

 

Le processus d’Extraction de Connaissances à partir de Bases de Données (ECBD)

Source : Frawley W. J. et al., « Knowledge Discovery in Databases », AAAI/MIT, 1991, pp 1-27   

 

Le processus d’Extraction de Connaissances à partir de Bases de Données comprend principalement trois phases.

 

1-La construction d’un datawarehouse

Généralement, il sera procédé dans un premier temps à la sélection de données en vue de la fouille. Les données seront donc rassemblées à un même endroit pour permettre la fouille, les données seront puisées dans les bases de production. La deuxième étape du processus consiste à l’intégration au sein de l’entrepôt de données ou datawarehouse. Bill Inmon a définit l’entrepôt de données comme étant une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision. Cet entrepôt de données constitue la structure destinée à accueillir le flot important de données. Son architecture est différente de celle au stade de l’informatique de production et permet d’extraire des informations, sa structure est organisée pour la recherche de connaissance d’où la recherche d’informations pertinentes est facilitée. Un ensemble d’applications sera utilisé dans la conception du datawarehouse pour réaliser l’aide à la décision. Du point de vue technique, la construction d’un datawarehouse passe par trois étapes interdépendantes, dans un premier temps, il sera procédé à une étude préalable, les études à effectuer sur la clientèle vont permettre d’établir les profils de chaque client. Cette étude préalable permettra également de définir les objectifs ainsi que la démarche à suivre. Dans la seconde étape, une étude du modèle des données représentant l’entrepôt sera effectué. Le modèle doit être simplifié au maximum pour permettre l’utilisation de l’entrepôt par le plus grand nombre. Le service informatique a le choix entre un modèle multidimensionnel sous forme de cube  ou un modèle en étoile. La troisième et dernière étape consiste à l’étude de l’alimentation. Cette phase permettra l’adaptation et le transfert des données du système opérationnel vers l’entrepôt.  Une fois l’entrepôt établi, le service informatique va procéder à l’établissement des tableaux de bord. Pour que l’utilisateur puisse extraire des données de l’entrepôt, il doit utiliser des outils tels que les reporting tools, les OLAP(Online analytical Processing)  tools ou les EIS(Executing information Systems) tools.  Les outils de visualisation qui présenteront les résultats sont également nécessaires, et cette représentation se fera généralement au moyen de graphiques en 2D, ou en 3D.

2-La phase de formatage

Après la construction du datawarehouse, les données qui en seront extraites passeront par une phase de nettoyage afin qu’elles soient les plus adaptées possibles par rapports aux objectifs prédéfinis. Si nécessaire, ces données peuvent être enrichies au moyen de recours à d’autres bases de données. Les données feront l’objet d’un formatage c’est-à-dire qu’elles seront organisées entre elles pour permettre la fouille, différentes manipulations seront entreprises dans cette phase notamment le choix et l’ajustement des codages, le regroupement des valeurs, l’utilisation des attributs et l’uniformisation des échelles. Une fois le formatage effectué, il sera procédé à la fouille proprement dite ou data mining dont il sera question dans les parties qui vont suivre. Après le data mining, les résultats des phases précédentes seront interprétés, il s’agit de la phase d’interprétation qui constitue la dernière étape dans du knowledge discovery.

 

3-le data mining

1-Le concept de data mining

Après avoir traversées les différentes étapes précédentes, les données seront structurées. Le data mining peut être définit comme étant un processus d’analyse fine et intelligente des données détaillées, interactif et itératif, permettant aux managers d’activité utilisant ce processus de prendre des décisions et de mettre en place des actions sur-mesure dans l’intérêt de l’activité dont ils ont la charge et de l’entreprise pour laquelle ils travaillent. Il utilise des outils automatisés exploitant des algorithmes et mettant en œuvre les meilleurs des techniques de tests statistiques pour la modélisation.  Grâce au développement de l’informatique en matière d’analyse de données et aux progrès ayant été effectués concernant les moyens de calcul, il est désormais possible de traiter et d’analyser des ensembles de données très volumineux. Actuellement, les entreprises possèdent un très grand nombre de clients, de nos jours, les bases de données des entreprises se rapportant à leurs clients peuvent atteindre une capacité de plusieurs térabits, et pour pouvoir gérer les informations les concernant, le recours au data mining est nécessaire car l’exploitation manuelle de ces données est impossible. Si on prend par exemple le cas des entreprises de ventes par correspondance, ils conservent des traces des achats ayant été effectués par les clients, ils collectent des informations sur les clients grâce à des cartes de fidélités et ils achètent même des bases de données géographiques et démographiques, cela donne une idée sur l’importance en quantité des données que l’entreprise est amenée à gérer.  Toutefois, avant de pouvoir passer au data mining, il faut suivre quelques étapes dans le cadre du knowledge discovery. A titre de rappel, Cette dernière se déroule en effet en plusieurs étapes, les données qui sont pertinentes pour le but recherché doivent d’abord être extraites à partir d’un datawarehouse. Ce dernier est un ensemble de bases relationnelles extraites des données brutes de l’entreprise dans notre cas relatives à la gestion de la clientèle. Il permet de poser de nouvelles questions et d’apporter de nouvelles réponses aux attentes des clients. Cependant, la faiblesse du datawarehouse réside dans sa taille qui peut atteindre plusieurs Téra octets, d’où, il est ingérable par les utilisateurs et ne peut pas servir de base pour construire des modèles de comportement du client ou identifier les clients les plus intéressants    Ces données seront ensuite réorganisées pour pouvoir être analysées, c’est la phase de nettoyage. Une fois ces deux étapes effectuées, il pourra alors être procédé au data mining au moyen des technologies informatiques appropriées. Après que le data mining ait été réalisé, les résultats seront interprétés en fonction du but recherché. Le logiciel du data mining permet à son utilisateur qui peut ne pas être un expert en statistique de mieux connaitre ses données. D’autres avantages du data mining sont la productivité et la réactivité en matière d’analyse. En effet, les utilisateurs n’ont pas besoins de passer par un tiers lors de la conception de leurs modèles.

2-Utilité pratique du data mining

Le data mining permet d’extraire de l’information des données. En ce qui concerne les clients, il permet de comprendre leurs comportements. La connaissance du client permettra ensuite de mettre en œuvre les campagnes marketing, de les améliorer et de les rendre plus efficaces. Pour connaître le client, l’utilisation de quatre concepts est nécessaires à savoir la segmentation, la technique du scoring, le data mining, et la valeur client. La segmentation quand à elle sert au découpage de la clientèle et à la mise en évidence les clients les plus importants ainsi que les plus rentables pour l’entreprise compte tenu des facteurs de différenciation pour le client. Le scoring quant à lui permet d’anticiper les comportements des clients et de mettre en place des indicateurs quantitatifs pour la compréhension de ces comportements. Ensuite, au moyen des techniques du data mining tels que les réseaux neurones ou les arbres de décisions, il lui est désormais possible à l’utilisateur de mettre en œuvre des modèles et de les manipuler. En ce qui concerne la valeur client, elle permet de construire une mesure de profitabilité du client c’est-à-dire d’évaluer sa contribution au profit de l’entreprise. Elle permet à la fois d’anticiper les revenus futurs et d’évaluer les avantages concurrentiels présents de la firme.

3-Les techniques du data mining

Le data mining met donc en œuvre un ensemble de techniques issues des statistiques, de l’analyse de données et de l’informatique pour explorer les données.

Ces techniques sont nombreuses or notre étude sera cantonnée à celles qui sont les plus appropriées pour la gestion de la relation client. Seulement, ce qu’il faut savoir c’est que ce sont la lisibilité du modèle et la puissance de prédiction qui différencient ces techniques

 

 

 

 

 

Carte de positionnement des techniques de data mining

 

Celles qui sont d’interprétation facile sont par exemple les arbres de décision à la différence des grilles de score. Cependant ces derniers sont plus fins. Les réseaux neurones quand à eux sont très efficaces en matière de prédiction mais moins lisibles en raison de la complexité des modèles mathématiques utilisés. Il va de soi que les plus lisibles s’adressent aux utilisateurs les moins expérimentés tendis que les plus difficiles à interpréter sont surtout pour les professionnels en matière de modélisation.

 

3-1-les régressions :

3-1-1-La régressions linéaire

La régression linéaire est une technique statistique qui permet de modéliser la relation linéaire entre une variable explicative notée X et une variable à expliquer notée Y. Pour plusieurs variables, il faut vérifier si ces variables sont fortement corrélées, en outre, il faut aussi voir les résidus de la régression de Y sur Xi.,  La première étape dans la régression linéaire consistera donc dans le tracé des observations (x, y) à partir des données obtenues de l’entrepôt. La construction d’un graphique notamment sous forme de nuages de points   permettra de savoir si le modèle linéaire est pertinent ou non. Si les points paraissent alignées et que la relation entre X et Y semble pouvoir être modélisée par une droite, alors la régression linéaire peut être utilisée.

 

 

Exemples fictifs de tracés de nuages de points

 

a)Fonction sinusoïdale            b) Fonction sigmoïdale               c)Fonction linéaire

 

Source: Pierre André Cornillon, Régression: théorie et application

 

On cherchera alors la droite dont l’équation est yi = axi + b et qui passe au plus près des points du graphe. Par contre, si le tracé présente une forme sinusoïdale ou sigmoïdale alors la régression linéaire est inadéquate. Le modèle de régression linéaire est définit par une équation de la forme yi = β1 + β2xi + εi avec ∀i ∈ {1, . . . , n}. Les βj sont les paramètres du modèle comprenant la constante de régression et le coefficient de régression, ils sont fixes et inconnus et ils feront l’objet d’une estimation. Les quantités εi  quant à elles sont nécessaires dans la mesure où les points ne sont jamais parfaitement alignés sur une droite, on les appelle les erreurs. Ils sont également inconnus mais à la différence des constantes de régression et des coefficients de régression, ils sont aléatoires. La droite de régression linéaire constitue un modèle de prédiction, elle permet de proposer des prévisions pour la variable à expliquer Y. Dans la régression linéaire, on cherche toujours à se ramener au tracé d’une droite à partir des nuages de points. L’ajustement linéaire peut ensuite être obtenu au moyen de la méthode des moindres carrés qui rendra minimale la somme des carrés des écarts des points à la droite. Et enfin pour pouvoir dire que la relation entre X et Y est linéaire ou affine, il faut que le coefficient de corrélation linéaire qui représente l’alignement parfait entre la droite d’équation yi = axi + b et celle ajustée par la méthode des moindres carrés soit très proche de 1.

La méthode des moindres carrés permettra l’élaboration d’un modèle mathématique qui décrira la relation entre les deux variables X et Y. Et pour pouvoir cerner la portée de la technique de la régression linéaire, un exemple sera pris à titre d’illustration. Si l’on prend le cas d’une équation qui s’écrit :

Cette équation décrit le problème mathématique, l(.) est appelée fonction de coût ou fonction de perte et G est un ensemble de fonctions données. n quant à elle représente le nombre de données à analyser. Il existe de nombreuses fonctions de coût mais celles qui sont les plus utilisées sont le coût quadratique représenté par la fonction l(u)=u2 et le coût absolu représenté par la fonction l(u)= |u|.

 

3-1-2-La régession logistique

La régression logistique est une technique de modélisation qui vise à prédire et expliquer des valeurs d’une variable catégorielle binaire Y qui peut être une variable à prédire, variable expliquée, variable dépendante, variable endogène ou un attribut classe, à partir d’une collection de variables X continues ou binaires qui seront selon Y des variables prédictives, variables explicatives, variables indépendantes, variables exogènes ou descripteurs. Il s’agit d’une technique qui permet d’ajuster une surface de régression à des données lorsque la variable dépendante est dichotomique. Dans ce type de régression, on évalue l’influence de différents facteurs sur une variable aléatoire qualitative en modélisant les probabilités des différente modalités  que cette variable peut prendre. Il faut noter qu’il existe différents types de régression logistique à savoir la régression logistique directe, la régression logistique séquentielle et la régression logistique automatisée possédant chacun leur propre procédé statistique et conduisant à l’élaboration de différents modèles théoriques. Concernant le nombre de modalités, s’il est égal à 2, on parle de variable dichotomique et s’il est supérieur à 2, on a une variable polytomique. Par rapport à la régression linéaire, pour la régression logistique, la variable expliquée est qualitative.

Au niveau technique, la mise en œuvre de la régression logistique passe par plusieurs étapes. Dans un premier temps, il est nécessaire de passer par l’apprentissage supervisé dont l’objectif est de prédire ou expliquer une variable catégorielle Y à partir d’une collection de descripteurs X. Cette première phase permettra de mettre en évidence l’existence d’un underlying concept de la forme Y = f(X, α). f(.) est la fonction qui constitue le modèle de prédiction. α quant à lui joue le rôle de vecteur des paramètres de la fonction, leurs valeurs doivent faire l’objet d’une estimation à partir des données disponibles. Cette technique permet par exemple de déterminer la viabilité d’un client qui sollicite du crédit à partir de ses caractéristiques ou de cibler les clients potentiels qui peuvent être intéressés par un produit quelconque. Une fois la phase d’apprentissage réalisée, il est nécessaire d’examiner les corrélations entre les prédicteurs avant de procéder à l’élaboration du modèle, la plupart des prédicteurs fortement corrélés entre eux doivent être éliminées pour empêcher la présence de variables redondantes. Dans la phase de modélisation, une forme de fonction sera choisie et la qualité ainsi que les paramètres du modèle obtenu seront estimés à partir d’un échantillon. Il s’agit ici de mesurer la qualité de la prédiction c’est-à-dire l’aptitude du modèle à prédire correctement. Après que les étapes qui viennent de précédées aient été remplies, on obtient un modèle de prédiction de la forme Y = f(X, α), la performance du modèle devra être évaluée et cette évaluation se fera au moyen d’une confrontation entre les vraies valeurs de la variable dépendante et celles prédites par le modèle. La fonction qui exprime la répartition de la loi logistique est :

On obtient de cette fonction le modèle de régression logistique. a et b sont des coefficients à estimer et une fois qu’ils sont déterminés, la fonction  précitées permettra de calculer la prévision de la probabilité y selon les valeurs de x , en passant par le Logit a + bx. Il faut préciser que le modèle obtenu peut être soit explicatif, soit prédictif soit descriptif. Lorsque le modèle est explicatif, il permettra de confirmer ou d’infirmer des hypothèses. Ainsi, il sera possible de distinguer les interactions entre les prédicteurs et la variable à prédire. A partir d’un modèle prédictif, il sera possible de mesurer la probabilité qu’un évènement se produise. Les variables les plus pertinents et les plus discriminants seront sélectionnés et ces variables serviront à l’élaboration de l’instrument de prédiction. En ce qui concerne le modèle descriptif, il permet de mesurer l’importance d’un phénomène et d’en tracer le profil à partir de plusieurs variables. Les données seront d’abord explorées afin d’en dégager les associations possibles, puis à partir de ces dernières, des hypothèses seront formulées. Etant donné qu’il s’agit d’une étude exploratoire plutôt que confirmatoire, le modèle descriptif tend donc à suggérer des hypothèses mais ne vise pas à les confirmer.

La limite de la régression logistique par rapport aux autres techniques réside dans le fait qu’elle nécessite des échantillons de grande taille pour être stable. Il lui faut au moins cinquante participants par variable et de plus, les prédicteurs doivent être spécifiques d’un groupe à l’autre parce qu’on est en présence d’une variable dichotomique.

 

2-Les réseaux neurones

 

Les réseaux neurones sont des ensembles d’outils qui permettent  la classification, l’estimation, la prédiction et la segmentation. Ils proviennent de l’imitation de modèles biologiques dont les neurones qui sont les unités élémentaires sont organisés selon une architecture. En effet, les neurones dont il est question ici sont des unités de calcul élémentaire dont le modèle est issu de principe de fonctionnement des neurones biologiques. Ses avantages comparés aux autres techniques est qu’il traite aisément les données préalablement normalisées et les algorithmes sont robustes au bruit c’est-à-dire aux erreurs. Il s’agit d’un outil bien adapté pour le traitement de données complexes. La segmentation et la prédiction sont déjà traitées dans d’autres parties de cette étude d’où on ne parlera que des réseaux neurones qui permettent l’estimation et la classification. Dans l’estimation, on estime la valeur d’un champ à valeurs continues à partir des caractéristiques d’un objet. La classification quant à elle consiste à examiner les caractéristiques d’un objet et lui attribuer une classe. A la différence de l’estimation, la classe est un champ particulier à valeurs discrètes.

 

 

 

Exemples de modèles neuronaux

 

 

 

Perceptron à une couche cachée

 

 

 

Réseau auto-associatif réalisant une compression de signal

 

 

Source : Ludovic Lebart, Marie Piron, Alain Morineau, Statistique exploratoire multidimensionnelle

 

 

 

Dans un premier temps, la technique nécessite l’utilisation d’algorithmes d’apprentissages adaptés à l’architecture. L’algorithme permettra de minimiser l’erreur apparente mesurée sur l’ensemble d’apprentissage. Dans la construction de l’algorithme, d’abord on initialise aléatoirement les poids de tous les réseaux neurones, et pour se faire, différents paramètres sont à régler à savoir le taux d’apprentissage, le paramètre d’inertie, ou le nombre d’exemples, ce sont les paramètres d’apprentissage. Ensuite, il faut procéder au codage du problème. Plusieurs codages sont possibles. Une normalisation des entrées au moyen du générateur de réseau neurone peut être nécessaire pour le bon fonctionnement de l’algorithme. Passer par la phase de codage n’est cependant pas nécessaire pour les entrées binaires, elle n’est indispensable que pour les données énumératives. Une fois le codage effectué, on choisi une architecture adaptée. Il faut savoir qu’il existe différents types d’architectures et plus la structure du réseau est riche, plus le pouvoir d’expression du modèle est grand. Les architectures varient donc en termes de puissance en fonction de la richesse. La qualité du réseau neurone dépend en grande partie du choix de l’architecture et si besoin est, les paramètres d’apprentissages peuvent être réglés pour obtenir un bon réseau neurone.

Si on observe les neurones biologiques, lorsque l’activité en entrée dépasse un certain seuil, sa sortie est activée. Il en est de même pour le neurone formel, il est appliqué à l’activité d’entrée une fonction de transfert de telle sorte que lorsque l’activité est suffisante, la valeur de sortie sera égale à 1 et lorsqu’elle ne l’est pas, la valeur de sortie sera égale à 0 voire même à -1. Une possibilité serait d’utiliser la fonction de Heaviside définie par H(x) =1 si x>0 et H(x)=0 ou bien la fonction sigmoïde définie par :

Cette fonction passe par 0 et 1 lorsque l’entrée est suffisante.

A la suite de l’apprentissage, on obtient un réseau constitué de cellules organisées selon une architecture avec une fonction d’activation. Seulement, un problème se situe au niveau de  la lisibilité du résultat et ce en raison de l’importance du nombre de poids à valeurs réelles, l’interprétation de ces poids est difficile. Comparé aux autres techniques de fouille de données, le réseau neurone nécessite beaucoup plus de temps dans la mesure il faut passer un grand nombre de fois tous les exemples de l’échantillon d’apprentissage avant de converger, l’échantillon pris pour l’apprentissage doit être suffisamment grand et représentatif des sorties attendues.

 

 

3-Les arbres de décision

 

Il s’agit d’une représentation graphique d’une procédure de classification. A titre de rappel, la classification consiste à examiner les caractéristiques d’un objet et lui attribuer une classe, la classe consiste en un champ particulier à valeurs discrètes. A l’intérieur de l’arbre de décision, les nœuds internes sont des tests sur les champs ou attributs et les feuilles constituent les classes. Des tests sont alors effectués et lorsqu’ils sont binaires, généralement, les réponses positives peuvent être placées au niveau du fils gauche tendis que les réponses négatives seront placées au niveau du fils droit. Une fois l’arbre établis, pour classer un enregistrement, selon les réponses aux tests, il suffit de descendre dans l’arbre. L’une des spécificités de ce dernier est qu’il constitue un système de règle et pour tout enregistrement, une seule règle s’applique.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Schéma d’un arbre de décision binaire

 

 

 

Source : Ludovic Lebart, Marie Piron, Alain Morineau, Statistique exploratoire multidimensionnelle

 

 

Du coté pratique, en ce qui concerne d’abord le fonctionnement de la technique, l’échantillon sera placé à l’entrée et un algorithme doit fournir en sortie un arbre de décision. Les algorithmes peuvent procéder de deux façons, soit de manière descendante c’est-à-dire du test qui constitue la racine de l’arbre vers l’étiquette des fils, ou de manière ascendante c’est-à-dire dans le sens inverse. Dans l’apprentissage de l’arbre de décision, dans un premier temps, il est nécessaire de déterminer si le nœud courant est terminal, à cette fon, on établi pour chaque nœud l’ensemble des divisions admissibles et on définit un caractère permettant de sélectionner la meilleure division d’un nœud, ensuite, on définit une règle permettant de déclarer un nœud comme terminal ou intermédiaire. Un nœud courant est terminal lorsque le long du chemin menant de la racine au nœud, tous les tests disponibles ont été utilisés, tous les exemples d’échantillon courant sont dans une même classe et la proportion d’exemples d’une classe est supérieure à un seuil prédéfini. Une fois cette première étape remplie, le nœud courant sera étiqueté par la classe majoritaire. L’idée de base de l’arbre des décisions est d’effectuer la division d’un nœud de telle sorte que les deux segments descendants soient plus homogènes que le nœud parent et qu’ils soient les plus différents possible ente eux vis-à-vis de la variable. On affecte alors chaque nœud terminal à l’un des groupes ou bien on affecte  une valeur à un variable pour chaque nœud terminal. Il sera ensuite procédé à la sélection d’un test, cette sélection se fera en fonction du caractère terminal ou intermédiaire du nœud. Le choix du test sera opéré au moyen des fonctions qui vont mesurer le degré de mélange des différentes classes. On peut par exemple utiliser la fonction Gini définie par Gini(x) = 4x(1-x) ou la fonction entropie définie par Entropie(x) = –x log x – (1-x) log (1-x). Dans ces deux équations, x désigne la proportion d’éléments dans l’une des deux classes. Après que le choix du test ait été effectué, l’arbre peut être débarrassé de la plupart de ses ramifications, on élague certaines de  ses branches c’est-à-dire que l’on détruit la plupart des sous-arbres, le but est d’obtenir un arbre plus petit donc un arbre ayant un meilleur pouvoir de généralisation car si l’arbre est trop grand, certes il classera bien les échantillons, cependant, la généralisation ne sera pas possible. Pour décider de quel sous arbre se débarrasser, il faut comparer l’erreur réelle de l’arbre courant qui sera mesurée sur un ensemble de test avec l’arbre élagué. On sélectionne donc le meilleur sous-arbre c’est-à-dire l’arbre qui contient le moins de segments terminaux et dont l’erreur apparente de prévision ou de classement est la plus petite possible tout en fournissant une estimation correcte de l’erreur théorique. Pour pouvoir procéder à la sélection, il est nécessaire de diviser l’échantillon de base en deux parties, l’échantillon d’apprentissage et l’échantillon test. L’échantillon d’apprentissage est constitué par une partie de l’échantillon de base, on construit l’arbre complet de l’échantillon de base et à partir de l’échantillon-test, on sélectionne, parmi les sous-arbres le meilleur d’entre eux qui présente la plus petite erreur théorique.     L’avantage que procure l’arbre des décisions est qu’il est facile à interpréter et même si sa taille est très grande, certains outils permettent de naviguer de manière aisée dans l’arbre. Comme les réseaux neurones, il est robuste aux bruits et peut prendre en charge tous types de données. Comme on l’a vu précédemment, l’arbre des décisions a surtout été conçu pour la classification, cependant, si le besoin se présente, il peut être adapté pour résoudre des problèmes d’estimation et de prédiction.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

PARTIEII/La prediction de l’attrition

 

 

A/La mise en place du modèle prédictif

 

 

3-1-Délimitation du concept de prédiction

 

En raison de la mutation continue et rapide du marché, de l’extension de la compétition, de la croissance des fichiers de prospects, des demandes de personnalisation des offres en réaction à la massification des marchés, les entreprises ont évolué des processus organisés autour des produits vers des processus organisés autour du client. Les entreprises ont pris conscience « qu’elles doivent fournir des efforts non seulement en essayant de convaincre les clients de signer des contrats mais également de retenir les clients déjà existants »[1]. Elles ont  alors été amenées à gérer les relations client pour permettre cette évolution. Pour piloter et animer ces relations, « les entreprises sont obligées de fournir des efforts au niveau de la prédiction et de la prévention de l’attrition »[2]. Van Den Poel et Larivière[3] ont également avancé que fournir des efforts en gardant les clients est devenu essentiel pour les entreprises orientées services et ils ont démontré que la rétention de client est source de valeur économique pour l’entreprise.

On parle actuellement de marketing opérationnel et l’évolution sur le sujet a déjà été traitée dans les parties précédentes. Il est indéniable qu’une entreprise qui use de la technique de prédiction a nécessairement un avantage en termes de performance par rapport à d’autres entreprises qui n’utilisent pas cette technique dans la mesure où actuellement, la concurrence est rude sur les marchés et pour que l’entreprise puisse survivre, le recours aux techniques marketing est un must et c’est précisément dans ce domaine qu’entre en jeux l’analyse prédictive..

Dans l’approche orientée client, les questions qui se posent à l’entreprise sont :- quand doit-elle revenir vers un client ?, que doit-elle lui proposer si l’entreprise le contact ?, si c’est le client qui contacte l’entreprise, quel message lui délivrer et comment s’assurer de la qualité du message ? Trois paramètres doivent être pris en compte lorsqu’on parle de l’orientation client à savoir la qualité de l’offre proposée au client, le moment de faire une offre et la qualité du client.

L’analyse prédictive est un procédé qui permet d’étudier les données et les caractéristiques comportementales des personnes ou des entreprises pour en tirer des modèles prédictifs en vue d’optimiser la relation avec les clients.  Elle met en œuvre des technologies et reprend les pratiques statistiques telles que l’analyse de données ou le data mining dont il a déjà été question précédemment.

De façon globale à partir des informations disponibles sur le client et une fois qu’elles ont été établies sous formes d’historique, à partir de l’analyse prédictive et avec la contribution d’une analyse statistique des relations clients entre les données disponibles, il sera possible de déterminer le comportement futur d’un client.

Il faut noter que le terme prédictif fait référence à la connaissance des valeurs de certaines variables qui vont permettre de prédire ce que serait la valeur d’autres  variables si ces variables étaient effectivement mesurées. Ce terme ne se rapporte pas à une prévision dans le temps.

 

3-2-La construction du modèle prédictif

 

La modélisation prédictive constitue l’une des deux branches principales de la modélisation de données à coté de la modélisation descriptive. Elle a pour objet de déterminer les liens forts entre les variables issues du tableau de données, ces liens seront définis sous forme d’équation reliant par exemple une variable à expliquer à un groupe d’autres variables explicatives ou prédicteurs. Lorsque la variable à expliquer est numérique, la modélisation prédictive est qualifiée de régression et lorsqu’elle est nominale, la modélisation prédictive est appelée classification. Les modèles prédictifs s’intéressent à une ou plusieurs variables définies comme cibles de l’analyse. En fonction de ces variables, dans l’exploration des données prédictives, deux opérations sont à entreprendre à savoir la discrimination et la prédiction proprement dite. La discrimination concerne l’aspect qualitatif des variables tendis que la régression également appelée prédiction s’intéresse aux variables continues. Ces deux opérations permettront de séparer les individus en plusieurs classes. On parle de méthode supervisée lorsque l’opération de classement consiste à analyser les caractéristiques d’individus pour les placer dans une classe déterminée au préalable. Dans le cas contraire, on est en présence de méthodes non-supervisées. Dans la méthode supervisée, un système analyse lui-même les informations qu’il reçoit et cherche à établir des structures émergentes parmi ces informations. Quant à la méthode supervisée, le système est guidé par l’utilisateur.  Les techniques prédictives expliquent les variables en vue de prédire la valeur de ces variables pour les nouveaux arrivants à la différence des méthodes descriptives qui résument les données pour donner une vision claire de l’ensemble de ces données.  Les arbres de décision ainsi que les réseaux neurones décrits précédemment sont des modèles non paramétriques auxquels peuvent avoir recours la modélisation prédictive lorsqu’il n’est pas possible de formuler des hypothèses simples sur la distribution des données. Ce type de modélisation peut également avoir recours à des fonctions sous forme d’expressions mathématiques explicites contenant des paramètres, il s’agit de la modélisation prédictive paramétrique. Cette dernière a le plus souvent recours à l’analyse discriminante ou bien à la régression linéaire.  L’analyste dans la prédiction peut également dans certains cas procéder au moyen des méthodes issues de la statistique et des probabilités, sinon il peut recourir aux techniques précitées. Il est à noter que ce ne sont pas les seules techniques à la disposition de l’analyste qui désire chercher les causes d’un phénomène ou la probabilité de la réalisation d’un évènement, il en existe de nombreuses autres.

 

L’équation définie sera ensuite utilisée pour prédire la valeur d’une variable pour de nouveaux individus dont la variable ne figurerait pas dans un tableau de données initiales. Ces techniques précitées permettent donc la mise en place d’un algorithme et chaque type de donnée possède l’algorithme qui lui est adapté, aucun n’est optimal dans tous les cas, dans certaines situations, ils peuvent même être combinés entre eux. Après qu’un modèle ait été établi, des indicateurs vont permettre d’évaluer la qualité de ce modèle. La performance d’un modèle peut être appréciée à partir de sa rapidité et le taux d’erreur qui doit être le plus bas possible c’est-à-dire que le modèle ne doit pas être sensible aux fluctuations de l’échantillon de données.

 

 

 

3-3-Le modèle prédictif appliqué au churn

3-3-1-Mise en œuvre technique

 

Pour déterminer qui sont les clients les plus enclins au churn, il est nécessaire de procéder dans un premier temps à une classification de ces clients. La technique permettra ainsi de déterminer qui seront ces clients dans le futur.  Dans cette classification, l’analyste mettra en place un historique des clients ayant été sujet au churn dans le passé. Ces derniers seront ensuite comparés aux clients existants au moment de la mise en œuvre de la technique de prédiction. Van den Poel et Larivière ont avancé quatre variables pour prédire le churn[4] à savoir le comportement du client, la perception du client, sa démographie, ainsi que les variables du macro environnement. Concernant le comportement du client,  il sera procédé à la détermination des services auxquels les clients ont le plus souvent recours et combien de fois ils en ont recours. Les variables sur la perception du client définiront comment les clients appréhendent-t-ils le service. Pour les variables sur la démographie du client, elles se rapportent le plus souvent à l’âge, le niveau d’éducation, le statut social, les données géographiques et autres. Puis en ce qui concerne les variables du macro environnement, elles se rapportent aux changement qui interviennent dans le monde et qui peuvent influencer le comportement du client par rapport aux services auxquels ils ont recours. En raison de l’importance en volume des données à traiter, comme dans le cas de la découverte de connaissance, entreprendre une phase de nettoyage des données est nécessaire pour ne garder par la suite que celles qui sont les plus pertinentes. La classification proprement dite sera ensuite effectuée au moyen de diverses techniques de modélisation comme les techniques de la régression, les réseaux neurones ou le modèle bayesien. La régression linéaire est en effet une technique qui peut être utilisée pour identifier et prédire la satisfaction du client, elle permet d’identifier les variables les plus significatifs par rapport à la régression linéaire et le modèle de régression du churn prediction en sera obtenu. Quant au modèle bayesien, il s’agit d’un modèle qui permet de faire des prédictions à partir de bases de données qui concerne le passé. La théorie Bayesienne dispose que la probabilité dans la prédiction d’un évènement   est obtenue  à partir de la probabilité de cette prédiction pour des situations généralement similaires multiplié par la probabilité de voir l’évidence qu’une prédiction particulière est correcte divisée par  la probabilité de la prédiction en général. Dans les réseaux neurones, chaque attribut est associé à des poids de données et la combinaison de ces derniers est utilisée dans la prédiction. A partir des données clients et des variables prédictifs, le réseau neurone essaie de calculer la probabilité qu’un client sera un churner dans le futur.

Pour évaluer la qualité des données une fois les étapes précédentes remplies, les données à la sortie seront analysées en termes de sensibilité, de spécificité, et de précision. La qualité des données permettra de régler par la suite les paramètres de classification afin obtenir un bon modèle prédictif.

 

3-3-2-Les autres hypothèses théoriques en présence

 

La prédiction du churn a fait l’objet de nombreux écrits, plusieurs auteurs ont proposés des modèles qui se rapportent à la prévention de ce phénomène et dont la démarche à suivre ne correspond pas à celle décrite plus haut, ce qui est cependant certain c’est que des similitudes existent entre ceux proposés par ces auteurs et le modèle de prédiction du churn dont il a été question précédemment. Bong-Horng Chu, Ming-Shian Tsai et Cheng-Seen Ho[5] ont proposé un modèle hybride de data  mining pour la prévention du churn. La technique proposée permet d’évaluer la probabilité de l’attrition et ces auteurs proposent en même temps des solutions pour prévenir le churn. Il existe deux modes dans l’architecture du modèle proposé à savoir le mode apprentissage et le mode usage. Dans le mode learning, comme dans le modèle originel du churn prediction, l’analyste cherche d’abord à établir un historique des données se rapportant aux clients Ces données permettront de créer un modèle prédictif. Par la suite, le model constructeur procède à une segmentation des churners à l’intérieur de différents groupes à partir des attributs du modèle de prédiction. Quant au mode usage, l’analyste utilise le modèle de prédiction pour déterminer la probabilité de churn de chaque groupe de churner. Lorsque la probabilité de churn est élevée, le prédicteur va suggérer un retention policies qui provient d’un modèle de politique. Une autre méthode de prédiction de l’attrition est celle de Kristof Coussement et  Dirk Van den Poel[6]. Ils ont avancé divers propositions se rapportant au churn prédiction, ils proposent notamment utilisant des machines à vecteurs de support en comparant deux paramètres de sélection techniques, la machine à vecteur est une technique de classification basée sur l’utilisation de la technique des réseaux neurones, il a la capacité  de définir des problèmes complexes en des fonctions discriminantes plus simples. Il fonctionne toujours sous le respect du principe de minimisation des bruits ou erreurs.

 

D’autres auteurs quant à eux ont proposé des solutions pour remédier aux imperfections du churn prediction. J. Burez, D. et Van den Poel[7] ont mis en évidence l’importance du désequilibre des classes dans la  prédiction du churn . Ils avancent des techniques pour mieux gérer ce déséquilibre. Ils proposent l’application de quatre des dix méthodes proposées par Weiss[8] à savoir l’utilisation de mesures d’évaluation plus appropriées, l’utilisation des méthodes d’apprentissage des coûts, le recours à des méthodes d’échantillonnage, et la stimulation. L’utilisation de paramètres d’évaluation plus appropriés permettra d’apporter des solutions aux imperfections et imprécision de la classification. Les méthodes d’apprentissage des coûts sensibles apporteront des solutions aux problèmes concernant la répartition des classes. L’échantillonnage est une technique qui permet de traiter la rareté. La stimulation quant à elle permet de minimiser les erreurs dans la prediction, elle procède en améliorant l’exactitude d’une fonction prédictive en appliquant la fonction à plusieurs reprises dans une série et la combinaison de la sortie de chaque fonction avec pondération.

Kristof Coussement et  Dirk Van den Poel suggèrent également d’autres méthodes pour améliorer la méthode de prédiction du churn. Ils disposent que la prédiction de l’attrition des clients peut être améliorée par l’intégration des émotions à partir des interactions entre les e-mails du client et de l’entreprise.

 

 

B/ Les problématiques se rapportant aux techniques de modélisation et les problèmes de l’entreprise face à sa clientèle

1/ Les problèmes rencontrés en matière de modélisation de données

Nous avons déjà vu auparavant tout ce qui concerne en général la modélisation des données, or, avant d’en tirer les difficultés, un rappel plus précis sur le concept nous aiderait à faire ressortir toutes les difficultés qui puissent être rencontrées en la matière.

1.1/ Rappel sur la modélisation des données

La Modélisation de Données est l’art d’enlever de l’information d’un ensemble de données obtenues par les différentes sortes de mesures, et de raffermir cette information dans un modèle exploitable.

Le but étant de parvenir à réaliser un modèle qui sera tout de suite opérationnel et qui conduira l’étude vers un le résultat obtenu. Le tableau ci-dessous permettra de voir le modèle exploitable.

Individu Sexe Taille Poids Âge Tension
1 F 1,68 49 48 14
2 M 1,79 72 23 13
3 M 1,67 69 65 19
4 F 1,53 95 61 22
5 M 1,82 85 35 15

 

 

1.2/ Les difficultés rencontrées en matière de modélisation de données

La modélisation n’est pas facile à établir alors que son application surtout en matière de prédiction s’avère profitable à toute entreprise. Malgré l’existence des diverses techniques pouvant être appliquées, il existe certainement des difficultés principales qui méritent d’être analysées.

  • Définition du problème

Vue la réorganisation qu’il faut engendrer pour la mise en place d’une technique de modélisation, cette dernière nécessite un grand investissement que ce soit en matière de temps qu’argent. A titre d’exemple, la collecte des données, sa mise en forme, la construction, la validation et l’interprétation d’un modèle nécessitent un temps plus ou moins long pour garder une assurance ainsi que beaucoup d’argent pour la mise en place.

Les procédures à suivre pour l’aboutissement d’un modèle sont définies avec précision, l’entreprise doit d’abord passer du temps à définir l’objectif  de l’étude qui va être menée (Churn prediction par exemple), ensuite, connaître les critères qui permettent de déduire que l’objectif a été atteint ou non, faire en sorte de savoir la nature et  le volume des données qui seront utiles à la construction d’un modèle approprié.

  • Qualité des Données

La qualité des données n’est pas toujours chose sure puisque dans la plupart des cas, les données sont soient insuffisantes, soient mal formatées, soient rares, soient non synchronisées, soient entachées de vices. Pourtant, les données constituent l’élément essentiel en matière de modélisation, ce qui nécessite dans ce cas toute une attention si l’on veut atteindre sa qualité. Si l’objectif n’est pas atteint, tous les efforts sont en vain perdus.

  • Le choix de la technique de modélisation

D’une manière générale te en réalité, le choix de la technique n’appartient pas en entier à l’entreprise, c’est l’analyste qui en apprécie. Le fait est que la modélisation de données se développe à grande vitesse et les différentes techniques aident l’entreprise à atteindre, du moins dans la théorie, l’objectif donné. Comme toutes techniques, chacune présente en même temps des avantages et des inconvénients, le choix détermine donc l’aboutissement du projet. Il faut dès lors chercher les techniques qui sont adaptés à l’objectif pour ensuite faire le bon choix entre elles. Ceux qui font le choix doivent donc être des praticiens, des expérimentés afin d’éviter le mauvais choix, or, dans la majeure partie des cas, l’existence de cette longue pratique n’est pas acquise.

  • Le choix des variables

Les variables sur lesquels portent le choix sont ceux qui seront prises en compte dans le modèle et ceux qui ne le seront pas. Le choix des variables est important en raison des fondements principaux de la statistique, cette importance des variables est souvent ignorée des praticiens. La sélection des variables est le plus souvent difficile, il faut choisir parmi les variables disponibles dans le tableau de données. Le choix porte surtout sur le nombre des variables, si beaucoup trop sont incluses dans le modèle, les modifications seront fréquentes et le modèle ne serait pas totalement crédible. Les variables varient selon l’objectif et même à l’égard des techniques qui poursuivent les mêmes objectifs en étant différentes.

  • Sélection de modèle

Tout modèle contient obligatoirement des paramètres. La détermination des valeurs de ces paramètres se fait à travers deux manières différentes : soit elles sont calculées par un algorithme d’ « apprentissage, en général sert à minimiser une quantité calculée à partir des données, soit elles sont définies de façon arbitraire.

Il appartient à l’analyste, quelque soit la façon utilisée pour les valeurs des paramètres, de faire le choix du nombre de paramètres à utiliser sur le modèle. Le nombre de paramètres est déjà imposé par le nombre de prédicteurs retenus, même en matière de régression linéaire multiple.

Tous les analystes se disent que l’augmentation du nombre de paramètres de modèle favorise sa souplesse et lui permet ainsi de rendre compte des données d’apprentissage. Pourtant, il a été découvert que cette augmentation mène vers la dégradation des performances du modèle sur les données nouvelles alors que ces performances sont les seules qui sont importantes.

Ainsi, il ne faut pas estimer les performances sur les données qui ont servi à construire le modèle mais plutôt sur des données nouvelles. Les différents modèles devraient donc passer par plusieurs tests de validation. On prend alors en compte le modèle qui a obtenu les meilleurs résultats au cours des tests mais non par rapport aux données d’apprentissage. La sélection de modèle nécessite donc beaucoup de temps et beaucoup d’expérience, ce qui conduit à dire que les praticiens occasionnels pourraient se tromper de choix par manque d’expérience, et le processus échoue.

Il est vrai que la sélection de modèle et la sélection de variables ne peuvent être faites en même temps du fait que les techniques sont spécifiques à chaque sélection, cependant, ce sont les deux conditions pour aboutir à un meilleur processus, leur traitement ne devrait pas se séparer.
L’art de la modélisation de données avec tout le processus à suivre et les différentes techniques comme les équations et les algorithmes nécessite des expériences comme tous les autres arts. Si on se force à appliquer les techniques alors qu’il manque de vraies pratiques, les résultats seront automatiquement mauvais.

D’une manière plus précise, la modélisation est fondée sur des bases que tous les praticiens doivent savoir, que ce soit l’analyste, que ce soit l’entreprise qui fait appel à lui. En réalité, c’est un travail d’équipe, les interactions entre les spécialistes du métier et l’analyste sont très importantes.

 

2/ Les problèmes du churn prediction

Au niveau technique dans la mise en œuvre de la modélisation prédictive, deux difficultés majeures se présentent, la première difficulté se rapporte au choix des variables indépendantes aussi appelées prédicteurs, il est indispensable de procéder à une sélection rigoureuse des prédicteurs. La seconde grande difficulté concerne le choix de la technique de prédiction c’est-à-dire la fonction f(.) dont l’appréciation est laissée à l’analyste.

La détermination du taux de churn est donc faisable en présence des analystes expérimentés, des techniques de modélisation et de tout investissement nécessaire à la mise en œuvre de tout le processus du churn prediction. Une fois le taux de churn déterminé, le problème surgit et différentes questions remontent à la surface. La plus importante de toutes ces questions est celle qui demande pourquoi le client veut quitter l’entreprise. En plus de la détermination du taux de churn, l’entreprise serait amenée à détecter les raisons qui poussent les clients à vouloir quitter la quitter. La conception des méthodes de rétention active est donc indispensable.

C’est par l’interprétation des résultats que l’on découvre l’efficacité du modèle de prediction choisi. Le fait est que l’on peut déterminer les raisons possibles du départ de la clientèle en fonction des résultats obtenus à la suite du processus.

Les réseaux de neurones possèdent une meilleure performance pour connaître le taux réel du churn mais c’est insuffisant. La régression linéaire et les arbres de décision aident à déterminer les raisons du comportement du client qui veut quitter l’entreprise.

 

3/ Les problèmes de l’entreprise face à la clientèle

Toute entreprise pense que leur service à la clientèle est d’une meilleure qualité et qu’il n’y a pas de grands risques qui puissent conduire les clients à la quitter. Pourtant, la majeure partie des entreprises fournit un service client médiocre. Un meilleur service client nécessite beaucoup d’efforts du fait que cela tend vers les principes fondamentaux qui doivent être respecté par toute entreprise qui veuille réussir dans son domaine. Ces principes sont la satisfaction de la clientèle, la loyauté, la rétention, l’achat des options, le référencement, etc.

Atteindre ces objectifs constitue une grande pression pour l’entreprise, elle rencontre divers problèmes qui sont les plus larges possibles. Mais pour mieux cerner les problèmes de l’entreprise face à la clientèle, il faut les diviser en deux parties, l’insuffisance de moyens matériels et l’insuffisance de moyens humains.

 

3.1/ L’insuffisance des moyens matériels

Il a tété dit auparavant que le service client nécessite une grande attention de la part de l’entreprise puisque la clientèle constitue le carburant du fonctionnement de l’entreprise. Qui dit essentiel dit grand investissement. Quand on parle de moyens matériels, il s’agit en même temps de matériels pris au sens propre du terme et aussi et surtout de moyens financiers.

L’entreprise, dans la plupart des cas, ne se soucient pas de l’état de leur bureau alors que cela constitue aussi un atout en matière de rétention de la clientèle. Toutes les matières employées au sein d’un bureau donné doivent être mises en place pour attirer la clientèle. Parfois, il est aperçu qu’une entreprise n’emploie pas le nombre d’ordinateurs adéquats, le nombre de fax ou d’imprimantes, ce qui engendre un retard dans les commandes de la clientèle. Les freins sont alors plusieurs et les clients quittent facilement l’entreprise pour aller voir là ou les matériels ne manquent pas, comme quoi les commandes sont arrivés à temps.

En matière financier, les entreprises sont toujours contraintes à beaucoup de pressions, tout ce qui concerne la clientèle nécessite un quelconque investissement. En matière de détermination du taux de churn par exemple, il y a des investissements à faire dans tout, la mise en place des techniques, les analystes, la réorganisation interne de l’entreprise mais aussi les enquêtes, la constitution du fichier client, la mise en place d’une base de données. Face à ces investissements incessants, les entreprise préfèrent conquérir de nouveaux clients au lieu de fidéliser ceux qui sont existants alors que c’est bien la que se trouve l’erreur, c’est le contraire qui augmente les chiffres d’affaires. Les entreprises ont donc peur des gros investissements. C’est pourquoi la fidélisation ne trouve plus sa raison d’être.

Les problèmes en moyens matériels sont encore plusieurs, ceux qui ont été abordés ne sont que des exemples qui sont les plus fréquents. Les entreprises sont également confrontées à l’insuffisance de moyens humains, des éléments qui sont aussi importants en matière de service client, c’est la clé même de toute satisfaction.

Dans le cadre même de cette insuffisance de moyens matériels, les politiques de service ne sont même pas conviviales. Le téléphone est toujours occupé, la durée d’une conversation avec un client est limitée et ne suffit même pas à aborder tous les problèmes et toutes les réclamations, une longue queue pour atteindre les guichets, les emplacements sont éloignés, les heures de service sont les mêmes que ceux pendant lesquels les clients exercent leur profession, etc. Il est fréquent aussi que lorsque le client réclame quelque puisqu’il est insatisfait, il doit remplir un long formulaire, ensuite, on lui pose des questions qui sont spécialement conçues dans le but de le culpabiliser par rapport à la survenance du problème.

Les attentes de la clientèle ne sont pas répondues de manière à les satisfaire. Dès fois, l’entreprise ne considère que les attentes qui sont portées à leur connaissance, elle ne se préoccupe pas des émotions de son client.

Le départ des clients est donc assuré dans ces conditions là, vu aussi que la concurrence est rude. Chaque entreprise cherche des moyen pour conquérir à chaque instant de nouveaux clients.

 

3.2/ L’insuffisance des moyens humains

 

L’insuffisance des moyens humains sont visibles dans la majeure partie des entreprises sauf celle qui sont déjà des renommées internationales, c’est-à-dire les grandes entreprises. Lorsqu’on parle de moyens humains, on parle du personnel de l’entreprise. Au sein d’une entreprise, il peut y avoir une subdivision de direction, par exemple, la direction des engagements, la direction de la communication, la direction de l’informatique, la direction du personnel et plusieurs autres encore. Toutes les directions d’une entreprise jouent un rôle important au niveau du service client, que ce soit avant ou après vente, le client est le roi. Or, le personnel est insuffisant, soit les employés sont nombreux mais ne sont pas expérimentés, soit ils le sont mais leur nombre est compressé. Ce qui est encore une conséquence du manque de moyens financiers.

Lorsque les employés sont nombreux mais ne disposent pas des compétences requises pour répondre aux besoins de la clientèle, les efforts restent vains. Lorsqu’ils sont expérimentés mais leur nombre est moindre, ils n’arrivent pas à suivre les commandes, à honorer les demandes comme il le faut.

 

Il est donc nécessaire d’investir sur les moyens humains car la satisfaction de la clientèle exige un travail d’équipe avec beaucoup de professionnalisme. Il appartient à chaque entreprise de trouver des moyens pour engager les bonnes personnes qui répondent en même temps à la qualité et à la quantité. Une entreprise disposant un personnel compétent réussirait à satisfaire sa clientèle avec moins de difficultés.

De par cette insuffisance de compétence de la part des responsables, ils traitent mal les clients, surtout quand le prix du produit acheté est moindre. Ils ne reçoivent pas comme il le doit la clientèle, il n’y a pas de convivialité. Dans ces cas, le client quitte facilement l’entreprise même si le produit est d’une meilleure qualité et de meilleur prix.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

PARTIE III : Les solutions proposées

 

Dans le cadre de cette partie, il s’agit de donner des suggestions et des propositions par rapport surtout à la perte de la clientèle, il s’agit de lutter contre les raisons qui poussent les clients à quitter l’entreprise. L’objectif étant de réduire le taux de churn à la fin de la période d’analyse. Les solutions données ne sont que des propositions qui pourront servir de base pour toute entreprise qui désire éviter le départ d’une partie de sa clientèle, ou même la totalité. La rétention de la clientèle est en fait basée sur sa satisfaction.

 

III.1/ Solutions avancées pour la perte de clientèle

 

Afin d’améliorer le service à la clientèle, l’entreprise doit prévoir au niveau de son organisation quelques stratégies d’affaires lui permettant d’atteindre cet objectif. Le véritable objectif est de réduire le taux de churn et même de le supprimer.

Au niveau même de la planification générale de l’entreprise, les exigences du service client doivent y être intégrées. La raison en est que ces exigences doivent être considérées par toutes les autres fonctions qui existent au sein de l’entreprise. Tous les aspects sont touchés par ces exigences, partant de la conception des produits, passant par la manutention, la tarification, les achats, la communication et se termine par la culture de l’entreprise. Rendre service à la clientèle est une affaire de tous, toutes les directions doivent en tenir compte.

La fonction de service à la clientèle se trouve toujours confrontée à divers critiques, de plus que les salaires du personnel sont d’un montant inférieur à ceux dans les autres fonctions. Les responsables du service client ne sont donc pas enthousiastes, ce qui rend le service désagréable et catastrophique. En premier lieu, l’entreprise doit investir un peu plus au niveau des salaires de ces responsables pour leur motiver. En second lieu, les responsables doivent changer d’attitude et se préoccuper du bien être de l’entreprise à travers le respect des clients. Il appartient aussi à la direction de donner exemple de respect à tous les employés pour que ces derniers suivent le pas. De plus, dans le cadre du marketing, les clients engendrent une ressource capitale et importante par rapport à toutes les autres activités pouvant être mis en place. Le marketing devrait donc devenir le seul responsable du service à la clientèle.

Les organisations tendent à considérer le service client comme génératrice de profit. Le service devient dans ce cas coûteux. Ce qui est fatal pour l’entreprise puisque la clientèle s’attende à un prix de service relativement bas avec une qualité de service meilleure, c’est ce qui attire les clients. Il serait donc plus rentable de générer des profits dans d’autres activités et mettre de côté cette recherche de profit par rapport au service client. Si l’entreprise tient à cette recherche de profit, les clients la quittent facilement pour courir vers d’autres fournisseurs au sein desquels le service client est abordable et ce même si la qualité n’est pas parfaite.

Il est vrai que le prix d’un tel produit doit inclure le coût de la rétention, le coût d’acquisition, le coût du service. Pourtant, un client mérite une qualité de service irréprochable. Il faut donc adopter une politique de prix de rétention. Le client reçoit un service de qualité même si le prix du produit est faible. Le prix ne doit pas donc être ressenti par l’entreprise comme moyen de s’évader d’une obligation de donner une qualité de service.

Une autre stratégie concerne la gestion des attentes des clients. Elles peuvent être explicites et implicites, et pourtant, l’entreprise doit répondre à ces attentes. Elles sont explicites lorsqu’il s’agit des promesses qui sont faites par l’entreprise même au moment de l’achat, dans ce cas, il n’y a pas de problème. Elles sont pourtant implicites lorsque les clients ne partagent pas ses émotions, il s’agit de leur perception de l’image de marque, la réputation de l’entreprise, ce qu’ils pensent du rapport qualité prix. La gestion est dans ce cas difficile. L’entreprise ne devrait pas se limiter à considérer seulement les attentes explicites, il faut aussi apprendre à gérer les attentes implicites. Les deux attentes doivent être comblées et les réponses doivent tenir compte de ces attentes.

D’une manière générale, les entreprises font des publicités pour vendre leur produit, des publicités qui attirent plusieurs catégories de clientèle. Cependant, une fois les clients acquis, les services après vente sont soumises à des conditions très strictes. Les clients se trouvent donc dans une situation de déception et se précipite à quitter l’organisation. L’entreprise devrait se mettre à la place des clients pour voir ce que l’on peut ressentir et changer ainsi de comportement pour fidéliser les clients.

 

III.2/ Solutions proposées aux problèmes du churn prediction

L’idéal pour toute entreprise serait de mettre en place des solutions de CRM. Le but étant d’avoir entre les mains un système d’information qui permet de faire le suivi des relations avec chaque client sur l’ensemble des canaux qui permet une interaction d’action (les centres d’appels, le web, les agences).

Si l’entreprise met en œuvre une analyse prédictive de ces données, l’outil de gestion de la relation client devient une formidable arme de guerre : l’analyse prédictive alimente le système avec des recommandations propres à chaque client, elle choisit la population à cibler pour telle ou telle action sortante, elle prévient les risques d’attrition sur tel ou tel client et déclenche une action préventive (visite, appel sortant, etc.).

 

 

 

 

 

CONCLUSION

 

 

De l’informatique opérationnelle, on est actuellement passé à l’informatique décisionnelle. L’extraction de connaissance à partir d’une base de donnée est devenu un outil indispensable à laquelle les organes décisionnelles d’une entreprise doit avoir recours dans le choix de ses décisions. Cependant, plusieurs étapes doivent être respectées scrupuleusement pour passer de l’exploitation d’un datawarehouse jusqu’à la prise de décision. Il a été vu dans l’étude effectuée que le processus de knowledge discovery passe par plusieurs phases, dans un premier temps, il faut procéder à la construction d’un datawarehouse, ensuite, il faut passer par les phases de formatage, le data mining, l’interprétation et la validation. C’est au niveau du data mining qu’il sera procéder à la modélisation, diverses techniques de modélisation ont été exposées dans l’étude qui vient de précéder et ces dernières vont permettre de définir une équation ou un algorithme. Il a également été vu qu’il existe principalement deux types de modélisation qui sont la modélisation descriptive et la modélisation prédictive. Le churn prediction est compris dans la modélisation prédictive.

 

Actuellement la rétention des clients est aussi importante que l’acquisition d’une nouvelle clientèle pour l’entreprise en raison. En raison de la l’existence d’une concurrence rude sur le marché, les entreprises ont été obligées d’innover dans la gestion de leur relation client. C’est pour faire diminuer le taux de churn et par conséquent pour limiter les pertes financières occasionnées par le churn que les techniques de prévention et de prédiction de ce phénomène ont été mis en place dans le cadre du data mining. Même si on ne peut remédier complètement aux futures churn, ils peuvent être atténués et maintenus à un certain niveau. Il existe actuellement de nombreuses techniques de prédiction et de nouvelles méthodes continuent à être mise en place grâce aux travaux recherches ayant été effectués dans le domaine et qui ont été consignés dans des ouvrages et des périodiques. Ces méthodes ont le plus souvent recours à des techniques de calcul statistique, de calcul de probabilité et à des techniques de validation  ayant déjà existées depuis très longtemps. La combinaison de ces dernières si la manipulation est effectuée de manière intelligente peut vivement contribuer à l’amélioration du résultat qui en sera obtenu.

 

Les techniques de prédiction du churn ainsi que les processus du knowledge discovery ne sont pas encore totalement maitrisée à notre époque. Il s’agit encore de domaines tout à fait nouveaux pour les entreprises ce qui explique les difficultés auxquelles sont encore confrontées les analystes actuellement. Dans la relation entre le client et l’entreprise et dans le cadre du churn, les problèmes existants se situent à trois niveaux, il y a d’abord les problèmes qui sont à l’origine du churn, il y a les problèmes occasionnés par le churn pour l’entreprise et il y les difficultés au niveau du processus de découverte de connaissance et de prédiction du churn. L’étude ici présent concerne surtout la prévention du churn, les causes à son origine n’ont été traitées que succinctement.

 

Même si les causes du churn n’ont été exposées que succinctement, des solutions à ce problème sont proposé, ensuite des solutions se rapportant aux problèmes techniques sont également avancées avec la contribution des propositions de certains ouvrages. Le problème occasionné par le churn pour l’entreprise relève surtout du domaine financier, une fois les autres problèmes résolus, ce dernier le sera également.

 

Ce qui est sûr c’est qu’actuellement, aucune des méthodes et techniques de prédiction n’est totalement fiable malgré les procédés de validation, cependant, il va de soi que certaines sont plus performantes que d’autres et procurent des résultats plus précis. Effectuer une étude comparative en terme de fiabilité est difficile vu le nombre de techniques possibles, et encore, la plupart peuvent être combinées entre elles.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

GLOSSAIRE

-Apprentissage (phase d’) : détermination des paramètres d’un modèle par ajustements successifs en prenant comme référence des données connues (l’échantillon d’apprentissage)

 

-Arbres de décision : modèle issu des techniques d’intelligence artificielle. Son principe est de chercher à diviser une population en 2 (arbres binaires) ou plus (arbres n-aires) de sorte que ces sous-populations soient aussi différentes entre elles que possibles, et homogènes du point de vue de la répartition de la variable cible.

-Attrition : départ vers la concurrence (en anglais, « churn »)

Binaire : se dit d’une variable qui ne prend que 2 valeurs distinctes.

 

-Corrélation linéaire (coefficient de) : ou coefficient R². Il mesure de la liaison linéaire entre deux variables, c’est à dire de l’erreur commise en affirmant que X1 et X2 peuvent s’écrire comme X1 = a + b*X2. Graphiquement, dans un nuage de points représenté avec un axe pour X1 et l’autre pour X2, le R² mesure « l’alignement » des points. Dans le cas d’un modèle linéaire, un fort R² laisse présager d’une bonne qualité de prédiction du modèle.

 

-CRM : initiales de Customer Relationship Management, ou gestion de la relation client. Il s’agit d’une méthode de marketing visant à gérer de manière globale un fichier de client tout en donnant à chacun d’eux le sentiment d’être traité comme s’il était unique. étudier chaque client comme si on le connaissait personnellement, alors qu’il n’est qu’une part d’un gros volume de données. Le but poursuivi est de cibler l’approche du client en jouant sur ses spécificités, tout en conservant une étude de l’ensemble de la clientèle pour des raisons de coûts.

 

 

DataMining : Ensemble de techniques héritées de la statistique « classique », de la statistique bayésienne et de l’intelligence artificielle, qui permet l’étude de grands volumes de données. Ces techniques sont soutenues en général par une méthode de travail (voir à S comme SEMMA ou à C comme CRISP-DM) qui pose les étapes de l’étude DataMining.

 

DataWareHouse : ou entrepôt de données. C’est le lieu de stockage et d’agrégation (en général par un système de bases de données relationnelles) de toutes les informations connues de l’entreprises décrivant un secteur donné (commercial, GRH, production, …).

 

-Input : variable explicative, dans un modèle. Synonyme : covariable

 

Modèle : mécanique plus ou moins « boîte noire » qui, à partir de données connues (input), calcule une réponse (target) et la probabilité de réalisation de cette réponse associée (score).

 

-OLAP : Online Analytical Processing

 

-Perceptron : catégorie de réseaux de neurones robustes. Ils diffèrent des autres réseaux (les RBF) par la fonction d’activation des neurones, c’est à dire leur manière de transformer les signaux d’entrée en signal de réponse.

 

Régression : modèle statistique qui ajuste une « droite » (c’est à dire l’addition des valeurs de plusieurs variables, pondérées par des coefficients) passant au plus près des valeurs de la variable à prédire pour les individus.

BIBLIOGRAPHIE

– Bong-Horng Chu, Ming-Shian Tsai , Cheng-Seen Ho, Toward a hybrid data mining model for customer retention

– J. Burez, D. Van den Poel, Handling class imbalance in customer churn prediction

– John Hadden, Ashutosh Tiwari, Rajkumar Roy, and Dymtr Ruta, Churn Prediction using complaints Data

 

-Kristof Coussement, Dirk Van den Poel, Integrating the voice of customers through call center emails into a decision support system for churn prediction

 

-Kristof Coussement, Dirk Van den Poel, Improving customer attrition prediction by integrating emotions from client/company interaction emails and evaluating multiple classifiers

 

-Kristof Coussement, Dirk Van den Poel, Churn prediction in subscription services: An application of support vector machines while comparing two parameter-selection techniques

 

-Kristof Coussement, Dirk Van den Poe, Improving customer complaint management by automatic email classification using linguistic style features as predictors

 

-Longbing Cao, In-depth behavior understanding and use: The behavior informatics approach

-P. Adriaans and D. Zantinge. Data Mining. Addison-Wesley, 1996.

-R. Kimball. Entrepôts de données. 1997

– Scott A. Neslin, Sunil Gupta, Wagner Kamakura, Junxiang Lu, Charlotte Mason, Defection Detection: Improving Predictive Accuracy of Customer Churn Models

-Teemu Mutanen, Customer churn analysis – a case study

– T. Mitchell. Machine Learning. McGraw-Hill, 1997.

-Vladislav Lazarov, Marius Capota, Churn Prediction

 

-Webographie:

 

 

–  http://www.wikipedia.org

 

-http://www.piloter.org

 

-www.statsoft.fr

 

-http://tutoriels-datamining.blogspot.com

 

-http://statisticien-dz.forums-actifs.net/t40-decouverte-de-connaissance-a-partir-des-donnees

 

-http://www.knowledgediscovery.info/

 

-http://www.springer.com/

 

-http://www.dnb.ca/ChurnPrediction-Modeling.html

 

-http://home.in.tum.de/~lazarov/files/research/papers/churnprediction.pdf

 

-http://www.elsevier.com

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ANNEXES

 

Annexe 1 : Exemple de procédure d’exploitation de données

 

 

 

 

 

 

 

 

Source : George Gardarin, Data bases

 

 

 

 

 

 

 

 

 

 

Annexe 2 : Schéma du processus de la découverte de connaissance

 

 

 

 

 

Source : George Gardarin, Data bases

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Annexe 3 Schéma de l’analyse par le data mining

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Source : George Gardarin, Data bases

 

 

 

 

 

 

 

 

 

Annexe 4 : Architecture de l’entrepôt de données

 

 

 

 

 

 

 

 

Source : George Gardarin, Data bases

 

 

 

 

 

 

 

 

 

[1] Vladislav Lazarov, Churn prediction

[2] Vladislav Lazarov, Churn prediction

[3] D. V. den Poel and B. Larivière, Customer attrition analysis for financial services using proportional

hazard models

[4] D. V. den Poel and B. Larivière. Customer attrition analysis for financial services using proportional hazard models.

[5] Bong-Horng Chu, Ming-Shian Tsai, Cheng-Seen Ho,  Toward a hybrid data mining model for customer retention.

 

[6]Kristof Coussement, Dirk Van den Poel Churn prediction in subscription services: An application of support vector machines while comparing two parameter-selection techniques

 

[7] J. Burez, D. et Van den Poel, Handling class imbalance in customer churn prediction

[8] Weiss, G. M., Mining with rarity: A unifying framework

Nombre de pages du document intégral:79

24.90

Retour en haut