Comment construire une analyse de cohortes

Niveau Intermédiaire

Ce guide est complémentaire à notre article sur les analyses de cohortes. Alors que l'article vous explique les concepts et les enjeux stratégiques, ce guide vous montre concrètement comment construire votre première analyse, étape par étape.

Étape 1 : Structuration de la base de données

C'est l'étape la plus importante, car c'est la qualité de cette base et son organisation qui fera la qualité de votre modèle de cohortes, en évitant des fichiers trop lourds. Gardez cependant en tête que cette approche présente des limites : pour des business établis avec des bases clients substantielles, vos analyses de cohortes peuvent s'avérer longues et voraces en puissance de calcul.

Pour mener une analyse de cohortes efficace, vous aurez besoin de deux bases de données complémentaires : une base facturation qui trace l'historique des transactions, et une base clients qui centralise les informations sur vos clients. Ces deux bases sont interdépendantes et s'enrichissent mutuellement pour construire une vision complète de votre activité.

Base de facturation

N° Facture 1
Nom Client
ID Client 2
Date Facturation 3
MRR Facturé
INV-2501-001 TechStart CLT001 2025-01-01 299 €
INV-2501-002 DataFlow CLT002 2025-01-01 299 €
INV-2502-001 TechStart CLT001 2025-02-01 299 €
INV-2502-002 DataFlow CLT002 2025-02-01 299 €
INV-2502-003 CloudOps CLT003 2025-02-01 999 €
INV-2503-001 TechStart CLT001 2025-03-01 299 €
INV-2503-003 CloudOps CLT003 2025-03-01 999 €
INV-2504-001 TechStart CLT001 2025-04-01 299 €
INV-2504-003 CloudOps CLT003 2025-04-01 999 €
INV-2505-001 TechStart CLT001 2025-05-01 299 €
1

Numéro de facture : Il s'agit ici de la clé principale de votre base de données, qui garantit l'unicité de chaque ligne et ainsi, d'éviter le double comptage qui fausserait l'analyse. Il est préférable que son format soit de type 'texte', afin d'éviter qu'Excel ne le convertisse au format 'Date' mettant ainsi en péril le concept de l'identifiant unique.

2

Identifiant client : Cet identifiant sert de source de vérité pour relier la facturation (reflétée par cette base) avec quelconque information relative au client. Ainsi, si par exemple votre client change de nom en cours de route, il vous est possible de tracer cela.

3

Date de facturation (normalisée) : Bien qu'en pratique c'est à la fin du mois que l'on observe le MRR, il est préférable de mener l'analyse au premier du mois pour assurer le bon fonctionnement des formules et surtout les simplifier.

Vous pourriez enrichir cette base en ajoutant des colonnes qualitatives comme la Région, le Segment, ou encore le Canal d'acquisition. Ces dimensions supplémentaires permettraient de pousser davantage la profondeur de votre analyse, par exemple en comparant les taux de rétention selon la zone géographique ou le profil client. Cependant, ce guide se concentre sur l'essentiel par souci de lisibilité et d'efficacité : nous gardons uniquement les colonnes indispensables au calcul des métriques de cohortes.

Base clients

La base clients complète la base facturation en centralisant les informations stables et qualitatives sur chaque client. Contrairement à la base facturation qui enregistre chaque transaction, cette base contient une ligne unique par client, identifiée par l'ID Client. Elle regroupe des attributs permanents ou peu variables : nom, segment commercial, canal d'acquisition, dates clés (acquisition, churn éventuel), et le dernier MRR connu.

Id 1
Client
Région 2
Segment 3
Canal Acquisition 4
Date Acquisition Date Churn MRR
CLT001 TechStart EMEA Startup Paid Search Jan-25 299 €
CLT002 DataFlow Americas SMB Organic Jan-25 Mar-25 299 €
CLT003 CloudOps APAC Enterprise Outbound Sales Fév-25 999 €
CLT004 Startup Hub EMEA Startup Referral Mar-25 99 €
CLT009 DataSync APAC SMB Organic Jan-25 499 €
CLT010 CloudBase EMEA Startup Referral Jan-25 149 €
CLT011 AutoDeploy Americas SMB Paid Social Jan-25 Aoû-25 249 €
CLT012 SecureNet APAC Enterprise Outbound Sales Jan-25 699 €

Chaque ligne représente un client unique avec ses caractéristiques immuables ou rarement modifiées. Le MRR indiqué correspond au dernier montant connu, ce qui permet d'avoir rapidement une vue d'ensemble de la valeur actuelle du portefeuille client. Pour un client churné, c'est le MRR du dernier mois d'activité qui est affiché.

1

Identifiant client : Cet identifiant fait le lien avec la base facturation. C'est la clé qui permet de croiser les données transactionnelles avec les attributs client pour vos analyses segmentées.

2

Région : Permet de segmenter vos analyses géographiquement. Vous pourrez par exemple comparer les taux de rétention entre EMEA, Americas et APAC, ou identifier les marchés où votre produit rencontre le plus de succès.

3

Segment : Catégorise vos clients selon leur profil commercial (Startup, SMB, Enterprise). Cette segmentation révèle souvent des patterns de comportement distincts : les Enterprise peuvent avoir un MRR plus élevé mais un cycle de vente plus long, tandis que les Startups s'engagent rapidement mais présentent parfois plus de volatilité.

4

Canal d'acquisition : Identifie la source d'origine du client (Paid Search, Organic, Outbound Sales, Referral...). Cette donnée est essentielle pour évaluer la qualité de chaque canal : certains génèrent peut-être beaucoup de volume mais avec une rétention faible, tandis que d'autres amènent moins de clients mais avec une meilleure LTV.

La relation entre les deux bases se fait via l'identifiant client : la base facturation enregistre chaque transaction avec son identifiant client, tandis que la base clients stocke les attributs permanents de ce client. Cette architecture vous permet de naviguer facilement entre la vision transactionnelle (facturation) et la vision client (profil et caractéristiques).

Bien sûr, ces caractéristiques sont à titre d'exemple. Selon votre business (produit, pricing, scope géographique, ICP, etc), elles seront amenées à différer.

Étape 2 : Création d'un suivi mensuel de MRR par client

Une fois vos deux bases de données structurées, l'étape suivante consiste à construire un tableau qui synthétise l'évolution du MRR de chaque client, mois par mois. Ce tableau consolidé est la pierre angulaire de votre analyse de cohortes : il vous permettra de calculer l'ensemble des métriques essentielles (churn MRR, expansion, downsell, new MRR, ARPA) que nous détaillerons dans les sections suivantes.

La structure de ce tableau repose sur les informations que vous avez déjà collectées : la base clients détermine les lignes du tableau (un client = une ligne), ainsi que la période d'analyse pour chaque client (de sa date d'acquisition jusqu'à sa date de churn ou jusqu'à aujourd'hui s'il est toujours actif). La base facturation, quant à elle, alimente les valeurs mensuelles : pour chaque mois, elle vous indique le MRR facturé par ce client.

Le résultat est un tableau où chaque colonne représente un mois calendaire (de votre mois minimum jusqu'à votre mois maximum d'analyse), et chaque cellule contient le MRR du client pour ce mois-là. Les cellules vides ou à zéro indiquent soit que le client n'était pas encore acquis, soit qu'il a déjà churné. Cette représentation visuelle permet d'identifier en un coup d'œil les trajectoires client : upsells progressifs, stabilité, downsells, ou churn.

Id Client Date Acquisition Date Churn Jan-25 Fév-25 Mar-25 Avr-25 Mai-25 Jun-25 Jui-25 Aoû-25 Sep-25
CLT001 TechStart 2025-01-01 990 € 990 € 1 480 € 1 480 € 1 480 € 1 480 € 1 480 € 1 480 € 1 480 €
CLT002 DataFlow 2025-01-01 2025-03-01 2 990 € 2 990 € 2 990 € — € — € — € — € — € — €
CLT003 CloudOps 2025-02-01 — € 4 990 € 9 990 € 9 990 € 9 990 € 9 990 € 9 990 € — € — €
CLT004 Startup Hub 2025-03-01 — € — € 1 990 € 1 990 € 990 € — € — € — € — €
CLT005 DevTools 2025-01-01 1 490 € 1 490 € 1 490 € 1 490 € 1 490 € 1 490 € 1 490 € 1 490 € 1 490 €
CLT006 WebFlow 2025-01-01 1 990 € 1 990 € 2 990 € 2 990 € 2 990 € 2 990 € 2 990 € 2 990 € 2 990 €
CLT007 DataSync 2025-01-01 3 990 € 3 990 € 4 990 € 4 990 € 4 990 € 4 990 € 4 990 € 4 990 € 4 990 €
CLT008 CloudBase 2025-01-01 1 490 € 1 490 € 1 490 € 1 490 € 1 490 € 1 490 € 1 490 € 1 490 € 1 490 €

Étape 3 : Consolider les lignes par période d'acquisition

C'est à cette étape que les cohortes commencent à se déssiner, car le critère d'unicité des lignes du tableau n'est plus le client, mais la date d'acquisition. En fonction de la maturité du business, on consolidera par mois, trimestre ou encore année d'acquisition.

Il est possible de procéder selon deux prismes : le prisme MRR et le prisme clients. Ces deux approches se verront être complémentaires, ainsi, nous allons procéder aux deux.

Cohortes MRR

AVANT

Client Jan-26 Fév-26 Mar-26 Avr-26 Mai-26 Jun-26
CLT001 2 500 € 2 500 € 2 800 € 2 800 € 2 800 € 3 200 €
CLT002 1 200 € 1 200 € 1 200 €
CLT003 1 800 € 1 800 € 1 800 € 1 800 € 1 800 € 1 800 €
CLT004 3 500 € 3 500 € 3 500 € 3 500 € 3 500 €
CLT005 2 200 € 2 200 € 2 200 € 2 200 €
CLT006 1 500 € 1 500 € 1 500 €

APRÈS

Cohorte Jan-26 Fév-26 Mar-26 Avr-26 Mai-26 Jun-26
Jan-26 5 500 € 5 500 € 5 800 € 4 600 € 4 600 € 5 000 €
Fév-26 3 500 € 3 500 € 3 500 € 3 500 € 3 500 €
Mar-26 2 200 € 2 200 € 2 200 € 2 200 €
Avr-26 5 000 € 5 000 € 5 000 €
Mai-26 3 200 € 3 200 €
Jun-26 4 700 €

Cohortes Clients

AVANT

Client Jan-26 Fév-26 Mar-26 Avr-26 Mai-26 Jun-26
CLT001 1 1 1 1 1 1
CLT002 1 1 1
CLT003 1 1 1 1 1 1
CLT004 1 1 1 1 1
CLT005 1 1 1 1
CLT006 1 1 1

APRÈS

Cohorte Jan-26 Fév-26 Mar-26 Avr-26 Mai-26 Jun-26
Jan-25 3 3 3 2 2 2
Fév-25 1 1 1 1 1
Mar-25 1 1 1 1
Avr-25 1 1 1
Mai-25 1 1
Jun-25 1

Grâce à ces tableaux, il est désormais possible de tirer les premières conclusions sur le comportement des cohortes, mais l'analyse complète ne s'arrête pas là.

Étape 4 : Transposer la matrice pour introduire la vision évolutive

Sans cette étape l'analyse se limite à une évolution comportementale des cohortes au fil des mois calendaires, et non au fil de leur vie dans votre base, ce qui nous intéresse davantage.

La logique est simple : déterminer le nombre de mois écoulés entre le mois d'acquisition et le mois d'activité observé dans la colonne du tableau. De la même manière que pour l'étape précédente, il est possible de faire cela selon la perspective client ou la perspective MRR.

Cohortes MRR

AVANT

Cohorte Jan-26 Fév-26 Mar-26 Avr-26 Mai-26 Jun-26
Jan-25 5 500 € 5 500 € 5 800 € 4 600 € 4 600 € 5 000 €
Fév-25 3 500 € 3 500 € 3 500 € 3 500 € 3 500 €
Mar-25 2 200 € 2 200 € 2 200 € 2 200 €
Avr-25 4 800 € 4 800 € 4 800 €
Mai-25 3 200 € 3 200 €
Jun-25 4 500 €

APRÈS

Cohorte M0 M1 M2 M3 M4 M5
Jan-25 5 500 € 5 500 € 5 800 € ↑+5% 4 600 € ↓-16% 4 600 € ↓-16% 5 000 € ↓-9%
Fév-25 3 500 € 3 500 € 3 500 € 3 500 € 3 500 €
Mar-25 2 200 € 2 200 € 2 200 € 2 200 €
Avr-25 4 800 € 4 800 € 4 800 €
Mai-25 3 200 € 3 200 €
Jun-25 4 500 €

Note : Les pourcentages affichés après M0 représentent le NRR (Net Revenue Retention) en lecture quasi-directe, il s'agit du NRR - 100%, ainsi une valeur à +5% correspond à un NRR de 105%. En d'autres termes '↑' suggère un NRR > 100%, tandis que '↓' suggère une contraction et donc un NRR < 100%.

Cohortes Clients

AVANT

Cohorte Jan-26 Fév-26 Mar-26 Avr-26 Mai-26 Jun-26
Jan-25 3 3 3 2 2 2
Fév-25 1 1 1 1 1
Mar-25 1 1 1 1
Avr-25 2 2 2
Mai-25 1 1
Jun-25 2

APRÈS

Cohorte M0 M1 M2 M3 M4 M5
Jan-25 3 3 3 2 ↓-33% 2 ↓-33% 2 ↓-33%
Fév-25 1 1 1 1 1
Mar-25 1 1 1 1
Avr-25 2 2 2
Mai-25 1 1
Jun-25 2

Gagnez du temps avec notre template

Template Excel pré-configuré avec toutes les formules de calcul automatiques. Importez vos données et obtenez vos analyses de cohortes en quelques clics.