Skip to main content

Les êtres humains partagent entre eux 99,9 % de leur ADN. Un chiffre surprenant que la science génomique a clairement démontré.

Vous avez bien lu : les 8,2 milliards d’êtres humains sur Terre partagent un génome identique à 0,1 % près. Une goutte d’eau dans un océan. Mais qui change tout.

Restez, on vous explique…

99,9 % d’ADN en commun

 

Prenez deux personnes au hasard.  Attention, complètement au hasard parmi les 8,2 milliards d’êtres humains qui peuplent la planète. Demandez-leur de vous donner un peu de leur salive. Extrayez leur ADN. Passez-le dans un séquenceur à haut débit. Comparez.

Résultat ?

99,9 % de leur génome est identique.

Disons-le autrement : 99,9 % de votre ADN est identique à celui des 8,2 milliards d’autres êtres humains qui peuplent la planète avec vous.

Vos différences génétiques – votre génotype, ce qui vous rend biologiquement unique – se concentrent en moyenne dans seulement… 0,1% de votre génome.

Concrètement, cela représente environ 3 millions de bases différentes dans votre ADN par rapport aux autres êtres humains.

3 millions, ça vous semble beaucoup ? Pas du tout, c’est une goutte d’eau dans un océan. Pourquoi ? Parce le nombre de paires de base qui composent le génome humain, votre génome et celui des 8,2 milliards d’autres êtres humains qui peuplent la planète avec vous, ne se compte pas en millions.

Il se compte en milliards.

Trois milliards de paires de bases.
Environ, hein ? On n’est pas là pour chipoter…

99,9 %. 0,1 %. Deux chiffres à méditer, non ?
Scientifiquement. Philosophiquement. Humainement, surtout.

Vous êtes toujours là ? Tant mieux.

 

99,9 % d’ADN en commun…

Et les 0,1 % qui restent ?

 

Pour les plus curieux, on va essayer d’affiner un peu pour voir ce qui compose ces 0,1%, cette goutte d’eau dans l’océan. Attention, accrochez-vous un peu, on risque de dire des gros mots…

Pour chaque individu, vous, nous et les 8,2 milliards d’autres êtres humains qui peuplent la planète avec nous, on recense en moyenne environ 4 à 5 millions de variants (différences) par rapport à une référence.

Ce sont surtout des SNP (soit environ 1 base différente tous les 1300 nucléotides). Mais aussi des variations dites structurales (InDels, duplications, inversions, CNV). Ce sont ces 0,1% – cette goutte d’eau – qui déterminent notre génotype… qui est à l’origine de notre phénotype.

On vous l’avait dit, on n’a pas pu s’empêcher de dire plein de gros mots…

Ok, temps mort, temps mort : on revient un peu en arrière.

Base, nucléotides, SNP ?!?

Quelques explications…

 

Une “base” ? Qu’est-ce que c’est ?

C’est l’une des quatre « lettres » chimiques de l’ADN : A (Adénine), T (Thymine), C (Cytosine) et G (Guanine).

Et un nucléotide ?

Fastoche : un nucléotide, c’est juste une base plus un sucre plus un groupe phosphate.

Et donc… une « paire de bases » ?

Dans la fameuse structure en double hélice de l’ADN, les bases se mettent ensemble par deux. Les A avec les T, et le C avec les G. On parle donc de « paires de base ». On l’a vu plus haut, le génome humain en possède environ 3 milliards. L’ordre de ces paires de bases est appelé la séquence. C’est elle qui constitue l’information génétique.

Et les SNP, indels et autres CNV ? C’est quoi ça ?

Ce sont « simplement » des modifications plus ou moins importantes dans la séquence.

  • SNP (pour Single nucleotide Polymorphism) : modification ponctuelle d’un seul nucléotide.
  • InDels (pour Insertions/Délétions) : quelques nucléotides ajoutées ou supprimées.
  • CNV (pour Copy Number Variation) : de grands segments de nucléotides dupliqués ou supprimés (on parle de duplications/délétions).

D’accord… Et un gène ?

Un gène, c’est un segment du génome. C’est-à-dire un ensemble de paires de bases localisé sur un endroit bien déterminé d’un chromosome. Il porte l’information génétique nécessaire pour produire un ARN fonctionnel. Cet ARN va porter une copie de l’information génétique. Il va en être le fidèle messager pour que la « machinerie cellulaire » puisse correctement remplir sa fonction de fabrication de protéines (si, si, on vient bien de vous parler de… l’ARN messager).

Et le génotype ?

Ha ! Le génotype, c’est l’ensemble des variantes (différences) génétiques qu’un individu possède dans son ADN et qui le rendent unique. On peut parler du génotype d’un gène précis ou de tout le génome. Comme on l’a dit plus haut, le génotype  est à l’origine du phénotype.

Alors, et le « phénotype », puiqu’on y est ?

Eh bien le phénotype, c’est l’ensemble des caractères uniques observables chez un individu (taille, couleur des yeux, groupe sanguin, métabolisme, sensibilité aux médicaments, etc.). Il résulte donc de notre génotype (combinaison des variantes génétiques exprimées dans nos désormais fameux 0,1%, notre goutte d’eau). Mais il est également déterminé par notre « environnement » au sens large (alimentation, altitude, activité physique, expositions, climats, etc) qui va influer sur  l’expression des gènes (ça, c’est l’épigénétique, c’est vachement passionnant mais on vous en reparlera une autre fois).

Et la référence ? Vous avez parlé d’une référence ? Quelle référence ?

Pour interpréter correctement le résultat du séquençage à haut débit de l’ADN d’un individu, et trouver les éventuels variants (différences qui peuvent par exemple expliquer une maladie génétique), on le compare aux résultats d’un génome sans variants : un génome de référence. La dernière référence en date a été publiée en 2023 et s’appelle la « référence pangénome ». C’est une sorte d’« atlas génomique » réalisé à partir des génomes de 47 personnes d’origines diverses.

 

99,9 % d’ADN en commun :

le chiffre à retenir

 

Vous n’avez pas tout retenu ? C’est normal.
Vous n’avez pas tout compris ? C’est pas grave.
Promis, on prendra le temps plus tard de réexpliquer et d’éclaircir tout ça.

Mais pour l’instant, retenez juste ces nombres : 99,9% et 0,1%.
Les êtres humains, où qu’ils se trouvent sur la planète, partagent 99,9 % d’ADN en commun.

Quant aux 0,1 % qui nous différencient :

Ils posent des questions cruciales : comment mieux les explorer ? Comment mieux les comprendre, mieux les étudier ? Pour mieux soigner, par exemple… Et puisqu’ils fondent l’unicité de chaque individu : comment les préserver ? Comment les protéger ? Comment s’assurer que chacun puisse en conserver la pleine et entière propriété ?

Quant aux 99,9 % d’ADN en commun :

Il nous semble qu’à travers ce nombre, la science génomique énonce une évidence simple : au-delà de leurs différences ethniques, physiques, culturelles, sociales, politiques ou religieuses, les êtres humains sont d’abord semblables.

En 2025, il serait peut-être temps que cette vérité scientifique relègue au rang des archaïsmes illusoires les préjugés et idéologies qui divisent, tuent et oppressent.

99,9 %. 0,1 % de différences. Deux chiffres à méditer.
Scientifiquement. Philosophiquement.

Humainement, surtout.

Si vous nous avez lu jusqu’au bout, on vous remercie.
Si vous avez zappé des morceaux parce qu’on a été trop longs mais que vous êtes quand même arrivés jusqu’ici, on vous remercie aussi.

Et on vous dit à très bientôt.

 

L’équipe de GENARO

 

Sources (sélection)

  • NHGRI (NIH) — Human Genomic Variation ; DNA Fact Sheet.
  • Science (2022) — The complete sequence of a human genome (T2T-CHM13).
  • Nature (2023) — A draft human pangenome reference.
  • Collins FS. JAMA (2001). (JAMA Network, PubMed)
  • NHGRI (NIH) — Glossaire & fiches : définitions SNP, CNV, variation génomique. (Institut Genomic)
  • 1000 Genomes Project, Nature (2015) : référence mondiale de la diversité génétique (26 populations, > 80 M de variants). (Nature, PubMed, Welcome to DTU Research Database)
  • NCBI Bookshelf — Indel (définition). (NCBI)
  • NCI (NIH) — Phénotype (définition). (Institut National du Cancer)
  • ASHG — Prises de position (2018–2021) : une seule humanité ; dénonciation des mésusages de la génétique. (PMC, ASHG)
GENARO

Créée en 2023 et basée à Marseille, la société GENARO développe un procédé breveté de double sécurisation - biologique et numérique - des données génomiques issues du séquençage à haut débit. Il s’appuie sur 2 piliers : - un algorithme codec qui permet d’encoder des données de caractères alphanumériques en caractères nucléotidiques. Spécifiquement développé en interne, et conçu pour être évolutif et adaptatif, il prend en compte les contraintes biologiques et physico-chimiques inhérentes à l’ADN, à l’impression d’ADN synthétique, ainsi que les contraintes techniques du séquençage à haut débit (NGS 2 et NGS 3). Cet algorithme permet de générer : - une séquence d’ADN synthétique contenant l’ensemble des données encodées. Cette étiquette d’ADN synthétique - et ses données - ont vocation à être mélangée à l’ADN génomique au plus près du prélèvement de l’échantillon biologique. L’étiquette d’ADN synthétique va ainsi transporter les données encodées tout au long du process de séquençage à haut débit, sans perte ni corruption. L’algorithme s’inscrit dans un système informatique ayant vocation à parfaitement s’adapter aux systèmes déjà en place. Après le séquençage, il peut donc authentifier et discriminer automatiquement l’étiquette d’ADN synthétique de l’ADN génomique de l’échantillon. Les données encodées sont donc décodées, lues et traitées automatiquement. Ces données peuvent être plurielles, quels que soient les besoins : référence unique relative à l’échantillon biologique, instructions d’automatisation de traitement, indexage dans une base de données, ou tout autres données utiles selon l’usage. Entre autres avantages, ce procédé offre par exemple une maîtrise complète de la traçabilité et une détection automatique de contaminations durant le processus de séquençage à haut débit. Mais on l’aura compris, il permet également une structuration de bases de données génomiques extrêmement propres, fiables et sécurisées. Les accès ultérieurs (ex : données secondaires) sont ainsi facilités et fluidifiés. Il rend de plus parfaitement possible la réorganisation des produits dérivées. Il offre surtout la possibilité de créer à la demande des bases de données extemporanées pour la recherche. Notons, et ce n’est pas un détail, qu’il respecte exhaustivement les règlementations en vigueur (RGPD). GENARO a réalisé sa preuve de concept de son procédé en juillet 2024, avec des résultats démontrant sans conteste sa robustesse et sa fiabilité. Elle sait maintenant que son innovation se prête parfaitement à de nombreuses applications dans les domaines de la Santé, de la recherche bio-industrielle et des sciences de la vie. Forte de ces résultats et d’une R&D en progression constante, la jeune société marseillaise cherche aujourd’hui des partenaires « first users », académiques et/ou privés, parmi les acteurs des sciences omiques (CRB, plateformes, laboratoires, etc.) avec lesquelles elle pourra poursuivre sa route et franchir les échelons de l’accès marché.