Le mystérieux A de A. Thaliana

AHHHHHHHHHHH 😱

L'Arabidopsis Thaliana est un plante bien connue en biologie, c'est ce que l'on appelle un organisme modèle, depuis 1998 pour cette arabette des Dames qui a un un génome relativement petit d'environ 135 millions de paires de bases (Mbp).

L'Arabidopsis est un eucaryote. Dans les gènes des organismes eucaryotes, les exons sont les segments d’un précurseur ARN et des introns est une portion d'un gène qui est transcrite en ARN

Exon 1 - Intron 1 - Exon 2 - Intron 2 - Exon 3 - … - Intron n-1 - Exon n

Il est assez rare qu'un eucaryote ne contienne pas d'intron à l'endroit ou un gène existe dans son génome. Environ 3 % seulement des gènes humains ne contiennent qu'un seul exon et donc aucun intron.

Il y a donc très souvent plusieurs exons également.

Pour faire simplifier et grossièrement, un exon c'est avec une longueur moyenne d'environ 150 nucléotides. Les nucléotides c'est A, G, C, T pour l'ADN et A, G, C, U pour l'ARN. De petites séquences légères, relativement en tout cas, d'un point de vue de paire de base (pb).

Rien de quoi effrayer… pourtant il y a secret qui rend dingue les personnes en bioinformatique (et leurs modèles)

APC11 (At3g05870) est un gène dans le génome d'Arabidopsis thaliana. Selon l'annotation actuelle, APC11 possède trois exons et deux introns et sa séquence codante (CDS) contient 261 nucléotides, produisant un polypeptide de 87 acides aminés (AA)… Un petit gène quoi…

Ce gène agit en amont ou au cours du développement “embryonnaire”, aboutissant à la dormance de la graine, à la régulation du cycle cellulaire mitotique.

Ce gène il m'intéresse beaucoup, notamment car je conçois des tests de détection de trucs avec des graines, seeds bioassay

L'ADN complémentaire (ADNc) d'APC11 dans la GenBank est mal annoté… 😬 (2016, Lei Guo & Chun-Ming Liu )

Une typo ????????? 😰

Le travail d'alignement de l'ADNc obtenu avec la séquence génomique d'APC11 a révélé un A mononucléotidique inséré dans l'ADNc. Mononucléotique, AVEC 1 SEUL NUCLÉOTIDE BORDEL DE PURÉE DE BOIS D'ARBRE.

IL Y A UN de l'ADÉNINE TOUTE SEUL QUI EMBROUILLE TOUT LÀ.

Le mystérieux A n'est pas en continuité avec la région codante en question 🥶, (CDS, Coding DNA Séquence).

Pourtant, l'insertion est absolument nécessaire pour la traduction “in-frame” d'APC11. 🤔 (migraines)

Il y a des écotypes pour l'A. Thaliana (ouais, je vous embrouille de A mois aussi.

Ces écotypes sont des organismes génétiquement distincts d'une même espèce et servent de modèle de référence dans les organismes modèles. Bref, on se sent un peu (trop) costaud·e avec un écotype. Moi y compris avec ma thaliana Col—0 que j'ai galérée 2 ans à pécho

Le reséquençage de l'ADN génomique d'APC11 extrait des écotypes Col-0 et Ler a confirmé que la séquence génomique disponible dans la GenBank du National Center for Biotechnology Information (NCBI) est correcte, alors que son ADNc annoté est erroné.

Il y a un A qui se ballade et qui était pas prévu dans cet ADN complémentaire.

Le A supplémentaire peut provenir d'un exon mononucléotidique situé dans l'intron entre le premier et le deuxième exons précédemment annotés. Dans la séquence intronique attribuée de 422 nucléotides, nous avons identifié un A putatif (désigné comme A333 dans la Fig. 1), entouré de GT et AG, situé en 333 nucléotides après la jonction exon-intron en amont. Un point de branchement A putatif a été détecté 44 nucléotides en amont de l'A333

Je résume : il y a là un exon, oui. Un exon d'un longueur de… 1, oui un exon d'un 1 longueur d'une seule et unique paire de base, 1pb.

Ce qui brise pas mal de théorie de modèle en bioinformatique. Notamment pour ce qui concerne l'épissage, processus par lequel les ARN transcrits à partir de l' ADN génomique peuvent subir des étapes de coupure et ligature qui conduisent à l'élimination de certaines régions dans l'ARN final.

Ce petit A est en violet dans la figure 1 de la publication de Lei Guo & Chun-Ming Liu, datant de 2016. https://www.nature.com/articles/srep18087

Il y au d'autres discussions sur car d'exon à 1pb https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0177959

VoilÀ,

C'est tout pour Aujourd'hui.

À +