Table des matières
Notes sur le croisement de BdD et analyses génétiques depuis les tests ADN récréactifs
Avant-propos
Il s'agit ici de notes de recherche-action
Démarrer
Télécharger facilement des ensembles de données“ - La fonction de téléchargement de masse d'openSNP vous permet de télécharger facilement le génotypage complet des données brutes dans les formats de fichiers fournis par 23andMe, deCODEme et FamilyTreeDNA. openSNP : https://opensnp.or - Github : https://github.com/openSNP/snpr
- récupérer la listes de ces 700 000 Snps (Illumina omniExpress) pour voir si il y a des Snps pathogènes…. Oui il y en a ! Par exemple chr7:g.117251703C>T dans la mucoviscidose…. https://cftr.iurc.montp.inserm.fr/cgi-bin/affiche.cgi?variant=c.3208C%3ET&provenance=0
- BRCA1 qui est couvert , ainsi que les exons…
- possibilité d'atablir une liste des probabilité de maladie grâce à ces données
Savoirs
Décomposition par minimisation de l'entropie
ADN : la séquence peut être vue comme une suite de 4 événements aléatoires (A,C,G,T) ex: aligner plusieurs séquences d'ADN et calculer la fréquence des 4 nucléotides puis l'entropie sur chaque position. Alors il est possible de quantifier une certitude (2-entropie) sur la présence d'un nucléotide dans un motif particulier.
“Minimum entropy decomposition: Unsupervised oligotyping for sensitive partitioning of high-throughput marker gene sequences” https://www.nature.com/articles/ismej2014195
Peut être utile pour comprendre
- L'entropie et la théorie de l'information et l'ADN : http://dridk.me/shannon-entropy.html