====== Notes sur le croisement de BdD et analyses génétiques depuis les tests ADN récréactifs ====== ===== Avant-propos ===== Il s'agit ici de notes de recherche-action ===== Démarrer ===== Télécharger facilement des ensembles de données" - La fonction de téléchargement de masse d'openSNP vous permet de télécharger facilement le génotypage complet des données brutes dans les formats de fichiers fournis par 23andMe, deCODEme et FamilyTreeDNA. openSNP : https://opensnp.or - Github : https://github.com/openSNP/snpr * récupérer la listes de ces 700 000 Snps (Illumina omniExpress) pour voir si il y a des Snps pathogènes.... Oui il y en a ! Par exemple chr7:g.117251703C>T dans la mucoviscidose.... https://cftr.iurc.montp.inserm.fr/cgi-bin/affiche.cgi?variant=c.3208C%3ET&provenance=0 * BRCA1 qui est couvert , ainsi que les exons... {{ bcra1.png }} * possibilité d'atablir une liste des probabilité de maladie grâce à ces données ==== Savoirs ==== Décomposition par minimisation de l'entropie ADN : la séquence peut être vue comme une suite de 4 événements aléatoires (A,C,G,T) ex: aligner plusieurs séquences d'ADN et calculer la fréquence des 4 nucléotides puis l'entropie sur chaque position. Alors il est possible de quantifier une certitude (2-entropie) sur la présence d'un nucléotide dans un motif particulier. "Minimum entropy decomposition: Unsupervised oligotyping for sensitive partitioning of high-throughput marker gene sequences" https://www.nature.com/articles/ismej2014195 {{ ismej2014195f1.jpg }} ===== Peut être utile pour comprendre ===== * L'entropie et la théorie de l'information et l'ADN : http://dridk.me/shannon-entropy.html