Il s'agit ici de notes de recherche-action
Télécharger facilement des ensembles de données“ - La fonction de téléchargement de masse d'openSNP vous permet de télécharger facilement le génotypage complet des données brutes dans les formats de fichiers fournis par 23andMe, deCODEme et FamilyTreeDNA. openSNP : https://opensnp.or - Github : https://github.com/openSNP/snpr
Décomposition par minimisation de l'entropie
ADN : la séquence peut être vue comme une suite de 4 événements aléatoires (A,C,G,T) ex: aligner plusieurs séquences d'ADN et calculer la fréquence des 4 nucléotides puis l'entropie sur chaque position. Alors il est possible de quantifier une certitude (2-entropie) sur la présence d'un nucléotide dans un motif particulier.
“Minimum entropy decomposition: Unsupervised oligotyping for sensitive partitioning of high-throughput marker gene sequences” https://www.nature.com/articles/ismej2014195