Abstrait

Machine Learning 2018 : Utilisation de la plateforme cloud génomique et du machine learning pour l'analyse des variantes du génome - Tilila El Moujahid-Microsoft

Tilila El Moujahid

Le séquençage de pointe (NGS) permet d'effectuer un séquençage d'ADN hautement parallèle et révolutionne déjà les recherches biologiques. Au lieu de séquencer un ensemble spécifique de caractéristiques uniquement, le NGS permet de regrouper une partie plus étendue du génome (voire un génome entier), ce qui ouvre la porte à une étude plus approfondie des voies biologiques à l'intérieur d'un individu. Les chercheurs n'ont jamais eu accès à une telle abondance de données génomiques qui promettent de révéler les informations privilégiées sur les maladies les plus dévastatrices du siècle, par exemple le cancer. Il s'accompagne également de son propre ensemble de défis pour la gestion et l'analyse du Big Data afin d'extraire des éléments de données importants et significatifs. Le calcul distribué et l'IA ont la capacité d'expliquer ce problème. Dans cette discussion, nous montrerons comment la phase de génomique basée sur le cloud permet de gérer des pétaoctets de données génomiques et d'encourager une analyse secondaire rapide et dynamique. Nous utiliserons également des packages d'IA spécifiques à la génomique pour effectuer une analyse tertiaire sur les données de variations de qualité et des outils de représentation pour découvrir et transmettre les résultats au réseau scientifique c. Nous commencerons la discussion par un prologue au domaine de la génomique et au processus d'analyse génomique généralement utilisé et présenterons les utilisations concrètes des services et recherches ci-dessus. La capacité de séquencer l'ADN donne aux chercheurs la capacité de « lire » le plan génétique qui dirige toutes les activités d'un organisme vivant. Pour donner un contexte, le dogme central de la biologie est résumé comme la voie de l'ADN à l'ARN et aux protéines. L'ADN est composé de paires de bases, basées sur 4 unités de base (A, C, G et T) appelées nucléotides : A s'associe à T et C s'associe à G. L'ADN est organisé en chromosomes et les humains en ont un total de 23 paires. Les chromosomes sont en outre organisés en segments d'ADN appelés gènes qui fabriquent ou codent des protéines. La somme des gènes qu'un organisme possède est appelée le génome. Les humains possèdent environ 20 000 gènes et trois milliards de paires de bases. Il est intéressant de noter que seulement 2 % environ du génome humain code des protéines, un domaine d’intérêt majeur de la recherche et donc de la génomique. La génomique est étroitement liée à la médecine de précision. Avec un marché qui devrait atteindre 87 milliards de dollars d’ici 2023, le domaine de la médecine de précision (également connue sous le nom de médecine personnalisée) est une approche des soins aux patients qui englobe la génétique, les comportements et l’environnement dans le but de mettre en œuvre une intervention thérapeutique spécifique au patient ou à la population, contrairement à une approche universelle. Par exemple, pour réduire le risque de complications, une personne qui a besoin d’une transfusion serait mise en correspondance avec un donneur qui partage le même groupe sanguin plutôt qu’avec un donneur sélectionné au hasard. Actuellement, deux principaux obstacles s’opposent à une plus grande mise en œuvre de la médecine de précision : les coûts élevés et les limites technologiques.Pour faire face à la grande quantité de données sur les patients qui doivent être collectées et analysées, et pour contribuer à réduire les coûts, de nombreux chercheurs mettent en œuvre des techniques d’apprentissage automatique. Heureusement pour les chercheurs et les entreprises de génomique, la valeur du séquençage d’un génome continue de baisser d’année en année – même après une énorme chute relative des coûts entre 2007 et 2012.

Biographie:

Tilila est actuellement Data Scientist et Technical Evangelist pour les données et l'IA chez Microsoft. Elle accompagne les partenaires dans l'architecture et la construction de leurs solutions basées sur le cloud et alimentées par l'IA. Elle était auparavant stratège technologique pour des comptes d'entreprise, notamment dans le secteur de l'éducation et de la santé. Elle est également boursière Fulbright et a obtenu, en 2012, un master en informatique et en commerce de l'université d'État de San Francisco, où elle s'est concentrée sur la bioinformatique, notamment la génomique et l'analyse d'images biomédicales.

Avertissement: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été examiné ni vérifié

Indexé dans

Google Scholar
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Electronic Journals Library
RefSeek
Hamdard University
Scholarsteer
International Innovative Journal Impact Factor (IIJIF)
International Institute of Organised Research (I2OR)
Cosmos

Voir plus