Detection of structural variants in cancer genomes using a Bayesian approach. You will find below the abstract of my PhD thesis

Résumé : Il est admis actuellement que le cancer se développe à la suite d’un processus de mutations sur l’ADN d’un génome. En sus des mutations ponctuelles, les génomes tumoraux contiennent souvent un nombre significatif de rearrangements chromosomiques appelés variantes structurales (SV). Certains types de cancer sont associés à des variantes structurales récurrentes (ABL/BCR dans la leucémie myeloïde chronique, EWSR/FLI1 dans le sarcoma d’Ewing, l’amplification de MYCN dans le neuroblastome, l’amplification de ERBB2 dans les cancers de l’ovaire ou du sein, certains SV dans le promoteur de TAL1 pour la leucémie lymphoblastique). Il est important d’identifier les positions exactes et les types de ces variantes pour pouvoir suivre l’évolution du cancer et choisir le traitement le plus approprié pour le malade. Le séquençage Nouvelle Génération (NGS) ouvre la possibilité d’identifier rapidement et précisémement des variantes structurales Je propose une nouvelle méthode, SV-Bay, pour détecter des variantes structurales à partir de données de séquençage. Cette méthode combine deux techniques en une seule: elle prend en compte les anomalies dans l’alignement de données “paired-end” et les variations de taux de couverture. SV-Bay utilise une approche probabiliste bayésienne. où le modèle statistique prend en compte les erreurs de séquençage, le profil de mappabilité le long du genome et les variations de contenu en GC. D’une part, cette méthode améliore la précision en filtrant efficacement de faux candidats SV. D’autre part, la prise en compte de la mappabilité des “reads” et du contenu en GC assure une excellente sensibilité. De plus, SV-Bay inclut la possibilité de ne garder que les SV somatiques lorsque des données sur un génome normal de contrôle sont disponibles. Ce travail présente une comparaison approfondie de SV-Bay et de 4 outils de detection de variantes stucturales fréquemment utilisés: Delly, GASVPro, Lumpy et BreakDancer (BreakDancerMax). Cette comparaison se base sur des données “mate-pair” et “pair-end” simulées et sur des données “mate-pair” provenant d’une lignée cellulaire du neuroblastome CLB-GA. Sur tous les ensembles de données simulées, SV-Bay obtient les meilleures performances à la fois sur le “recall” et sur la precision. Sur les données expérimentales du neuroblastome, les variantes structurales découvertes par SV-Bay permettent l’interprétation de 78% des points de rupture dans le profil du nombre de copies, calculé avec un tableau Affymetrix SNP6.0 . Sa spécificité est bien meilleure: il propose moins de SVs potentielles que les trois autres outils. Une contribution originale de ma thèse est un nouveau catalogue exhaustif des types de variantes structurales. Sur la base de publications récentes et de données expérimentales, je propose 17 types de variantes structurales. Sept d’entre elles sont ignorées par les algorithmes de détection de SV. Ce catalogue, le plus à jour actuellement, a été utilisé par SV-Bay pour annoter des SV prédites.
Type de document :
Thèse
Computer Science [cs]. Ecole Polytechnique, 2015. English
Liste complète des métadonnées

Littérature citée [52 références]  Voir  Masquer  Télécharger

https://hal-polytechnique.archives-ouvertes.fr/tel-01294142
Contributeur : Daria Iakovishina <>
Soumis le : dimanche 27 mars 2016 - 16:26:29
Dernière modification le : jeudi 11 janvier 2018 - 06:19:44
Document(s) archivé(s) le : lundi 14 novembre 2016 - 06:43:04

Identifiants

  • HAL Id : tel-01294142, version 1

Citation

D Iakovishina. Detection of structural variants in cancer genomes using a Bayesian approach. You will find below the abstract of my PhD thesis. Computer Science [cs]. Ecole Polytechnique, 2015. English. 〈tel-01294142〉

Partager

Métriques

Consultations de la notice

352

Téléchargements de fichiers

456