Pour avoir connu moult galères dans la quête d’un jeu de données (en l’occurrence issu de Ion Torrent) afin de tester des versions de pipelines analytiques ou pour optimiser les paramètres de ceux-ci, nous avons décidé de publier un jeu de données, les résultats en sortie de pipeline et les conclusions statistiques puis biologiques qui en découlent. Avant, dans et après la moulinette bio-informatique.
En espérant, que ceci puisse éviter des galères à d’autres… :
Targeted metagenomic sequencing data of human gut microbiota associated with Blastocystis colonization
Concernant l’exploitation « biologique » de ce jeu de données, l’article publié dans Scientific Data est rattaché à celui-ci :
Colonization with the enteric protozoa Blastocystis is associated with increased diversity of human gut bacterial microbiota
Le choix d’une méthode analytique confortable, fiable, adaptée au profil de données (avec un peu ou beaucoup d’erreurs liées à la technologie de séquençage utilisée), à votre degré d’expertise, est souvent un casse-tête et un dédale qui occupent certains partenaires d’un projet nécessitant le recours à une analyse métagénomique ciblée. D’autres encore décident de ne pas décider, de ne pas se lancer dans le labyrinthe et votent ainsi pour une solution tout-terrain, sorte de martingale génomique, proposée par des prestataires de services.
Cet article de Plos One : Assessment of Common and Emerging Bioinformatics Pipelines for Targeted Metagenomics tente – ayant un conflit d’intérêt majeur, je n’en ferai pas la critique – d’identifier les grandes approches algorithmiques disponibles. Quels sont les paramètres influençant la qualité des résultats ?
Ce travail a permis de fournir un canevas généralisable permettant d’évaluer un pipeline analytique et d’observer dans quelle mesure ce dernier influe sur la qualité des résultats. Concernant le protocole mis en place ainsi que d’autres ressources nécessaires (jeu de données simulées, réelles etc.) vous pourrez consulter la page dédiée à ce travail sur le site de PEGASE-biosciences.
Un petit tableau synoptique permet de synthétiser les caractéristiques principales des pipelines évalués dans l’article.
Un article du Sydney Morning Herald du 20 novembre 2016 réalise un assez bon plan de communication pour la société Microba.
L’objet : les tribulations gastro-dentaires d’un testeur du service que souhaite bientôt proposer la société investissant le marché de la métagénomique personnelle… Dans la roue des sociétés proposant des services de génomique personnelle voire de génomique récréative, voici venir celles proposant d’appliquer le séquençage haut-débit couplé à de l’analyse automatisée de séquences pour révéler une part de ce qui constitue votre microflore corporelle. Presque triviales, ces analyses métagénomiques sont aujourd’hui à la portée de qui peut les payer. Vous qui ne savez qu’offrir à Noël… peut être une piste de cadeau ! La question que l’on peut légitimement se poser est : à quelles fins analyser votre flore intestinale…? revenons sur l’article du Sydney Morning Herald pour tenter d’y trouver un intérêt ou deux.
L’article commence sur un mode enthousiaste, la technologie permet de révéler une part de notre microbiote… à quoi bon s’en priver ? Le gonzo-journaliste rédacteur de l’article se propose comme cobaye et reçoit des « cotons tiges » de prélèvements qui lui permettent de procéder à l’envoi d’échantillons censés être des prélèvements de sa microflore corporelle -buccale et intestinale. Pas simple l’échantillonnage de la flore intestinale avec un coton tige ! Ainsi que le dit Dr Alena Rinke, porte-parole de Microba : « la recherche dans ce domaine vient d’exploser au cours des cinq ou dix dernières années. Nous constatons qu’il existe un nombre incroyable de liens entre les microbes de notre corps et des états pathologiques« . Ces « liens » peuvent être très divers : diabète, cancer du côlon, maladie inflammatoire de l’intestin, mélanome, polyarthrite rhumatoïde. En guise de commentaire, disons que tout comme corrélation n’est pas raison, liaison n’est pas causalité non plus. L’argument santé finit de motiver le jeune investigateur de sa flore intérieure. Donc le journaliste expédie ses cotons tiges à la société australienne qui réalise une métagénomique ciblée (séquençage haut-débit d’une portion du gène de l’ARN 16S).
Six semaines plus tard, ses résultats lui parviennent. Bilan : beaucoup de Ruminococcus, Blautia, Prevotella copri. Le petit bestiaire personnel qu’il héberge le fascine. Le test de Microba tente de mettre une couche d’interprétation de ces données de séquences mais le rendu semble un peu insatisfaisant pour le jeune intrépide. Il demande au professeur Andrew Holmes (plutôt sceptique sur l’intérêt du service) d’examiner rapidement ses résultats. La première métrique clé qui lui saute aux yeux est le nombre de Proteobacteria présente, dit – il. » En général, une personne en bonne santé a une faible proportion de bactéries dites « pro-inflammatoires ». Il faudrait pour Proteobacteria être inférieur à 5 %, et idéalement moins de 2 %. »
Le journaliste se voit rassuré avec une proportion de Proteobacteria, inférieure à 1 %.
Son microbiote est légèrement plus diversifié que la moyenne – c’est un bon point. Cela signifie qu’il est en bonne santé avec/grâce à un régime alimentaire équilibré et lui-même diversifié. Dans l’ensemble, le test de Microba conclut que sa flore intestinale suggère qu’il est en «excellente» santé avec un IMC de 20,7. Basé sur l’information de son microbiote, le test prédit qu’il a 28 ans (plutôt pas mal puisqu’il en accuse 26, avec un IMC de 21,9).
L’enthousiasme retombe un peu quand le cobaye-journaliste promoteur du service de Microba apprend qu’il a des proportions de Dialister en quantités supérieures à la moyenne. Dialister est un bon prédicteur de la gingivite. Il va donc se programmer une visite chez le dentiste ce qui fait toujours plaisir !
Comme l’a fait remarquer le professeur Holmes, les résultats reçu par le journaliste comporte beaucoup de données intéressantes – mais pas beaucoup d’idées utiles. A l’instar de ce que l’on a pu constater pour d’autres fournisseurs de « génomique personnelle », chaque échantillon reçu par Microba permet d’améliorer sa méthode de prédiction d’éléments interprétés du microbiote. Le service sera lancé au public au début d’année 2017.
Moralité : à moins d’avoir un Holmes sous la main, ces sociétés devront fournir à leurs clients des résultats automatiquement pré-interprétés pour que ces derniers puissent avoir un outil influençant leur mode de vie ou leur gestion de planning-dentiste. En effet, l’inventaire à la Prévert de ce que l’on a dans le ventre n’a que peu de sens et nécessiterait d’être remis en perspective. Cette liste, ces métriques devraient être rattachées à la singularité du client du service pour réellement pouvoir lui être utiles. Un modèle prédictif basé sur une méthode d’apprentissage automatique ne peut suffire ! On comprend que plus Microba va séquencer, plus précis sera son modèle mais son développement futur passera par une meilleure intégration d’un résultat interprétable par le commun des mortels.
Qui sommes nous?
Christophe Audebert [@]
En charge de la plateforme génomique du département recherche et développement de la société Gènes Diffusion .
Renaud Blervaque [@]
Biologiste moléculaire, chargé d'études génomiques.
Gaël Even [@]
Responsable bioinformatique au sein du département recherche et développement de la société Gènes Diffusion.Catégories
- Analyse de données (14)
- Automatisation (5)
- Bioinformatique (27)
- Biologie (56)
- biologie transverse (35)
- Biotechnologie (30)
- Chronique littéraire (8)
- Comparatif (6)
- Diagnostic (8)
- Economie (17)
- Epidemiologie (2)
- Evénement (17)
- Formation (3)
- Gestion de projet (5)
- Grille de calcul (1)
- Intégration (5)
- Logiciels (8)
- Médecine (14)
- politique de la recherche (17)
- Recherche (21)
- Séquençage (70)
- Séquenceur (39)
- Uncategorized (25)
- Workflow (4)
Accès rapide aux articles
- Covid-19 : zoom sur les vaccins
- Comment l’ADN pourrait être le stockage de données du futur
- COVID-19 : la data visualisation au service de la science
- COVID-19 : des explications et un point d’étape au 20 février 2020
- Pour mettre du vin dans son eau
- Des petits trous, toujours des petits trous…
- Qui serait candidat ?
- Un robot pour analyser vos données…
- Monde de dingue(s)
- L’art et la manière de développer une qPCR
- Un MOOC Coursera sur le WGS bactérien
- Chercheurs & enseignants-chercheurs, l’art du multitâche.
- Un jeu de données métagénomiques
- Facteur d’impact
- Microbiote & smart city : juxtaposition de tendances
Accès mensuels
- février 2021 (1)
- décembre 2020 (1)
- février 2020 (2)
- septembre 2019 (1)
- avril 2018 (2)
- décembre 2017 (1)
- novembre 2017 (2)
- juillet 2017 (2)
- juin 2017 (5)
- mai 2017 (4)
- avril 2017 (3)
- mars 2017 (1)
- janvier 2017 (2)
- décembre 2016 (3)
- novembre 2016 (4)
- octobre 2016 (2)
- septembre 2016 (2)
- août 2016 (3)
- juillet 2016 (2)
- juin 2016 (4)
- mai 2016 (3)
- mars 2016 (1)
- novembre 2015 (2)
- avril 2015 (1)
- novembre 2014 (1)
- septembre 2014 (1)
- juillet 2014 (1)
- juin 2014 (1)
- mai 2014 (1)
- avril 2014 (1)
- mars 2014 (1)
- février 2014 (3)
- janvier 2014 (1)
- décembre 2013 (5)
- novembre 2013 (2)
- octobre 2013 (2)
- septembre 2013 (1)
- juillet 2013 (2)
- juin 2013 (2)
- mai 2013 (4)
- avril 2013 (2)
- mars 2013 (1)
- février 2013 (3)
- janvier 2013 (2)
- décembre 2012 (2)
- novembre 2012 (2)
- octobre 2012 (2)
- septembre 2012 (2)
- août 2012 (1)
- juillet 2012 (3)
- juin 2012 (5)
- mai 2012 (5)
- avril 2012 (6)
- mars 2012 (6)
- février 2012 (8)
- janvier 2012 (6)
- décembre 2011 (5)
- novembre 2011 (6)
- octobre 2011 (6)
- septembre 2011 (7)
- août 2011 (5)
- juillet 2011 (8)
Pages