Questions to answer with the pipeline (biologist)
- Quelles bactéries ai-je dans le milieu ?
- Quels gènes sont présents dans le milieu ?
- Pour une fonction donnée, qui a cette fonction/gène dans le milieu? --> construire un script qui à partir d'une liste de fonctions (example: PFAMs ids) (ou à partir d'une liste de clusters de gènes qui ont une fonction ou des fonctions en particulier) aille chercher les gènes qui ont pour représentant les clusters ids ayant ces fonctions et aille chercher les contigs auquels ils appartiennent (c'est inclut dans le nom des gènes) et leur affiliation taxonomique. Lorsqu'on aura le binning, ça pourra être géré autrement (partir des bins et de l'annotation des gènes sur les contigs dans chaque bin par exemple).
Edited by Celine Noirot