Assemblage de transcriptome
Assemblage de transcriptome
Objectif |
Établir le transcriptome de référence d'une espèce, à partir de données de séquençage RNA-Seq. |
---|---|
Prérequis |
Données issues du séquençage de l'ARN (fichiers fastq, paired-end ou single-end), le protéome (optionnel, format: fichier fasta avec les séquences d'acides aminés). |
Livrable |
Un transcriptome potentiellement redondant (format fasta), un fichier Word comprenant un tableau de métriques (nombre de transcrits, N50, taille moyenne, taille médiane, longueur totale, remapping des reads, score BUSCO) et un rapport html (pour consulter un exemple). |
Méthode |
DRAP (De novo RNA-Seq Assembly Pipeline) runDRAP : nettoie les données (TrimGalore) et assemble un transcriptome avec Oases ou TrinityrunMeta fusionne des assemblages (provenant de runDrap) par clustering (avec cd-hit, et tgicl) runAssessment calcule les métriques (nombre de transcrits, N50, taille moyenne, taille médiane, longueur totale...), un score de remapping des reads et un score de complétion du jeu de données avec BUSCO. |