Prédiction de gènes
Prédiction de gènes sur un génome
Objectif |
Obtenir les séquences de prédiction de gènes dans une espèce donnée. |
---|---|
Prérequis |
Génome assemblé (fichier .fasta), données de RNA-Seq (fichiers .fastq), protéomes (optionnel : séquences d'acides aminés en .fasta). |
Livrables |
Un GFF de l'annotation, un fichier fasta de séquences transcriptomiques prédites, un fichier fasta de séquences protéiques prédites, un fichier Word comprenant un tableau de métriques (nombre de transcrits, N50, taille moyenne, taille médiane, longueur totale, remapping des reads, score BUSCO). |
Méthodes |
- RepeatModeler et RepeatMasker (masque les séquences répétées du génome) - STAR et Cufflinks pour les mapping RNA-Seq - Exonerate (mapping protéines) - BRAKER (comprend Genemark-ET et AUGUSTUS , prédiction de séquences) - MAKER (fignolage de prédiction et reprise de tous les mappings) - DrapAssessment calcule les métriques (nombre de transcrits, N50, taille moyenne, taille médiane, longueur totale...), un score de remapping des reads et un score de complétion du jeu de données avec BUSCO. |