Aller au contenu Aller au menu Aller à la recherche

accès rapides, services personnalisés
Rechercher
Biologie Intégrative des Organismes Marins
UMR 7232

Prédiction de gènes

Prédiction de gènes sur un génome

Objectif

Obtenir les séquences de prédiction de gènes dans une espèce donnée.

Prérequis

Génome assemblé (fichier .fasta), données de RNA-Seq (fichiers .fastq), protéomes (optionnel : séquences d'acides aminés en .fasta).

Livrables

Un GFF de l'annotation, un fichier fasta de séquences transcriptomiques prédites, un fichier fasta de séquences protéiques prédites, un fichier Word comprenant un tableau de métriques (nombre de transcrits, N50, taille moyenne, taille médiane, longueur totale, remapping des reads, score BUSCO).

Méthodes

- RepeatModeler et RepeatMasker (masque les séquences répétées du génome)

- STAR et Cufflinks pour les mapping RNA-Seq

- Exonerate (mapping protéines)

- BRAKER (comprend Genemark-ET et AUGUSTUS , prédiction de séquences)

- MAKER (fignolage de prédiction et reprise de tous les mappings)

- DrapAssessment calcule les métriques (nombre de transcrits, N50, taille moyenne, taille médiane, longueur totale...), un score de remapping des reads et un score de complétion du jeu de données avec BUSCO.

08/02/21

Traductions :