Prédiction de gènes

En bio-informatique, la prédiction de gènes consiste à identifier les zones de l'ADN qui correspondent à des gènes (le reste étant non codant).

Deux approches

Prédiction par similitude

Les méthodes par similitudes, aussi appelées méthodes par homologie ou méthodes extrinsèques, consistent à utiliser des informations extérieures au génome pour trouver les gènes. Plus précisément, ces méthodes consistent à comparer la séquence étudiée avec des séquences connues, rassemblées dans les bases de données. Par exemple les séquences associées à des marqueurs de séquence exprimée ou des ARN messagers sont utilisées[1].

Comme les séquences peuvent être proches mais rarement égales, on utilise en plus des algorithmes d’alignement de séquences, comme l'algorithme de Smith-Waterman ou l'heuristique BLAST[1].

Prédiction Ab Initio

Les prédictions Ab Initio, aussi appelées De Novo ou intrinsèques, sont des méthodes qui ne travaillent que sur la séquence elle-même. De façon générale il y a deux propriétés qui permettent de trouver un gène :

Notes et références

  1. a et b Catherine Mathé, Marie-France Sagot, Thomas Schiex et Pierre Rouzé, « Current methods of gene prediction, their strengths and weaknesses », Nucleic Acids Research, vol. 30, no 19,‎ , p. 4103-4117 (lire en ligne)
  2. Hélène Touzet, « Présentation : Prédiction de gènes », sur Laboratoire d'informatique fondamentale de Lille

Liens externes