Résumé | GenericBioMatch est un nouvel algorithme permettant d'apparier exactement des séquences biologiques. Il permet au motif de séquences de renfermer une ou plusieurs lettres de remplacement (p. ex. Y, R, W dans des séquences d'ADN) et un ou plusieurs trous d'un nombre déterminé de bases. GenericBiomatch est un algorithme relativement rapide comparé aux algorithmes probabilistes, et son surcoût système est minime. Il peut exécuter un appariement exact de motifs de protéines ou de motifs d'ADN. Cet algorithme peut servir d'outil rapide de validation pour la mise au point d'autres algorithmes, et on peut également l'utiliser comme outil d'appoint avec des algorithmes probabilistes dans le but de réduire le surcoût système. Cet algorithme a été implanté dans le logiciel BioMine (<a href="http://iit-iti.nrc-cnrc.gc.ca/projects-projets/biomine_f.html">http://iit-iti.nrc-cnrc.gc.ca/projects-projets/biomine_f.html</a>), une suite d'outils Java pour l'exploration intégrée de données de génomique. Des tests avec des séquences d'ADN humain, de levure et d'Arabidopsis ont donné de bons résultats. |
---|