SIMAP

SIMAP (Similarity Matrix of Proteins; dt.: Ähnlichkeitsmatrix für Proteine) ist eine Datenbank für Proteinähnlichkeiten. Diese Datenbank beinhaltet alle bisher veröffentlichten Proteinsequenzen und wird fortlaufend aktualisiert. Ähnlichkeiten der Proteine werden dabei unter Verwendung des FASTA-Algorithmus berechnet.[1][2][3]

Es handelt sich um die bisher einzige derartige Datenbank, die tatsächlich alle bisher bekannten Proteine mit einbezieht. Seit 2014 wird eine neue SIMAP-Datenbank (SIMAP2) entwickelt. SIMAP2 verwendet den exakten Smith-Waterman-Algorithmus und soll daher eine bessere Empfindlichkeit als das ursprüngliche Projekt erreichen. Dieses wurde Ende 2014 letztmals aktualisiert, bleibt aber noch so lange online, wie es wissenschaftlich relevant ist. SIMAP2 wird nicht mehr mit BOINCSIMAP, sondern mit einem Hochleistungscomputer der Universität Wien berechnet.

Hintergrund

Proteinähnlichkeiten sind ein wichtiges Arbeitsmittel der Bioinformatik. Sie bieten ein Maß für eine Art Verwandtschaftsverhältnis zwischen verschiedenen Proteinen. Da die Zahl der bekannten Proteine bei weitem die Menge übersteigt, die sich experimentell in Labors untersuchen lässt, werden die Eigenschaften bereits untersuchter Proteine auf nahe Verwandte, also sehr ähnliche Proteine, übertragen. Bisher wurden diese Ähnlichkeiten bei Bedarf immer wieder aufs Neue berechnet. Bei SIMAP werden diese Ähnlichkeiten nun nicht bei Bedarf, sondern bereits im Voraus vollständig berechnet und in der Datenbank hinterlegt. SIMAP ist ein Gemeinschaftsprojekt des GSF-Forschungszentrums für Gesundheit und Umwelt in Neuherberg und der Technischen Universität München und steht für Forschung und Lehre vollständig kostenlos zur Verfügung.

BOINCSIMAP

SIMAP@home
Bereich: Biochemie
Ziel: Berechnung der Ähnlichkeit von Proteinsequenzen und Speicherung in einer Datenbank
Betreiber: Universität Wien
Land: Deutschland
Plattform: BOINC
Website: boincsimap.org
Projektstatus
Status: beendet
Beginn: 13.12.2005
Ende: 31.12.2014

Da der immens hohe Rechenaufwand bei der Vorausberechnung der Ähnlichkeiten die SIMAP-Kapazitäten übersteigt, entschloss man sich, mit dem Projekt BOINCSIMAP und dem Programm SIMAP@home auf Mittel des verteilten Rechnens zurückzugreifen. Dazu wurde auf der Basis von FASTA ein Client entwickelt, welcher die BOINC-Infrastruktur nutzt.[4]

Ein weiteres Programm namens HMMER nutzt das Hidden Markov Model zur Suche nach Proteindomänen und wird auch gelegentlich mit BOINCSIMAP eingesetzt.

Für die Analyse der Sequenzähnlichkeiten und Domänen werden unter anderem die Daten aus den Datenbanken PDB, RefSeq, UniProt und GenBank verwendet.[5]

Einzelnachweise

  1. Roland Arnold, Florian Goldenberg, Hans-Werner Mewes, Thomas Rattei: SIMAP—the database of all-against-all protein sequence similarities and annotations with new interfaces and increased coverage. In: Nucleic Acids Research. Band 42, D1, Januar 2014, ISSN 0305-1048, S. D279–D284, doi:10.1093/nar/gkt970, PMID 24165881, PMC 3965014 (freier Volltext).
  2. Thomas Rattei, Patrick Tischler, Stefan Götz, Marc-André Jehl, Jonathan Hoser, Roland Arnold, Ana Conesa, Hans-Werner Mewes: SIMAP—a comprehensive database of pre-calculated protein sequence similarities, domains, annotations and clusters. In: Nucleic Acids Research. Band 38, suppl_1, Januar 2010, ISSN 0305-1048, S. D223–D226, doi:10.1093/nar/gkp949, PMID 19906725, PMC 2808863 (freier Volltext).
  3. T. Rattei, P. Tischler, R. Arnold, F. Hamberger, J. Krebs, J. Krumsiek, B. Wachinger, V. Stumpflen, W. Mewes: SIMAP structuring the network of protein similarities. In: Nucleic Acids Research. Band 36, Database, 23. Dezember 2007, ISSN 0305-1048, S. D289–D292, doi:10.1093/nar/gkm963, PMID 18037617, PMC 2238827 (freier Volltext).
  4. Ralph Hülsenbusch: Deutsche simap@home-Community erstellt Protein-Karte. 8. Juni 2006, abgerufen am 8. Februar 2025.
  5. BOINCSIMAP News (Memento des Originals vom 30. Dezember 2010 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/boincsimap.org – Meldung bei BOINCSIMAP; Stand: 12. Oktober 2007

 

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia