Dieser Artikel erläutert den Dotplot in der Bioinformatik; zum Dotplot in der Statistik siehe Dotplot (Statistik).
Ein Dotplot (englisch für „Punktauftragung“) ist eine graphische Methode der Bioinformatik zwei biologische Sequenzen miteinander (oder eine Sequenz mit sich selbst) zu vergleichen. Dabei werden die Sequenzen auf die horizontale und vertikale Achse (oben und links) aufgetragen und Übereinstimmungen zwischen einer Zeile und Spalte an der entsprechenden Schnittstelle durch einen Punkt (englisch „dot“) markiert.
Der Dotplot dient der Auffindung von ähnlichen bzw. übereinstimmenden Regionen. Diese Darstellung wurde erstmals 1970 von Gibbs und McIntyre publiziert und wurde seitdem weiterentwickelt.[1] Obwohl fast 50 Jahre alt, finden Dotplots noch immer Eingang in aktuelle Publikationen, wie z. B. bei der Analyse der epigenetischen Steuerung in Pflanzen.[2]
Auf dem Bild rechts ist eine DNA-Sequenz mit sich selbst verglichen worden. Neben der zu erwartenden, vollständigen Übereinstimmung der Sequenz, erkennbar durch die Diagonale (links oben nach rechts unten), ergeben sich noch weitere, regionale Ähnlichkeiten.
Eine Unterbrechung der Diagonalen mit nach unten oder rechts verschobener Fortsetzung würde Insertionen (z. B. Introns) bzw. Deletionen aufzeigen (hier nicht der Fall).
Linien außerhalb der Hauptdiagonalen stehen für ähnliche oder repetitive Einheiten.
SynMap – Web-basiertes Tool, um Dotplots für viele Genome zu generieren. Durch die Genomik-Plattform CoGe ist der Zugang zu einer umfangreichen Datenbank möglich.
↑Adrian J. Gibbs, George A. Mcintyre: The Diagram, a Method for Comparing Sequences. Its Use with Amino Acid and Nucleotide Sequences. In: European Journal of Biochemistry. Band16, Nr.1, September 1970, ISSN0014-2956, S.1–11, doi:10.1111/j.1432-1033.1970.tb01046.x.
↑Aoi Hosaka, Raku Saito, Kazuya Takashima, Taku Sasaki, Yu Fu: Evolution of sequence-specific anti-silencing systems in Arabidopsis. In: Nature Communications. Band8, Nr.1, Dezember 2017, ISSN2041-1723, doi:10.1038/s41467-017-02150-7, PMID 29255196, PMC 5735166 (freier Volltext) – (nature.com [abgerufen am 13. Mai 2018]).
↑Peter Rice, Ian Longden, Alan Bleasby: EMBOSS: The European Molecular Biology Open Software Suite. In: Trends in Genetics. Band16, Nr.6, Juni 2000, ISSN0168-9525, S.276–277, doi:10.1016/s0168-9525(00)02024-2 (elsevier.com [abgerufen am 13. Mai 2018]).
↑Erik L.L. Sonnhammer, Richard Durbin: A dot-matrix program with dynamic threshold control suited for genomic DNA and protein sequence analysis. In: Gene. Band167, Nr.1-2, Dezember 1995, ISSN0378-1119, S.GC1–GC10, doi:10.1016/0378-1119(95)00714-8 (elsevier.com [abgerufen am 13. Mai 2018]).
↑Ryan Brodie, Rachel L. Roper, Chris Upton: JDotter: a Java interface to multiple dotplots generated by dotter. In: Bioinformatics. Band20, Nr.2, 22. Januar 2004, ISSN1367-4803, S.279–281, doi:10.1093/bioinformatics/btg406 (oup.com [abgerufen am 13. Mai 2018]).
↑Kathrin M. Seibt, Thomas Schmidt, Tony Heitkam: FlexiDot: Highly customizable, ambiguity-aware dotplots for visual sequence analyses. In: Bioinformatics. doi:10.1093/bioinformatics/bty395 (oup.com [abgerufen am 14. Mai 2018]).
↑Jan Krumsiek, Roland Arnold, Thomas Rattei: Gepard: a rapid and sensitive tool for creating dotplots on genome scale. In: Bioinformatics. Band23, Nr.8, 15. April 2007, ISSN1367-4803, S.1026–1028, doi:10.1093/bioinformatics/btm039 (oup.com [abgerufen am 13. Mai 2018]).