Das Programm verfügt über eine der schnellsten bekannten Implementierungen für Multiplikationen, in dem es hochoptimierten Prozessor-Code zur Durchführung von schnellen Fourier-Transformationen verwendet. Die zugehörigen Routinen stehen als gwnum-Bibliothek in der Programmiersprache C zur Verfügung und werden von einigen anderen Programmen eingesetzt. Die gwnum ist frei nutzbar, jedoch müssen bei der Suche nach Mersenne-Primzahlen die Projektbedingungen (Software End User License Agreements „EULA“)[2] eingehalten werden.
Der Code für die Generierung von Prüfsummen ist aus Sicherheitsgründen nicht öffentlich vorhanden.[3]
Das Programm kann als Software-Client für das PrimeNet, einer von GIMPS betriebenen zentralen Datenbank für Mersenne-Primzahlen, betrieben werden. Es verbindet sich dann in regelmäßigen Abständen mit dem PrimeNet-Server, um neue Arbeit anzufordern und fertige Ergebnisse abzuliefern. Die Berechnung erfolgt auf der CPU, während diese ungenutzt ist. Eine offizielle Unterstützung für GPUs existiert noch nicht. Mit CUDALucas (Lucas-Lehmer-Test) und mfaktc (Probedivision) existieren allerdings zwei CUDA-fähige Programme, deren Ergebnisse vom Server ebenfalls akzeptiert werden. Das PrimeNet verfügt Mitte 2011 über rund 62 Teraflops Rechenleistung.[4]
Belastungstest
Prime95/Mprime kann unabhängig von der Teilnahme an PrimeNet und ohne Netzwerkverbindung als Belastungstest für Prozessoren verwendet werden, da interne Plausibilitätsprüfungen eventuell auftretende Rechenfehler oder Stabilitätsprobleme sichtbar machen. Die Intention der Programmverwendung ist dabei nicht die Suche nach Primzahlen, sondern eine möglichst intensive Auslastung der Prozessoren, welche zu einer hohen thermischen Belastung führt und so beispielsweise unzureichend montierte Kühlkörper am Prozessor nachweist. Neben der einfachen Prüfung von Standardhardware auf korrekte Funktion unter Belastung wird diese Funktion auch bei dem Übertakten und Betrieb von Prozessoren außerhalb der Herstellerspezifikation als Stabilitätstest eingesetzt.[5]
Rechenleistung
Das Programm kann als Benchmark verwendet werden. Die Ergebnisse können der Öffentlichkeit automatisch durch den PrimeNet-Server[6][7] zum Vergleich dargestellt werden.
1) Durchsatz pro Zeitspanne, welche Zeitspanne das ist, ist irrelevant.
2) Durchsatz geteilt durch die Taktfrequenz in GHz, keine Messungen bei 1 GHz Taktfrequenz (ergibt andere Werte)
3) Durchsatz geteilt durch die Taktfrequenz in GHz und die TDP in Watt, multipliziert mit der Kernanzahl. Dieser Wert ist Unsinn, da höhere Taktfrequenzen zweimal „weggerechnet“ werden, einmal durch Division durch den Takt, ein zweites Mal durch Division der TDP bei diesem Takt. TDP ist weiterhin nicht die Leistungsaufnahme bei Prime95.
Faktorisierungsmethoden und Primzahltest
Prime95 kann zur Faktorisierung von Zahlen der Form benutzt werden. Im Normalfall sucht es jedoch nur nach Mersenne-Primzahlen, für die a = 1, b = 2, c = Primzahl und d = −1 gilt.
Das Programm unterstützt die Faktorisierungsmethoden:
Bezüglich der Menge aller zu testenden Zahlen, wird die Faktorisierungsmethode Probedivision dem eigentlichen Lucas-Lehmer-Primzahltest vorgeschaltet, um vergleichsweise schnell kleine Faktoren q in einzelnen Zahlen zu finden. Die Faktorisierungsmethode Probedivision zeigt Zahlen auf, die zusammengesetzt sind und deshalb keine Mersenne-Primzahlen sind. Diese Zahlen werden mit Hilfe des PrimeNet-Servers administriert. Auf sie kann der ECM-Test angewendet werden, der mögliche weitere Faktoren mit einer Länge bis etwa 60 Dezimalstellen effektiv findet. Hiernach wird mit jenen Zahlen, welche diesen ECM-Test durchlaufen, bei Bedarf zum Zahlkörpersieb übergegangen, das vom BOINC-Projekt NFS@Home angeboten wird.
Probedivision mit Grafikkarten
Seit den Anfängen der programmierbaren Grafikprozessoren im Jahr 2000 besteht die Möglichkeit, die Rechenleistung von Grafikkarten zur Berechnung von parallelisierbaren Rechenoperationen zu nutzen (GPGPU). In Zusammenarbeit der Firmen AMD, IBM, Intel und Nvidia wurde der erste Entwurf für OpenCL, eine Programmierschnittstelle u. a. für Grafikprozessoren, ausgearbeitet und schließlich bei der Khronos Group eingereicht.[25][26]
Durch den derzeitigen Überschuss an GIMPS-Rechenkapazität im Bereich Probedivision durch GPGPU-Unterstützung leistungsfähiger Grafikkarten mittels der mfaktc Software und OpenCL, werden seit August 2011 höhere Obergrenzen verwendet.[27] Da der Aufwand der Probedivision bei mfaktcproportional zur Faktorgröße ist, d. h. nur von der Größe des Faktors abhängt, wird diese Software für größere Faktoren zunehmend ungeeignet. Es wird im Vergleich zu den beiden anderen Faktorisierungsmethoden Probedivision und P1 Test jedoch kaum Arbeitsspeicher benötigt, d. h. geeignete Grafikkarten mit vergleichsweise geringem Grafikarbeitsspeicher reichen aus.
P-1-Test
Bezüglich der Menge aller zu testenden Zahlen, wird der P-1-Test dem eigentlichen Lucas-Lehmer-Primzahltest vorgeschaltet, um effektiv mittelgroße Faktoren q in einzelnen Zahlen zu finden. Er erfolgt im Anschluss an die Probedivision und findet Faktoren, die stark zusammengesetzt sind. Man weiß, dass mögliche Faktoren q von den Aufbau haben müssen.[28] Der Teil k ist hierbei meist selbst zusammengesetzt. Das Verfahren findet den Faktor q, solange alle Faktoren von k kleiner als die sogenannte B1-Grenze sind (Stufe 1) oder alle bis auf einen kleiner als B1 und der verbleibende letzte Teilfaktor von k kleiner als die sogenannte B2-Grenze ist (Stufe 2, mit B2 ≈ 30*B1). In seltenen Fällen können durch die sogenannte Brent-Suyama-Erweiterung aber auch Faktoren gefunden werden, die das B2-Kriterium eigentlich nicht erfüllen.[29] Der Berechnungsaufwand ist abhängig von der Größe des Exponenten sowie der Wahl von B1 und B2. Stufe B2 benötigt viel Arbeitsspeicher.
LL-Test
Der rechenaufwändige Lucas-Lehmer-Primzahltest wird dann nur noch auf die Untermenge alle Zahlen angewendet, für die obige Faktorisierungsmethode ergebnislos blieben. Im Normalfall erfolgt die Zuweisung von zu testenden Zahlen automatisch durch PrimeNet. Die Grenze, bis zu der Faktoren im Rahmen der Probedivision gesucht werden, ist abhängig von der zu testenden Zahl und steigt mit ihrer Größe an. Die aufwandsoptimalen Obergrenzen sind in der Tabelle Probedivision genannt. Sie werden empirisch ermittelt.
ECM-Test
Die „Elliptic Curve Method“ (ECM) wird auf Zahlen angewendet, die vom PrimeNet-Server zugewiesen werden. Der ECM-Test findet große Faktoren q mit einer Länge bis etwa 60 Dezimalstellen effektiv. Die Exponenten aus der automatischen ECM-Zuweisung des PrimeNet-Servers sind derzeit siebenstellig. Eine Zuweisung erfolgt nur nach entsprechender Einstellung in Prime95 oder manueller Anforderung über die Projekt-Webseite. Es verfügt ebenfalls über eine B1- und B2-Grenze (B2 = 100*B1). Auch hier benötigt Stufe B2 viel Arbeitsspeicher.
Programmoptionen
Arbeitstypen unter Worker Windows
Abkürzung
Bedeutung
GIMPS
was sinnvoll ist (Serverwahl, Standardeinstellung)
TF
Probedivision
TF-LMH
Probediv. LMH(Lone Mersenne Hunters), kleine Faktoren
PM1-L
Faktorisierung P-1, große Expon. (vor Lucas-Lehmer)
Auf der Projekt-Webseite kann in den Worker Windows (Prime95) bzw. Workers (MPrime) festgelegt werden, welche Art von Arbeit man erhalten möchte, zum Beispiel ein Faktorisierungsverfahren oder den Lucas-Lehmer-Test. Dies kann auch im Programm selbst vorgenommen werden. Unter Status sieht man die Arbeiten, die man erhalten hat, sowie die erwarteten Vervollständigungsdaten. Die Arbeiten werden in der Datei worktodo.txt gespeichert. Bei Unreserve Exponent kann man einen Exponenten freigeben. Die Prozentzahl einer erledigten Arbeit wird automatisch an GIMPS weitergeleitet, man kann sie jedoch auch im Programm bei Manual PrimeNet Communication (Advanced → Manual Communication…) manuell zur Website schicken, indem man ein Häkchen bei Send new expected completion dates to server setzt. Dabei werden die neuen Vervollständigungsdaten zum Server geschickt.
Man kann mit dem Programm anonym oder mit einem GIMPS-Nutzerkonto arbeiten. Das Nutzerkonto sowie der Computername müssen im Fenster Configure PrimeNet (Test → PrimeNet…) eingegeben werden. Will man anonym arbeiten, muss man die Felder leer lassen. Die Ergebnisse sind in der Datei results.txt ersichtlich, die Erneuerungen in Versionen in der Datei whatsnew.txt.
Versionen
Ausgewählte Haupt-Versionen:
Version 28, letzte Version 28.9, 29. März 2016 (Beschleunigung für Multi-Thread-Fälle im Vergleich zu Version 27, erreicht durch Nutzung von Opcodes der Intel Haswell CPUs im FFT-Bereich und durch Reduzierung der Speichertransfers)[30]
Version 27, letzte Version 27.9, 12. Dezember 2012, mit AVX-Unterstützung (~30 % Beschleunigung ab Intel-Sandy-Bridge-Mikroarchitektur (Core 2xxx / Core 3xxx) im Vergleich zu Version 26)[31]
Version 26, letzte Version 26.6, 4. April 2011 (~20 % Beschleunigung für Core-i-Generation im Vergleich zu Version 25)
Version 25, letzte Version 25.11, 13. Juli 2009 (PrimeNet 5.0 Protokoll)
Version 24, letzte Version 24.14, Februar 2006 (PrimeNet 4.0 Protokoll)
↑„[…] verkündete die Khronos Group am 9. Dezember 2008 die Veröffentlichung der OpenCL 1.0-Spezifikation […] Unmittelbar nach der Freigabe der OpenCL 1.0-Spezifikation kündigte AMD die beabsichtigte schnelle Übernahme des OpenCL 1.0-Programmierstandards sowie die Integration eines kompatiblen Compilers und einer kompatiblen Laufzeitumgebung in sein kostenloses ATI Stream SDK an […] Durch die enge Kooperation mit OpenCL-Content- und Softwareentwicklern konnte AMD eine Entwicklerversion des ATI Stream SDKs mit OpenCL 1.0-Unterstützung erstellen. Das offiziell freigegebene ATI Stream SDK v2.0 mit OpenCL 1.0-Unterstützung ist seit der zweiten Jahreshälfte 2009 verfügbar.“ AMD – Die Geschichte des GPGPU-Computings in aller Kürze (Memento des Originals vom 27. Mai 2013 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.amd.com; Webzugriff am 2. Mai 2012