Die Xorshift-Generatoren bilden eine Klasse moderner Pseudozufallszahlengeneratoren. Durch geringe Anforderungen an Speicher und Prozessor sind sie auch für den Einsatz auf Systemen mit geringen Ressourcen, z. B. Eingebettete Systeme, geeignet. Vorgestellt wurde der Xorshift-Generator im Jahr 2003 von seinem Entwickler George Marsaglia.[1]
Der Zustand des Generators ist ein Bitvektor mit Bit, der zur Berechnung des nächsten Zustandes mit einer binären n×n Matrix multipliziert wird. Mit den Elementen wird dabei modulo 2 gerechnet im Körper GF(2). Die Addition von Elementen (Bits) wird dabei zur XOR-Verknüpfung und die Multiplikation zur UND-Verknüpfung. Die Periodenlänge des Generators beträgt , wenn mit einem von Null verschiedenen Wert initialisiert und die Matrix geeignet gewählt wird. Dies wird mit genau den Matrizen erreicht, die in der Allgemeinen linearen Gruppe GL(n,2) (der Gruppe der invertierbaren binären n×n Matrizen mit der Multiplikation) die Elementordnung haben.
Die Matrix wird außerdem so konstruiert, dass sich die Multiplikation mit dem Zustandsvektor einfach und effizient mit wenigen Maschinenoperationen (Bitverschiebung, und bitweise XOR-Verknüpfung) ausführen lässt. Die Entwickler gingen von solchen Darstellungen in Maschinenoperationen aus und prüften, ob die dadurch definierte Multiplikationsmatrix die Elementordnung hat.
Es zeigte sich: wenn ein Computerwort mit oder Bit ist, dann entsprechen die drei aufeinanderfolgenden Operationen
einer Multiplikation mit einer Matrix der Ordnung , wenn die konstanten Schiebeweiten geeignet gewählt werden.
Um längere Perioden als zu erhalten, kann man den Zustand des Generators auch mit mehreren Wörtern darstellen:
Der Zustand dieses Generators ist durch die Wörter gegeben ( bis sind die Saatwerte). Wenn die Wortlänge ist, enthält der Zustand somit Bit. Es werden wiederum so gewählt, dass obige Operationen eine Multiplikation des Zustandsvektors mit einer n×n-Matrix der Elementordnung entsprechen, welche den nächsten Zustand ergibt. Nach jedem solchen Rechenschritt wird als Ergebnis ausgegeben und inkrementiert.
Man erhält in der Regel bessere Zufallszahlen, wenn man statt eine etwas komplexere Funktion des Zustands ausgibt, zum Beispiel mit einem ungeraden konstanten Multiplikator oder .[1]
Initialisierung
Der Anfangszustand des Generators darf nicht Null sein; mindestens eines der Zustandsbits muss den Wert 1 haben. Ansonsten erhält man einen Generator der Periodenlänge 1, der immer nur 0 ausgibt, da nur durch Shift- und XOR-Operationen aus einer Serie von „0“ niemals eine „1“ hervorgehen kann.
Von schlechter Initialisierung, d. h. nur wenige 1-Bits im Zustandsvektor, erholt sich der Xorshift relativ schnell dank seines (in der Regel) kleinen Zustandsvektors. Die Wahrscheinlichkeit, später zufällig auf solche Zustände zu stoßen, ist wegen der geringen Zahl dieser Zustände im Vergleich zur Periodenlänge vernachlässigbar.
Die unter C (und C++) standardmäßig verfügbare Funktion rand() ist unter Linux (Glibc) und Windows als linearer Kongruenzgenerator implementiert und liefert eine Sequenz, die nicht einmal die einfachsten statistischen Tests besteht. Es ist somit von der Verwendung abzuraten.
Ein Xorshift-RNG in der oben dargestellten Form ist mit lediglich fünf Variablen eine schnell implementierte Alternative, die jedoch auch einige statistische Tests nicht besteht.
Vergleich mit Mersenne-Twister
Der Xorshift-Generator ist dem Mersenne-Twister zumindest ebenbürtig, wenn nicht sogar überlegen:
Die generierten Bitsequenzen sind in beiden Fällen pseudozufällig und gleichverteilt, jedoch besteht der Mersenne-Twister nahezu alle stochastischen Tests.
Der Speicherbedarf (für den Zustandsvektor) ist erheblich geringer (hier: 16 Bytes, statt 2496 Bytes).
Auch ist der Xorshift-Generator knapp 60 % schneller.
Bei schlechter Initialisierung (d. h. nur ein gesetztes Bit im Zustandsvektor) benötigt der Xorshift weniger als 10 Schritte, bis er wieder eine gleichverteilte Bit-Sequenz liefert. Der Mersenne-Twister benötigt hierzu fast 800.000 Schritte, was auch an dem größeren Zustandsvektor liegt.[4]
Der Xorshift-RNG hat mit 2128−1 eine kürzere Periodenlänge als der Mersenne-Twister mit 219937−1. Die nochmals deutlich größere Periodenlänge des Mersenne-Twisters liefert jedoch nicht wirklich eine Aussage über die Güte eines Zufallszahlengenerators: Eine längere Periode bedeutet nicht gleichzeitig eine höhere Güte oder im Ergebnis eine bessere Statistik. Darüber hinaus existieren andere moderne Generatoren mit noch längeren Perioden (bis zu 2131086 ≈ 1039461) und teils überlegenen Eigenschaften (vgl. CMWC und WELL).
Varianten
Xorshift versagt bei einigen Tests der BigCrush Test Suite (TestU01). Das gilt für alle Generatoren, die auf linearen Operationen basieren, wie auch Mersenne-Twister oder WELL. Es ist jedoch leicht, deren Ausgaben zu verwürfeln, um ihre Qualität zu verbessern.
Xorwow
Marsaglia schlug vor, die Periodenlänge zu vergrößern, indem Xorshift mit einem einfachen Zähler modulo 232 kombiniert wird (was er als „Weyl-Sequenz“ bezeichnet; nach dem Gleichverteilungssatz von Weyl: die Folge mit irrationalem ist im Intervall gleichverteilt). Dieser Generator hat eine Periodenlänge von :
/* die ersten vier Wörter von state[] dürfen nicht komplett mit 0 initialisiert werden */uint32_txorwow(uint32_tstate[static5]){/* Algorithmus "xorwow" von S. 5 in Marsaglia, "Xorshift RNGs" */uint32_ts,t=state[3];t^=t>>2;t^=t<<1;state[3]=state[2];state[2]=state[1];state[1]=s=state[0];t^=s;t^=s<<4;state[0]=t;returnt+(state[4]+=362437);}
Xorwow ist schnell, aber besteht einige Tests aus BigCrush nicht.[5] Er ist der Standardgenerator in Nvidias CUDA.[6]
Xorshift*
Xorshift* entsteht aus einem normalen Xorshift, indem man die Ausgabe mit einer Konstanten modulo bzw. multipliziert (von Marsaglia vorgeschlagen).[1] Der folgende Generator mit 64 Zustandsbits hat die Periodenlänge [7] und versagt nur beim MatrixRank-Test aus BigCrush:
#include<stdint.h>uint64_txorshift64star(uint64_t&state){uint64_tx=state;/* state nicht mit 0 initialisieren */x^=x>>12;// ax^=x<<25;// bx^=x>>27;// cstate=x;returnx*0x2545F4914F6CDD1D;}
Ein ähnlicher Generator wird in Numerical Recipes als RanQ1 vorgeschlagen[8]; er versagt aber ebenfalls beim BirthdaySpacings-Test.
Wenn man Xorshift* nur die 32 höchstwertigen Bits des Ergebnisses ausgeben lässt, besteht er BigCrush ohne Fehler. Dabei besteht noch eine Sicherheitsreserve, da diese Tests auch schon von einer Version des Generators mit nur 40 Zustandsbits bestanden werden.[9]
Vigna[7] schlägt folgenden Xorshift1024* vor, mit 1024 Zustandsbits und einer Periodenlänge von , der BigCrush besteht:
#include<stdint.h>staticuint64_ts[16];// nicht komplett mit 0 initialisierenstaticintp;uint64_txorshift1024star(void){constuint64_ts0=s[p++];uint64_ts1=s[p&=15];s1^=s1<<31;// as1^=s1>>11;// bs1^=s0^(s0>>30);// cs[p]=s1;returns1*(uint64_t)1181783497276652981;}
Xorshift+
Statt der Multiplikation kann man auch die in der Regel schnellere Addition als nichtlineare Transformation einsetzen. Diese Idee wurde zuerst von Saito und Matsumoto (von denen auch der Mersenne-Twister stammt) vorgeschlagen, und zwar im XSadd-Generator, der zwei aufeinanderfolgende Ausgaben eines zugrundeliegenden Xorshift addiert.[10]
XSadd hat Schwächen in den niederwertigen Ausgabebits und fällt bei einigen BigCrush-Tests durch, wenn man die Ausgabewörter invertiert, also die niederwertigsten Bits an die höchste Stelle setzt und umgekehrt. Als Abhilfe hat Vigna[11] die Xorshift+ Familie konstruiert, die mit 64-Bit-Wörtern arbeiten: nachfolgender Xorshift128+ nutzt 128 Zustandsbits und hat eine Periodenlänge von . Er besteht BigCrush, auch bei Invertierung.
#include<stdint.h>uint64_ts[2];// nicht komplett mit 0 initialisierenuint64_txorshift128plus(void){uint64_tx=s[0];uint64_tconsty=s[1];s[0]=y;x^=x<<23;// as[1]=x^y^(x>>17)^(y>>26);// b, creturns[1]+y;}
Es ist einer der schnellsten Generatoren, die BigCrush bestehen.[12] Ein Nachteil der Addition von aufeinanderfolgenden Ausgabewörtern ist, dass der Generator so nur noch in einer Dimension gleichverteilt ist, obwohl dies für den zugrundeliegenden Xorshift in 2 Dimensionen gilt.[11]
Xoroshiro und Xoshiro
Diese von Sebastiano Vigna und David Blackman entwickelten Generatoren basieren auf der gleichen Theorie wie Xorshift.[13] Sie enthalten jedoch auch die Bitrotation als elementare Operation. Nachfolgende Versionen haben eine Periodenlänge von .[14]
#include<stdint.h>inlineuint64_trotl(uint64_ta,intw){returna<<w|a>>(64-w);}uint64_txoroshiro128plus(void){staticuint64_ts0=1451815097307991481;staticuint64_ts1=5520930533486498032;// auch hier wieder nicht beide mit 0 initialisierenconstuint64_tresult=s0+s1;s1^=s0;s0=rotl(s0,55)^s1^(s1<<14);s1=rotl(s1,36);returnresult;}uint64_txoroshiro128starstar(void){staticuint64_ts0=1321861022983091513;staticuint64_ts1=3123198108391880477;// auch hier wieder nicht beide mit 0 initialisierenconstuint64_tresult=rotl(s0*5,7)*9;s1^=s0;s0=rotl(s0,24)^s1^(s1<<16);s1=rotl(s1,37);returnresult;}
Xoshiro ist die weiterentwickelte Variante, die nochmals bessere Zufallszahlen erzeugt und eine Periodenlänge von aufweist.[15]
#include<stdint.h>inlineuint64_trotl(uint64_ta,intw){returna<<w|a>>(64-w);}uint64_txoshiro256(void){staticuint64_ts0=1321861022983091513;staticuint64_ts1=3123198108391880477;// nicht alle vier mit 0 initialisierenstaticuint64_ts2=1451815097307991481;staticuint64_ts3=5520930533486498032;constuint64_tresult=s0+s3;// alternativ: result = rotl(s1 * 5, 7) * 9constuint64_tt=s1<<17;s2^=s0;s3^=s1;s1^=s2;s0^=s3;s2^=t;s3=rotl(s3,45);returnresult;}