Neu angelegte Artikel mit anderen Sprachen verknüpfen
Letzter Kommentar: vor 1 Jahr1 Kommentar1 Person ist an der Diskussion beteiligt
Hallo Sigma^2, vielen Dank für die zahlreichen Artikel.
Damit diese dem Leser auch in anderen Sprachen und Projekten (z.B. Commons) zur Verfügung stehen (bzw. umgekehrt auch Lesern der Artikel in anderen Sprachen der deutschsprachige Artikel; links unter Navigationspunkt "In anderen Sprache") können diese dem zugehörigen Wikidata-Objekt zugeordnet werden.
nur ein verhältnismäßig geringer Zusatzaufwand pro neuem Artikel, bei mehreren hunderten neuen Artikeln täglich ist das aber leider entsprechend aufwendig.
Ich bin von dort aus zunächst in den Artikel empirische Verteilungsfunktion gekommen, auf den man sich noch nicht richtig stützen konnte. Ich komme zum Bootstrap zurück. --Sigma^2 (Diskussion) 22:44, 22. Jul. 2023 (CEST)Beantworten
Auch hier noch einmal explizit ein großer Dank für deine Überarbeitung des Artikels empirische Verteilungsfunktion. Durch deine Unterscheidung zwischen der zufälligen empirischen Verteilungsfunktion und deren Realisierung hat der Artikel extremst an Genauigkeit zugenommen und ist für mich viel besser zu lesen :) biggerj1 (Diskussion) 00:08, 1. Aug. 2023 (CEST)Beantworten
Empirische Verteilung vs. Stichprobenverteilung
Letzter Kommentar: vor 1 Jahr7 Kommentare3 Personen sind an der Diskussion beteiligt
Hallo Dorschleber, inzwischen habe ich den Artikel 'Empirische Verteilungsfunktion' sehr stark überarbeitet und erweitert. So richtig sehe ich nicht, an welcher Stelle es eine Verwechselungsmöglichkeit mit der Stichprobenverteilung als Verteilung einer Stichprobenfunktion gibt. In einem weiteren Sinn hat auch die zufällige empirische Verteilungsfunktion eine Stichprobenverteilung, das ist aber dann eine Verteilung in einem Funktionenraum und dieses Fass sollte man in dem Artikel nicht öffnen. Angedeutet ist es mit dem Verweis auf die Theorie empirischer Prozesse. Vielleicht hast Du einen Hinweis, an welcher Stelle man eine solche Abgrenzung sinnvoll unterbringen würde? --Sigma^2 (Diskussion) 11:42, 26. Jul. 2023 (CEST) Rechtschreibung korr. --Sigma^2 (Diskussion) 00:52, 27. Jul. 2023 (CEST)Beantworten
>In einem weiteren Sinn hat auch die zufällige empirische Verteilungsfunktion eine Stichprobenverteilung, das ist aber dann eine Verteilung in einem Funktionenraum und dieses Fass sollte man in dem Artikel nicht öffnen
Genau: die Stichprobenfunktion (ausgewertet an der Stelle x) ist die geschätzte empirischen Verteilungsfunktion. Sie ist eine Realisierung der (theoretischen) empirischen Verteilung von der Verteilung aus der die Realisierung der Stichprobe stammt, also . Wie sich zu verhält, wird durch die Konvergenzeigenschaften der empirischen Verteilungsfunktion beschrieben. So kann man das formulieren, oder würdest du das anders formulieren Sigma^2?biggerj1 (Diskussion) 00:47, 1. Aug. 2023 (CEST)Beantworten
Ich würde etwas anders formulieren (unter Verwendung der folgenden Bausteine):
(ausgewertet an der Stelle x) ist ein Schätzwert für, die theoretische Verteilungsfunktion an der Stelle
(ausgewertet an der Stelle x) ist ein Schätzer (eine Schätzfunktion) für, die theoretische Verteilungsfunktion an der Stelle .
eine Realisierung von für jede Stelle .
Die Funktion ist eine Realisierung von.
ist eine konkrete Schätzung für.
ist eine Schätzungfunktion für.
ist eine Realisierung der zufälligen Funktion
Etwas unscharf finde ich die Formulierung die geschätzte empirische Verteilungsfunktion'. Geschätzt [passiv] wird die theoretische Verteilungsfunktion. Die empirische Verteilungsfunktion schätzt [aktiv] die (in der Regel unbekannte) theoretische Verteilungsfunktion. --Sigma^2 (Diskussion) 22:51, 3. Aug. 2023 (CEST)Beantworten
Super, dann würde ich also korrekterweise folgendes schreiben
"Die empirische Verteilungsfunktion (ausgewertet an der Stelle x) ist eine Schätzwert der Verteilungsfunktion (ausgewertet an der Stelle x). Sie ist eine Realisierung der Schätzfunktion für die Verteilungsfunktion . Wie sich die Schätzfunktion zu verhält, wird durch die Konvergenzeigenschaften von beschrieben." Danke für deine Hilfe und eventuelle erneute Korrekturen. Falls es passt, freue ich mich aber auch über ein kurzes "passt" :) biggerj1 (Diskussion) 21:26, 6. Aug. 2023 (CEST)Beantworten
Für mich passt es noch nicht. Für mich ist die Funktion und ein Funktionswert (siehe en:Abuse of Notation#Function notation). Diese Pedanterie zahlt sich hier aus, weil es zunächst um die Schätzung der Wahrscheinlichkeit durch die relative Häufigkeit für fixiertes geht und dann um die Schätzung der Funktion durch die Funktion . Das "Sie" im zweiten Satz könnte sich grammatisch auf beziehen. Ich würde daher z. B. folgendermaßen schreiben, um alle denkbare Missverständnisse auszuschließen.
"Die empirische Verteilungsfunktion an einer Stelle , d. h. , ist ein Schätzwert für die Verteilungsfunktion an der Stelle , d. h. ein Schätzwert für die Wahrscheinlichkeit . Dies gilt für jede Stelle . Die empirische Verteilungsfunktion ist eine Realisierung der Schätzfunktion für die Verteilungsfunktion . Wie sich die Schätzfunktion zu verhält, wird durch die Konvergenzeigenschaften von beschrieben." --Sigma^2 (Diskussion) 23:01, 6. Aug. 2023 (CEST)Beantworten
Ja dein Vorschlag liest sich besser. Allerdings stelle ich mir die Frage ob der Rückgriff auf die Stelle x im ersten Satz hier nicht etwas suggestiv ist (weil man nur einen x-Wert anschaut und man daher einen Schätzwert im natürlichen Sinn "eines Wertes"/einer Zahl betrachten kann). Eigentlich wäre es doch auch richtig zu schreiben: "die empirische Verteilungsfunktion ist ein Schätzwert der Verteilungsfunktion , wohingegen ihre Schätzfunktion ist." In dieser Formulierung werden Wert und Funktion nicht mehr suggestiv verwendet. Sehe ich das richtig? biggerj1 (Diskussion) 23:35, 6. Aug. 2023 (CEST)Beantworten
Empirische Verteilungsfunktion und Freunde :)
Letzter Kommentar: vor 1 Jahr2 Kommentare1 Person ist an der Diskussion beteiligt
Nachdem du den Artikel zur empirischen Verteilungsfunktion so extrem verbessert hast, gehe ich davon aus, dass dich ihre Anwendungen auch interessieren könnten. Falls das so ist, habe ich dir hier die en:Empirical_likelihood, die für mich neu war, aber welche ich sehr spannend finde (für die Nichtparametrische Maximum-Likelihood-Schätzung) :) Lass mich wissen, ob du diese Art von kleinen Hinweisen auf (meiner Meinung nach) spannende Artikel magst :) Liebe Grüße biggerj1 (Diskussion) 10:08, 27. Jul. 2023 (CEST)
Ja, danke für so kleine Hinweise, auch falls ich sie nicht weiter aufgreife. Zurzeit habe ich eine ziemlich große unerledigte Agenda für die WP.--Sigma^2 (Diskussion) 23:56, 3. Aug. 2023 (CEST)Beantworten
Letzter Kommentar: vor 1 Jahr8 Kommentare2 Personen sind an der Diskussion beteiligt
Hallo Sigma^2, wie würdest du denn meine folgenden zwei Sätze zurechtrücken? Danke schonmal für dein Feedback! "Eine Realisierung eines (zur Regression gefitteten) Gauss-Prozesses kann als eine zufällige Funktion mit bestimmten bevorzugten Eigenschaften (z.B. Korrelation) angesehen werden, siehe Pfad (Stochastik). Die Verteilung der Realisierungen eines Gaußprozesses kann als Wahrscheinlichkeitsverteilung von Funktionen verstanden werden." biggerj1 (Diskussion) 01:17, 2. Aug. 2023 (CEST)Beantworten
Der Gauß-Prozess ist eine zufällige Funktion (vorsichtiger formuliert: kann als zufällige Funktion interpretiert werden), dagegen ist eine Realisierung des Gaußprozesses eine gewöhnliche (nicht zufällige) Funktion. Die (unbekannte) Verteilung des Gauß-Prozesses hat bestimmte interessierende Eigenschaften (Erwartungswertfunktion und Kovarianzfunktion; dies bilden die unbekannten Verteilungsparameter).
(a) Statistische Inferenz: Man versucht aus den Eigenschaften einer beobachteten Realisierung (und daraus berechneter Kennzahlen, wie Mittelwertfunktion und empiririscher Kovarianzfunktion) auf die Verteilungsparameter zu schließen.
(b) Kalibrierung, Fittung: Man dreht an den Verteilungsparametern solange, bis der so modellierte Gaußprozess bei der Simulation Daten erzeugt, die ungefähr so aussehen wie die beobachteten Daten.
Wenn ich den Satz zurechtbiegen würde, dann folgendermaßen – ohne zu wissen, ob Du das ausdrücken wolltest – "Eine Realisierung eines Gauß-Prozesses, der eine zufällige Funktion ist, ist eine gewöhnliche Funktion (ein so genannter Pfad). Die Verteilung der Realisierungen eines Gaußprozesses kann als Wahrscheinlichkeitsverteilung von Funktionen verstanden werden. Aus den Eigenschaften eines beobachteten Pfades versucht man, auf interessierende Eigenschaften der Verteilung des Gaußprozesses (z. B. deren Autokorrelationsstruktur) zu schließen."
Der dritte Satz beschreibt allerdings die Sichtweise der Inferenzstatistik. Als Kalibrierer würde ich stattdessen vielleicht sagen: "Die Eigenschaften des Gauß-Prozesses bestimmen die Eigenschaften seiner Realisierungen. Durch geeignete Einstellung der Verteilungsparameter können beobachtete Eigenschaften der Realisierungen reproduziert werden."
Der Klammerzusatz "(zur Regression gefittet)" ist mir zu unklar. Übrigens gibt es im Artikel Anwendung von Gaußprozessen in der Abschnittsüberschrift und im Text zwar das Wort Regression, aber ich finde kein Regressionsmodell, keine Berechnung einer Regressionsfunktion oder etwas Ähnliches, was man als Regression identifizieren könnte. Ich weiß überhaupt nicht, was das Wort Regression in diesem Artikel bedeutet, in einem ziemlich starken Unterschied zu Kapitel 2 in Rasmussen/Williams, auf den sich der Autor bezieht. --Sigma^2 (Diskussion) 23:52, 3. Aug. 2023 (CEST)Beantworten
Vielen Lieben Dank für die Korrektur und danke für die Zeit, die du dir genommen hast! Ich erkenne den Fehler in meiner Formulierung (die Realisierung eines Gauss-Prozesses ist eine gewöhnliche Funktion)! Dementsprechend würde ich nun folgendes schreiben: "Ein Gauß-Prozess ist eine zufällige Funktion, welche bestimmte Eigenschaften, wie bedingte Mittelwerte oder eine Autokorrelationsstruktur besitzt. Eine Realisierung eines Gauß-Prozesses ist eine gewöhnliche Funktion (ein so genannter Pfad). Die Verteilung der Realisierungen eines Gaußprozesses kann als Wahrscheinlichkeitsverteilung von Funktionen verstanden werden. Die Eigenschaften des Gauß-Prozesses bestimmen die Eigenschaften seiner Realisierungen. Durch geeignete Einstellung der Verteilungsparameter können beobachtete Eigenschaften der Realisierungen reproduziert werden. Aus den Eigenschaften eines beobachteten Pfades versucht man in der statistischen Inferenz, auf interessierende Eigenschaften der Verteilung des Gaußprozesses (z. B. deren Autokorrelationsstruktur) zu schließen." biggerj1 (Diskussion) 21:42, 6. Aug. 2023 (CEST)Beantworten
Gut so. Ich hab praktisch nichts zu meckern. Erwartungswerte anstatt Mittelwerte ist besser; im englischen Sprachraum sagt man zwar auch mean zu Erwartungswerten, im deutschen Sprachrum ist das nicht üblich. Nur: alles das, was jetzt da steht, gilt praktisch für jeden stochastischen Prozess. Nicht davon ist typisch für einen Gauß-Prozess ist, der gerade dadurch charakterisiert ist, dass alle endlichdimensionalen Verteilungen multivariate Normalverteilungen (und zwar im weiteren Sinn einschließlich singulärer Verteilungen) sind, daran kommt man nicht vorbei. --Sigma^2 (Diskussion) 22:28, 6. Aug. 2023 (CEST)Beantworten
Richtig :) das definiert nicht den Gauss-Prozess an sich, sondern liefert nur eine Interpretation, inwiefern die Pfade als Realisierungen einer Wahrscheinlichkeitsverteilung von Funktionen verstanden werden kann. Ich finde dieses eingeschränkte Ziel beschreiben die Sätze sehr klar. Wäre es für dich ok sie einzubauen - oder würde es die Leser eher verwirren? LG biggerj1 (Diskussion) 23:25, 6. Aug. 2023 (CEST)Beantworten
Hallo Biggerj1, nun, es ist ja ein Wiki und Du kannte natürlich einbauen, was Du für richtig hältst. Ich habe damit keine Problem. Den Verweis auf bedingte Erwartungswerte würde ich allerdings in der Einleitung vermeiden, da ich nicht wüsste, wies man das verlinken kann, und das doch ein schwieriges Gebiet ist, da so etwas gemeint sein kann, wie z. B. für einen zeitdiskreten stochastischen Prozess der Erwartungswert oder die zufällige Erwartung , die selbst als Funktion der Zufallsvariablen eine Zufallsvariable ist. --Sigma^2 (Diskussion) 16:16, 8. Aug. 2023 (CEST)Beantworten
Wunderbar! Ich habe den Text als Hinweis unter "Anmerkungen" im Artikel Gaußprozess (GP) untergebracht und noch hinzugefügt, das dies keine Eigenschaft des GP ist, sondern für städtische Prozesse ebenso gilt. biggerj1 (Diskussion) 20:16, 8. Aug. 2023 (CEST)Beantworten
Letzter Kommentar: vor 1 Jahr1 Kommentar1 Person ist an der Diskussion beteiligt
Hallo Sigma^2, magst du Mal einen Blick in dem Artikel werden und vielleicht die Grundidee darlegen. Ich finde ihn generell sehr schlecht motiviert. Da es ja beliebig viele Scoring functions gibt, stellt sich mir auch die Frage wann man welche Scoring function benutzen will. biggerj1 (Diskussion) 23:20, 30. Aug. 2023 (CEST)Beantworten
An alle Leerraum-Löscher
Letzter Kommentar: vor 1 Jahr5 Kommentare2 Personen sind an der Diskussion beteiligt
Es gibt Wikipedianutzer, die häufig meinen WikiTeX-Satz korrigieren.
Leerraum vor Satzzeichen im Formelsatz
Es geht dabei z. B. um einen von mir gesetzten kleinen Leerraum (WikiTeX: \;) vor Satzzeichen, die zwischen Gleichungen und nach Gleichungen stehen. Dieser Leerraum ist typographisch üblich, sinnvoll und bei mir seit vielen Jahren eintrainiert. Beispielweise heißt es in den LaTeX-Vorgaben des Springer-Verlages für Autoren
Please punctuate displayed equations in the same way as any other written statement and insert \; before the punctuation to add a little extra space. (LATEX2ε SVMono Document Class Author Instructions for Monographs, S. 8)
Um den Unterschied zu sehen, hier beide Varianten.
Mit Leerraum: Die Addition von 0.4 und 0.6 lautet formelmäßig
Ohne Leerraum:
Die Addition von 0.4 und 0.6 lautet formelmäßig
Der typographische Leerraum vor dem Satzendezeichen ist sinnvoll, da bei der zweiten Variante das Satzzeichen fälschlich leicht der rechten Seite der Gleichung oder der Zahl 1.0 zugeordnet wird. Auch bei mehreren Gleichungen, die durch Komma getrennt werden, ist der Leerraum sinnvoll, damit Gleichungen optisch jeweils als ein Objekt erfasst werden.
Ich sehe beim Editieren nicht, wenn z. B. vor einem Zeilenumbruch ein Leerzeichen steht, das keine Auswirkung in der Darstellung hat, aber von einigen Wikipedianern gelöscht wird. Diese Leerzeichen sind unbeabsichtigt. Gibt es eine Einstellungsmöglichkeit im Editor, um diese Leerzeichen zu sehen?
--Sigma^2 (Diskussion) 20:40, 19. Sep. 2023 (CEST)Beantworten
Mir ist keine Möglichkeit bekannt, wie man diese überflüssigen Leerzeichen vor einem Zeilenumbruch in der Anzeige sichtbar machen kann, aber man kann sie im Text-Editor suchen (und finden):
Nach Aktivierung von "Erweitert" über die Suche (Lupen-Symbol am rechten Rand des Editierfensters) mit Suche nach: " $" (Leerzeichen Dollar) und Ankreuzen von "Die Zeichenkette der Suche als regulären Ausdruck behandeln". --At40mha (Diskussion) 13:50, 29. Sep. 2023 (CEST)Beantworten
Das fällt wohl in die Kategorie "Änderungen ohne sichtbare Auswirkungen" und ist ist daher unerwünscht, außer wenn es gleichzeitig mit einer anderen Änderung im Artikel durchgeführt wird. Daher nehme ich an, dass das als Bot-Auftrag abgelehnt werden würde. Es gibt einige Bearbeiter, die bei jeder Änderung an einem Artikel dann auch noch auf doppelte Leerzeichen und Leerzeichen am Ende überprüfen. Wirklich notwendig ist es nicht, da es keine sichtbaren Auswirkungen hat. --At40mha (Diskussion) 14:29, 29. Sep. 2023 (CEST)Beantworten
Danke!
Letzter Kommentar: vor 1 Jahr3 Kommentare2 Personen sind an der Diskussion beteiligt
Nein, das fände ich nicht gut. Nicht-elementare Bedingtheit ist ein wirklich schwieriges Gebiet und es gibt sehr viele Verallgemeinerungsstufen, wobei man die Mathematiker bremsen muss, nicht mit dem allgemeinsten Konzept zu starten. Dann ist jeder abgehängt. Ich bin froh, dass es mehrere Artikel unterschiedlicher Schwierigkeitsstufen gibt.
1. Elementare Konzepte (mit und )
Elementare bedingte Wahrscheinlichkeiten (Zahlen) sind
Elementare bedingte Erwartungswerte (Zahlen) sind
Elementare bedingte Verteilungsfunktionen sind
2. Nicht-elementar sind
eine bedingte Wahrscheinlichkeit als Zufallsvariable
,
ein bedingter Erwartung als Zufallsvariable, z. B.
eine bedingte Verteilungsfunktion als Zufallsobjekt (zufällige Verteilungfunktion)
Diese Konzepte lassen sich in Spezialfällen noch mit elementaren bedingten Wahrscheinlichkeiten definieren oder wenigstens plausibel machen, führen aber in Schwierigkeiten, wenn eine stetige Zufallsvariable mit für alle ist.
3. Nicht-elementare bedingte Wahrscheinlichkeiten und Erwartungswerte (im engeren Sinn nicht existierende, aber als reguläre bedingte Wahrscheinlichkeiten in bestimmten Zusammenhängen definierbar) sind
, falls
, falls
, falls .
Dazu wird in der maßtheoretisch fundierten Wahrscheinlichkeitstheorie das noch allgemeinere Konzept einer zufälligen Erwartung ,
wobei ein Sigma-Algebra von Ereignissen in einem abstrakten Wahrscheinlichkeitsraum ist,
implizit durch Existenzsätze (letztlich den Satz von Radon-Nikodým) definiert. Ein Mathematiker ist damit zufrieden, weil sich alles andere als Spezialfälle ergibt. Für 99 % aller Statistik-Anwender ist das aber eine unnötige maßtheritische Verallgemeinerung mit einem langen Weg zu . Was ich im Beweis zum Buffonschen Nadelexperiment geschrieben habe, ist die gerade noch verstehbare Sparversion für Statistik-Anweder ohne maßtheoretische Kenntnisse.
Aber zurück zur Frage. Was ich vermisse ist ein Artikel bedingte Wahrscheinlichkeit, der vom Einfachen zum Komplizierten aufsteigt, also erst elementare bedingte Wahrscheinlichkeiten und dann nicht-elementare Verallgemeinerungen wie bedingte Wahrscheinlichkeit als Zufallsvariable und bedingt auf Ereignisse mit Wahrscheinlichkeit Null behandelt.
Danke für den Hinweis. Ich lese, dass in dieser Publikation ein nach jeder üblichen Definition nichtstationärer Prozess, der als additive Überlagerung von einem linearen Trend und weißem Rauschen entsteht, als trendstationär bezeichnet wird. Falls das eine auch sonst übliche Bezeichnung ist, sollte es in einem Artikel erläutert sein, so dass es verlinkt werden kann. Gemeint ist wohl, dass die Abweichungen von einem deterministischen linearen Trend stationär sind. --Sigma^2 (Diskussion) 00:29, 7. Nov. 2023 (CET)Beantworten
Exzellenter Artikel Mathematische Optimierung
Letzter Kommentar: vor 1 Jahr3 Kommentare2 Personen sind an der Diskussion beteiligt
Es ist kein Gebiet, auf dem ich geforscht oder gelehrt habe, daher werde ich mich eher zurückhalten. Ich werde aber kritisch lesen und auf der Diskussionsseite eventuell Fragen stellen und Anmerkungen machen.--Sigma^2 (Diskussion) 11:26, 29. Jan. 2024 (CET)Beantworten
Letzter Kommentar: vor 11 Monaten3 Kommentare2 Personen sind an der Diskussion beteiligt
Hallo Sigma^2,
hast Du für den Begriff irreguläre Distribution, den Du in Distribution (Mathematik) eingebaut hast, eine deutschsprachige Quelle? Ich habe den Begriff noch nie gehört. Ich denke, das ist kein "Allgemeinwissen der Funktionalanalysis" und sollte daher belegt werden. Vielen Dank und viele Grüße! --Christian1985(Disk)17:18, 31. Jan. 2024 (CET)Beantworten
Hallo Christian1985, die wichtigste singuläre Distribution ist sicher die Delta-Distribution. Im Artikel Delta-Distribution steht schon seit etwa 2009 im ersten Satz der Einleitung und im Text, dass es sich um eine irreguläre Distribution handele, ohne dass es bisher jemand moniert hat. Mindestens ein Koautor des Artikels, der jetzt sagt, er habe den Begriff noch nie gehört, ist dir bekannt;) Es stand mal im Artikel "irregulär (= singulär)" und singulär wurde gelöscht. Wie man mit Google-Suche feststellt, ist der Begriff irreguläre Distribution an anderen Stellen zu finden, aber diese Fundstellen sind möglicherweise durch den WP-Artikel Delta-Distribution beeinflusst. Falls singuläre Distribution der einzig richtige Fachbegriff ist und irreguläre Distribution eine TF eines WP-Autors war, sollten wir das zunächst im Artikel Delta-Distribution und dann durchgängig in der WP korrigieren und die WL löschen. Grüße, --Sigma^2 (Diskussion) 18:33, 31. Jan. 2024 (CET)Beantworten
Hallo Sigma^2,
entschuldige die späte Antwort. Irgendwie ist die Diskussion hier untergegangen. Ja ich habe sicher auch an den Artikel Delta-Distribution rumgeschraubt. ;-) Ich werde mal auf der Diskussionsseite des Artikel nach einer Quelle nachfragen. Viele Grüße --Christian1985(Disk)19:29, 3. Feb. 2024 (CET)Beantworten
Diskussion Likelihood als Realisierung einer "theoretischen Likelihood"
Letzter Kommentar: vor 8 Monaten2 Kommentare2 Personen sind an der Diskussion beteiligt
Hallo Sigma^2, unter https://de.m.wikipedia.org/wiki/Diskussion:Stichprobenverteilung im Diskussionsabschnitt zur Bayesschen Inferenz hast du mich zum Nachdenken gebracht. Ich habe verstanden, dass du die Likelihood (basierend auf einem Stichprobenvektor) als Realisierung einer "theoretischen Likelihood" siehst. Dann wäre die (stichprobenbasierte) Likelihood-Funktion ja selbst als Realisierung dieser theoretischen Likelihood-Funktion zu betrachten und wäre dann eine Stichprobenfunktion mit eigener Stichprobenverteilung. Die theoretische Likelihood würde dann von den den Zufallsvariablen X_1, ... X_N, und eventuellen Parametern theta_1.... theta_N abhängen, während die Likelihood im Gegensatz dazu nicht vom den Zufallsvariablen sondern deren Realisierung x_1... x_n abhinge. Ich denke du hast absolut Recht mit dieser Sichtweise und sie wäre eine tolle Ergänzung für den Artikel Likelihood-Funktion. Allerdings finde ich zu dieser Interpretation keine Literatur :( wenn du welche hast, lass uns den Artikel Likelihood entsprechend erweitern! biggerj1 (Diskussion) 07:25, 20. Mai 2024 (CEST)Beantworten
Super, wie tief Du Dich in die theoretischen Grundlagen der Statistik hineindenkst.
Bei vorliegender Beobachtung , die ein realisierter Wert des zufälligen Stichprobenvektors ist, dessen Verteilung von abhängt, ist die Likelihoodfunktion eine feste Funktion auf dem Parameterraum . Die zugehörige zufällige Funktion
ist ein stochastischer Prozess, dessen Realisierungen gewöhnliche Likelihoodfunktionen sind. Aber stochastische Prozesse hängen 99 % aller Statistikanwender ab, die mit der Methodik im Sinn der Entwicklung und Begründung statistischer Verfahren nichts zu haben (wollen). Erst recht, wenn der Index des stochastischen Prozesses – wie hier – kein Zeitindex ist, sondern die möglichen Realisierungen des Stichprobenvektors . Dann ist die Anzahl derjenigen, die überhaupt noch folgen können, sehr sehr klein.
Zum Glück kann die Maximierung der zufälligen Funktion -weise, d.h. für jedes erfolgen, so dass man üblicherweise erst die Herleitung eines Maximum-Likelihood-Schätzwertes darstellt und dann erst zum Schätzer übergeht, indem man durch ersetzt. Man leitet z. B. als ML-Schätzwert für ab und erhält so als Schätzer für .
Geradezu undurchschaubar wird es in einigen Anwendungsbereichen, bei denen man in der Notation nicht zwischen Zufallsvariablen und deren Realisierungen unterscheidet (es gibt z. B. solche Ökonometriebücher) – angeblich um es dem Leser zu erleichtert. Da man dann so etwas wie , oder gar nicht mehr formulieren kann, findet man irgendeine vage Symbolik wie , , oder und es ist der Phantasie des Lesers überlassen, was das wohl sein mag. Teile solcher vagen Notation findet man im Artikel Bayessche Statistik und vielen weiteren Wikipedia-Artikeln zur Statistik, die von Statistik-Anwendern konzipiert und geschrieben wurden. Vieles in vielen WP-Artikeln zur Statistik habe ich schon gerade gebogen. --Sigma^2 (Diskussion) 12:42, 20. Mai 2024 (CEST)Beantworten