May 19, 2024, Sunday, 139

KADD 2022 Laboratorium 10 EN

From Łukasz Graczykowski

(Difference between revisions)
Jump to: navigation, search
(Exercise)
(Exercise)
Line 6: Line 6:
* Narysować na jednym wykresie punkty pomiarowe i dopasowanie (metodą estymatora największej wiarygodności i funkcją Fit z ROOT'a użytą z parametrami "LR" - dopasowanie metodą największej wiarygodności). Funkcja TF1 do rysowania (i dopasowania ROOT'em) to TMath::PoissonI (1 pkt.)
* Narysować na jednym wykresie punkty pomiarowe i dopasowanie (metodą estymatora największej wiarygodności i funkcją Fit z ROOT'a użytą z parametrami "LR" - dopasowanie metodą największej wiarygodności). Funkcja TF1 do rysowania (i dopasowania ROOT'em) to TMath::PoissonI (1 pkt.)
-
* Sprawdzić jakość dopasowania za pomocą testu χ2. W tym celu należy zaimplementować funkcję obliczającą statystykę testową χ2 zgodnie z wzorem [[File:wzor.png]]
+
* Check the quality of the fit with the χ2 test. For this purpose, a function for calculating the χ2 test statistic should be implemented according to the formul [[File:wzor.png]]
-
gdzie: nk - liczba obserwacji w k-tym binie, npk - przewidywana przez teorię liczba przypadków w k-tym binie tj.:
+
where: nk - number of observations in the kth bin, npk - the number of cases predicted by the theory in the kth bin, i.e .:
-
  // h - histogram danych
+
  // h - data histogram
-
  // g - przewidywanie "teoretyczne"
+
  // g - "theoretical" prediction
  double chi2(TH1D *h, TF1 *f);
  double chi2(TH1D *h, TF1 *f);
-
* Okreslić liczbę stopni swobody i obliczyć wartość statystyki testowej. (1 pkt.)
+
* Determine the number of degrees of freedom and calculate the value of the test statistic. (1 pt)
-
* Zaimplementować funkcję zwracającą wynik testu χ2 na zadanym poziomie istotności α tj.:
+
* Implement a function that returns the result of the χ2 test at a given significance level α, i.e .:
-
// true - brak podstaw do odrzucenia hipotezy
+
  // true - there is no reason to reject the hypothesis
-
// false - sa podstawy do odrzucenia hipotezy
+
  // false - there are grounds for rejecting the hypothesis
-
// Parametry:
+
  // Parameters:
-
// T - wartosc statystyki testowej chi2
+
  // T - value of the chi2 test statistic
-
// alpha - poziom istotnosci
+
  // alpha - significance level
-
// ndf - liczba stopni swobody rozkladu chi2
+
  // ndf - the number of degrees of freedom of chi2 distribution
  bool testChi2(double T, double alpha, int ndf);
  bool testChi2(double T, double alpha, int ndf);
-
Wykorzystując zaimplementowaną funkcję zweryfikować hipotezę mówiacą, że dane pomiarowe podlegają rozkładowi Poissona. Dobrać odpowiednią wartość poziomu istotności. Uwaga! Kwanyl możemy odczytać z policzonej na ostatnich zajęciach dystrybuanty. (2 pkt.)
+
Using the implemented function, verify the hypothesis that the measurement data are subject to the Poisson distribution. Select the appropriate value for the significance level. Warning! Kwanyl can be read from the distribution box counted in the last class. (2 pts)
== Attention ==
== Attention ==

Revision as of 11:20, 16 May 2022

Exercise

Statistical hypotheses testing (5 pkt.)

  • The experiment of irradiating a hydrogen bubble chamber with a beam of photons was carried out in order to study the interaction of photons with protons. Photons create electron-positron pairs that can be used to monitor the photon beam. The frequency of images with 0,1,2, ... electron-positron pairs should follow the Poisson distribution. Data should be read from the file (the first column shows the number of electron pairs in the image k, and the second column shows the number of photos containing k electron pairs). We can see that this distribution resembles the Poisson distribution - therefore we are trying to calculate the maximum likelihood estimator for the parameters of the Poisson distribution (see Lecture 10) (1 pkt.)
  • Narysować na jednym wykresie punkty pomiarowe i dopasowanie (metodą estymatora największej wiarygodności i funkcją Fit z ROOT'a użytą z parametrami "LR" - dopasowanie metodą największej wiarygodności). Funkcja TF1 do rysowania (i dopasowania ROOT'em) to TMath::PoissonI (1 pkt.)
  • Check the quality of the fit with the χ2 test. For this purpose, a function for calculating the χ2 test statistic should be implemented according to the formul Wzor.png

where: nk - number of observations in the kth bin, npk - the number of cases predicted by the theory in the kth bin, i.e .:

// h - data histogram
// g - "theoretical" prediction
double chi2(TH1D *h, TF1 *f);
  • Determine the number of degrees of freedom and calculate the value of the test statistic. (1 pt)
  • Implement a function that returns the result of the χ2 test at a given significance level α, i.e .:
 // true - there is no reason to reject the hypothesis
 // false - there are grounds for rejecting the hypothesis
 // Parameters:
 // T - value of the chi2 test statistic
 // alpha - significance level
 // ndf - the number of degrees of freedom of chi2 distribution
bool testChi2(double T, double alpha, int ndf);

Using the implemented function, verify the hypothesis that the measurement data are subject to the Poisson distribution. Select the appropriate value for the significance level. Warning! Kwanyl can be read from the distribution box counted in the last class. (2 pts)

Attention

  • Nasze zadanie to ręczne przeprowadzenie czynności wykonywanych automatycznie przez funkcję Fit.
  • Zadanie zawiera w sobie dwie części: wyznaczenie parametru rozkładu Poissona metodą największej wiarygodności (maximum likelihood), szukając estymatora o najniższej wariancji. Czytamy zatem: Wykład 9 link - o metodzie największej wiarygodności, od początku do slajdu 24 (to są części teoretyczne z wyprowadzeniami), dalej Wykład 10 link
  • Funkcja wiarygodności to ogólnie rzecz biorąc funkcja rozkładu prawdopodobieństwa dla parametrów badanego rozkładu, okreslana na podstawie próby losowej (jeżeli badamy np. rozkład wzrostu Polaków f(x), gdzie X to zmienna losowa okreslająca wzrost Polaków, np. rozkład Gaussa o dwóch parametrach (średnia, odchylenie), to L będzie funkcją wiarygodności, rozkładem prawdopodobieństwa parametrów średniej i odchylenia -> szukamy maksimum funkcji L, które da nam najbardziej wiarygodne wartości parametrów średnia i odchylenie funkcji f(x))
  • Szukanie parametrów metodą największej wiarygodności polega na rozwiązaniu równań wiarygodności, które są niczym innym tylko warunkami koniecznymi na istnienie maksimum funkcji L (zgodnie z analizą matematyczna - liczymy odpowiednie pochodne)
  • Dla rozkładu Poissona estymator o najniższej wariancji otrzymany metodą największej wiarygodności wynika z rozwiązania równania wiarygodności (jedno równanie, bo jeden parametr Lambda) - slajd 14 na Wykładzie 11 link
  • Druga część, po znalezieniu estymatora o najwyższej wiarygodności, polega na przeprowadzeniu testu chi-kwadrat. W tym celu czytamy dokładnie Wykład 11 (zwłaszcza slajdy 7-16) link.
  • Na wykresie poniżej (histogram) są dwie linie - niebieska i czerwona. Jedna z nich to dopasowanie dokonane automatycznie funkcją Fit, druga to ręczne dopasowanie sposeb powyżej.
  • Do rozkładu Poissona w postaci takich "schodków" stosujemy funkcję TMath::PoissonI (link)
  • Kwantyl rozkładu chi-kwadrat o odpowiedniej liczbie stopni swobody do wykonania testu możemy odczytać z Zadania 9 (poprzednie zajęcia) - po to żeśmy te rozkłady chi-kwadrat rysowali.

Result

Lab10 2.png

Output:

FCN=5.75356 FROM MIGRAD    STATUS=CONVERGED      29 CALLS          30 TOTAL
                    EDM=5.17016e-07    STRATEGY= 1      ERROR MATRIX ACCURATE 
 EXT PARAMETER                                   STEP         FIRST   
 NO.   NAME      VALUE            ERROR          SIZE      DERIVATIVE 
  1  p0           3.55268e+02   1.88558e+01   3.25727e-02   3.68816e-05
  2  p1           2.33737e+00   8.17264e-02   1.40382e-04  -2.26405e-03
                              ERR DEF= 0.5

Lambda of the highest likelihood: 2.33239
Lambda (ROOT Fit): 2.33737
chi2 (value of the test statistics T): 10.5336
chi2/NDF: 1.7556
chi2 (ROOT Fit): 9.85507
chi2 (ROOT Fit)/NDF: 1.40787
Significance level alpha: 0.01
Test result: no grounds to reject the null hypothesis