Analiza danych — tabela regresji: wartość P
„Statystyka części współczynników” w tabeli regresji
Teraz chcemy sprawdzić, czy współczynniki z funkcji regresji liniowej mają istotny wpływ na zmienną zależną (Calorie_Burnage).
Oznacza to, że chcemy udowodnić, że istnieje związek między Average_Pulse a Calorie_Burnage za pomocą testów statystycznych.
Istnieją cztery elementy, które wyjaśniają statystyki współczynników:
- std err oznacza błąd standardowy
- t jest „wartością t” współczynników
- P>|t| nazywana jest „wartością P”
- [0,025 0,975] reprezentuje przedział ufności współczynników
Skoncentrujemy się na zrozumieniu „wartości P” w tym module.
Wartość P
Wartość P jest liczbą statystyczną, którą należy stwierdzić, jeśli istnieje związek między wartością Average_Pulse i Calorie_Burnage.
Testujemy, czy prawdziwa wartość współczynnika jest równa zeru (brak związku). Test statystyczny na to nazywa się testowaniem hipotez.
- Niska wartość P (< 0,05) oznacza, że współczynnik prawdopodobnie nie będzie równy zeru.
- Wysoka wartość P (> 0,05) oznacza, że nie możemy wnioskować, że zmienna objaśniająca wpływa na zmienną zależną (tu: jeśli średnia_impuls wpływa na spalanie kalorii).
- Wysoka wartość P jest również nazywana nieistotną wartością P.
Testowanie hipotez
Testowanie hipotez to statystyczna procedura sprawdzająca, czy wyniki są prawidłowe.
W naszym przykładzie testujemy, czy prawdziwy współczynnik Average_Pulse i wyraz wolny jest równy zero.
Test hipotez ma dwa stwierdzenia. Hipoteza zerowa i hipoteza alternatywna.
- Hipotezę zerową można w skrócie zapisać jako H0
- Hipotezę alternatywną można w skrócie zapisać jako HA
Napisane matematycznie:
H0: Average_Pulse = 0
HA: Average_Pulse ≠ 0
H0: Intercept =
0
HA: Intercept ≠ 0
Znak ≠ oznacza „nie równy”
Testowanie hipotez i wartość P
Hipotezę zerową można odrzucić lub nie.
Jeśli odrzucimy hipotezę zerową, dojdziemy do wniosku, że istnieje związek między wartością Average_Pulse a Calorie_Burnage. Do tego wniosku stosuje się wartość P.
Wspólny próg wartości P wynosi 0,05.
Uwaga: wartość P 0,05 oznacza, że w 5% przypadków fałszywie odrzucimy hipotezę zerową. Oznacza to, że akceptujemy, że w 5% przypadków mogliśmy fałszywie zawrzeć związek.
Jeśli wartość P jest mniejsza niż 0,05, możemy odrzucić hipotezę zerową i stwierdzić, że istnieje związek między zmiennymi.
Jednak wartość P średniej_impulsu wynosi 0,824. Tak więc nie możemy stwierdzić związku między Average_Pulse a Calorie_Burnage.
Oznacza to, że istnieje 82,4% szans, że prawdziwy współczynnik Average_Pulse wynosi zero.
Punkt przecięcia służy do dokładniejszego dostosowania zdolności funkcji regresji do przewidywania. Dlatego rzadko interpretuje się wartość P wyrazu wolnego.