Analiza danych — tabela regresji: wartość P


„Statystyka części współczynników” w tabeli regresji

Tabela regresji — statystyki współczynników

Teraz chcemy sprawdzić, czy współczynniki z funkcji regresji liniowej mają istotny wpływ na zmienną zależną (Calorie_Burnage).

Oznacza to, że chcemy udowodnić, że istnieje związek między Average_Pulse a Calorie_Burnage za pomocą testów statystycznych.

Istnieją cztery elementy, które wyjaśniają statystyki współczynników:

  • std err oznacza błąd standardowy
  • t jest „wartością t” współczynników
  • P>|t| nazywana jest „wartością P”
  •  [0,025 0,975] reprezentuje przedział ufności współczynników

Skoncentrujemy się na zrozumieniu „wartości P” w tym module.


Wartość P

Wartość P jest liczbą statystyczną, którą należy stwierdzić, jeśli istnieje związek między wartością Average_Pulse i Calorie_Burnage.

Testujemy, czy prawdziwa wartość współczynnika jest równa zeru (brak związku). Test statystyczny na to nazywa się testowaniem hipotez.

  • Niska wartość P (< 0,05) oznacza, że ​​współczynnik prawdopodobnie nie będzie równy zeru.
  • Wysoka wartość P (> 0,05) oznacza, że ​​nie możemy wnioskować, że zmienna objaśniająca wpływa na zmienną zależną (tu: jeśli średnia_impuls wpływa na spalanie kalorii).
  • Wysoka wartość P jest również nazywana nieistotną wartością P.

Testowanie hipotez

Testowanie hipotez to statystyczna procedura sprawdzająca, czy wyniki są prawidłowe.

W naszym przykładzie testujemy, czy prawdziwy współczynnik Average_Pulse i wyraz wolny jest równy zero.

Test hipotez ma dwa stwierdzenia. Hipoteza zerowa i hipoteza alternatywna.

  • Hipotezę zerową można w skrócie zapisać jako H0
  • Hipotezę alternatywną można w skrócie zapisać jako HA

Napisane matematycznie:

H0: Average_Pulse = 0
HA: Average_Pulse ≠ 0
H0: Intercept = 0
HA: Intercept ≠ 0

Znak ≠ oznacza „nie równy”


Testowanie hipotez i wartość P

Hipotezę zerową można odrzucić lub nie.

Jeśli odrzucimy hipotezę zerową, dojdziemy do wniosku, że istnieje związek między wartością Average_Pulse a Calorie_Burnage. Do tego wniosku stosuje się wartość P.

Wspólny próg wartości P wynosi 0,05.

Uwaga: wartość P 0,05 oznacza, że ​​w 5% przypadków fałszywie odrzucimy hipotezę zerową. Oznacza to, że akceptujemy, że w 5% przypadków mogliśmy fałszywie zawrzeć związek.

Jeśli wartość P jest mniejsza niż 0,05, możemy odrzucić hipotezę zerową i stwierdzić, że istnieje związek między zmiennymi.

Jednak wartość P średniej_impulsu wynosi 0,824. Tak więc nie możemy stwierdzić związku między Average_Pulse a Calorie_Burnage.

Oznacza to, że istnieje 82,4% szans, że prawdziwy współczynnik Average_Pulse wynosi zero.

Punkt przecięcia służy do dokładniejszego dostosowania zdolności funkcji regresji do przewidywania. Dlatego rzadko interpretuje się wartość P wyrazu wolnego.