Teoria wartości p i hipoteza zerowa mogą początkowo wydawać się skomplikowane, ale zrozumienie pojęć pomoże ci poruszać się po świecie statystyki. Niestety, terminy te są często niewłaściwie stosowane w nauce popularnej, dlatego przydałoby się wszystkim zrozumieć podstawy.
Zobacz także nasz artykuł Jak usunąć każdy inny wiersz w programie Excel
Obliczanie wartości p modelu i udowodnienie / obalenie hipotezy zerowej jest zaskakująco proste w MS Excel. Można to zrobić na dwa sposoby i omówimy oba z nich. Wejdźmy.
Hipoteza zerowa i wartość p
Hipoteza zerowa to stwierdzenie, określane również jako pozycja domyślna, które twierdzi, że związek między obserwowanymi zjawiskami nie istnieje. Można go również zastosować do powiązań między dwiema obserwowanymi grupami. Podczas badań testujesz tę hipotezę i próbujesz ją obalić.
Powiedzmy na przykład, że chcesz zaobserwować, czy dana moda na pranie ma znaczące wyniki. Hipoteza zerowa w tym przypadku jest taka, że nie ma znaczącej różnicy w wadze badanych przed i po diecie. Alternatywna hipoteza jest taka, że dieta zrobiła różnicę. Właśnie to badacze próbowaliby udowodnić.
Wartość p reprezentuje szansę, że podsumowanie statystyczne będzie równe lub większe od wartości obserwowanej, gdy hipoteza zerowa jest prawdziwa dla określonego modelu statystycznego. Chociaż często jest wyrażany jako liczba dziesiętna, ogólnie lepiej jest wyrażać go w procentach. Na przykład wartość p 0, 1 powinna być reprezentowana jako 10%.
Niska wartość p oznacza, że dowody przeciwko hipotezie zerowej są mocne. Oznacza to ponadto, że Twoje dane są znaczące. Z drugiej strony, wysoka wartość p oznacza, że nie ma mocnych dowodów przeciwko hipotezie. Aby udowodnić, że modna dieta działa, badacze musieliby znaleźć niską wartość p .
Statystycznie istotny wynik to taki, który jest wysoce mało prawdopodobny, jeśli hipoteza zerowa jest prawdziwa. Poziom istotności jest oznaczony grecką literą alfa i musi być większy niż wartość p, aby wynik był statystycznie istotny.
Wielu badaczy z wielu dziedzin korzysta z wartości p, aby uzyskać lepszy i głębszy wgląd w dane, z którymi pracują. Niektóre z najważniejszych dziedzin obejmują socjologię, wymiar sprawiedliwości w sprawach karnych, psychologię, finanse i ekonomię.
Znajdowanie wartości p -Value w programie Excel
Możesz znaleźć wartość p zestawu danych w MS Excel za pomocą funkcji T-Test lub narzędzia do analizy danych. Najpierw przyjrzymy się funkcji T-Test. Przebadamy pięciu studentów, którzy przeszli 30-dniową dietę. Porównamy ich wagę przed i po diecie.
UWAGA: Do celów tego artykułu użyjemy MS Excel 2010. Chociaż nie jest to najnowszy, kroki powinny zasadniczo dotyczyć także nowszych wersji.
Funkcja testu T.
Wykonaj następujące kroki, aby obliczyć wartość p za pomocą funkcji T-Test.
- Utwórz i wypełnij tabelę. Nasz stół wygląda następująco:
- Kliknij dowolną komórkę poza stołem.
- Wpisz: = T.Test (.
- Po otwartym nawiasie wpisz pierwszy argument. W tym przykładzie jest to kolumna Przed dietą. Zakres powinien wynosić B2: B6. Jak dotąd funkcja wygląda następująco: T.Test (B2: B6.
- Następnie wprowadzimy drugi argument. Kolumna After Diet i jej wyniki to nasz drugi argument, a potrzebny nam zakres to C2: C6. Dodajmy to do wzoru: T.Test (B2: B6, C2: C6.
- Wpisz przecinek po drugim argumencie, a opcje rozkładu jednostronnego i rozkładu dwustronnego pojawią się automatycznie w menu rozwijanym. Wybierzmy pierwszą - jednostronną dystrybucję. Kliknij go dwukrotnie.
- Wpisz inny przecinek.
- Kliknij dwukrotnie opcję Sparowane w następnym menu rozwijanym.
- Teraz, gdy masz już wszystkie potrzebne elementy, zamknij wspornik. Wzór dla tego przykładu wygląda następująco: = T.Test (B2: B6, C2: C6, 1, 1)
- Naciśnij enter. Komórka natychmiast wyświetli wartość p . W naszym przypadku wartość wynosi 0, 1333906 lub 13, 3906%.
Ponieważ wartość ta jest wyższa niż 5%, ta wartość p nie dostarcza mocnych dowodów przeciwko hipotezie zerowej. W naszym przykładzie badania nie wykazały, że dieta pomogła badanym osobom stracić znaczną wagę. Nie musi to oznaczać, że hipoteza zerowa jest poprawna, tylko że nie została jeszcze obalona.
Trasa analizy danych
Narzędzie analizy danych pozwala robić wiele fajnych rzeczy, w tym obliczenia wartości p . Aby uprościć sprawę, użyjemy tej samej tabeli, co w poprzedniej metodzie.
Oto jak to się robi.
- Ponieważ mamy już różnice masy w kolumnie D, pomiń obliczanie różnic. W przyszłych tabelach użyj tej formuły: = „Komórka 1” - „Komórka 2”.
- Następnie kliknij kartę Dane w menu głównym.
- Wybierz narzędzie analizy danych.
- Przewiń listę w dół i kliknij opcję t-Test: Paired Two Sample for Means.
- Kliknij OK.
- Pojawi się wyskakujące okno. To wygląda tak:
- Wpisz pierwszy zakres / argument. W naszym przykładzie jest to B2: B6.
- Wprowadź drugi zakres / argument. W tym przypadku jest to C2: C6.
- Pozostaw domyślną wartość w polu tekstowym Alpha (jest to 0, 05).
- Kliknij przycisk opcji Zakres wyjściowy i wybierz miejsce, w którym chcesz uzyskać wynik. Jeśli jest to komórka A8, wpisz: $ A $ 8.
- Kliknij OK.
- Excel obliczy wartość p i kilka innych parametrów. Ostateczny stół może wyglądać następująco:
Jak widać, wartość p dla jednego ogona jest taka sama jak w pierwszym przypadku - 0, 133 905569. Ponieważ jest powyżej 0, 05, hipoteza zerowa ma zastosowanie do tej tabeli, a dowody przeciwko niej są słabe.
Co warto wiedzieć o wartości p- Value
Oto kilka przydatnych wskazówek dotyczących obliczeń wartości p w programie Excel.
- Jeśli wartość p jest równa 0, 05 (5%), dane w tabeli są znaczące. Jeśli jest mniejsza niż 0, 05 (5%), posiadane dane są bardzo znaczące.
- Jeśli wartość p jest większa niż 0, 1 (10%), dane w tabeli są nieistotne. Jeśli jest w zakresie 0, 05-0, 10, masz nieznacznie istotne dane.
- Możesz zmienić wartość alfa, chociaż najczęściej stosowanymi opcjami są 0, 05 (5%) i 0, 10 (10%).
- Wybór testu dwustronnego może być lepszym wyborem, w zależności od twojej hipotezy. W powyższym przykładzie badanie jednostronne oznacza, że badamy, czy badani schudli po diecie, i właśnie tego potrzebowaliśmy się dowiedzieć. Ale w dwustronnym teście sprawdzono by również, czy przybrały one istotne statystycznie masy.
- Wartość p nie może identyfikować zmiennych. Innymi słowy, jeśli zidentyfikuje korelację, nie może zidentyfikować przyczyn.
Wartość p- Valed Demystified
Każdy statystyka wart swojej soli musi znać tajniki testowania zerowej hipotezy i co oznacza wartość p . Ta wiedza przyda się także badaczom z wielu innych dziedzin.
Czy kiedykolwiek używałeś programu Excel do obliczenia wartości p modelu statystycznego? Jakiej metody użyłeś? Wolisz inny sposób na obliczenie tego? Daj nam znać w sekcji komentarzy.