מדוע סטטיסטיקאים אומרים שתוצאה לא משמעותית פירושה "אינך יכול לדחות את האפס" לעומת קבלת השערת האפס?

שְׁאֵלָה:

מדוע סטטיסטיקאים אומרים שתוצאה לא משמעותית פירושה "אינך יכול לדחות את האפס" לעומת קבלת השערת האפס?

ryu576

2014-02-09 02:55:04 UTC

view on stackexchange narkive permalink

מבחנים סטטיסטיים מסורתיים, כמו שני מבחן ה- t המדגם, מתמקדים בניסיון לחסל את ההשערה כי אין הבדל בין פונקציה של שתי דגימות עצמאיות. לאחר מכן אנו בוחרים רמת ביטחון ואומרים שאם הבדל האמצעים הוא מעבר לרמת 95%, אנו יכולים לדחות את השערת האפס. אם לא, אנו "לא יכולים לדחות את השערת האפס". נראה שזה מרמז שגם אנחנו לא יכולים לקבל את זה. האם זה אומר שאנחנו לא בטוחים אם השערת האפס נכונה?

כעת, ברצוני לעצב מבחן שבו ההשערה שלי היא שפונקציה של שתי דוגמאות זהה (וזה ההפך ממבחני סטטיסטיקה מסורתיים כאשר ההשערה היא ששני המדגמים שונים). אז ההשערה האפסית שלי הופכת להיות ששתי הדוגמאות שונות. כיצד עלי לעצב מבחן כזה? האם יהיה פשוט לומר כי אם ערך ה- p נמוך מ- 5% אנו יכולים לקבל את ההשערה כי אין הבדל משמעותי?

מאוד קשור: [האם אי דחיית האפס בגישה של ניימן-פירסון פירושה שיש "לקבל" אותו?] (Http://stats.stackexchange.com/questions/125541)

הבדל האמצעים הוא מעבר לרמת 95%, אנו יכולים לדחות את השערת האפס.95% אינם "רמה" זה כאן ב 95 מקרים מתוך 100 מקרים (השוואות), ההבדל במדגם סטטיסטי מתעורר בגלל תנודות דגימה.זה אומר שאפס מקובל ב- alpha = .05.אמירת רמת 95% אינה מונח נכון.

ארבע תשובות:

gung - Reinstate Monica

2014-02-09 04:20:04 UTC

view on stackexchange narkive permalink

באופן מסורתי, השערת האפס היא ערך נקודתי. (זה בדרך כלל $ 0 $, אך למעשה יכול להיות כל ערך נקודתי.) ההשערה החלופית היא שהערך האמיתי הוא כל ערך שאינו הערך null . מכיוון שמשתנה רציף (כגון הבדל ממוצע) יכול לקבל ערך הקרוב ללא הגבלה לערך האפס אך עדיין לא לגמרי שווה וכך להפוך את השערת האפס לשגויה, לא ניתן להוכיח השערת אפס נקודתית מסורתית.

תאר לעצמך שהשערת האפס שלך היא $ 0 $, וההפרש הממוצע שאתה צופה הוא $ 0.01 $. האם זה סביר להניח שהשערת האפס נכונה? אתה עדיין לא יודע; מועיל לדעת כיצד נראה רווח הביטחון שלנו. נניח שמרווח הביטחון של 95% הוא $ (- 4.99, \ 5.01) $. כעת, עלינו להסיק שהערך האמיתי הוא $ 0 $? לא ארגיש בנוח לומר את זה מכיוון שה- CI הוא רחב מאוד ויש ערכים גדולים וגדולים שאינם אפסים שאנו עשויים לחשוד בקנה אחד עם הנתונים שלנו. בואו נגיד שאנחנו אוספים הרבה הרבה יותר נתונים, ועכשיו ההבדל הממוצע שנצפה שלנו הוא 0.01 $, אך ה- 95% CI הוא $ (0.005, \ 0.015) $. ההבדל הממוצע שנצפה נותר זהה (וזה יהיה מדהים אם זה באמת יקרה), אך רווח הביטחון אינו כולל כעת את ערך האפס. כמובן, זהו רק ניסוי מחשבה, אך עליו להבהיר את הרעיונות הבסיסיים. לעולם איננו יכולים להוכיח שהערך האמיתי הוא ערך נקודתי מסוים; אנחנו יכולים רק (אולי) להפריך שזה ערך נקודתי כלשהו. בבדיקת השערה סטטיסטית, העובדה שערך ה- p הוא> 0.05 (וכי ה- 95% CI כולל אפס) פירושה ש איננו בטוחים אם השערת האפס נכונה .

באשר למקרה הקונקרטי שלך, אינך יכול לבנות בדיקה בה ההשערה החלופית היא שההפרש הממוצע הוא $ 0 $ והשערת האפס היא משהו אחר מאפס. זה מפר את ההיגיון של בדיקת השערה. סביר לחלוטין שזו ההשערה המהותית והמדעית שלך, אך היא לא יכולה להיות ההשערה החלופית שלך במצב של בדיקת השערה.

אז מה אתה יכול לעשות? במצב זה, אתה משתמש בבדיקת שקילות. (כדאי לקרוא חלק מהשרשורים שלנו בנושא זה על ידי לחיצה על התג שקילות). האסטרטגיה האופיינית היא להשתמש בגישת שני המבחנים החד-צדדיים. בקצרה רבה, אתה בוחר מרווח שבמסגרתו אתה מחשיב שההפרש הממוצע האמיתי עשוי להיות $ 0 $ לכל מה שמעניין אותך, ואז תבצע בדיקה חד צדדית כדי לקבוע אם הערך הנצפה הוא פחות מהגבול העליון של מרווח זה, ובדיקה חד צדדית נוספת לבדוק אם היא גדולה מהגבול התחתון. אם שתי המבחנים הללו הם משמעותיים, דחית את ההשערה שהערך האמיתי נמצא מחוץ למרווח שמעניין אותך. אם אחד (או שניהם) אינם משמעותיים, אינך מצליח לדחות את ההשערה לפיה הערך האמיתי נמצא מחוץ למרווח.

לדוגמא, נניח שכל דבר במרווח $ (- 0.02, \ 0.02) $ כל כך קרוב לאפס שאתה חושב שזה בעצם זהה לאפס למטרותיך, אז אתה משתמש בזה כהשערה המהותית שלך. עכשיו דמיין שתקבל את התוצאה הראשונה שתוארה לעיל. אף על פי ש- $ 0.01 $ נופל בתוך מרווח זה, לא תוכל לדחות את השערת האפס במבחן t חד צדדי, ולכן לא תצליח לדחות את השערת האפס. מצד שני, דמיין שקיבלת את התוצאה השנייה שתוארה לעיל. כעת אתה מגלה שהערך הנצפה נופל בתוך המרווח המיועד, וניתן להראות שהוא פחות מהגבול העליון וגדול מהגבול התחתון, כך שתוכל לדחות את האפס. (ראוי לציין כי ניתן לדחות את שניהם את ההשערה לפיה הערך האמיתי הוא $ 0 $, ו את ההשערה שהערך האמיתי נמצא מחוץ למרווח $ (- 0.02 , \ 0.02) $, שנראה אולי מבלבל בהתחלה, אך תואם לחלוטין את ההיגיון של בדיקת השערה.)

"באופן מסורתי, השערת האפס היא ערך נקודתי" - [אם כי במקרים מסוימים אנו כותבים את השערת האפס כאילו הייתה נקודה, אך למעשה היא מורכבת] (http://stats.stackexchange.com/a/7856/22228).מעניין אותי איזו השלכה יש לטענה בפסקה הראשונה שלך מבחנים חד צדדיים.(מכיוון שאנחנו לא - ככל הידוע לי - כותבים "מקבלים $ H_0 $" אפילו למבחנים חד צדדיים, אני לא בטוח שהפסקה הראשונה תופסת את הסיבה האמיתית שאנחנו לא כותבים "מקבלים $ H_0 $.)

@Silverfish, הפסקה מסתיימת ב: "לא ניתן להוכיח השערת אפס מסורתית * נקודת *".עם זאת, אנו גם לא כותבים "קבל $ H_0 $" למבחנים חד-צדדיים מאותה סיבה.כאשר $ H_0: \ delta \ le 0 $, $ \ delta $ האמיתי יכול להיות $> 0 $, אך באופן שרירותי קרוב ולכן אינו משמעותי.אם באמת רצית להראות שזה $ <0 $, אז אתה יכול להפוך את כיוון הבדיקה החד-צדדית.אני לא רואה בעיה כאן.

אני לא אומר שכתבת שגוי וחשדתי שזה הרעיון שניסית לתקשר.ברור שהסיבה שהתמודדת עם המבחן הדו-צדדי בהשערה נקודתית בשתי הפסקאות הראשונות של תשובתך, היא שזה המקרה בשאלה.אבל אם מישהו תוהה מדוע איננו "מקבלים $ H_0 $" באופן כללי, תשובתך נקראת, יתכן שלא יהיה ברור להם כי הטיעון שלך למעשה חורג מהשערות אפס נקודתיות.

הטיעון "לעולם איננו יכולים להוכיח שהערך האמיתי הוא ערך נקודה מסוים; אנו יכולים רק (אולי) להפריך שמדובר בערך נקודה כלשהו" הוא מקרה מסוים - מה אם CI היה מתגלה כ- -0.015, -0.005)?באיזו מידה "הוכחנו" $ \ delta \ neq 0 $ (אני יודע שאתה לא משתמש ב"הוכיח "במובן המילולי, המתמטי - אולי" הפגין "או" מציע "קרובים יותר למשמעות המיועדת) נראה"הוכחנו" גם $ \ delta \ leq 0 $, ובכל זאת לא "נקבל" את $ H_0: \, \ delta \ leq 0 $

@Silverfish אני חושב שהתגובה האחרונה שלך נותנת נקודה טובה.אני מרגיש שמבחינה פילוסופית, בדיקה חד צדדית עם $ H_0: \ delta <0 $ שונה למדי מדו-צדדי עם נקודה null $ H_0: \ delta = 0 $, למרות שמתמטית הם כמעט זהים.קבלת נקודת null אינה הגיונית;אך בדיקת $ \ delta> 0 $ מול $ \ delta <0 $ יכולה להוביל למעשה לקבל אחד מהם (או לתוצאה לא חד משמעית).בנוסף לבדיקה חד צדדית הגיוני יותר מנקודת מבט בייסיאנית.בנוסף לחיזוי מדעי צריך להיות כיוון.אני מניח שאני מתחיל לחשוב שבדיקה חד צדדית לא זוכה להערכה מספקת.

מכיוון שהניסוח חשוב כאן באופן קריטי: "העובדה שערך ה- p הוא> 0.05 [...] פירושה שאיננו בטוחים אם השערת האפס נכונה" - זה עשוי לגרום לחשוב בטעות שעם p <.05 נהיה בטוחים.

Greg Snow

2014-02-09 03:51:07 UTC

view on stackexchange narkive permalink

שקול את המקרה שבו השערת האפס היא שמטבע הוא בעל 2 ראשים, כלומר ההסתברות לראשים היא 1. כעת הנתונים הם תוצאה של היפוך מטבע בפעם אחת וראיית ראשים. התוצאה היא ערך p של 1.0 שגדול מכל אלפא סביר. האם זה אומר שהמטבע מכוון 2? זה יכול להיות, אבל זה יכול להיות גם מטבע הוגן וראינו ראשים בגלל סיכוי (יקרה 50% מהמקרים עם מטבע הוגן). כך שערך ה- p הגבוה במקרה זה אומר כי הנתונים שנצפו תואמים לחלוטין את האפס, אך הם תואמים גם אפשרויות אחרות.

בדיוק כמו פסק דין "לא אשם" בבית המשפט יכול להיות הנאשם חף מפשע, זה יכול להיות גם בגלל שהנאשם אשם אך אין מספיק ראיות. אותו דבר עם השערת האפס שאיננו מצליחים לדחות מכיוון שהאפס יכול להיות נכון, או יכול להיות שאין לנו מספיק ראיות לדחות למרות שהוא שקר.

אני אוהב את הדוגמה "לא אשם". צעד אחד קדימה, פתיחה חוזרת של תיקים על סמך עדויות DNA שלא ידענו להשתמש בהם בעבר וביטולן של כמה הרשעות היא דוגמה מושלמת לכך שהוספת נתונים נוספים עשויה להיות כל מה שצריך כדי שיהיו מספיק ראיות.

Thomas Speidel

2014-02-10 21:16:47 UTC

view on stackexchange narkive permalink

היעדר ראיות אינו עדות להיעדרות (כותרתו של אלטמן, מאמר בלנד על BMJ). ערכי P נותנים לנו עדות להיעדר רק כאשר אנו רואים בהם משמעות. אחרת הם לא אומרים לנו כלום. מכאן, העדר ראיות. במילים אחרות: אנחנו לא יודעים ונתונים נוספים עשויים לעזור.

נאנח ... שוב אני רואה את הציטוט הזה נאמר ושוב אני חייב לציין שזו הצהרה שקרית.היעדר ראיות איננו * הוכחת * היעדרות.זו עדות להיעדרות.תחשוב - אם אני בולע חומר חדש זה עלול להיות רעיל.לאחר שעשיתי זאת פעם אחת ולא מצאתי תופעות לוואי - יש לי עדויות להיעדר רעל, מהיעדר השפעה בנתונים שצפיתי.אבל זה לא הוכחה (אולי היה לי מזל), מכיוון שזה ידרוש יותר נתונים, כמו שאתה אומר.

SomeEE

2014-02-09 03:05:13 UTC

view on stackexchange narkive permalink

השערת האפס, $ H_0 $, נחשבת בדרך כלל לדבר שיש לך סיבה להניח. פעמים רבות "מצב הידע הנוכחי" שאתה מעוניין להציג אינו סביר מבחינה סטטיסטית.

ההגדרה המקובלת לבדיקת השערה היא למזער את שגיאת סוג I כלומר , למזער את הסיכוי שנדחה את השערת האפס לטובת החלופה $ H_1 $ למרות ש- $ H_0 $ נכון. זו השגיאה שאנו בוחרים לצמצם תחילה כי איננו רוצים לבטל את הידע הנפוץ כאשר הידע המשותף אכן נכון.

עליך תמיד לעצב את הבדיקה שלך תוך התחשבות ש- $ H_0 $ צריך להיות מה אתה מצפה.

אם יש לנו שתי דוגמאות אנו מצפים להתפלג זהה אז ההשערה האפסית שלנו היא שהדוגמאות זהות. אם יש לנו שתי דוגמאות שהיינו מצפים שהן יהיו שונות (באופן פראי), השערת האפס שלנו היא שהן שונות.

ומה אם אין לנו ציפיות .. יכול להיות שאנחנו פשוט לא יודעים. כמו כן, כיצד יעבוד כלל ההחלטה אם נרצה לדחות את ההשערה ששתי הדגימות שונות?

במקרה שאין לך ציפיות אתה רוצה לשמור על שני סוגי השגיאות קטנים אך זה לא תמיד אפשרי. אתה צריך משתנה נוסף (כגון הגדלת גודל המדגם) כדי לעשות זאת.

מכיוון שאנחנו יכולים לדחות את האפס אך לא להוכיח אותו נכון, האפס הוא בדרך כלל ההפך ממה שאנחנו רוצים להוכיח או להניח שהוא נכון. אם אנו מאמינים שיש הבדל, אז האפס לא צריך להיות הבדל, כך שתוכל להפריך את זה.

@Greg זו גישה טובה אם אתה יודע איזה מהם אתה רוצה להיות נכון וזה כנראה המקרה הרגיל.

@MathEE תשובה די טובה. ואני הצבעתי את תשובתך. אם יש לנו שתי דוגמאות אנו מצפים להפצה זהה אז ההשערה האפסית שלנו היא שהדוגמאות זהות. אם יש לנו שתי דוגמאות שהיינו מצפים להיות שונות (באופן פרוע), ההשערה האפסית שלנו היא שהן שונות. ניתן לתמוך בחלק האחרון של קביעתך בעזרת אומדן שונות אמיתית תחת מטה-אנליזה. אנשים עדיין עוקבים אחר מבחני השערה מסורתיים.

"מה שאתה מצפה" ו"הן שונות "לא יכולות להיות השערות סטטיסטיות כלל * מכיוון שהן אינן כמותיות. * זה מגיע לעיקר העניין: חוסר הסימטריה בתפקידים בין ההשערות האפסיות והאלטרנטיביות נובעת מהיכולת לקבוע את התפלגות הדגימה של נתון הבדיקה תחת ה- null, בהשוואה לצורך לפרמט את ההתפלגות לפי גודל האפקט לפי ההשערה האלטרנטיבית. זה גם לא המקרה שאנחנו "ממזערים שגיאת סוג I": ש * אף פעם * לא קורה (המינימום הוא תמיד 0). הבדיקות מבקשות * איזון * בין שיעורי השגיאה מסוג I ו- II.

ברור שהמינימום הוא אפס. "למזער" הנה הערכה איכותית.

כמו כן, די ברור שניתן לכמת "למה אתה מצפה" ו"הם שונים "במצב הנתון. בעיני נראה כי ה- OP מבין בבירור כיצד בדיקות השערה עובדות מתמטית ומבקשות להבין היוריסטיקה.

ⓘ

שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.

about - legalese

Loading...