שְׁאֵלָה:
כיצד לבדוק השערה שאין הבדלים בין קבוצות?
Jeromy Anglim
2010-09-24 10:24:00 UTC
view on stackexchange narkive permalink

תאר לעצמך שיש לך מחקר עם שתי קבוצות (למשל, זכרים ונקבות) המתבונן במשתנה תלוי מספרי (למשל, ציוני מבחן אינטליגנציה) ויש לך את ההשערה שאין הבדלים בין קבוצות.

שאלה:
  • מהי דרך טובה לבדוק אם אין הבדלים בין קבוצות?
  • כיצד היית קובע את גודל המדגם הדרוש בכדי להתאים לבדוק אם אין הבדלים בין קבוצות?

מחשבות ראשוניות:

  • לא יספיק לעשות מבחן t סטנדרטי מכיוון כישלון של דחיית השערת האפס אינו אומר שהפרמטר של עניין שווה או קרוב לאפס; זה במיוחד המקרה בדגימות קטנות.
  • יכולתי להסתכל על רווח הביטחון של 95% ולבדוק שכל הערכים נמצאים בטווח קטן מספיק; אולי פלוס מינוס 0.3 סטיות תקן.
למה אתה מתכוון ב"זה מניח שהשערת האפס אמיתית "?
אם אתה רוצה להיות מסוגל לשלוט בהסתברות להכריז שלא כשורה "יש הבדל" אתה צריך להפריד בין שתי ההשערות (האם כבר הזכרתי שאני אוהב את הציטוט הזה: http://stats.stackexchange.com/questions/726/ מפורסם-סטטיסטיקאי-ציטוטים / 728 # 728;))
@Robin ערך p של בדיקת משמעות של השערת אפס הוא ההסתברות לראות נתונים קיצוניים או יותר מאלה שנצפו בהנחה שהשערת האפס נכונה; אבל אולי אוכל לנסח טוב יותר את ההצהרה לעיל.
@Robin שיניתי את השאלה כדי לנסות להבהיר את הנקודה שלי
שמונה תשובות:
#1
+20
Thylacoleo
2010-09-24 10:50:39 UTC
view on stackexchange narkive permalink

אני חושב שאתה שואל לגבי בדיקת שקילות. בעיקרו של דבר עליכם להחליט עד כמה ההבדל גדול מקובל עליכם, ובכל זאת להסיק ששתי הקבוצות שוות ערך. החלטה זו מגדירה את גבולות רווח הביטחון של 95% (או אחרים), וחישובי גודל המדגם נערכים על בסיס זה.

ישנו ספר שלם בנושא.

"שווה ערך" קליני נפוץ מאוד למבחני שקילות הוא מבחן אי נחותות / משפט. במקרה זה אתה "מעדיף" קבוצה אחת על פני השנייה (טיפול מבוסס) ומתכנן את הבדיקה שלך כדי להראות שהטיפול החדש אינו נחות מהטיפול הקבוע ברמה כלשהי של ראיות סטטיסטיות.

אני חושב אני צריך לזכות את הארווי מוטולסקי עבור האתר GraphPad.com (תחת "הספרייה").

#2
+16
Henrik
2010-09-24 16:39:12 UTC
view on stackexchange narkive permalink

מלבד האפשרות שכבר הוזכרה ל מבחן שקילות כלשהו, ​​שרובם, למיטב ידיעתי, מנותבים בעיקר במסורת התדירות הישנה והטובה, קיימת האפשרות של ביצוע בדיקות אשר באמת מספקות כימות ראיות לטובת היפותזות בטלות, כלומר בדיקות בייזיאניות .

יישום של מבחן t בייזיאני ניתן למצוא כאן: Wetzels, R., Raaijmakers, JGW, Jakab, E., & Wagenmakers, E.-J. (2009). כיצד לכמת תמיכה בעד ונגד השערת האפס: יישום גמיש של WinBUGS של מבחן ברירת מחדל של Bayesian. עלון פסיכונומי & Review, 16, 752-760.

יש גם הדרכה כיצד לעשות את כל זה ב- R:

http://www.ruudwetzels.com/index.php?src=SDtest


אלטרנטיבה (אולי מודרנית יותר) של מבחן t בייסיאני מסופקת (עם קוד) במאמר זה על ידי קרושקה:

Kruschke, JK (2013). הערכה בייסית מחליפה את מבחן t. כתב העת לפסיכולוגיה ניסיונית: כללי , 142 (2), 573–603. doi: 10.1037 / a0029146


כל האביזרים לתשובה זו (לפני הוספת קרושקה) צריכים להגיע לעמיתי דייוויד קלן. גנבתי את תשובתו מ שאלה זו.

אולי כדאי לעדכן תשובה זו כדי לכלול התייחסות לחבילת BayesFactor המדהימה עבור R.
#3
+13
Jeromy Anglim
2010-09-24 13:25:03 UTC
view on stackexchange narkive permalink

בעקבות התשובה של Thylacoleo, ערכתי מחקר קטן.

החבילה שקילות ב- R כוללת את הפונקציה tost () .

ראו רובינסון ופרוז (2004) " אימות מודל באמצעות מבחני שקילות" למידע נוסף.

#4
+8
Henrik
2010-09-24 16:50:33 UTC
view on stackexchange narkive permalink

ישנם כמה מאמרים שאני מכיר שיכולים להועיל לך:

Tryon, W. W. (2001). הערכת הבדל סטטיסטי, שקילות ואי-קביעות באמצעות מרווחי ביטחון מסיקים: שיטה חלופית משולבת לביצוע מבחנים סטטיסטיים של השערת אפס. שיטות פסיכולוגיות, 6, 371-386. ( PDF בחינם)

ותיקון:
Tryon, W. W., & Lewis, C. (2008). שיטת מרווחי אמון מסקנת לקביעת שוויון סטטיסטי המתקן את גורם ההפחתה של טריון (2001). שיטות פסיכולוגיות, 13, 272-278. ( PDF בחינם)

יתר על כן:

Seaman, M. A. & Serlin, R. C. (1998). E רווחי ביטחון מרובים להשוואה בין שתי קבוצות של אמצעים. שיטות פסיכולוגיות, כרך ג '(4), 403-411.

#5
+7
Stéphane Laurent
2013-06-05 23:08:13 UTC
view on stackexchange narkive permalink

חשבתי לאחרונה על דרך אלטרנטיבית של "בדיקת שקילות" המבוססת על מרחק בין שתי ה התפלגויות ולא בין האמצעים שלהן.

ישנן כמה שיטות המספקות מרווחי אמון ל חפיפה של שתי התפלגויות גאוסיות: enter image description here

החפיפה $ O (P_1, P_2) $ של (בין?) שתי הפצות $ P_1 $ ו- $ P_2 $ יש פרשנות הסתברותית יפה: $$ 1-O (P_1, P_2) = TV (P_1, P_2) $$ איפה $ TV (P_1, P_2) = \ sup_A \ big | P_1 (A) - P_2 (A) \ big | $ הוא מרחק הווריאציה הכולל בין $ P_1 $ ל- $ P_2 $.

פירוש הדבר, לדוגמה, אם $ O (P_1, P_2) >0.9 $ אז ההסתברויות שניתנות ב- $ P_1 $ ו- $ P_2 $ בכל אירוע לא שונות מ- $ 0.1 $ . באופן גס, שתי ההפצות מייצרות את אותן חיזויים עד $ 10 \% $.

לפיכך, במקום להשתמש בקריטריון קבלה המבוסס על ערך קריטי להפרש בין האמצעים $ \ mu_1 $ ו- $ \ mu_2 $, כמו בבדיקות שקילות קלאסיות, נוכל לבסס אותו על ערך קריטי להבדל בין ההסתברויות של התחזיות הניתנות על ידי שתי ההפצות.

אני חושב שיש יתרון מבחינת "אובייקטיביות" של הקריטריון. הערך הקריטי של $ | \ mu_1 - \ mu_2 | $ צריך להינתן על ידי מומחה לבעיה האמיתית: זה צריך להיות ערך שמעבר לו ההבדל הוא בעל חשיבות מעשית. אבל לפעמים לאף אחד אין ידע מוצק אודות הבעיה האמיתית ואין מומחה שמסוגל לספק ערך קריטי. אימוץ ערך קריטי קונבנציונאלי על $ TV (P_1, P_2) $ יכול להיות דרך לקריטריון שאינו תלוי בבעיה הפיזית הנדונה.

במקרה הגאוסי עם אותן שונות, החפיפה היא אחת- לאחד הקשור להפרש הממוצע הסטנדרטי $ \ frac {| \ mu_1- \ mu_2 |} {\ sigma} $.

האם יש לך משאבים כלשהם המראים שחפיפה _משמשת_ בכמה בעיות אמיתיות?זה נשמע מבטיח להפליא, אבל לא ברור לי כיצד ניתן ליישם את זה בבעיה אמיתית (כאשר מסקנותיך הן פוטנציאליות במספר צעדים מ"ההפצה הזו די דומה ל- X ", ובכך מקשה קצת לראות איך זה10% טלוויזיה מתורגמת לגודל ההשפעה על ההסקות).
@StumpyJoePete כתבתי משהו באותה רוח בבלוג שלי: http://stla.github.io/stlapblog/posts/EquivalenceExceedanceProbabilities.html
#6
+5
pmgjones
2010-09-24 14:43:09 UTC
view on stackexchange narkive permalink

במדעי הרפואה, עדיף להשתמש בגישה של רווח סמך בניגוד לשני מבחנים חד-צדדיים (טוסט). כמו כן, אני ממליץ לשרטט את אומדני הנקודות, שיעורי ה- CI ושולי השוויון שנקבעו מראש כדי להבהיר את הדברים.

סביר להניח שאלתך תטופל בגישה כזו.

CONSORT הנחיות למחקרי אי-נחיתות / שווי ערך שימושיות למדי בהקשר זה.

ראה Piaggio G, Elbourne DR, DG Altman, Pocock SJ, Evans SJ ו- CONSORT Group. דיווח על ניסויים אקראיים של אי-נחיתות ושוויון ערך: הרחבה של הצהרת CONSORT. ג'אמה. 2006, 8 במרץ; 295 (10): 1152-60. (קישור לטקסט מלא.)

לא בהכרח הייתי אומר שמועדפים על מרווחי ביטחון. למעשה מרווחי הביטחון תואמים למבחני השערה. ניתן להשיג TOST על ידי התבוננות במרווחי הביטחון המתקבלים על ידי חיתוך שני רווחי הביטחון החד-צדדיים המתאימים לשני מבחני ה- t החד-צדדיים המשמשים בהליך.
#7
+4
Michael R. Chernick
2012-05-06 09:50:57 UTC
view on stackexchange narkive permalink

כן. זו בדיקת שקילות. בעיקרון אתה הופך את ההשערה האפסית והאלטרנטיבית ומבסס את גודל המדגם על הכוח להראות שההבדל בין האמצעים נמצא בתוך חלון השקילות. בלקוולדר כינה זאת "הוכחת השערת האפס". זה נעשה בדרך כלל בניסויים קליניים פרמצבטיים בהם נבדקת שקילות של תרופה גנרית לתרופה המשווקת או בהשוואה לתרופה מאושרת לתכשיר חדש (המכונה לעתים קרובות ביו-שקילות). הגרסה החד-צדדית נקראת אי-נחיתות. פעמים מסוימות ניתן לאשר תרופה רק על ידי מראה כי התרופה החדשה אינה נחותה מהמתחרה המשווקת. Shao ו- Pigeot פיתחו גישה עקבית של bootstrap לשוויון ביולוגי באמצעות עיצובים מוצלבים.

#8
  0
babelproofreader
2010-10-02 04:13:10 UTC
view on stackexchange narkive permalink

הבדלי Bootstrap (למשל ההבדל בין האמצעים) בין שתי קבוצות המדגם ובדקו אם יש משמעות סטטיסטית. תיאור מפורט יותר של גישה זו, אם כי בהקשר אחר, ניתן למצוא כאן http://www.automated-trading-system.com/a-different-application-of-the-bootstrap/

אתה משלב את הכשל של * לקבל את השערת האפס של הבדל * ולמצוא * עדויות לכך ששתי כמויות שוות ערך *.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...