שְׁאֵלָה:
מדוע להשתמש במבחן z ולא במבחן t עם נתונים פרופורציונליים?
user41270
2014-03-21 20:39:22 UTC
view on stackexchange narkive permalink

כאשר בודקים את ההבדל בין 2 פרופורציות מדוע אנו משתמשים במבחן z ולא במבחן t?

יתר על כן, האם יש דרך פשוטה לבצע בדיקת אומניבוס להבדלים משמעותיים בין יותר מ -2 פרופורציות (בצורה של אחוזים). האם יש לכך מקבילה ל- ANOVA חד כיווני? אני מתאר לעצמי שתוכל להשתמש ברגרסיה לוגיסטית (בהנחה שיש לך את הנתונים המקוריים עבור הפרופורציות בצורה של 0s ו- 1s) האם יש אפשרויות אחרות?

אם $ \ hat p = s / n $ מעריך $ p. $ אז $ np $ מעריך אוכלוסיית ממוצע ו- $ np (1-p) $ מעריך את שונות האוכלוסייה.// בסטטיסטיקה t הממוצע והשונות מוערכים על ידי כמויות עצמאיות סטוכסטית.
שתיים תשובות:
Glen_b
2014-03-22 04:45:17 UTC
view on stackexchange narkive permalink

גרסה קצרה: אינך משתמש במבחן t מכיוון שלנתון הברור אין חלוקת t. יש לה (בערך) התפלגות z.

גרסה ארוכה יותר:

במבחני ה- t הרגילים, הסטטיסטיקה של t היא כולם בצורה: $ \ frac {d} {s} $ , כאשר $ s $ הוא שגיאת תקן משוערת של $ d $ . התפלגות t נובעת מהבאים:

1) $ d $ מופץ בדרך כלל (עם ממוצע 0, מכיוון שאנחנו מדברים על הפצה תחת $ H_0 $ )

2) $ ks ^ 2 $ הוא $ \ chi ^ 2 $ , עבור חלק $ k $ (אני לא רוצה לפרט את הפרטים של מה $ k $ יהיה, מכיוון שאני מכסה כאן צורות רבות ושונות של מבחן t)

3) $ d $ ו $ s $ אינם עצמאיים

אלה קבוצה די מחמירה של נסיבות. אתה מקבל את שלושתם להחזיק רק כאשר יש לך נתונים רגילים.


אם במקום זאת, ההערכה, $ s $ מוחלפת ב הערך האמיתי של השגיאה הסטנדרטית של $ d $ ( $ \ sigma_d $ ), סוג זה של נתון תהיה $ z- $ הפצה.


כאשר גדלי המדגם גדולים מספיק, נתון כמו $ d $ (שלעתים קרובות הוא ממוצע משונה או הבדל של אמצעי) לעתים קרובות מבוזר באופן נורמלי ללא סימפטומים *, בגלל משפט הגבול המרכזי.

* ליתר דיוק, a גרסה סטנדרטית של $ d $ , $ d / \ sigma_d $ תהיה רגילה מבחינה סימפטומית רגילה

אנשים רבים חושבים שהדבר מצדיק באופן מיידי שימוש במבחן t, אך כפי שאתה רואה מהרשימה שלעיל, עמדנו רק בפעם הראשונה משלושת התנאים שבהם נגזר מבחן ה- t.

מצד שני, יש משפט נוסף, שנקרא משפט סלוצקי שעוזר לנו. כל עוד המכנה מתכנס בהסתברות לאותה שגיאת תקן לא ידועה, $ \ sigma_d $ (מצב חלש למדי), אז $ d / s $ אמור להתכנס להתפלגות נורמלית רגילה.

בדיקות הפרופורציות המקובלות בדו-מימד אחד ושתיים הן מהצורה הזו, ולכן יש לנו הצדקה להתייחס אליהן כאל נורמליות מבחינה סימפטומית , אך אין לנו הצדקה להתייחס אליהם כאל $ t $ - מופץ.

בפועל, כל עוד $ np $ ו $ n (1-p) $ אינם קטנים מדי **, הנורמליות האסימפטוטית של המדגם האחד והשני מבחני הפרופורציות נכנסים במהירות רבה (כלומר, לעתים קרובות מפתיע $ n $ קטן להפליא כדי ששני המשפטים 'יכנסו' כביכול וההתנהגות האסימפטוטית תהיה קירוב טוב להתנהגות מדגמית קטנה).

** אם כי ישנן דרכים אחרות לאופי אנזה "גדולה דיה" מכך, נראה שתנאים מסוג זה הם הנפוצים ביותר.

אמנם לא נראה שיש לנו טיעון טוב (לפחות לא שראיתי) שיביא לכך יש לצפות ש- t יהיה טוב יותר מ- z כקירוב להתפלגות הבדידה של נתון הבדיקה בכל גודל מדגם מסוים, עם זאת בפועל נראה שהקירוב המתקבל באמצעות מבחן t על נתונים 0-1 די טוב. , כל עוד התנאים הרגילים שבהם ה- z אמור להחזיק בקירוב סביר.

האם יש דרך פשוטה לבצע בדיקת אומניבוס להבדלים משמעותיים בין יותר מ -2 פרופורציות (בצורה אחוזים)

בטח. אתה יכול לשים את זה בצורה של מבחן ריבועי צ'י.

(אכן, בדומה ל- ANOVA אתה יכול אפילו לבנות ניגודים והשוואות מרובות וכאלה.)

לא ברור מ שאלתך, לעומת זאת, אם בהכללה שלך יהיו שתי דוגמאות עם מספר קטגוריות, או מספר דגימות עם שתי קטגוריות (או אפילו שתיהן בבת אחת, אני מניח). בשני המקרים, אתה יכול להשיג כיכר צ'י. אם אתה ספציפי יותר אני אמור לתת פרטים ספציפיים יותר.

+1, זו תשובה טובה, יסודית הרבה יותר משלי. אני זהיר לגבי מבחן הצ'י בריבוע. העניין במבחן הצ'י בריבוע הוא שהוא לא מניח שאחד המשתנים הוא משתנה הסבר ואחד הוא משתנה תגובה, כך שאם זה נכון, יש לך פחות כוח מאשר לומר רגרסיה לוגיסטית עם כל המנבאים הקטגוריים. אני מתאר זאת בתשובה האחרת אליה אני מקשר בתשובתי כאן.
@gung כפי שקראתי אותו, השאלה המוצגת היא שוויון הסתברויות בין קטגוריות ("* מבחן אומניבוס להבדלים משמעותיים בין יותר מ -2 פרופורציות *"). כיכר הצ'י עושה זאת. למעשה ניתן לנסח מגוון רחב של בעיות השוואת פרופורציות, עם מספר גורמים (/ משתני הסבר) כריבועי צ'י דמויי ANOVA (חד כיווני, דו כיווני וכן הלאה), עם מחיצות של סכומי ריבועים. הוחלף במחיצות של ריבועי צ'י. אתה יכול להיות מופתע עד כמה רחוק ההיקש.
תשובה פנטסטית - צריך להפוך את התשובה הקנונית לאיזו נקודה כל האחרים שקשורים למבחן t של פרופורציה.
+1 @gung-ReinstateMonica glen_b כאשר אתה כותב "מבחן אומניבוס להבדלים משמעותיים בין יותר מ -2 פרופורציות" כנראה חשוב להוסיף את המוקדמות המפורשת "בנתונים לא חסומים": מבחן אומניבוס לפרופורציות על פני * נתונים חסומים * הוא [שאלה של קוקראן* test] (https://en.wikipedia.org/wiki/Cochran%27s_Q_test) (אם כי אתה יכול להשתמש במבחן של McNemar כשיש לך רק שני חסימות ... כלומר הנתונים 'משויכים').בדיוק כמו שיש ANOVA וניל ומודדים חוזרים ונשנים ANOVA עבור נתונים נורמליים בערך עם = vars, יש $ \ chi ^ {2} $ ו- * Q * של Cohran לפרופורציות בינומיות.
[אן] (https://stats.stackexchange.com/users/284162/ann) מצביע (בתשובה שנמחקה) על: "נאותותם של כמה פרוצדורות נפוצות לבדיקת שוויוניותן של שתי אוכלוסיות בינומיות עצמאיות מאת ראלף ב 'ד.אגוסטינו, וורן צ'ייס ואלברט בלנג'ר. המחברים כותבים "במאמר זה אנו מדגימים כי גם עבור דגימות קטנות, מבחן הצ'י בריבוע הלא מתוקן (כלומר, מבחן הצ'י בריבוע של פירסון) ומבחן הדו-עצמאי הדו-ממדי.חזקים בכך שרמות המשמעות בפועל שלהם בדרך כלל קרובות לרמות הנומינליות או קטנות יותר.אנו ממליצים להשתמש בשני המבחנים האחרונים הללו. "
gung - Reinstate Monica
2014-03-21 20:52:51 UTC
view on stackexchange narkive permalink

הסיבה שאתה יכול להשתמש במבחן $ z $ עם נתוני פרופורציה היא מכיוון שסטיית התקן של פרופורציה היא פונקציה של הפרופורציה עצמה. לפיכך, לאחר שהערכת את הפרופורציה במדגם שלך, אין לך מקור נוסף של אי וודאות שעליך לקחת בחשבון. כתוצאה מכך, אתה יכול להשתמש בהתפלגות הרגילה במקום בהפצה $ t $ כהפצת הדגימה שלך. למידע נוסף על כך, עיין בתשובתי כאן: המבחן $ z $ לעומת המבחן $ \ chi ^ 2 $ להשוואת הסיכויים להצטנן בשתי קבוצות.

אם יש לך יותר משתי קבוצות, אתה יכול להשתמש ברגרסיה לוגיסטית, כפי שאתה מציין. אתה צריך לדעת את $ n_j $ s בכל קבוצה עם זאת. אם היו לך רק קבוצה של פרופורציות נצפות, אך לא ידעת כמה ניסויים נצפו כדי ליצור פרופורציות אלה, אינך יכול לערוך בדיקה מתאימה האם הפרופורציות שונות.

חשבתי שמבחן ה- t מיועד לנתונים מופצים _נורמלי_, עם סטיית תקן לא ידועה, ונותן לך בדיקה מדויקת (או _ מרווח_ביטחון_), ואילו מבחן z מיועד לנתונים מבוזרים רגילים בערך_ ונותן מבחן משוער (או ביטחון מרווח) - או שהאמירה זהה לתשובתך אך באופן אחר?
תוכלו לראות עוד בתשובה המקושרת שלי, @TooTone. שתי המבחנים משווים את נתון הבדיקה המחושב להתפלגות הדגימה שהניחה לנתון הבדיקה ההוא. אם נתוני הבדיקה שלך חושבו ממדגם של נתונים מאוכלוסייה נורמלית, אך כאשר יש צורך לחשב את הממוצע וה- SD מהמדגם, יש לקחת בחשבון את שני מקורות האי וודאות, ומתברר כי התפלגות הדגימה יהיה $ t $. אם אינך צריך לדאוג לחוסר וודאות גם ב- SD, b / c זה ידוע אפריורי או שהמדגם שלך הוא אינסופי, אז התפלגות הדגימה תהיה תקינה.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.
Loading...