שְׁאֵלָה:
מסקנה סטטיסטית כאשר המדגם "הוא" האוכלוסייה
pbneau
2010-09-13 23:35:24 UTC
view on stackexchange narkive permalink

תאר לעצמך שאתה צריך לדווח על מספר המועמדים שנבחנים מדי שנה במבחן נתון. נראה שקשה למדי להסיק את אחוז ההצלחה הנצפה, למשל, באוכלוסייה רחבה יותר בגלל הספציפיות של אוכלוסיית היעד. אז אתה יכול לשקול כי נתונים אלה מייצגים את כלל האוכלוסייה.

האם תוצאות בדיקות המצביעות על כך שפרופורציות הזכרים והנקבות שונות באמת נכונות? האם נראה שמבחן המשווה בין פרופורציות נצפות ותיאורטיות הוא נכון, מכיוון שאתה מחשיב אוכלוסיה שלמה (ולא מדגם)? ​​

חָמֵשׁ תשובות:
#1
+32
ars
2010-09-14 00:30:10 UTC
view on stackexchange narkive permalink

יכולות להיות דעות שונות על כך, אבל הייתי מתייחס לנתוני האוכלוסייה כמדגם ומניח אוכלוסיה היפותטית ואז מסיק מסקנות בדרך הרגילה. אחת הדרכים לחשוב על זה היא שיש תהליך הפקת נתונים בסיסי האחראי על הנתונים שנאספו, התפלגות ה"אוכלוסיה ".

במקרה הספציפי שלך, זה עשוי להיות הגיוני עוד יותר מכיוון שיהיו לך קבוצות בעתיד. אז האוכלוסייה שלך היא ממש קבוצות שעוברות את המבחן גם בעתיד. באופן זה, תוכל להסביר וריאציות מבוססות זמן אם יש לך נתונים במשך יותר משנה, או לנסות להתחשב בגורמים סמויים באמצעות מודל השגיאה שלך. בקיצור, תוכלו לפתח מודלים עשירים יותר בעלי כוח הסבר גדול יותר.

זה עתה נתקלתי בפוסט זה מאת A Gelman, * במה שונה ניתוח סטטיסטי בעת ניתוח האוכלוסייה כולה ולא מדגם? *, Http://j.mp/cZ1WSI. נקודת התחלה טובה לגבי דעות שונות על מושג "אוכלוסיית על".
@chl: מעניין - מזכיר לי שלגלמן היה דיון בהסקת אוכלוסיה סופית / סופר אוכלוסית בהשוואה לתופעות קבועות / אקראיות במאמרו על ANOVA [http://www.stat.columbia.edu/~gelman/research/published /econanova3.pdf].
+1 בדיוק חזרתי לזה שוב (דרך google). אני חושב שהתשובה שלך נכונה.
#2
+26
Joris Meys
2010-09-14 01:12:57 UTC
view on stackexchange narkive permalink

למעשה, אם אתה באמת חיובי שיש לך את כל האוכלוסייה, אפילו אין צורך להיכנס לסטטיסטיקה. אז אתה יודע בדיוק כמה ההבדל גדול ואין שום סיבה לבדוק אותו יותר. טעות קלאסית היא שימוש במובהקות סטטיסטית כמשמעות "רלוונטית". אם דגימתם את האוכלוסייה, ההבדל הוא מהי.

מצד שני, אם תנסחו מחדש את ההשערה שלכם, ניתן לראות במועמדים מדגם של מועמדים אפשריים, מה שיאפשר בדיקה סטטיסטית. . במקרה זה, היית בודק באופן כללי האם זכר ונקבה נבדלים על הבדיקה העומדת על הפרק.

כפי שנאמר ב- ars, אתה יכול להשתמש במבחנים של מספר שנים ולהוסיף זמן כגורם אקראי. אבל אם האינטרס שלך באמת הוא בהבדלים בין מועמדים אלה במבחן מסוים זה, אינך יכול להשתמש בהכללה והבדיקה חסרת טעם.

#3
+17
Brett
2010-09-14 23:15:21 UTC
view on stackexchange narkive permalink

באופן מסורתי, ההסקה הסטטיסטית נלמדת בהקשר של דגימות הסתברות ואופי טעות הדגימה. מודל זה הוא הבסיס למבחן המשמעות. עם זאת, ישנן דרכים אחרות לדגמן סטייה שיטתית מהמקרה ומתברר כי הבדיקות הפרמטריות שלנו (מבוססות הדגימה) נוטות להיות קירוב טוב לחלופות אלה.

בדיקות פרמטריות של השערות מסתמכות על תיאוריית הדגימה כדי לייצר אומדנים של שגיאה סבירה. אם מדגם בגודל נתון נלקח מאוכלוסיה, הידע על שיטת הדגימה השיטתית הופך את משמעות הבדיקה ורווחי הביטחון למשמעותיים. אצל אוכלוסייה, תיאוריית הדגימה פשוט אינה רלוונטית והמבחנים אינם משמעותיים במובן המסורתי. מסקנה היא חסרת תועלת, אין מה להסיק, יש רק את הדבר ... הפרמטר עצמו.

יש כאלה שעוקפים את זה על ידי פנייה לאוכלוסיות-על שהמפקד הנוכחי מייצג. לדעתי ערעורים אלה אינם משכנעים - מבחנים פרמטריים מתבססים על דגימת הסתברות ומאפייניה. אוכלוסייה בזמן נתון עשויה להיות מדגם של אוכלוסייה גדולה יותר לאורך זמן ומקום. עם זאת, אני לא רואה שום דרך שבה ניתן לטעון באופן לגיטימי שמדובר במדגם אקראי (או באופן כללי יותר בצורה כלשהי של הסתברות). ללא מדגם הסתברות, תיאוריית הדגימה וההיגיון המסורתי של בדיקות פשוט אינן חלות. באותה מידה תוכל לבדוק על בסיס מדגם נוחות.

ברור שכדי לקבל בדיקה בעת שימוש באוכלוסיה, עלינו לוותר על הבסיס של אותם בדיקות בהליכי דגימה. אחת הדרכים לעשות זאת היא לזהות את הקשר ההדוק בין המבחנים התיאורטיים המדגמיים שלנו - כגון t, Z ו- F - ובין הליכי אקראיות. מבחני אקראיות מבוססים על המדגם הקיים. אם אאסוף נתונים על הכנסות זכרים ונקבות, מודל ההסתברות והבסיס לאומדני הטעות שלנו הם הקצאות אקראיות חוזרות ונשנות של ערכי הנתונים בפועל. יכולתי להשוות הבדלים שנצפו בין קבוצות להתפלגות על סמך אקראיות זו. (אנו עושים זאת כל הזמן בניסויים, אגב, כאשר הדגימה האקראית ממודל אוכלוסיה אינה מתאימה לעתים נדירות). מבחנים. לכן, בסופו של דבר, אני חושב שמבחנים מאוכלוסיות מועילים ומשמעותיים במסגרת זו ויכולים לעזור להבחין בין שיטתיות לבין וריאציות מקריות - ממש כמו במבחנים מבוססי-מדגם. ההיגיון המשמש לשם הגעה הוא מעט שונה, אך אין לו השפעה רבה על המשמעות המעשית ועל השימוש במבחנים. כמובן, אולי עדיף פשוט להשתמש במבחני אקראיות ותמורות באופן ישיר בהתחשב בכך שהם זמינים בקלות עם כל כוח המחשוב המודרני שלנו.

+1 לדיון הגיוני; כמה נקודות אף. מכונות מסקנות אינן זמינות לניתוח אוכלוסין, אך במקרים רבים של דוגמנות הייתי שואל אם יש למישהו * את * נתוני האוכלוסייה מלכתחילה - לעתים קרובות, לא קשה מאוד לתקוע חורים. אז זה לא * תמיד * פנייה לאוכלוסיית-על כאמצעי לפרוש הסקה. במקום "אוכלוסיית על", הדרך הטובה יותר היא להניח תהליך הפקת נתונים המניב, למשל, מבחן משנה לשנה שלוקח קבוצות דנן. שם נוצר המרכיב הסטוכסטי.
אני לא חושב שיש כאן מחלוקת, למעט היעדר מכונות מסקנות לניתוח אוכלוסייה. מבחני אקראיות רלוונטיים לאוכלוסיות ויכולים לבדוק באופן סביר אם תהליך ייצור הנתונים נובע ככל הנראה מתהליך ייצור אקראי לעומת תהליך ייצור שיטתי. הם לא מניחים דגימה אקראית והם מבחן ישיר למדי של סיכוי לעומת וריאציה שיטתית. המבחנים המסורתיים שלנו עומדים במקרה די טוב עבורם.
זה נכון מחדש: "מחסור במכונות הסקת מסקנות". ניסוח רשלני מצדי, במיוחד מכיוון שאהבתי את הנקודה שהעלית לגבי מבחני אקראיות בתשובתך.
מצטער. יש לי קשיים להבין כיצד אוכל לחשב תמורות ואילו מסקנות אוכל להסיק עבורן.
האם bootstrapping אינו חלופה תקפה?כיצד bootstrapping אינו מצליח לפתור את הצורך להניח את אחת מההנחות הללו?
#4
+4
dca
2016-06-19 22:43:18 UTC
view on stackexchange narkive permalink

נניח שהתוצאות מצביעות על כך שהמועמדים נבדלים על פי מגדר. לדוגמא, שיעור המשתלמים במבחנים הוא כדלקמן: 40% נשים ו -60% גברים. כדי להציע את הברור מאליו, 40% שונה מ -60%. עכשיו מה שחשוב הוא להחליט: 1) אוכלוסיית העניין שלך; 2) איך התצפיות שלך מתייחסות לאוכלוסיית העניין. להלן מספר פרטים על שני הנושאים הללו:

  1. אם אוכלוסיית העניין שלך היא רק המועמדים שצפית בהם (למשל, 100 המועמדים שהגישו מועמדות לאוניברסיטה בשנת 2016), אתה אין צורך לדווח על מבחני מובהקות סטטיסטיים. הסיבה לכך היא שאוכלוסיית העניין שלך נדגמה לחלוטין ... כל מה שמעניין אותך זה 100 המועמדים עליהם יש לך נתונים מלאים. כלומר, 60% הם נקודת התחנה, שונה מ -40%. סוג השאלה שעונה על כך, האם היו הבדלים בין המינים באוכלוסיית 100 הפונים לתוכנית? זו שאלה תיאורית והתשובה חיובית.

  2. עם זאת, שאלות חשובות רבות עוסקות במה שיקרה במסגרות שונות. כלומר, חוקרים רבים רוצים להעלות מגמות על העבר שעוזרות לנו לחזות (ואז לתכנן) את העתיד. שאלה לדוגמא בהקשר זה תהיה: עד כמה סביר שמבחנים עתידיים של מועמדים יהיו שונים במגדר? אוכלוסיית העניין גדולה יותר מאשר בתרחיש מס '1 לעיל. בשלב זה, שאלה חשובה שיש לשאול היא: האם הנתונים הנצפים שלך עשויים להיות מייצגים את המגמות העתידיות? זו שאלה מסקנת, ועל סמך המידע שמספק הכרזה המקורית, התשובה היא: איננו יודעים.

לסיכום, תלויה הסטטיסטיקה שאתה מדווח עליה. על סוג השאלה שאתה רוצה לענות עליה.

חשיבה על תכנון מחקר בסיסי עשויה להועיל ביותר (נסה כאן: http://www.socialresearchmethods.net/kb/design.php). חשיבה על אוכלוסיות-על עשויה להועיל אם ברצונך לקבל מידע מתקדם יותר (הנה מאמר שעשוי לעזור: http://projecteuclid.org/euclid.ss/1023798999#ui-tabs-1).

#5
+2
James
2010-09-14 19:58:43 UTC
view on stackexchange narkive permalink

אם אתה מחשיב כל מה שאתה מודד כתהליך אקראי, אז כן מבחנים סטטיסטיים רלוונטיים. קחו לדוגמא, הופכים מטבע 10 פעמים כדי לראות אם הוא הוגן. אתה מקבל 6 ראשים ו -4 זנבות - מה אתה מסיק?

אני לא ממש מבין איך המסקנה אליה הגעת לעניין השלכת מטבע קשורה לשאלה שנשאלה. אולי תוכל להרחיב מעט בנקודה זו? נראה כי מבחנים סטטיסטיים רלוונטיים במידה שהם עוזרים להסיק תוצאות נצפות לאוכלוסייה גדולה יותר, בין אם מדובר בהתייחסות ובין אם מדובר באוכלוסייה כללית. נראה כי השאלה כאן היא: בהתחשב בכך שהמדגם קרוב לאוכלוסיית הנבחנים למשך פרק זמן קבוע (כאן, שנה), האם מסקנה קלאסית היא הדרך הנכונה להגיע להחלטה לגבי הבדלים אפשריים ברמה האישית?
@chl כן, אך נראה כי OP מנסה להסיק את ההסתברות הבסיסית להצלחה. המבחנים משווים את הפרופורציות שנצפו להתפלגות התיאורטית כדי לקבוע אם יש הבדל לרמת ביטחון נתונה. אתה בודק כל סוג של אקראיות, ולא רק אקראיות לשגיאות דגימה.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...