שְׁאֵלָה:
מה ההבדל בין אוכלוסייה לבין מדגם?
Baltimark
2010-07-20 16:07:42 UTC
view on stackexchange narkive permalink

מה ההבדל בין אוכלוסייה לבין מדגם? באילו משתנים וסטטיסטיקה נפוצים משתמשים עבור כל אחד מהם, וכיצד קשורים אלה זה לזה?

קריאת חובה: קריגר, נ '(2012).[מי ומהי "אוכלוסייה"?ויכוחים היסטוריים, מחלוקות עכשוויות והשלכות על הבנת "בריאות האוכלוסייה" ותיקון אי-השוויון בבריאות] (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3530737/pdf/milq0090-0634.pdf).* הרבעון של מילבנק *, 90 (4): 634–681.
חָמֵשׁ תשובות:
#1
+38
Graham Cookson
2010-07-21 19:00:03 UTC
view on stackexchange narkive permalink

האוכלוסייה היא קבוצת הגופים הנחקרים. לדוגמא, הגובה הממוצע של גברים. זו אוכלוסייה היפותטית מכיוון שהיא כוללת את כל הגברים שחיו, חיים ויחיו בעתיד. אני אוהב את הדוגמה הזו מכיוון שהיא מביאה את הנקודה שאנחנו, כאנליסטים, בוחרים את האוכלוסייה שאנחנו רוצים ללמוד. בדרך כלל אי ​​אפשר לסקר / למדוד את כלל האוכלוסייה מכיוון שלא כל החברים נצפים (למשל גברים שיקיימו בעתיד). אם ניתן למנות את כל האוכלוסייה לעיתים קרובות יקר לעשות זאת ויקח זמן רב. בדוגמה שלעיל יש לנו אוכלוסייה "גברים" ופרמטר מעניין, גובהם.

במקום זאת, נוכל לקחת תת קבוצה של אוכלוסייה זו הנקראת מדגם ולהשתמש במדגם זה כדי להסיק על האוכלוסייה. במחקר, בהינתן כמה תנאים. כך נוכל למדוד את הגובה הממוצע של גברים במדגם של האוכלוסייה שאנו מכנים נתונים סטטיסטיים ולהשתמש בזה כדי להסיק מסקנות לגבי פרמטר העניין באוכלוסייה. זו הסקה מכיוון שתהיה אי וודאות וחוסר דיוק בהסקת מסקנות לגבי האוכלוסייה על סמך מדגם. זה צריך להיות מובן מאליו - יש לנו פחות חברים במדגם שלנו מאשר האוכלוסייה שלנו ולכן איבדנו קצת מידע.

ישנן דרכים רבות לבחור מדגם ומחקר זה נקרא תורת הדגימה. שיטה נפוצה נקראת Simple Random Sampling (SRS). ב- SRS לכל אחד מהאוכלוסיות יש סבירות שווה להיכלל במדגם, ומכאן המונח "אקראי". ישנן שיטות דגימה רבות אחרות למשל דגימה מרובדת, דגימת אשכולות וכו 'אשר לכל היתרונות והחסרונות שלהם.

חשוב לזכור כי המדגם שאנו מפיקים מהאוכלוסייה הוא רק אחד ממספר גדול של דגימות פוטנציאליות. אם עשרה חוקרים היו לומדים את אותה אוכלוסיה, מציירים דוגמאות משלהם, הם עשויים לקבל תשובות שונות. אם נחזור לדוגמא הקודמת שלנו, כל אחד מעשרת החוקרים עשוי להגיע לגובה ממוצע שונה של גברים, כלומר הנתון המדובר (גובה ממוצע) משתנה מדגימה לדגימה - יש לו התפלגות הנקראת התפלגות דגימה. אנו יכולים להשתמש בהתפלגות זו כדי להבין את חוסר הוודאות בהערכתנו את פרמטר האוכלוסיה.

התפלגות הדגימה של ממוצע הדגימה ידועה כהפצה נורמלית עם סטיית תקן השווה לסטיית התקן המדגם חלקי גודל המדגם. מכיוון שניתן בקלות לבלבל זאת עם סטיית התקן של המדגם, מקובל יותר לקרוא לסטיית התקן של התפלגות הדגימה ל שגיאת התקן .

האין זה שימוש חסר טעם מעט "כל הגברים אי פעם" כאוכלוסיה? כלומר, אין אפילו הסכמה בת כמה * הומו סאפיאנס * הוא, או האם * הומו ניאנדרטלנסיס * היה זן נפרד, שלא לדבר על אם זכרים של כלי האבן המשתמשים ב * הומו הביליס * נחשבים "גברים". יש להניח שאותן בעיות יעמדו בפנינו גם בעתיד.
בפסקה האחרונה, אני חושב שיש קלות יד קטנה, והיא צריכה לקרוא ... "שווה לסטיית התקן לדוגמא חלקי ** [שורש ריבוע] ** בגודל המדגם" בהתייחס ל [שגיאת תקן] (https://en.wikipedia.org/wiki/Standard_error#standard_error_of_the_mean).
#2
+13
Vivi
2010-07-20 16:21:59 UTC
view on stackexchange narkive permalink

האוכלוסייה היא מכלול הערכים, או יחידים שאתה מעוניין בהם. המדגם הוא קבוצת משנה של האוכלוסייה, והיא קבוצת הערכים שאתה משתמש בפועל להערכתך.

אז לדוגמא, אם אתה רוצה לדעת את הגובה הממוצע של תושבי סין, זו האוכלוסייה שלך, כלומר אוכלוסיית סין. העניין הוא שמדובר במספר די גדול ולא תוכלו לקבל נתונים עבור כולם שם. אז אתה מצייר מדגם, כלומר אתה מקבל כמה תצפיות, או את הגובה של חלק מהאנשים בסין (קבוצת משנה של האוכלוסייה, המדגם) ועושה את ההסקה שלך על סמך זה.

תשובה טובה. אני חושב שכדאי לך להיכנס יותר למה שאתה מתכוון ב"עשה את ההסקה שלך על סמך זה ". זה סוג של החלק השני של השאלה שלי.
מממ ... לא ממש הבנתי למה התכוונתם לאיזה משתנים וסטטיסטיקה נפוצים ... אה, אתה מתכוון כאילו אתה משתמש בהתפלגות z אם יש לך את שונות האוכלוסייה ואת התפלגות t אם יש לך רק את השונות לדוגמא וגודל המדגם קטן? משהו בסגנון הזה?
מה שהגעתי אליו היה שהממוצע וסטיית התקן הם פרמטרים המשויכים לאוכלוסיה, אך הם מוערכים לפי ממוצע המדגם ((1 / N) * \ sum (x_i)) וסטיית התקן לדוגמה ((1 / ( N-1)) * \ sum (x_i - x ^ bar) ^ 2).
#3
+8
Neil McGuigan
2010-07-20 22:41:00 UTC
view on stackexchange narkive permalink

האוכלוסייה היא הכל בקבוצת המחקר. לדוגמה, אם אתה בוחן את מחיר המניות של אפל, זה מחירי המניות ההיסטוריים, הנוכחיים ואפילו כל העתידיים. לחלופין, אם אתה מנהל מפעל לביצים, כל הביציות שמייצר המפעל.

לא תמיד אתה צריך לדגום ולעשות בדיקות סטטיסטיות. אם האוכלוסייה שלך היא משפחתך הקרובה ביותר, אינך צריך לדגום מכיוון שהאוכלוסיה קטנה.

הדגימה פופולרית ממגוון סיבות:

  • היא זולה יותר ממפקד (דגימת כל האוכלוסייה)
  • אין לך גישה לנתונים עתידיים, לכן עליך לדגום את העבר
  • אתה צריך להשמיד כמה פריטים על ידי בדיקתם, ולא רוצה להשמיד את כולם (נגיד ביצים)
#4
+2
roseleneramas
2014-01-16 14:25:49 UTC
view on stackexchange narkive permalink

כאשר אנו חושבים על המונח "אוכלוסיה", אנו בדרך כלל חושבים על אנשים בעירנו, באזורנו, במדינתנו ובמדינתנו ועל מאפייניהם בהתאמה, כגון מין, גיל, מצב משפחתי, חברות אתנית, דת וכו '. בסטטיסטיקה המונח "אוכלוסייה" מקבל משמעות שונה במקצת. "האוכלוסייה" בסטטיסטיקה כוללת את כל חברי הקבוצה המוגדרת עליה אנו לומדים או אוספים מידע לקבלת החלטות מונעות נתונים.

חלק מהאוכלוסייה נקרא מדגם. זהו חלק מהאוכלוסייה, נתח ממנה, חלק ממנה וכל מאפייניה. מדגם הוא קבוצה מצוירת מדעית שלמעשה מחזיקה באותם מאפיינים כמו האוכלוסייה - אם היא מצוירת באופן אקראי. (זה יכול להיות קשה לך להאמין, אבל זה נכון!) בעלי שני מאפיינים:

* לכל אדם יש הזדמנות שווה להיבחר לדוגמא שלך; ו

* בחירה של אדם אחד אינה תלויה בבחירת אדם אחר. אז אם תדגימו 500 משקי בית בקהילה שלכם, תוכלו להכליל ל -50,000 משקי הבית שגרים שם. אם אתה תואם חלק מהמאפיינים הדמוגרפיים של 500 עם 50,000, תראה שהם דומים באופן מפתיע.

זה בעצם נכון, אם מפרשים אותו כראוי. אני חושש מכך שקוראים מסוימים יוטעו לחשוב שדגימות אקראיות פשוטות עם החלפה (שזה סוג המדגם האקראי שאתה מתאר; יש סוגים אחרים) משחזרות נכון את * כל * מאפייני האוכלוסייה. למעשה, הם רק לעתים רחוקות. נקודת הדגימה האקראית היא שניתן לייחס את ההבדלים (הבלתי נמנעים) בין מאפייני המדגם לבין מאפייני האוכלוסייה.
#5
  0
user91513
2015-10-08 05:56:32 UTC
view on stackexchange narkive permalink

אוכלוסייה כוללת את כל האלמנטים ממערכת נתונים. מדגם מורכב מתצפית אחת או יותר מהאוכלוסייה. BOA, A. (2012, 17)

כאשר כל האלמנטים של "קבוצת נתונים" נחשבים אוכלוסיה, מערך הנתונים הזה נקרא * מפקד אוכלוסין *.מעט מאוד מערכי נתונים הם מפקדים.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...