שְׁאֵלָה:
מדוע הגיל החציוני הוא נתון טוב יותר מגיל הממוצע?
Lazer
2010-09-11 01:26:57 UTC
view on stackexchange narkive permalink

alt text

alt text

ברור ש חציון נראה נתון הבחירה בכל מה שקשור לגילאים.

אני לא מסוגל להסביר לעצמי מדוע אריתמטיקה תהיה נתון גרוע יותר. מדוע זה כך?

במקור פורסם כאן מכיוון שלא ידעתי שקיים אתר זה. Sub>

נראה שכבר הייתה לך תשובה סבירה באתר השני?
@Shane: אבל אולי אתרים שונים טומנים בחובם פוטנציאל לצבור תשובות שונות מנקודות מבט שונות?
ארבעה עשר תשובות:
#1
+47
whuber
2010-09-11 03:17:24 UTC
view on stackexchange narkive permalink

לסטטיסטיקה אין תשובה טובה לשאלה זו, לדעתי. ממוצע יכול להיות רלוונטי במחקרי תמותה למשל, אך גילאים אינם קלים למדידה כפי שאפשר לחשוב. אנשים מבוגרים, אנשים אנאלפביתים ואנשים בכמה מדינות עולם שלישי נוטים לעגל את גילם לכפול של 5 או 10, למשל.

החציון עמיד יותר בפני שגיאות כאלה מאשר הממוצע. יתר על כן, הגילאים החציוניים הם בדרך כלל 20 - 40, אך אנשים יכולים לחיות עד 100 ויותר (שיעור גדל וניכר מאוכלוסיית המדינות המודרניות חי כיום מעבר למאה). לאנשים בגיל כזה השפעה של פי 1.5 עד 4 על הממוצע מאשר על החציון בהשוואה לאנשים צעירים מאוד. לפיכך, החציון הוא סטטיסטיקה קצת יותר עדכנית לגבי התפלגות הגילאים במדינה והוא קצת יותר עצמאי משיעורי התמותה ותוחלת החיים מאשר הממוצע.

לבסוף, החציון נותן לנו תמונה מעט טובה יותר איך נראית התפלגות הגילאים עצמה: כשאתה רואה חציון של 35, למשל, אתה יודע שמחצית האוכלוסייה מבוגרת מגיל 35 ואתה יכול להסיק כמה דברים לגבי שיעורי הילודה, גיל ההורים וכו '. ; אבל אם ה ממוצע הוא 35, אינך יכול להגיד כל כך הרבה, מכיוון ש- 35 יכולים להיות מושפעים מבעיית אוכלוסייה גדולה בגיל 70 למשל, או אולי מפער אוכלוסין בטווח גילאים כלשהו למלחמה או מגיפה ישנה.

לכן, מסיבות דמוגרפיות, לא סטטיסטיות, , חציון נראה ראוי יותר לתפקיד של ערך אומניבוס. לסיכום הגילאים של אוכלוסיות גדולות יחסית של אנשים.

אני חושב שהתכוונת "החציון עמיד יותר לטעויות כאלה מאשר הממוצע". אני מסכים עם ההערות שלך, ואני מאמין שמפקד האוכלוסין בארה"ב מדווח בדרך כלל על חציון עבור קטגוריות רבות בדוחות רשמיים (לא רק בגיל) מאותן סיבות. הכנסה היא אולי אפילו דוגמה טובה יותר מגיל כדי להמחיש נקודות כאלה.
החלפת עובדה - הממוצע רגיש לחריגים / התפלגויות מוטות - באמירה ערכית לגבי העדפת החציון על פני הממוצע. למעשה, טענת כי אין להעדיף את הממוצע מכיוון שהוא אינו החציון (בדומה לאלו שאומרים שיש להשתמש בממוצע רק על התפלגויות סימטריות, כלומר כאשר הממוצע והחציון שווים).
@Alexis אני לא עוקב אחר הביקורת שלך. האם תוכל לפרט? אחרי הכל, תשובה זו מספקת הרבה יותר מ"עובדה ": היא מכילה לא מעט מהן, יחד עם ניתוח השלכותיהן. ובאופן ספציפי לאיזה "הצהרת ערך" אתה מתייחס?
הדאגה שלי היא שמאפיינים עובדתיים של הממוצע והחציון (למשל הראשון רגיש לחריגים, כלומר "אנשים בגיל כזה משפיעים פי 1.5 עד 4 על הממוצע מאשר על חציון בהשוואה לאנשים צעירים מאוד.") מתורגמים ל * ערכים * על ערכם, דהיינו "החציון נותן לנו תמונה מעט טובה יותר כיצד נראית התפלגות הגילאים עצמה". הראשון הוא עובדה, מאוחר יותר הערכת שווי של עובדה זו. הדאגה שלי היא עם המעבר בין השניים. עוד: http://stats.stackexchange.com/questions/96371/should-the-mean-be-used-when-data-are-skewed
@Alexis תודה. אני עדיין נאבק להבין מה הכוונה ב"ערכים ". הצהרתי על האמינות שבה הנתונים הסטטיסטיים נותנים לנו מידע על התפלגויות, ולא על כמה שאנשים דואגים לגילאים שונים (וזה מה ש"ערך "בדרך כלל מתכוון בהקשר כזה). אני תומך בהצהרה זו במידה רגילה של רגישות (ההשפעה). אם היית יכול לעזור לי להבין טוב יותר את הדאגה שלך, אשמח להבהיר את ההודעה בנושא זה. (לחלק מהמשיבים לשאלה המקושרת יש בעיות דומות בהבנת הדאגה שלך).
@whuber (תודה על סבלנותך), זה השימוש במילים כמו "טוב יותר" בציטוט בתגובה הקודמת שלי, שלדעתי נושא כאן את הקונוטציה "כמה אכפת לאנשים". אני מניח שאני מנסה לדחוק את השאלה "האם איננו מתכוונים לשונה, לא טוב יותר?"
@Alexis יש לזכור כי שאלה זו אינה עוסקת בשימוש בממוצע או בחציון באופן כללי, אלא בכלי השירות שלהם בהערכת * התפלגויות גיל. * שים לב שבראשית הדברים התשובה שלי מודה שאין תרופת פלא: שהממוצע הוא שימושי ורלוונטי * למטרות ספציפיות. * אני לא חושב שעשיתי את החטא שבו אתה מאשים אותי, שהוא היישום המעורפל של "טוב יותר": קבעתי בקפידה * כיצד * החציון והממוצע שונים * בהקשר זה *. נשמע לי שיש לך בעיה להלקות לגבי אמצעים * לעומת * חציונים, אבל זה לא המקום לעשות את זה.
#2
+17
Dirk Eddelbuettel
2010-09-11 01:48:50 UTC
view on stackexchange narkive permalink

ג'ון נתן לך תשובה טובה באתר האחיות.

היבט אחד שהוא לא הזכיר במפורש הוא החוסן: חציון כמדד ל מיקום מרכזי עושה טוב יותר מהממוצע מכיוון שיש לו נקודת פירוט גבוהה יותר (של 50%) ואילו הממוצע נמוך מאוד של 0 (ראה ויקיפדיה לפרטים).

באופן אינטואיטיבי, המשמעות היא שתצפיות גרועות אינדיבידואליות אינן מטות את החציון ואילו הן מתכוונות לממוצע.

פירוט אינו נושא לנתון תיאורי של אוכלוסייה שלמה.
#3
+12
John D. Cook
2010-09-11 19:20:44 UTC
view on stackexchange narkive permalink

הנה התשובה שלי שפורסמה לראשונה ב- math.stackexchange:

חציון הוא מה שאנשים רבים באמת חושבים כאשר הם אומרים "מתכוון". קל יותר לפרש את החציון: חצי מהאוכלוסייה מעל גיל זה ומחציתם מתחת. הממוצע הוא קצת יותר עדין.

אנשים מחפשים סימטריה ולפעמים מטילים סימטריה כשהיא לא שם. התפלגות הגילאים באוכלוסייה רחוקה מלהיות סימטרית, כך שהממוצע עלול להטעות. חלוקות גיל הן משהו כמו פירמידה. הרבה ילדים, לא הרבה קשישים. (או לפחות ככה זה במצב של יציבות. בארה"ב דור הבייבי בום שלאחר מלחמת העולם השנייה עיוות את ההתפלגות הזו ככל שהם מתבגרים. יש אנשים שכינו זאת "בריבוע הפירמידה" מכיוון שהבומרים עשו בראש הפירמידה רחב יותר ממה שהיה בעבר.)

עם התפלגות א-סימטרית, אולי עדיף לדווח על החציון מכיוון שמדובר בנתון סימטרי. החציון הוא סימטרי גם אם התפלגות הדגימה אינה.

באיזה מובן החציון הוא נתון "סימטרי"? זה בהחלט לא המקרה שההפצות נוטות להיות מופצות באופן סימטרי על החציונים שלהם (וגם לא על האמצעים שלהם). אם אתה מתכוון רק למה שכתבת בתגובה אחרת לפיה "החציון מחלק את האוכלוסייה לשניים" (מה שמגדיר * את החציון), הטיעון שלך נשמע מעגלי: החציון הוא טוב כי החציון הוא החציון!
#4
+7
John
2010-09-11 05:30:30 UTC
view on stackexchange narkive permalink

מדוע גרזן טוב יותר מאשר גרזן?

זה דומה לשאלתך. הם פשוט מתכוונים ועושים דברים שונים. אם מדברים על חציונים אז הסיפור שהם מנסים להעביר, המודל שהם מנסים ליישם על הנתונים, שונה מזה של אמצעים.

#5
+4
ars
2010-09-12 10:01:58 UTC
view on stackexchange narkive permalink

לדוגמא קונקרטית, שקול את הגילאים הממוצעים לקונגו (DRC) וליפן. האחת הרוסה ממלחמת אזרחים, השנייה מפותחת היטב עם אוכלוסייה מזדקנת. הממוצע לא מעניין במיוחד עבור השוואה בין תפוחים לתפוחים. מצד שני, החציון יכול להיות אינפורמטיבי כמדד לנטייה מרכזית שכן בהגדרה יש לנו חצי מעל, חצי מתחת. המאמר בוויקיפדיה על פירמידת אוכלוסייה עשוי להיות מאיר עיניים (ראה את הסעיפים בנושא בליטות נוער, הזדקנות אוכלוסיות).

#6
+3
Henry
2011-03-27 10:39:31 UTC
view on stackexchange narkive permalink

אני לא חושב שיש סיבה תיאורית טובה לבחור בחציון על פני ממוצע להתפלגות גיל. יש מעשיות כאשר משווים נתונים מדווחים.

מדינות רבות מדווחות על אוכלוסייתם במרווחי גיל 5 שנים עם הלהקה העליונה פתוחה. זה גורם לקשיים מסוימים בחישוב הממוצע מתוך המרווחים, במיוחד עבור המרווח הצעיר ביותר (המושפע משיעורי תמותת תינוקות), "המרווח" העליון (מה הממוצע של "מרווח" 80+?) והמרווחים העליונים הקרובים ביותר ( הממוצע של כל מרווח הוא בדרך כלל נמוך יותר מהאמצע).

הרבה יותר קל לאמוד את החציון על ידי אינטרפולציה בתוך המרווח החציוני, ולעתים קרובות בקירוב על ידי הנחת התפלגות גיל שטוחה או טרפז באותו מרווח (שיעורי התמותה במדינות רבות נמוכים יחסית לגיל החציוני, מה שהופך זה קירוב סביר יותר מאשר עבור צעירים או זקנים).

#7
+3
Richard E. Gilder
2012-01-02 21:18:02 UTC
view on stackexchange narkive permalink

מאגרי נתוני בריאות הציבור בארצות הברית עוברים לעבר גיל AGE במתכונת שנים של תוספות של חמש שנים עקב ההשפעה של תקנות HIPAA בנוגע לעיוור ומסווה של נתונים בכוונה מטעמי פרטיות אישית.

בהתחשב באתגר זה למה שהיה בעבר (לפני HIPAA) רמה נרחבת למדי של אלמנט נתוני מידה בהתבסס על ההבדל בין תאריך הלידה לתאריך המוות, ייתכן שנצטרך לשקול מחדש את AGE כמשתנה בקנה מידה שיכול יתוארו באופן פרמטרי בכלל במערכי נתוני בריאות הציבור, לטובת מודלים המתארים AGE באופן שאינו פרמטרי, כמידת מידה סדירה. אני יודע שזה אולי נראה "מעל לראש" עבור פלגים רבים בקהילת האינפורמטיקה הביו-רפואית, אך לרעיון זה עשויה להיות זכות מסוימת מבחינת "פרשנות" כמתואר בתגובות לעיל.

מה עם כל הכוח האנליטי שעומד לרשות הגישות הלא פרמטריות? כן, נכון שכל אחד מאיתנו ינסה כמעט ליישם טכניקות GLM (מודל ליניארי כללי) על משתנה המציג את עצמו בפנינו בהתפלגויות שמתנהגות כפי שנהוג.

במקביל יש לקחת בחשבון את צורת ההתפלגות ואת האופן בו נקבעת צורה זו על ידי השפעות אינטראקציה מרובות ממדים על מרכזים רב-ממדיים ועל מרכזים תת-קבוצתיים הנמצאים בהתפלגות. מה לעשות עם מערכי הנתונים המורכבים האלה?

כאשר אלמנט נתונים לא מצליח לעמוד ב"הנחות המודל ", אנו סורקים בהדרגה (אמרתי מעבר, לא למטה; עלינו להיות מעסיקים של הזדמנות שווה, כל כלי מגיע מהמפעל עם הטופס עוקב אחר כללי הפונקציה) רשימת המודלים האפשריים האחרים כדי למצוא את אלה ש"לא נכשלים "במבחני ההנחות.

במתכונת הנוכחית במערכי נתוני בריאות הציבור, אנו באמת צריכים (כקהילה להדמיית נתונים) להמציא מודל סטנדרטי יותר לטיפול ב- AGE במרווחים של חמש שנים (5YI). ההצבעה שלי להדמיית נתונים של AGE (בהתחשב בפורמט 5YI החדש) היא להשתמש בהיסטוגרמות ובעלילות תיבות ושפן. כן, זה אומר החציון. (אין משחק מילים מיועד!)

לפעמים תמונה באמת שווה אלף מילים, ותמצית היא סיכום של אלף מילים. עלילת התיבה והזפון מציגה את "צורת" ההפצה כייצוג סמלי משמעותי של ההיסטוגרמה כמעט ברמה של רזולוציה איקונית. השוואת התפלגויות במרווחי גיל חמש שנים על ידי הצגת עלילות "זו לצד זו" ותאי זיפים שבהם ניתן להשוות באופן ויזואלי באופן מיידי בין דפוסים של 75-50 (חציון) לחצבים נמוכים יותר של 25, יהפוך ל"סטנדרט אוניברסלי "אלגנטי להשוואת AGE על פני העולם. לאלו מאיתנו הממשיכים ליהנות מהריגוש של ייצוג נתונים באמצעות המכניקה הטקסטואלית של התצוגה הטבלאית, דיאגרמת ה"גבעול והעלה "עשויה להועיל גם כאשר הם משמשים כאלמנט גרפי ויזואלי מונפש בגישה" ניצוץ "המציגה את השונות של צורות ההפצות לאורך זמן.

גיל הגיע לגיל המבוגר. צריך לבחון את זה יותר בעזרת האלגוריתמים החישוביים החזקים יותר שקיימים כעת.

זהו פוסט כתוב היטב, אך נראה כי אין לו שום קשר לשאלה המקורית.
אני חושב שהוא עוסק בעקיפין אך כראוי בכוונתה לכאורה של השאלה, @Andy. התקלה, אם בכלל, נעוצה בשאלה עצמה, שאינה משתמעת לשתי פנים משום שהיא אינה מפרטת את המשמעות בה ממוצע עשוי להיות "גרוע" יותר מחציון. לכן תשובה טובה צריכה לבחון זאת ולשקול את מטרת סיכום התפלגות הגילאים בנתון יחיד. כאן זה מוביל באופן טבעי לדיון מה המשמעות של "עידן" וכיצד ניתן להשוות בין חלוקות גיל.
#8
+3
Emil Friedman
2012-05-23 20:34:40 UTC
view on stackexchange narkive permalink

כדי לתת תשובה שימושית השאלה המקורית מחייבת שאנחנו מכירים את השאלה שעומדת מאחורי השאלה. במילים אחרות, "מדוע אתה רוצה איזשהו נתון סיכום המשווה את התפלגות הגילאים במדינות שונות?" החציון עשוי להיות שימושי ביותר לכמה שאלות. הממוצע עשוי להיות שימושי ביותר עבור אחרים. וכנראה יש שאלות בהן "אחוז מעל (או מתחת) גיל מסוים" יהיה הנתון הכי שימושי.

#9
+2
Mike Dunlavey
2010-09-14 05:23:26 UTC
view on stackexchange narkive permalink

אתה מקבל תשובות טובות כאן, אבל תן לי להוסיף את 2 הסנט שלי. אני עובד בפרמקומטריה שעוסקת בדברים כמו נפח דם, קצב חיסול, רמת הבסיס של השפעת התרופה, השפעה מרבית על התרופות ופרמטרים כאלה.

אנו מבחינים בין משתנים שיכולים לקבל כל ערך. פלוס מינוס, לעומת ערכים שיכולים להיות חיוביים בלבד. דוגמה למשתנה שיכול לקבל על עצמו כל ערך, פלוס מינוס, תהיה השפעת התרופה, שיכולה להיות חיובית, אפסית או שלילית. דוגמה למשתנה שיכול רק להיות חיובי באופן ריאליסטי הוא נפח הדם או שיעור חיסול התרופות.

אנו מדגמנים את הדברים האלה עם התפלגויות שבדרך כלל הן נורמליות או לוגנמליות, נורמליות לכל אלה עם ערך כלשהו, ​​ולוגנורמליות. לחיוביים היחידים. מספר לוגני-נורמלי הוא המספר E שנלקח לעוצמה של מספר מופץ רגיל, ולכן הוא יכול להיות חיובי בלבד.

עבור משתנה שמופץ באופן נורמלי, החציון, הממוצע והמצב זהים. מספר, כך שלא משנה באיזה שימוש אתה משתמש. עם זאת, עבור משתנה המופץ באופן נורמלי, הממוצע גדול יותר מהחציון ומהמצב, כך שהוא לא ממש שימושי. למעשה, החציון הוא המקום שבו לנורמלי הבסיסי יש את הממוצע שלו, ולכן זהו מדד אטרקטיבי הרבה יותר.

מכיוון שגיל (ככל הנראה) לעולם לא יכול להיות שלילי, התפלגות לוגנורמלית היא כנראה תיאור טוב יותר שלו. מהרגיל, כך שחציון (E לממוצע של הנורמה הבסיסית) שימושי יותר.

התפלגות הגיל היא בהחלט לא נורמלית.
אני לא חושב שתוכל להסיק שהגיל מופץ באופן נורמלי רק מהעובדה שהוא תמיד חיובי. התפלגות הגמא והוויבול הן תמיד חיוביות, אז מדוע לא לבחור אלה?
@Rob: @nico: אני בטוח שאתה צודק. זו הייתה בחירה גרועה של דוגמה. בדרך כלל אנו מדגמנים פרמטרים פרמקומטריים כמו נפח ואישור.
#10
+2
Susanne
2015-02-12 22:34:32 UTC
view on stackexchange narkive permalink

לימדו אותי שיש להשתמש בחציון בטווח ובממוצע עם סטיית תקן. כשאנחנו מדברים על גיל, אני חושב שטווח הוא דרך רלוונטית יותר לבטא את התפשטות, וקלה יותר להבנה לרובם. לדוגמא באוכלוסיית מחקר, הגיל הממוצע היה 53 (SD 5.4) או הגיל החציוני היה 48 (טווח 23-77). מסיבה זו, אני מעדיף להשתמש בחציון במקום בממוצע. אבל הייתי מעוניין מאוד כאן מה סטטיסטיקאי או מקצוען סטטיסטיקה יגיד על השימוש אומר עם טווח? אני רואה זאת לא מעט במאמרים מדעיים.

ברוך הבא לקורות החיים, סוזן.אם פרסמת זאת בניסיון לקבל תשובות, אנא מחק אותו ופרסם אותו מחדש כשאלה חדשה.הנחיות לשימוש באתר זה זמינות ב [עזרה] שלנו.
#11
+1
user28
2010-09-11 02:33:58 UTC
view on stackexchange narkive permalink

ניתן לראות את התשובה של ג'ון במתמטיקה.סטאצ'קיישן כדלקמן:

כאשר יש לך התפלגות מוטה, החציון עשוי להיות נתון סיכום טוב יותר מהממוצע.

שים לב>

שימו לב שכשהוא אומר שיש יותר תינוקות מאשר מבוגרים הוא בעצם מציע שהתפלגות הגילאים היא חלוקה מוטה.

למעשה אני חושב שבימינו ההטיה בהרבה מדינות היא יותר כלפי קשישים, ולא טוטים.
אולי, זה מוטה בכיוון ההפוך אבל הנקודה הכללית עומדת. עבור התפלגויות מוטות חציון עשוי להיות הגיוני יותר מהממוצע.
בדיוק עדכנתי את תשובתי ב- math.stackexchange כדי להדגיש בדיוק את הנקודה הזו. אנשים מחפשים סימטריה ויכולים להטיל סימטריה באופן שגוי כאשר היא לא שם. כשאתה מדווח על החציון אתה נותן תשובה שהיא סימטרית - החציון מחלק את האוכלוסייה לשניים - למרות שההתפלגות אינה סימטרית.
תשובה זו תמיד נראית לי קצת פסיכולוגית: כאשר התפלגויות אינן מוטות (כלומר הן סימטריות), הממוצע * שווה * לחציון, כך שאומר שהחציון הוא "טוב יותר" כשההפצה מוטה היא דרך אחורית לומר " השתמש רק בחציון. "
#12
+1
Eustache
2012-03-10 16:27:28 UTC
view on stackexchange narkive permalink

אני מקווה שהגיל הממוצע יושפע מהחריגים במערכת הנתונים שלך, בעוד שזה לא המקרה לגיל חציוני. הבה ניקח דוגמה למערך נתונים של חולים מחוסנים: 1,2,3,4,4,5,6,6,6,78 שנים הממוצע יהיה: 11.5 והגיל החציוני של חולים אלה הוא 4.5. הגיל הממוצע הזה הושפע מהמתאר 78. החציון הוא הטוב ביותר כאשר מתמודדים עם מערכי נתונים של ההתפלגות העקומה.

ראה את תגובתי למשתמש 28.
#13
  0
Matt L.
2014-05-28 21:18:26 UTC
view on stackexchange narkive permalink
בהחלט אם במקרה של ניתוח דמוגרפי, הייתי חושב שגם הממוצע וגם החציון יהיו יקרי ערך, במיוחד בשילוב זה עם זה, אם אתם מחפשים חריגים או אזורי צמיחה שעלולים להיות מתויגים על ידי החציון בלבד. בקהילות עם קהילת פרישה גדולה או באזור עם התפוצצות הילודה, החציון לבדו לא יכול לתת לך את כל התמונה, וכאן הממוצע, בהשוואה, יכול להיות מאוד שימושי.
#14
  0
brethvoice
2020-03-31 19:21:02 UTC
view on stackexchange narkive permalink

תשובה קצרה: הגיל החציוני הוא לא פשוט טוב יותר מגיל הממוצע; עם זאת, יתכן ששמתם כי יותר אנשים משתמשים בו. אז שאלה טובה יותר עשויה להיות: "מדוע יותר דמוגרפים ישתמשו בגיל חציון מאשר גיל ממוצע?"

נתונים סטטיסטיים, כמונח אוצר מילים, מקורם בכך שהמדינה (באופן ישיר ישות משפטית) מנסה להבין את האוכלוסייה האנושית שלה. אז חשוב על האנשים באותן ממשלות וכמה מידע שהם רוצים או זקוקים להם, כמו גם כמה זמן יש להם להקדיש להבנת המשמעות המתמטית המדויקת של מילים מדעיות.

הדרך הקלה ביותר לסכם נתונים רבים, ללא שימוש בתמונה, היא לדווח על מספר אחד; זה ידוע כאומדן לפרמטר המדובר (בכלוב זה, הזמן שחלף מאז לידתו של בן אנוש, מדויק לרמת שנים). סט. ג'יינס הראה ב ספרו P Theory Theory: The Logic of Science, אפשר לבחור לבנות אומדן על בסיס פונקציית אובדן תועלתנית המסכם את ההשלכות של טעות בהתבסס על שימוש במספר יחיד במקום במספר שלם ערכת נתונים בעת קבלת החלטות על סמך מידע זה.

בספרו של ג'יינס, הוא מראה באמצעות הוכחה מתמטית שהמצב, או אומדן הסבירות המקסימלי, הוא האומדן שמצמצם אובדן בצורת פונקציית דלתא של Dirac. הממוצע ממזער פונקציות אובדן ריבועיות, כך שככל שמתקדמים מההערכה, כמות האובדן (תוצאה לא רצויה) עולה מהר מאוד ברגע שעוברים את סולם היחידות.

לעומת זאת, החציון ממזער פונקציית אובדן בצורת משולש הפוך, כך שרק פי חמש פחות רצוי להיפטר מיחידת דיוק אחת, ולא פי 25 (כמו במקרה של שימוש המשמעות). למעשה, ביחידת הדיוק אין שום הבדל כלשהו, ​​מכיוון שאין עקמומיות בתפקוד אובדן מחודד כה משולש.

עם יסוד תיאורטי זה, ניתן ממש לצייר פונקציות אובדן שאינן סימטריות כלל וליצור מספר אינסופי של אומדנים חדשים המותאמים אישית לצרכי הצרכנים / משתמשים שלהם. אלטרנטיבה נוספת להתמודדות עם הציפייה התרבותית של מספר בודד היא לחנך את אותם משתמשים / צרכני מידע שמידה של נטייה מרכזית יכולה לספק מידע רב יותר כאשר הם משויכים לפרמטרים אחרים של התפלגות, כגון שונות, הטייה וקורטוזיס ( אולי כדאי להתחיל בשונות בלבד ולהטות כדי להקל עליהם.

השונות היא רק דוגמה אחת למדד פיזור; ג'ייס אחר מציע (בכתבים אחרים) הוא ליצור התפלגות אחורית בייסית ולחשב את רוחב המרווח המהימן הקצר ביותר עם ערך 0.5 (או רווח ביטחון / סטיית תקן וכו 'אם אתה לא קונה לתיאוריה של בייזיה - בבקשה, בואו לא לקבל מסלול צד). שיטה אינטואיטיבית יותר שאולי יותר קלה לאנשים רבים יותר לתפוס תהיה הטווח הבין רביעי, במיוחד כאשר מדווחים על חציון כמדד המקביל לנטייה המרכזית.

אני לא בטוח אם יש צורה לא פרמטרית של הטיה או קורטוזיס, אבל אם הם קיימים הם כמעט בוודאות יהיו קלים יותר להבנה מאשר האנלוגים הפרמטריים האלה. יש לי תחושה שחלק מרכזי, אם לא דומיננטי, מהסיבה שהגיל החציוני גדל לעיתים קרובות יותר מאשר הגיל הממוצע הוא משום שהוא פשוט מושך יותר אנשים עם פחות זמן או רצון להיכנס לפרטים תיאורטיים על דברים כמו סיגמה-אלגברות, תיאוריית המדדים של לבג וכו ', שכולם נחוצים מבחינה טכנית כדי להבין את היסודות הנפוצים יותר של הנמקות הסתברותיות.

למרות שיש כאן הרבה מחשבות טובות על אומדנים וכו ', אני חושב שהם מופיעים במקום הלא נכון: שאלה זו נוגעת לנתון * תיאורי * בלבד.זה לא בהכרח נועד להיות אומדן לכל דבר.
@whuber מה המטרה של נתון כלשהו, אם לא לתאר מאפיין בעל עניין לגבי מערך נתונים עם מספר יחיד?אני מסכים ששונות, הטיה, קורטוזיס, או כמויות הקשורות לרגעים מסדר גבוה הם בדרך כלל לא אומדנים, אלא מתאימים למדד של נטייה מרכזית.אך אני מקווה שלא נתעלם ממשמעות המילה "הסתברות" בעגה המקובלת.בהקשר של ה- OP, נראה שמישהו שאל "בערך בן כמה אנשים נמצאים במיקום כזה וכזה?"אז חציון הוא אומדן מכיוון שהוא מאפיין כמות (פרמטר) של עניין עם מספר בודד.
ההבחנה בין נתון תיאורי לבין אומדן טמונה בחלקו בשימוש בו: הראשון הוא מאפיין של מערך הנתונים, טהור ופשוט.אין מעורבות בהסתברות, ואין צורך ליצור או להשתמש בסטטיסטיקה תיאורית.אומדן, להיפך, מנסה לאפיין משהו אחר לגמרי: כלומר "אוכלוסיה" שממנה נגזרים הנתונים באופן היפותטי.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...