שְׁאֵלָה:
סטיית תקן של סטיית תקן
user88
2010-07-26 21:10:46 UTC
view on stackexchange narkive permalink

מהו אומדן סטיית התקן של סטיית התקן אם ניתן להניח את תקינות הנתונים?

אני מניח שאתה מחפש את [התפלגות שונות הדגימה] (https://en.wikipedia.org/w/index.php?title=Variance&oldid=735567901#Distribution_of_the_sample_variance).זה מקשר לקטע בדף הוויקיפדיה על שונות ב- 16:55, 21 באוגוסט 2016. מכיוון שמדובר בקישור לוויקיפדיה, המאמר עשוי להשתנות בעתיד.לפיכך, ייתכן שהקטע לא משקף את התוכן אליו מתייחסת תשובה לאחר שינויים כאלה.לכן ניתן קישור לגרסה היסטורית של דף ויקיפדיה כאן.המאמר הנוכחי על שונות נמצא [כאן] (https://en.wikipedia.org/wik
שְׁלוֹשָׁה תשובות:
#1
+59
Macro
2012-05-16 05:20:06 UTC
view on stackexchange narkive permalink

תן ל- $ X_1, ..., X_n \ sim N (\ mu, \ sigma ^ 2) $. כפי שמוצג ב שרשור זה, סטיית התקן של סטיית התקן לדוגמה,

$$ s = \ sqrt {\ frac {1} {n-1} \ sum_ {i = 1} ^ {n} (X_i - \ אוברליין {X})}, $$

זה

$$ {\ rm SD} (ים) = \ sqrt {E \ left ([E (s) - s] ^ 2 \ right)} = \ sigma \ sqrt {1 - \ frac {2} {n-1} \ cdot \ left (\ frac {\ Gamma (n / 2) } {\ Gamma (\ frac {n-1} {2})} \ right) ^ 2} $$

כאשר $ \ Gamma (\ cdot) $ היא פונקציית הגמא, $ n $ הוא גודל המדגם ו- $ \ overline {X} = \ frac {1} {n} \ sum_ {i = 1} ^ {n} X_i $ הוא ממוצע הדוגמה. מכיוון ש $ s $ הוא אומדן עקבי של $ \ sigma $, זה מציע להחליף $ \ sigma $ ב- $ s $ במשוואה לעיל כדי לקבל אומדן עקבי של $ {\ rm SD} (s) $.

אם זה אומדן חסר משוא פנים שאתה מחפש, אנו רואים בשרשור זה ש- $ E (s) = \ sigma \ cdot \ sqrt {\ frac {2} {n- 1}} \ cdot \ frac {\ Gamma (n / 2)} {\ Gamma (\ frac {n-1} {2})} $, שעל פי ליניאריות של ציפייה, מציע

$ $ s \ cdot \ sqrt {\ frac {n-1} {2}} \ cdot \ frac {\ Gamma (\ frac {n-1} {2})} {\ Gamma (n / 2)} $$

כאומדן משוחד של $ \ sigma $. כל זה יחד עם ליניאריות הציפייה נותנים אומדן משוחד של $ {\ rm SD} (s) $:

$$ s \ cdot \ frac {\ Gamma (\ frac {n-1} { 2})} {\ Gamma (n / 2)} \ cdot \ sqrt {\ frac {n-1} {2} - \ left (\ frac {\ Gamma (n / 2)} {\ Gamma (\ frac { n-1} {2})} \ right) ^ 2} $$

+1 זה נחמד לראות לא רק תשובה טובה יותר מגיעה אחרי כמעט שנתיים, אלא תשובה המספקת פרטים שימושיים יותר מההפניות במקומות אחרים בשרשור זה.
האם שכחת לרבוע את המרחקים בנוסחה הראשונה?
קשה לחשב את פונקציית הגמא עבור ערכים לא קטנים של $ n $.אם אני מיישם את הקירוב של סטירלינג, אני מקבל $ s \ cdot \ sqrt {\ mathrm {e} \ cdot (1- \ frac {1} {n}) ^ {n-1} -1} $, מה שאפשר לבצע חישובית כמו גםקצת יותר קומפקטי בהבעה.
מן הסתם ראוי לציין כי s (המחושב בתשובת @Macro's מכונה לפעמים שגיאת התקן של סטיית התקן לדוגמה.
למי שרוצה טופס פשוט, $ s / \ sqrt {2 (n-1)} $ הוא קירוב טוב ברמה של כמה אחוזים.
#2
+5
robin girard
2010-07-26 21:23:25 UTC
view on stackexchange narkive permalink

נניח שאתה צופה ב- $ X_1, \ נקודות, X_n $ i מהנורמלי עם אפס ממוצע ושונות $ \ sigma ^ 2 $. סטיית התקן (האמפירית) היא שורש הריבוע של האומדן $ \ hat {\ sigma} ^ 2 $ של $ \ sigma ^ 2 $ (לא משוחד או לא זו השאלה). כאומדן (שהושג עם $ X_1, \ נקודות, X_n $), ל- $ \ hat {\ sigma} $ יש שונות שניתן לחשב תיאורטית. אולי מה שאתה מכנה סטיית התקן של סטיית התקן הוא למעשה השורש הריבועי של שונות סטיית התקן, כלומר $ \ sqrt {E [(\ sigma- \ hat {\ sigma}) ^ 2]} $? זה לא אומדן, זוהי כמות תיאורטית (ניתן לאשר במשהו כמו $ \ sigma / \ sqrt {n} $)!

האין פונקציה של אומדן היא עדיין אומדן? אני עדיין לא יודע \ sigma, רק X_i.
אוקי, אז יתכן שתעריך את השורש הריבועי של השונות של אומדן השורש הריבועי של השונות ... נכון :) צריך להיות משהו כמו $ \ hat {\ sigma} / n $?
מה ש- Srikant מצא (ומה שנראה מאושר ב- PhysicsForums) צריך להיות $ \ sqrt {2} $, אז דווקא $ \ hat {\ sigma} \ frac {\ sqrt {2}} {2n} $.
אה, התגובות האלה ננעלות; $ \ frac {\ hat {\ sigma}} {\ sqrt {2n}} $. לפחות זה נותן את התוצאה בהסכמה עם bootstrap.
#3
-3
Harvey Motulsky
2010-07-27 00:34:08 UTC
view on stackexchange narkive permalink

@Macro סיפק הסבר מתמטי נהדר עם משוואה לחישוב. הנה הסבר כללי יותר עבור אנשים פחות מתמטיים.

אני חושב שהמינוח "SD של SD" מבלבל בעיני רבים. קל יותר לחשוב על מרווח הביטחון של SD. עד כמה סטיית התקן שאתה מחשב מדגימה מדויקת? פשוט במקרה יכול להיות שקיבלתם נתונים המקובצים זה בזה מקרוב, מה שהופך את ה- SD לדוגמא לנמוך בהרבה מה- SD של האוכלוסייה. לחלופין, ייתכן שקיבלתם באופן אקראי ערכים המפוזרים בהרבה מהאוכלוסייה הכוללת, מה שהופך את מדגם ה- SD גבוה יותר מהאוכלוסייה.

פירוש ה- CI של ה- SD הוא פשוט. התחל עם ההנחה המקובלת כי הנתונים שלך נדגמו באופן אקראי ועצמאי מהתפלגות גאוסית. כעת חזור על דגימה זו פעמים רבות. אתה מצפה ש -95% מרווחי הביטחון האלה יכללו את אוכלוסיית SD האמיתית.

כמה רחב מרווח הביטחון של 95% של SD? זה תלוי כמובן בגודל המדגם (n).

n: 95% CI של SD

2: 0.45 * SD ל- 31.9 * SD

3: 0.52 * SD ל- 6.29 * SD

5: 0.60 * SD ל- 2.87 * SD

10: 0.69 * SD ל- 1.83 * SD

25: 0.78 * SD ל- 1.39 * SD

50: 0.84 * SD ל- 1.25 * SD

100: 0.88 * SD ל- 1.16 * SD

500: 0.94 * SD ל- 1.07 * SD

מחשבון אינטרנט בחינם

אני יכול לעשות את מונטה קרלו, רק רציתי לעשות בצורה יותר 'מגוונת'; ובכל זאת אתה צודק שההפצה אינה תקינה, ולכן ה- SD הזה לא יועיל לבדיקה.
בשביל מה זה שווה, לא נעים לי מההצהרה "מרווח ביטחון שהוא 95% ... עשוי להכיל את ה- SD האמיתי" (או, נאמר בצורה מפורשת יותר בעמוד המקושר: "אתה יכול להיות בטוח ב -95% כי CI המחושב מדגם SD מכיל את אוכלוסיית ה- SD האמיתית "). אני חושב שההצהרות האלה מפלרטטות / מחזקות תפיסה מוטעית פופולרית, ראה [כאן] (http://stats.stackexchange.com/questions/26450/why-does-a-95-ci-not-imply-a-95-chance -מכיל את הממוצע), למשל, לדיון בנושא קורות חיים.
מה פירוש "אני חושב שגם המושג וגם המינוח של" SD של SD "חלקלק מדי מכדי להתמודד עם זה? סטיית התקן לדוגמא היא משתנה אקראי בעל סטיית תקן.
@Macro.תודה על הערותיך.כתבתי מחדש באופן מהותי.
@gung.כתבתי מחדש כדי להסביר כראוי את מרווח הביטחון.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...