שְׁאֵלָה:
השגת נוסחה למגבלות חיזוי במודל ליניארי (כלומר: מרווחי חיזוי)
Tal Galili
2011-04-03 23:24:50 UTC
view on stackexchange narkive permalink
ניקח את הדוגמה הבאה:
  set.seed (342) x1 <- runif (100) x2 <- runif (100) y <- x1 + x2 + 2 * x1 * x2 + rnorm (100) fit <- lm (y ~ x1 * x2)  

זה יוצר מודל של y המבוסס על x1 ו- x2, תוך שימוש ברגרסיה של OLS. אם ברצוננו לחזות y ל- x_vec נתון, נוכל פשוט להשתמש בנוסחה שאנו מקבלים מה- סיכום(fit).

עם זאת, מה אם נרצה לחזות את התחתון ואת התחזיות העליונות של y? (לרמת ביטחון נתונה).

כיצד אם כן נבנה את הנוסחה?

החלק * מרווח אמון בתצפיות חדשות * ב [דף זה] (https://web.archive.org/web/20110719124646/http://www.weibull.com/DOEWeb/confidence_intervals_in_multiple_linear_regression.htm) עשוי לעזור.
@Tal מצטער, אבל לא ממש ברור לי למה אתה מתכוון בפועל "לחזות את התחזיות התחתונות והעליונות של y". האם יש לזה קשר ללהקות חיזוי או סובלנות?
@Tal - כמה שאילתות. כשאומרים ".. y בהתבסס על x1 ו- x2, באמצעות רגרסיה של OLS." , אתה מתכוון ליצור מודל לינארי _ להעריך פרמטרים באמצעות OLS_. האם אני צודק? ושאלת @chl's - האם אתה רוצה לחזות את הגבול התחתון והעליון עבור מרווח החיזוי?
@chl, מצטער על שלא היה ברור יותר. אני מחפש שתי נוסחאות שיתנו מרווח לכך ש"יתפוס "את הערך" האמיתי "של y 95% מהזמן. אני מרגיש כיצד אני משתמש בהגדרות עבור ה- CI לממוצע, כשיש כנראה מונח אחר שאני צריך להשתמש בו, מצטער על כך ...
@suncoolsu - כן וכן.
ממה שאתה צריך את הנוסחה שהצעתי לעיל. אפרסם אותו מחדש כתשובה.
ראה את הנוסחה בקטע * מרווח אמון בתצפיות חדשות * (מרווח חיזוי) של http://www.weibull.com/DOEWeb/confidence_intervals_in_multiple_linear_regression.htm [(permalink)] (http://www.webcitation.org/5xonEjGdb).
שְׁלוֹשָׁה תשובות:
Rob Hyndman
2011-04-04 06:44:16 UTC
view on stackexchange narkive permalink

תזדקק לחשבון מטריצה. אני לא בטוח איך אקסל ילך עם זה. בכל מקרה, הנה הפרטים.

נניח שהרגרסיה שלך נכתבת כ $ \ mathbf {y} = \ mathbf {X} \ mathbf {\ beta} + \ mathbf {e} $.

תן $ \ mathbf {X} ^ * $ להיות וקטור שורה המכיל את ערכי המנבאים לתחזיות (באותה תבנית כמו $ \ mathbf {X} $). ואז התחזית ניתנת על ידי $$ \ hat {y} = \ mathbf {X} ^ * \ hat {\ mathbf {\ beta}} = \ mathbf {X} ^ * (\ mathbf {X} '\ mathbf {X }) ^ {- 1} \ mathbf {X} '\ mathbf {Y} $$ עם שונות משויכת $$ \ sigma ^ 2 \ left [1 + \ mathbf {X} ^ * (\ mathbf {X}' \ mathbf {X}) ^ {- 1} (\ mathbf {X} ^ *) '\ right]. $$ ואז ניתן לחשב מרווח חיזוי של 95% (בהנחה ששגיאות מבוזרות בדרך כלל) כ $$ \ hat {y} \ pm 1.96 \ hat {\ sigma} \ sqrt {1 + \ mathbf {X} ^ * (\ mathbf {X} '\ mathbf {X}) ^ {- 1} (\ mathbf {X} ^ *)'}. $$ זה לוקח בחשבון את אי הוודאות עקב מונח השגיאה $ e $ ואת אי הוודאות באומדני המקדם. עם זאת, הוא מתעלם מכל שגיאה ב- $ \ mathbf {X} ^ * $. אז אם הערכים העתידיים של המנבאים אינם בטוחים, אז מרווח החיזוי המחושב באמצעות ביטוי זה יהיה צר מדי.

+1, תשובה מעולה. אני צריך לציין כי מודל רגרסיה תמיד מעריך ציפיות מותנות, ולכן הוא טוב כמו שרגרסיו. אז ההערה האחרונה אמנם טובה מאוד, אך היא אינה הכרחית בהחלט, שכן אם בונים מודל רגרסיה עליכם לסמוך על הרגרסורים.
מדוע ה- 1 עולה בנוסחה? יש לנו $ \ hat {y} = X ^ * \ beta + X ^ * (X'X) ^ {- 1} X'e $. ואז $ var \ hat {y} = var X ^ * (X'X) ^ {- 1} X'e = \ sigma ^ 2X ^ * (X'X) ^ {- 1} (X ^ *) '$ ?
ה- 1 מיועד למרווחי חיזוי. השאר את זה מרווחי ביטחון. Var ($ \ hat {y} $) מתייחס לרווחי ביטחון.
@RobHyndman תודה על תשובתך המצוינת (לפני שנה;)) אולם האם חסר לי משהו או שהמונח נמצא בשורש הריבועי $ N \ times N $?
@Seb. $ X ^ * $ הוא וקטור שורה, ולכן המונח הוא סקלרי.
@RobHyndman כן כמובן! סליחה - לא הבנתי
Dirk Eddelbuettel
2011-04-04 02:04:34 UTC
view on stackexchange narkive permalink

האם במקרה יש לך סוגים שונים של מרווחי חיזוי? בדף הידני predict.lm יש

  ## S3 שיטה לחיזוי class 'lm' (אובייקט, נתונים חדשים, se.fit = FALSE, scale = NULL, df = Inf, מרווח = c ("אין", "ביטחון", "חיזוי"), רמה = 0.95, סוג = c ("תגובה", "מונחים"), מונחים = NULL, na.action = na.pass, pred .var = res.var / weights, weights = 1, ...)  

ו-

הגדרת 'מרווחים' מציינת חישוב ביטחון או חיזוי ( מרווחי סובלנות) ב'רמה 'שצוינה, המכונים לפעמים מרווחים צרים לעומת רחבים.

האם זה מה שחשבתם?

היי דירק, זה אכן מה שאני רוצה למצוא, אבל אני רוצה שהקשרים העליונים והתחתונים יהיו בצורה של * נוסחה * (כך שאחר כך ייושמו בצורה נמוכה כלשהי של תוכנה סטטיסטית, למשל, מצטיינים ... )
p.s: עכשיו אני רואה שהייתה עריכה לכותרת השאלה שלי שאולי גרמה לך לחשוב שאני שואל על פרמטר interval.lm (מה שאני לא) :)
אתה מתעלל כאן במינוח. אקסל אינה תוכנה סטטיסטית.
אתה צודק, ההצעה שלי, מה דעתך על "יישום גיליון אלקטרוני"?
אני יכול לחיות עם זה; הוא מכנה את השטן בשמו ;-)
B_Miner
2011-04-04 06:15:10 UTC
view on stackexchange narkive permalink

@Tal: אולי אני מציע ל Kutner et al כמקור נהדר למודלים ליניאריים.

יש הבחנה בין 1) חיזוי של Y מתצפית חדשה בודדת X_vec, 2) הערך הצפוי של Y המותנה ב- X_vec, $ E (Y | X_ {vec}) $ ו- 3 ) Y ממספר מקרים של x_vec - כולם מכוסים בפירוט בטקסט.

אני חושב שאתה מחפש את הנוסחה עבור רווח הביטחון סביב $ E (Y | X_ {vec}) $ וזה $ \ hat {Y} $ $ \ pm $ t (1- $ \ alpha $ / 2) s {$ \ hat {Y} $} כאשר אין לו n-2 df ו- s {$ \ hat {Y} $} היא השגיאה הסטנדרטית של $ \ hat {Y} $, $ \ frac {\ sigma ^ {2}} {n} $ + ($ X_ {vec} - \ bar { X}) ^ {2} \ frac {\ sigma ^ {2}} {\ sum (X_ {i} - \ bar {X}) ^ {2}} $

(+1) לביצוע ההבחנה. עם זאת, אני מאמין שה- OP מבקש (1), ולא (2) (וערכתי את כותרת השאלה בהתאם). שים לב כי נראה כי הנוסחה שלך מניחה שהרגרסיה תלויה רק ​​במשתנה אחד.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...