מרווח חיזוי רגרסיה לינארית

bmx

2012-08-01 00:27:20 UTC

view on stackexchange narkive permalink

אם הקירוב הליניארי הטוב ביותר (תוך שימוש בריבועים קטנים ביותר) של נקודות הנתונים שלי הוא הקו $ y = mx + b $, כיצד אוכל לחשב את שגיאת הקירוב? אם אני מחשב סטיית תקן של הבדלים בין תצפיות ותחזיות $ e_i = real (x_i) - (mx_i + b) $, האם אוכל לומר אחר כך שערך אמיתי (אך לא נצפה) $ y_r = real (x_0) $ שייך מרווח $ [y_p- \ sigma, y_p + \ sigma] $ ($ y_p = mx_0 + b $) עם הסתברות ~ 68%, בהנחה שהתפלגות נורמלית?

להבהרה:

I ביצע תצפיות לגבי פונקציה $ f (x) $ על ידי הערכתה לכמה נקודות $ x_i $. אני מתאים את התצפיות האלה לקו $ l (x) = mx + b $. תמורת $ x_0 $ שלא התבוננתי ברצוני לדעת כמה גדול יכול $ f (x_0) -l (x_0) $ להיות. בעזרת השיטה לעיל, נכון לומר ש $ f (x_0) \ ב [l (x_0) - \ sigma, l (x_0) + \ sigma] $ עם prob. ~ 68%?

אני חושב שאתה שואל לגבי מרווחי חיזוי. שים לב, עם זאת, אתה משתמש ב- "$ x_i $", במקום "$ y_i $". האם זו שגיאת הקלדה? אנחנו * לא * חוזים $ x $ s.

@gung: אני משתמש ב- $ x $ כדי לציין למשל זמן ו- $ y $ את הערך של משתנה כלשהו באותה תקופה, כך ש- $ y = f (x) $ פירושו שעשיתי תצפית $ y $ בזמן $ x $. אני רוצה לדעת עד כמה יכולות להיות תחזיות הפונקציה המתאימות לערכים האמיתיים של y. האם זה הגיוני? הפונקציה $ real (x_i) $ מחזירה את הערך "הנכון" של $ y $ ב- $ x_i $, ונקודות הנתונים שלי מורכבות מ- $ {(x_i, real (x_i))} $.

זה נראה סביר לחלוטין. החלקים שאני מתמקד בהם הם, למשל, "$ e_i = real (x_i) - (mx_i + b) $", בדרך כלל אנו חושבים על השגיאות / שאריות במודל reg כ- "$ e_i = y_i- (mx_i + ב) $ ". ה- SD של השאריות * ממלא * תפקיד בחישוב מרווחי החיזוי. זה ש- "$ x_i $" זה מוזר בעיניי; אני תוהה אם זו שגיאת הקלדה, או שאתה שואל על משהו שאני לא מזהה.

אני חושב שאני רואה; התגעגעתי לעריכה שלך. זה מצביע על כך שהמערכת היא דטרמיניסטית לחלוטין ואם הייתה לך גישה לפונקציה * האמיתית * הבסיסית, תמיד תוכל לחזות $ y_i $ מושלם ללא שגיאה. זו לא הדרך בה אנו חושבים בדרך כלל על דגמי רג.

@gung: האם שאלה זו הגיונית אם אני צופה באלגוריתם לא קבוע במקום פונקציה? אני לא ברור איך לנסח מחדש את השאלה שלי, כך שיהיה הגיוני לסטטיסטיקאים :(. אני רוצה להעריך כמה טוב המודל הליניארי מקרב את הדבר הנצפה, בהנחה שהדבר הזה הוא ליניארי, אך חורג מקו עם אקראי שְׁגִיאָה.

אני חושב שאולי יש לך אי הבנה מהותית לגבי מרווחי חיזוי ומרווחי ביטחון. אני מרגיש ככה על סמך הניסוח הראשוני של הבעיה. גונג עושה עבודה טובה בניסיון להסביר לך דברים. אם אתה יכול להיות מדויק יותר לגבי שאלתך, נוכל לתת לך תשובה ברורה יותר ולתקן כל בלבול אם הוא קיים.

bmx, נראה לי שיש לך מושג ברור לשאלתך ומודעות טובה לחלק מהנושאים. אולי אתה מעוניין לסקור שלושה נושאים קשורים זה לזה. http://stats.stackexchange.com/questions/17773 מתאר מרווחי חיזוי במונחים לא טכניים; http://stats.stackexchange.com/questions/26702 נותן תיאור מתמטי יותר; וב http://stats.stackexchange.com/questions/9131, רוב הינדמן מספק את הנוסחה שאתה מחפש. אם אלה לא עונים באופן מלא על שאלתך, לפחות הם עשויים לתת לך תו תקן ואוצר מילים להבהרתה.