שְׁאֵלָה:
מדוע R יחזיר את NA כמקדם lm ()?
Fraijo
2012-04-04 03:19:53 UTC
view on stackexchange narkive permalink

אני מתאים מודל lm () למערכת נתונים הכוללת אינדיקטורים לרבעון הפיננסי (Q1, Q2, Q3, מה שהופך את Q4 כברירת מחדל). באמצעות lm (Y ~., Data = data ) אני מקבל NA כמקדם עבור Q3, ואזהרה כי משתנה אחד לא נכלל בגלל ייחודים.

האם אני צריך להוסיף עמודה Q4?

אחד תשובה:
Martin O'Leary
2012-04-04 04:01:33 UTC
view on stackexchange narkive permalink

NA כמקדם ברגרסיה מציין שהמשתנה המדובר קשור באופן לינארי למשתנים האחרים. במקרה שלך זה אומר ש- $ Q3 = a \ כפול Q1 + b \ כפול Q2 + c $ עבור כמה $ a, b, c $. אם זה המקרה, אין פיתרון ייחודי לרגרסיה מבלי להפיל את אחד המשתנים. הוספת $ Q4 $ רק תחמיר את המצב.

אני מסכים ... נראה שיש בעיה בהגדרות של משתני הדמה.
(+1). NA פירושו באופן כללי כי המקדם אינו ניתן להערכה. זה יכול לקרות בגלל קולינריות מדויקת, כפי שציינת. אבל, זה יכול לקרות גם בגלל שאין מספיק תצפיות כדי לאמוד את הפרמטרים הרלוונטיים (למשל אם $ p> n $). אם אתה מנבא הוא קטגורי ואתה מוסיף מונחי אינטראקציה, NA יכול גם להיות שאין תצפיות עם שילוב זה של רמות הגורמים.
$ p> n $ הוא רק מקרה מיוחד של קולינאריות - אם יש פחות תצפיות מאשר מנבאים, קולינאריות היא נתון. אתה צודק בכל הנוגע לתנאי האינטראקציה, אם כי אני די בטוח שזה לא מה שקורה כאן.
המשתנים אינם קשורים באופן ליניארי, שכן Q3 = 1 iF Q1 = Q2 = 0. יתר על כן, שימוש ב- stepAIC () ואילוץ המודל לכלול את כל שלושת המשתנים הללו לא גורם לבעיות. כמו כן, יש לי בערך פי 3 ממספר התצפיות למשתנים. הניחוש הטוב ביותר שלי הוא שקיימת קולינאריות בין Q3 למשתנה אחר, אשר אני מניח שהוא אינו נכלל ב- stepAIC.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.
Loading...