שְׁאֵלָה:
רגרסיה לוגיסטית עם משתנים תלויים ועצמאיים
upabove
2011-08-22 14:05:33 UTC
view on stackexchange narkive permalink

האם ראוי לעשות רגרסיה לוגיסטית כאשר המשתנים התלויים והבלתי תלויים הם בינאריים? לדוגמא המשתנה התלוי הוא 0 ו- 1 והמנבאים הם משתנים המקודדים בניגוד -1 ו- 1?

ארבע תשובות:
ttnphns
2011-08-22 14:47:33 UTC
view on stackexchange narkive permalink

שכן, בהירות: המונח "בינארי" שמור בדרך כלל לקידוד 1 לעומת 0 בלבד. מילה כללית יותר המתאימה לכל קידוד בעל ערך שני היא "דיכוטומית". מנבאים דיכוטומיים מוזמנים כמובן לרגרסיה לוגיסטית, כמו לרגרסיה לינארית, ומכיוון שיש להם רק 2 ערכים, אין שום הבדל אם להזין אותם כגורמים או כמשתנים משתנים.

Fomite
2011-08-23 23:06:51 UTC
view on stackexchange narkive permalink

אין שום סיבה שלא לעשות זאת, אלא שתי מחשבות אזהרה:

  1. עקוב אחר זהירות במהלך הניתוח של איזו. בפרויקטים גדולים זה יכול להיות קל ללכת לאיבוד ולייצר תוצאות שגויות.

  2. אם תבחר לדווח על אומדני רגרסיה, ולא על יחסי סיכוי, הבהיר את תוכנית הקידוד שלך בדוח שלך , כך שהקוראים לא מייצרים ORs לא מדויקים בכוחות עצמם בהנחה ששניהם קודנו 0,1.

אולי נראה בסיסי, אבל ראיתי ששתי הבעיות הופכות את המאמרים שפורסמו.

אז אז יהיה נכון גם להפריד קובץ נתונים ל -6 מקרים נפרדים ולהריץ השוואות אישיות בכל מערך נתונים עם מנבאים מקודדים למגבלות?
אני באמת לא בטוח מה אתה מבקש את החלק השני הזה. האם אתה יכול להסביר את מה שאתה מקווה להשיג?
יש לי מערך נתונים עם 3 בין לבין 4 בתנאי הנושא. הייתי רוצה לבדוק כל השפעה ואפקט, אך רגרסיה אחת עם כל האינטראקציות מפספסת הרבה מידע שאני מעוניינת בו. במקום זאת הייתי מחלקת את הנתונים לפי תנאי למערכי נתונים נפרדים ומריצה רגרסיות לוגיסטיות ממוקדות בכל מערכי נתונים בניגוד. קודים שמקודדים להבדלים שאני מעוניין בהם.
למידע נוסף על האופן שבו אני מקודד את קודי הניגוד ראה כאן: http://stats.stackexchange.com/questions/14546/how-to-interpret-regression-coefficients-in-logistic-regression
Nick Sabbe
2011-08-22 14:14:59 UTC
view on stackexchange narkive permalink

בדרך כלל זה עוזר לפרשנות אם אתה מקודד את המנבאים שלך 0-1, אך מלבד זאת (ומציין שזה לא נדרש), אין שום דבר רע בזה. יש כמה גישות אחרות (מבוססות לוח-תלות), אבל אם אני זוכר נכון, אלה מתגלים כשווים לרגרסיה לוגיסטית (כלשהי).

אז בקיצור: אני לא רואה שום סיבה לא עשה זאת.

תודה! ואם יש לי 3 מנבאים מקודדים בניגוד ואני מקודד את כולם 0-1 אז הם לא יהיו אורתוגונליים. לדוגמא יש לי 4 קטגוריות ושלושת הקודים שלי הם L1: 1, -1,0,0 L2: 0,1, -1,0, L3: 0,0,1, -1. האם זה נושא?
הדוגמה שלך L- מטריצה ​​(L1, L2, L3) היא _ הניגודים החוזרים על עצמם_ לפיהם כל קטגוריה מושווה לקטגוריה הבאה. גם מנבאי הניגודיות הללו אינם אורתוגונליים וגם לא בינאריים (מקודדים כ- 0-1). למעשה, הערכים שלהם הם .75 לעומת -.25 (משתנה ראשון), .5 לעומת -5.5 (משתנה שני), .25 לעומת -.75 (משתנה שלישי)
love-stats
2011-08-23 17:35:11 UTC
view on stackexchange narkive permalink
בנוסף, אם יש לך יותר משני מנבאים, סביר יותר להניח שתהיה בעיה של ריבוי קולינאריות אפילו עבור רגרסיה לוגיסטית או מרובה. עם זאת, אין כל נזק להשתמש ברגרסיה לוגיסטית עם כל המשתנים הבינאריים (כלומר, מקודדים (0,1)).


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.
Loading...