שְׁאֵלָה:
הפסאודו של מקפדן- $ R ^ 2 $ פרשנות
Matt Reichenbach
2014-01-13 20:02:00 UTC
view on stackexchange narkive permalink

יש לי מודל רגרסיה לוגיסטית בינארית עם ה- Pseudo R בריבוע של McFadden של 0.192 עם משתנה תלוי שנקרא תשלום (1 ​​= תשלום ו- 0 = ללא תשלום). מה הפירוש של פסאודו זה בריבוע?

האם מדובר בהשוואה יחסית למודלים מקוננים (למשל למודל 6 משתנה יש ריבוע פסאודו של McFadden ב- 0.192, ואילו מודל 5 משתנה (לאחר הסרת משתנה אחד מהמודל המשתנה 6 הנ"ל), זה למודל משתנה 5 יש ריבוע פסאודו של 0.131. האם נרצה לשמור על המשתנה השישי הזה במודל?) או שמדובר בכמות מוחלטת (למשל, מודל נתון שיש לו פסבדו R של ריבוע של מקפדן של 0.192 טוב יותר כל דגם קיים עם פסאודו ריבועי של ה- McFadden ב- 0.180 (אפילו עבור דגמים שאינם מקוננים)? אלה רק דרכים אפשריות להסתכל על ה- Pseudo R של ריבועי של מקפדן; עם זאת, אני מניח ששתי התצוגות הללו רחוקות, ולכן הסיבה לכך אני שואל את השאלה הזו כאן.

עשיתי מחקר רב בנושא זה, ועדיין לא מצאתי את התשובה שאני מחפש מבחינת היכולת לפרש את הפסאודו R של מקפדן. בהשוואה ל- 0.192. כל תובנה ו / או הפניות זוכים להערכה רבה! לפני שאני עונה על שאלה זו, אני מודע לכך אם זה לא המדד הטוב ביותר לתיאור מודל רגרסיה לוגיסטית, אבל הייתי רוצה להבין יותר את הנתון הזה בלי קשר!

ארבע תשובות:
Chris
2014-05-22 02:01:59 UTC
view on stackexchange narkive permalink

אז חשבתי שאמצה את מה שלמדתי על הפסאודו $ R ^ 2 $ של מקפדן כתשובה ראויה.

ההפניה המכוונת שאני יכול לראות עבור הפסבדו של מקפדן $ R ^ 2 $ היא: McFadden, D. (1974) "ניתוח לוגיט מותנה של התנהגות בחירה איכותית. " עמ. 105-142 בפ 'זרמבקה (עורכת), גבולות בכלכלה. העיתונות האקדמית. http://eml.berkeley.edu/~mcfadden/travel.html איור 5.5 מראה את הקשר בין $ \ rho ^ 2 $ מדידות $ R ^ 2 $ מסורתיות מ- OLS. הפרשנות שלי היא שערכים גדולים יותר של $ \ rho ^ 2 $ (הפסאודו של McFadden $ R ^ 2 $ ) טובים יותר מקטנים יותר.

הפרשנות של הפסאודו $ R ^ 2 $ של מקפאדן בין 0.2-0.4 נובעת מפרק ספר שתרם לו: דוגמנות נסיעות בהביורלית. נערך על ידי דייוויד הנשר ופיטר סטופר. 1979. מקפדן תרם את צ'. 15 "שיטות כמותיות לניתוח התנהגות נסיעות על אנשים: כמה התפתחויות אחרונות". הדיון בהערכת המודל (בהקשר למודלים גדולים של לוגיט) מתחיל בעמוד 306 שם הוא מציג את $ \ rho ^ 2 $ (הפסאודו של מקפאדן $ R ^ 2 $ ). McFadden קובע "בעוד ש $ R ^ 2 $ אינדקס הוא מושג מוכר יותר למתכננים המנוסים ב- OLS, הוא אינו מתנהג כמו $ \ rho ^ 2 $ מידה, להערכת ML. יש להזהיר את מי שלא מכיר את $ \ rho ^ 2 $ הערכים נוטים להיות נמוכים משמעותית מאלו של $ R ^ 2 $ אינדקס ... למשל, ערכים של 0.2 עד 0.4 עבור $ \ rho ^ 2 $ מייצגים התאמה מצוינת."

אז בעצם, ניתן לפרש את $ \ rho ^ 2 $ $ R ^ 2 $ , אבל אל תצפה שזה יהיה כל כך גדול. וערכים 0.2-0.4 מצביעים (במילותיו של מקפדן) על התאמה מצוינת של המודל.

לעטוף טוב, כריס. תודה לך על מאמציך!
הגעתי באיחור לדיון, אבל אשאיר את הקישור הזה בו הם מסבירים את R2 MacFadden בהשוואה לאמצעי הסתגלות אחרים: https://statisticalhorizons.com/r2logistic
Jonathan Bartlett
2015-01-11 23:28:01 UTC
view on stackexchange narkive permalink

$ R ^ 2 $ של McFadden מוגדר כ $ 1 - LL_ {mod} / LL_0 $ , כאשר $ LL_ {mod} $ הוא ערך הסבירות ביומן עבור המודל המותאם ו- $ LL_0 $ הוא סבירות יומן עבור מודל האפס הכולל רק יירוט כמנבא (כך שכל אדם נחזה באותה ההסתברות של 'הצלחה').

עבור מודל רגרסיה לוגיסטית ערך הסבירות של היומן הוא תמיד שלילי (מכיוון תרומת הסבירות מכל תצפית היא הסתברות בין 0 ל -1). אם המודל שלך לא ממש מנבא את התוצאה טוב יותר מהמודל null, $ LL_ {mod} $ לא יהיה גדול בהרבה מ- $ LL_0 $ וכך $ LL_ {mod} / LL_0 \ בערך 1 $ , והפסאודו של McFadden- $ R ^ 2 $ קרוב ל -0 (למודל שלך אין ערך ניבוי).

לעומת זאת אם המודל שלך היה ממש טוב, לאותם אנשים עם הצלחה (1) תהיה הצלחה הסתברות מתאימה קרוב ל -1, ולהיפך לבעלי כישלון (0). במקרה זה אם אתה עובר את חישוב הסבירות תרומת הסבירות מכל אדם עבור המודל שלך תהיה קרובה לאפס, כך ש $ LL_ {mod} $ יהיה קרוב ל אפס, והפסאודו של McFadden- $ R ^ 2 $ בריבוע קרוב ל -1, מה שמעיד על יכולת ניבוי טובה מאוד.

באשר למה שיכול להיחשב ערך טוב, ההשקפה האישית שלי היא שכאלה שאלות דומות בסטטיסטיקה (למשל מה מהווה מתאם גדול?), היא לעולם לא יכולה להיות תשובה סופית. בשנה שעברה כתבתי פוסט בבלוג על $ R ^ 2 $ של McFadden ברגרסיה לוגיסטית, עם איורים נוספים של סימולציה.

Matt Reichenbach
2014-01-14 23:00:58 UTC
view on stackexchange narkive permalink

עשיתי מחקר ממוקד יותר בנושא זה, ומצאתי שפרשנויות לפסבדו של מקפדן $ R ^ 2 $ (המכונה גם מדד יחס הסבירות) הם לא ברור; עם זאת, הוא יכול לנוע בין 0 ל -1, אך לעולם לא יגיע או יעלה על 1 כתוצאה מחישובו.

כלל אצבע שמצאתי שהוא מועיל למדי הוא ש- Pseudo $ R ^ 2 $ הנע בין 0.2 ל 0.4 מציין התאמה טובה מאוד של המודל. ככזה, המודל שהוזכר לעיל עם פסאודו של McFadden $ R ^ 2 $ של 0.192 הוא ככל הנראה לא מודל נורא, לפחות לפי המדד הזה, אבל זה לא גם חזק במיוחד.

חשוב גם לציין שהפסבדו $ R ^ 2 $ של McFadden משמש בצורה הטובה ביותר להשוואה בין מפרטים שונים של אותו דגם. (כלומר דגמים מקוננים). בהתייחס לדוגמא הנ"ל, המודל המשתנה 6 (הפסאודו של מקפדן $ R ^ 2 $ = 0.192) מתאים לנתונים טוב יותר מהמודל המשתנה 5 (הפסאודו $ R ^ 2 $ = 0.131), אותו בדקתי רשמית באמצעות מבחן יחס סבירות יומן, המציין שיש הבדל משמעותי ( p < 0.001) בין שני המודלים, ולכן המודל המשתנה 6 מועדף על מערך הנתונים הנתון.

מהי ההתייחסות שמצאת הטוענת כי ה- R2 של מקפדן בין 0.2 - 0.4 מתאים "טוב מאוד"?
Btw ... הנה הפניה וקישור למאמר המקורי של מקפדן שם הוא מגדיר את המדד הפסבדו-R2 שלו. McFadden, D. (1974) "ניתוח לוגיט מותנה של התנהגות בחירה איכותית." עמ. 105-142 בפ 'זרמבקה (עורכת), גבולות בכלכלה. העיתונות האקדמית. elsa.berkeley.edu/reprints/mcfadden/zarembka.pdf
@Chris, http://www.lifesciencesite.com/lsj/life1002/286_B01288life1002_2028_2036.pdf, עמוד 2029 (את הביטוי המדויק ניתן למצוא בחלק הימני התחתון של הדף מאת Louviere et al., 2000). עם זאת נאמר, אני ממליץ על שטח מתחת לעקומה (AUC), הסטטיסטיקה c, על פני השימוש בפסאודו R בריבוע של מקפדן מכיוון שזה מדד הרבה יותר חזק עם פרשנות פשוטה.
כמו כן, Louviere et al. (2000) הפניות למאמר, Domencich, T. and McFadden, D. (1975): דרישת נסיעה עירונית: גישה התנהגותית, שנראה כי אני לא מצליח למצוא גישה אליה, אך היא עשויה להוות התייחסות מועילה גם עבורך.
תודה על הפניות. נראה כי ניתן למצוא עבודות רבות של מקפדן באתר ברקלי. להלן קישור לכל הספר שאתה מצטט למעלה: http://elsa.berkeley.edu/users/mcfadden/travel.html כל הפרקים מופיעים כקובץ PDF. רו-ריבוע (הפסאודו R2 של מקפדן) מוזכר בפרק 5. עמודים 122 ואילך (ראה משוואה 5.33 והגרף הבא מיד לאחר מכן). אני לא רואה שום אזכור של 0.2-0.4 = "התאמת מודל VG". אמשיך לחפש את המראה המכריע של "כלל האצבע" הזה. תודה על עזרתך!
אין בעיה! אני מעריך את סקרנותך ויסודיותך. הביטוי המדויק ניתן למצוא בכתובת http://www.lifesciencesite.com/lsj/life1002/286_B01288life1002_2028_2036.pdf, שם הכותבים קובעים "טובת הכושר באמצעות McFadden 's spseudo r-square (ρ2) משמש להתאמה. הדוגמנית הכוללת. מקפדן הציע כי יש לקחת את ערכי ה- ρ2 שבין 0.2 ל 0.4 כדי לייצג התאמה טובה מאוד למודל (Louviere et al., 2000). "
אם כי כשאני מסתכל על Louviere et al. (2000), אני לא מצליח למצוא היכן הם משתמשים אפילו בפסאודו ה- R בריבוע של מקפדן. אנא יידע אותי אם אתה מצליח לאתר זאת טוב יותר!
למוסד שלי יש עותק אלקטרוני של Louviere et al (2000). "שיטות בחירה מוגדרות: ניתוח ויישומים". הוצאת אוניברסיטת קיימברידג '. זו ההתייחסות שמצטט לי (כתב העת מדעי החיים) לריבוע בריבוע ב {0.2-0.4} = "התאמת VG". בעמוד 55 בלובייר (המשויך למשוואה 3.32) אנו רואים את הציטוט הבא: "ערכים של רו-ריבוע בין 0.2-0.4 נחשבים כמעידים על התאמה טובה מאוד למודל. סימולציות של דומניץ 'ומקדדן (1975) מקבילות לטווח זה 0.7 עד 0.9 לפונקציה לינארית ".
תודה על המעקב! אני מקווה שזה עוזר לאחרים שמפנים לדף זה!
זה מאוד אפשרי ... תצפית טובה! זה מאשש עוד יותר את העדפתי לסטטיסטיקה הג ', אך פסאודו ה- R בריבוע של מקפדן הוא לפחות מדד יחסי טוב להשוואה בין מודלים מקוננים, ולכן יש לו יישומים מועילים. נצטרך לחפש במקום אחר כלל אצבע, אם קיים כלל כזה.
Yiran
2018-09-19 19:40:20 UTC
view on stackexchange narkive permalink

אם מישהו עדיין מעוניין למצוא את המילה של מקפדן עצמו, הנה הקישור.בהערת שוליים כתב מקפדן (1977, עמ '35) כי "הערכים של .2 עד .4 עבור [$ \ rho ^ 2 $] מייצגים התאמה מצוינת."העיתון זמין באופן מקוון.

http://cowles.yale.edu/sites/default/files/files/pub/d04/d0474.pdf



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.
Loading...