שְׁאֵלָה:
מהו מודל "רווי"?
Graham Cookson
2010-07-20 17:09:08 UTC
view on stackexchange narkive permalink

למה הכוונה כשאנחנו אומרים שיש לנו מודל רווי?

שבע תשובות:
#1
+40
James
2010-07-20 19:23:31 UTC
view on stackexchange narkive permalink

מודל רווי הוא מודל שיש בו פרמטרים משוערים כמו נקודות נתונים. בהגדרה, זה יוביל להתאמה מושלמת, אך לא יועיל מעט מבחינה סטטיסטית, מכיוון שלא נותרו לך נתונים לאומדן השונות.

לדוגמה, אם יש לך 6 נקודות נתונים והתאמת 5 - כדי להזמין פולינום לנתונים, יהיה לך מודל רווי (פרמטר אחד לכל אחד מחמש הכוחות של המשתנה העצמאי שלך ועוד אחד לטווח הקבוע).

ראיתי דוגמאות שבהן למודל עשר נקודות נתונים ותשעה פרמטרים. כשציינתי שיש למודל יותר מדי פרמטרים, נאמר לי שה- R ^ 2 היה 0.999 אז המודל חייב להיות נכון!
כפי שניתן לקרוא בפוסט שלי ושל דייב, מודלים רוויים אינם מובילים לפי הגדרה להתאמה מושלמת. אבל אם אתה משתמש בפולינום ה- n-1 כמודל הם יעשו זאת. ראה מאמר מכונן של סו דו ניהם בנושא זה http://psych.fullerton.edu/mbirnbaum/papers/Nihm_18_1976.pdf
סליחה אם זה OT: מה שם המקרה שבו יש לנו אוסף מסודר של נקודות נתונים ויש נקודת נתונים שמעבר לה כל המקרים מצליחים או כל המקרים נכשלים?
#2
+26
Rich
2010-07-20 20:47:05 UTC
view on stackexchange narkive permalink

מודל רווי הוא מודל שמופרז יתר על המידה עד כדי כך שהוא בעצם רק אינטרפולציה של הנתונים. בהגדרות מסוימות, כגון דחיסת תמונה ושחזור, זה לא בהכרח דבר רע, אך אם אתה מנסה לבנות מודל ניבוי זה מאוד בעייתי.

בקיצור, מודלים רוויים מובילים להפליא ביותר מנבאים בעלי שונות גבוהה שנדחקים על ידי הרעש יותר מהנתונים בפועל.

כניסוי מחשבה, דמיין שיש לך מודל רווי, ויש נתונים ברעש, ואז דמיין מתאים את המודל כמה מאות פעמים, כל פעם עם מימוש אחר של הרעש, ואז מנבא נקודה חדשה. סביר להניח שתקבל תוצאות שונות בתכלית בכל פעם, הן בהתאמה שלך והן בחיזוי שלך (והמודלים הפולינומיים הם חמורים במיוחד בהקשר זה); במילים אחרות, השונות של ההתאמה והמנבא הם גבוהים ביותר.

לעומת זאת, מודל שאינו רווי ייתן (אם הוא נבנה באופן סביר) בהתאמות עקביות יותר זו עם זו גם תחת מימוש רעש שונה. , וגם השונות של המנבא תצטמצם.

אז אתה מכניס יתר על המידה אז?
#3
+19
Dave Kellen
2010-07-27 18:09:55 UTC
view on stackexchange narkive permalink

כפי שכולם אמרו קודם, זה אומר שיש לך כמה פרמטרים שיש לך נקודות נתונים. אז, אין טוב לבדיקת התאמה. אך אין זה אומר ש"הגדרתו ", המודל יכול להתאים באופן מושלם לכל נקודת נתונים. אני יכול לספר לך על ידי ניסיון אישי בעבודה עם כמה מודלים רוויים שלא יכלו לחזות נקודות נתונים ספציפיות. זה די נדיר, אבל אפשרי.

נושא חשוב נוסף הוא שרווי אינו אומר חסר תועלת. לדוגמא, במודלים מתמטיים של קוגניציה אנושית, פרמטרים של מודלים קשורים לתהליכים קוגניטיביים ספציפיים בעלי רקע תיאורטי. אם מודל רווי, תוכלו לבדוק את מידת התאמתו על ידי ביצוע ניסויים ממוקדים עם מניפולציות שאמורות להשפיע רק על פרמטרים ספציפיים. אם התחזיות התיאורטיות תואמות את ההבדלים שנצפו (או חוסר) באומדני הפרמטרים, אפשר לומר שהמודל תקף.

דוגמה: דמיין למשל מודל שיש לו שתי קבוצות של פרמטרים, אחד לעיבוד קוגניטיבי ואחד לתגובות מוטוריות. דמיין עכשיו שיש לך ניסוי עם שני מצבים, האחד בו יכולת התגובה של המשתתפים נפגעת (הם יכולים להשתמש רק ביד אחת במקום בשניים), ובמצב השני אין פגיעה. אם המודל תקף, הבדלים באומדני הפרמטרים לשני התנאים צריכים להתרחש רק עבור הפרמטרים של תגובת המנוע.

כמו כן, שים לב שגם אם מודל אחד אינו רווי, ייתכן שהוא עדיין לא ניתן לזיהוי. , מה שאומר ששילובים שונים של ערכי פרמטרים מייצרים את אותה תוצאה, המסכנת כל התאמה של מודל.

אם ברצונך למצוא מידע נוסף על נושאים אלה באופן כללי, כדאי לך להסתכל בעיתונים הבאים:

Bamber, D., & van Santen, JPH (1985). כמה פרמטרים יכול להיות ובכל זאת ניתן לבדוק את המודל? כתב העת לפסיכולוגיה מתמטית, 29, 443-473.

Bamber, D., & van Santen, J. P. H. (2000). כיצד להעריך את יכולת הבדיקה והזיהוי של המודל. כתב העת לפסיכולוגיה מתמטית, 44, 20-40.

הידד

#4
+17
Henrik
2010-07-27 16:56:42 UTC
view on stackexchange narkive permalink

מודל רווי אם ורק אם יש לו כמה פרמטרים שיש לו נקודות נתונים (תצפיות). או לומר אחרת, במודלים שאינם רוויים דרגות החופש גדולות מאפס.

זה בעצם אומר שהמודל הזה חסר תועלת, מכיוון שהוא לא מתאר את הנתונים בצורה חסידית יותר מאשר הנתונים הגולמיים (ו תיאור נתונים בצורה חדה הוא בדרך כלל הרעיון העומד מאחורי השימוש במודל). יתר על כן, מודלים רוויים יכולים (אך לא בהכרח) לספק התאמה מושלמת (חסרת תועלת) מכיוון שהם פשוט אינטרפולציה או איטרציה של הנתונים.

קח למשל את הממוצע כמודל עבור נתונים מסוימים. אם יש לך רק נקודת נתונים אחת (למשל, 5) המשתמשת בממוצע (כלומר, 5; שים לב שהממוצע הוא מודל רווי לנקודת נתונים אחת בלבד) לא עוזר בכלל. עם זאת, אם יש לך כבר שתי נקודות נתונים (למשל, 5 ו -7) המשתמשות בממוצע (כלומר, 6) כמודל מספק לך תיאור מובהק יותר מהנתונים המקוריים.

נקודה זו לגבי רווי שאינו מרמז על התאמה מושלמת היא החלק המעניין ביותר בשרשור זה. דוגמא טבעית למצב כזה תהיה [רגרסיה מונוטונית] (http://en.wikipedia.org/wiki/Isotonic_regression). נניח, למשל, אתה יודע שהערכים שלך חייבים לעלות עם הזמן ואתה עושה רגרסיה פולינומית, * שמגבילה את הפולינום להיות הולכים וגדלים. * שקול נתונים שיש בהם שגיאה כלשהי, ולכן לפעמים הם פוחתים מעט. אז לא משנה בכמה פרמטרים תשתמשו (גם כאשר הם * יותר * ממספר ערכי הנתונים), לעולם לא תתאימו לנתונים הללו בצורה מושלמת.
#5
+3
Stephen Lien
2011-09-21 18:17:58 UTC
view on stackexchange narkive permalink

זה שימושי גם אם אתה צריך לחשב AIC עבור מודל כמעט סביר. אומדן הפיזור צריך להגיע מהמודל הרווי. אתה מחלק את ה- LL שאתה מתאים לפי הפיזור המשוער מהמודל הרווי בחישוב AIC.

#6
+3
Ehsan88
2015-11-19 21:01:28 UTC
view on stackexchange narkive permalink

בהקשר של SEM (או ניתוח נתיבים), מודל רווי או מודל שזוהה זה עתה הוא מודל בו מספר הפרמטרים החופשיים שווה במדויק למספר השונות והקובורציות הייחודיות. לדוגמא המודל הבא הוא מודל רווי מכיוון שישנן נקודות נתונים של 3 * 4/2 (שונות ומשתנים ייחודיים) וגם יש להעריך 6 פרמטרים חופשיים:

a saturated model

#7
+2
Richard DiSalvo
2019-12-05 21:04:02 UTC
view on stackexchange narkive permalink

ברגרסיה, אני חושב ששימוש נפוץ במונח "מודל רווי" הוא כדלקמן. למודל רווי יש כמה משתנים עצמאיים כמו שיש רמות (שילובים) ייחודיים של הקוביאט. כמובן שזה אפשרי רק עם משתנים קטגוריים. אז אם יש לך שני משתני דמה X1 ו- X2, רגרסיה רוויה אם המשתנים הבלתי תלויים שאתה כולל הם X1, X2 ו- X1 * X2.

זה יתרון מכיוון שפונקציית הציפייה המותנית של Y בהינתן X1 ו- X2 היא בהכרח לינארית בפרמטרים כאשר המודל רווי (הוא ליניארי ב- X1, X2, X1 * X2). חשוב לציין כי בדרך כלל אין למודל זה "כמה פרמטרים מוערכים כמו נקודות נתונים", ובדרך כלל אין לו "התאמה מושלמת".

הנה מקור אחד לכך, ישנם רבים אחרים: "מתי היינו מצפים שה- CEF יהיה ליניארי? שני מקרים. האחד הוא אם הנתונים (התוצאה והמשתנים המשתנים) הם נורמליים רב-משתניים. והשני הוא אם הליניארי רגרסיה היא saturated. מודל רגרסיה רווי הוא אחד שבו יש פרמטר לכל שילוב ייחודי של המשתנים המשתנים. במקרה זה, הרגרסיה מתאימה לחלוטין ל- CEF מכיוון שה- CEF הוא פונקציה לינארית של קטגוריות הדמה. " פרופ ' הערות ההרצאה של בלקוול, עמוד 2.

האפיון בפסקה הראשונה הוא רק מקרה מיוחד של הציטוט בשלישי (שזו תשובה מצוינת בפני עצמה).


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...