מכלול של טכניקות אימות צולבות

שְׁאֵלָה:

מכלול של טכניקות אימות צולבות

Amelio Vazquez-Reina

2011-08-18 20:53:09 UTC

view on stackexchange narkive permalink

אני תוהה אם מישהו מכיר מכלול של טכניקות אימות צולבות עם דיון על ההבדלים ביניהם ומדריך מתי להשתמש בכל אחת מהן. בוויקיפדיה יש רשימה של הטכניקות הנפוצות ביותר, אבל אני סקרן אם יש טכניקות אחרות, ואם ישנן טקסונומיות להן.

לדוגמה, אני פשוט רץ לספרייה המאפשרת לי לבחור באחת מהאסטרטגיות הבאות:

החזק
Bootstrap
K Validation
השאר אחד בחוץ
אימות צולב מרובד
אימות צולב מרובד מאוזן
שכבתי החוצה
רצועת רצועה מרובדת

ואני מנסה להבין מה המשמעות של ריבוד ומאוזן בתגובה, להחזיק מעמד או בקורות חיים.

אנחנו יכולים גם להפוך את הפוסט הזה לוויקי בקהילה אם אנשים רוצים, ולאסוף דיון של טכניקות או טקסונומיות כאן.

שאלה נהדרת זו תהיה מועילה עוד יותר אם נוכל לקשר להסברים על כל אחת מהשיטות.

ארבע תשובות:

Zach

2011-08-18 21:12:40 UTC

view on stackexchange narkive permalink

ניתן להוסיף לרשימה זו:

אימות חוצה-חוזר
השאר אימות חוצה-קבוצה-מחוץ
מחוץ- תיק (ליערות אקראיים ולדגמים אחרים שקיים)
632+ bootstrap

אין לי ממש עצה כ עד כמה ניתן להשתמש בטכניקות אלה או מתי להשתמש בהן. תוכלו להשתמש בחבילת caret ב- R כדי להשוות בין קורות חיים, Boot, Boot632, leave-one-out, leave-group-out ו- out-of-validation valid.

יש עצות לגבי מתי להשתמש בכל אלה?

Wayne

2011-08-18 22:27:33 UTC

view on stackexchange narkive permalink

אימות צולב של K-fold (CV) מפרק באופן אקראי את הנתונים שלך למחיצות K, ואתה מצידך מחזיק את אחד מאותם חלקי K כמקרה מבחן, ומגבש את חלקי K-1 האחרים יחד כנתוני האימון שלך. . השאר אחד בחוץ (LOO) הוא המקרה המיוחד שבו אתה לוקח את פריטי הנתונים שלך N ועורך קורות חיים בקיפול N. במובן מסוים, הולד אאוט הוא מקרה מיוחד נוסף, שבו אתה בוחר רק אחד מקיפולי K שלך כמבחן ולא מסתובב בכל קפלי K.

עד כמה שידוע לי, קורות חיים פי 10 זה יפה במידה רבה הקפדנות, מכיוון שהוא משתמש בנתונים שלך ביעילות ומסייע גם במניעת אפשרויות מחיצה לא מוצלחות. ה- Hold Out אינו עושה שימוש יעיל בנתונים שלך, ו- LOO אינו חזק כמוהו (או משהו כזה), אך קיפול 10-איש נכון בדיוק.

אם אתה יודע שהנתונים שלך מכילים יותר מ- קטגוריה אחת, וקטגוריה אחת או יותר קטנות בהרבה מהשאר, חלק מהמחיצות האקראיות של K יכולות אפילו לא להכיל אף אחת מהקטגוריות הקטנות, וזה יהיה רע. כדי לוודא שכל מחיצה מייצגת באופן סביר, אתה משתמש בשכבות: מחלק את הנתונים שלך לקטגוריות ואז יוצר מחיצות אקראיות על ידי בחירה אקראית ופרופורציונית מכל קטגוריה.

כל הווריאציות הללו בקורות החיים בקיפול K בחר מתוך הנתונים שלך ללא החלפה. ה- bootstrap בוחר בנתונים עם החלפה, כך שניתן לכלול את אותו נתון מספר פעמים וייתכן שחלק מהנתונים כלל לא ייכללו. (בכל "מחיצה" יהיו גם פריטי N, בניגוד לקיפול K, ובכל מחיצה יהיו פריטי N / K.)

(אצטרך להודות שאני לא יודע בדיוק איך עם זאת, ה- bootstrap ישמש בקורות חיים. העיקרון של בדיקה וקורות חיים הוא לוודא שלא תבדוק נתונים שהתאמנת עליהם, כך שתקבל מושג מציאותי יותר לגבי האופן שבו הטכניקה + המקדמים שלך עשויים לעבוד במציאות עולם.)

עריכה: הוחלף "החזק מעמד אינו יעיל" ל"החזק מעמד אינו עושה שימוש יעיל בנתונים שלך "כדי לעזור להבהיר, לפי ההערות.

כשאומרים ש"החזק מעמד אינו יעיל ", אני לא בטוח שאני עוקב. למה אתה מתכוון ביעילות כאן? בניגוד לקיפול N רגיל, ה- Hold Out אינו מסתובב בין הקפלים, ולכן הוא אמור להיות מהיר יותר. האם אתה מתכוון במקום זאת שזה יותר גרוע במאבק על התאמת יתר מאשר קורות חיים רגילים ב- N?

ב"יעיל "אני מתכוון שהוא לא משתמש בנתונים שלך ביעילות. היופי בקורות החיים של K-fold הוא ש 100% מהנתונים שלך משמשים לאימונים ו- 100% מהנתונים שלך משמשים לבדיקה, מה שעושה שימוש יעיל בנתונים שלך. המפתח הוא כמובן שכל הנתונים שלך לא מתרגלים לבדיקה והדרכה בו זמנית, מה שיניב תוצאות בדיקה אופטימיות (התאמת יתר). על ידי ביצוע חלוקה סטטית, Hold Out אומר כי, נניח, 1/3 מהנתונים שלך לעולם לא ישמשו לאימונים, ו- 2/3 מהנתונים שלך לעולם לא ישמשו לבדיקה, ובזבזו מידע רב בנתונים שלך.

@Wayne האם אומדן ההשהיה * חסר סימפטיות * משוחד? כמו כן, קורות חיים פשוטים בקיפול k נוטים יותר לשגיאה מסוג II מאשר קורות חיים חוזרים בקיפול k.

@chl: אני מאמין שאתה צודק בשתי הסעיפים. לא השתמשתי בקורות חיים בקיפול K חוזר ונשנה, אך הוא אמור להיות בעל שונות נמוכה יותר, מה שיעזור.

Marco Lui

2011-08-19 11:50:54 UTC

view on stackexchange narkive permalink

מצאתי את אחת ההפניות המקושרות במאמר בוויקיפדיה די שימושית

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.48.529&rep = rep1&type = pdf

"מחקר של אימות צולב ו- bootstrap לאמידת דיוק ובחירת מודל", רון כהבי, IJCAI95

הוא מכיל השוואה אמפירית עבור תת קבוצה של טכניקות קורות חיים. גרסת ה- tl; dr היא בעצם "השתמש בקורות חיים פי 10".

civilstat

2016-12-04 22:39:02 UTC

view on stackexchange narkive permalink

... ומדריך מתי להשתמש בכל אחד מהם ...

למרבה הצער הבעיה הזו קשה יותר ממה שהיא מקבלת קרדיט. ישנם שני שימושים עיקריים לפחות של אימות צולב: בחירת מודל והערכת ביצועי המודל.

באופן גס, אם אתה משתמש בגרסת CV המפצלת את הנתונים באמצעות יחס רכבת גבוהה לבדיקה. , זה יכול להיות טוב יותר להערכה. שימוש במערך אימונים גדול יותר יחקה בצורה מדויקת יותר את ביצועי המודל המתאים למערך הנתונים המלא.

אך יחס גבוה לרכבת לבדיקה יכול להיות גרוע יותר לבחירה. תאר לעצמך שיש באמת מודל "הכי טוב" שאתה צריך "לבחור, אבל מערך הנתונים שלך די גדול. לאחר מכן, דגמים גדולים מדי המשתלמים מעט יתרמו לביצועי קורות חיים כמעט זהים למודל "הטוב ביותר" (מכיוון שתעריכו בהצלחה את הפרמטרים המזויפים שלהם כזניחים). אקראיות בנתונים והליך CV / פיצול יגרמו לעיתים קרובות לבחור במודל התאמת יתר במקום המודל "הטוב ביותר" באמת.

ראה שאו (1993), "בחירת מודל לינארי על ידי צלב -אימות " לתיאוריה אסימפטוטית ישנה יותר במקרה של רגרסיה לינארית. יאנג (2007), "עקביות של אימות צולב לצורך השוואה בין נהלי רגרסיה" ו יאנג (2006), "השוואת שיטות למידה לסיווג" נותנות תיאוריה אסימפטוטית לנסיגה כללית יותר ו בעיות סיווג. אך קשה להשיג עצות של דוגמה סופית .

ⓘ

שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.

about - legalese

Loading...