הפחת את סף ההסתברות לסיווג

שְׁאֵלָה:

הפחת את סף ההסתברות לסיווג

sdgaw erzswer

2017-11-06 13:10:51 UTC

view on stackexchange narkive permalink

יש לי שאלה לגבי סיווג באופן כללי. תן ל $ f $ להיות מסווג, שמפיק קבוצה של הסתברויות בהינתן נתונים מסוימים D. בדרך כלל אפשר לומר: טוב, אם $ P (c | D) > 0.5 $ , נקצה מחלקה 1, אחרת 0 (שיהיה זה סיווג בינארי).

השאלה שלי היא, מה אם אגלה, שאם אני מסווג את המחלקה כ- 1 גם כאשר ההסתברויות גדולות מ- למשל 0.2, והסווג מתקדם יותר. האם זה לגיטימי להשתמש אז בסף החדש הזה בעת ביצוע סיווג?

הייתי מפרש את הצורך בסיווג נמוך יותר בהקשר לנתונים המשדרים אות קטן יותר; אך עדיין משמעותי לבעיית הסיווג.

אני מבין שזו דרך אחת לעשות זאת. עם זאת, אם זו אינה חשיבה נכונה להפחתת הסף, מה יהיו כמה טרנספורמציות נתונים, המדגישות תכונות בודדות באופן דומה, כך שהסף יכול להישאר על 0.5?

יש לך כבר תשובה מצוינת, אז בוא אני אגיד את זה: "בדרך כלל" שלך אינו רגיל שצריך להיות נורמלי.אני לא בטוח איפה הדבר "סף 0.5" הפך להיות סטנדרטי, ואני יודע שיש תוכנה כלשהי, אחרת מצוינת, שמעודדת את הרעיון, אך באופן כללי זה נוהג מאוד גרוע.

@MatthewDrury: אלא אם כן, כמובן, הציון הוא ההסתברות האחורית הרלוונטית המכוילת היטב שלא תעשה שום טעות חשובה (האחרון יטפל בעלויות שונות של סיווג שגוי).

ארבע תשובות:

Stephan Kolassa

2017-11-06 14:13:16 UTC

view on stackexchange narkive permalink

פרנק הראל כתב על כך בבלוג שלו: סיווג מול חיזוי, שאני מסכים איתו בלב שלם.

בעיקרו של דבר, הטיעון שלו הוא שהמרכיב הסטטיסטי של התרגיל שלך מסתיים כאשר אתה מביא הסתברות לכל מחלקה במדגם החדש שלך. בחירת סף שמעבר לו אתה מסווג תצפית חדשה כ -1 לעומת 0 אינה חלק יותר מ סטטיסטיקה . זה חלק ממרכיב ה החלטה . וכאן, אתה זקוק לפלט ההסתברותי של המודל שלך - אך גם לשיקולים כמו:

מה ההשלכות של ההחלטה להתייחס לתצפית חדשה כאל מחלקה 1 לעומת 0? האם אז אני שולח דואר שיווקי זול לכל ה- 1s? או שמא אני מבצע טיפול פולשני בסרטן עם תופעות לוואי גדולות?
מה ההשלכות של התייחסות ל- "אמיתי" כאל 1, ולהיפך? האם אסמן לקוח? להעביר מישהו לטיפול רפואי מיותר?
האם "השיעורים" שלי באמת נפרדים? או שמא ישנו רצף (למשל, לחץ דם), שבו הספים הקליניים הם למעשה רק קיצורי דרך קוגניטיביים? אם כן, עד כמה רחוק מעבר לסף המקרה שאני "מסווג" כרגע?
או שמא סבירות נמוכה אך חיובית להיות מחלקה 1 פירושה למעשה "קבל יותר נתונים", "הפעל בדיקה נוספת"?

אז, כדי לענות על שאלתך: שוחח עם הצרכן הסופי של הסיווג שלך וקבל תשובות לשאלות שלמעלה. או הסבירו לה או לו את התפוקה ההסתברותית שלכם, ותנו לה או לו לעבור על השלבים הבאים.

תודה רבה על התשובה התובנת הזו.אני עוד אבדוק את הבעיה עצמה - אני בטוח שאוכל איכשהו להמיר את המאפיין הזה לחלק הלמידה הסטטיסטית.

וואו, הלוואי שיכולתי להוסיף לזה משהו אבל לא קיבלתי כלום, תשובה יוצאת מן הכלל!

תשובה טובה מאוד: השאלות במקום!עם זאת, המקצוע שלי נמצא בצד היישום, בין אם מציאת סף החלטה נקרא סטטיסטיקה ובין אם לא - זה נופל לחלוטין במסגרת החובות המקצועיות שלי ... ועבורי הוא חלק מהמודל בדיוק כמו ש"עיבוד מראש "הוא חלק מהמודל - גם מהסיבה שכל ההחלטות האלה צריכות להיות מכוסות בתהליך האימות.

Benoit Sanchez

2017-11-06 21:22:32 UTC

view on stackexchange narkive permalink

התשובה של סטפן היא נהדרת. זה תלוי מיסודו במה ברצונך לעשות עם המסווג.

רק הוסף כמה דוגמאות.

דרך למצוא את הסף הטוב ביותר היא להגדיר פונקציה אובייקטיבית. לסיווג בינארי זה יכול להיות דיוק או ציון F1 למשל. תלוי באיזו בחירה, הסף הטוב ביותר יהיה שונה. לציון F1 יש כאן תשובה מעניינת: מהו סף F1 אופטימלי? כיצד לחשב את זה?. אבל האמירה "אני רוצה להשתמש בציון F1" היא המקום בו אתה באמת מבצע את הבחירה. אם בחירה זו טובה או לא תלויה במטרה הסופית.

דרך נוספת לראות את זה היא להתמודד עם הפשרה בין חקירה וניצול (הנקודה האחרונה של סטפן): השודד הרב זרוע הוא דוגמה לבעיה כזו: אתה צריך להתמודד עם שניים מטרות סותרות של רכישת מידע ובחירת השודד הטוב ביותר. אסטרטגיה בייסיאנית אחת היא לבחור כל שודד באופן אקראי עם ההסתברות שהוא הטוב ביותר. זה לא בדיוק סיווג אלא התמודדות עם הסתברויות פלט באופן דומה.

אם המסווג הוא רק לבנה אחת באלגוריתם של קבלת החלטות, הרי שהסף הטוב ביותר יהיה תלוי במטרה הסופית של האלגוריתם. יש להעריך ולהתאים אותו לתפקוד האובייקטיבי של התהליך כולו.

תודה על תשובה נהדרת נוספת.אם אני מבין נכון, אם אני מתמודד עם השלב האחרון בצינור, זה לגיטימי לחלוטין לייעל את הסף באופן ישיר.

@sdgawerzswer: כן.וא) ודא שאתה ממטב את התשובה לשאלה הנכונה וב) ודא שאתה מאמת את ההחלטה (ומציאת הסף) יחד עם שאר המודל.

Kameron Cole

2019-04-01 21:03:30 UTC

view on stackexchange narkive permalink

ייתכן שיש ערך כלשהו לשקול כיצד מחשבים את ההסתברות.בימינו, מסווגים משתמשים בווקטור הטיה, המכופל במטריצה (אלגברה לינארית).כל עוד ישנם ערכים שאינם אפסיים בווקטור, ההסתברות (תוצר הווקטור והמטריקס) לעולם לא תהיה 0.

זה גורם לבלבול בעולם האמיתי של אנשים שלא לקחו אלגברה לינארית, אני מניח.הם מוטרדים מהעובדה שיש ציוני הסתברות לפריטים שלדעתם צריכים להיות 0. במילים אחרות, הם מבלבלים בין הקלט הסטטיסטי לבין ההחלטה על סמך קלט זה.כבני אדם, אנו יכולים לומר שמשהו עם הסתברות של 0.0002234 זהה ל- 0, ברוב המקרים השימושיים ה"מעשיים ".בדיונים מדעיים קוגניטיביים גבוהים יותר, אולי, קיים דיון מעניין מדוע וקטור ההטיה עושה זאת, או ליתר דיוק, האם זה תקף ליישומים קוגניטיביים.

Alex F

2017-12-15 20:19:44 UTC

view on stackexchange narkive permalink

אין סף שגוי.הסף שתבחר תלוי במטרתך בחיזוי שלך, או ליתר דיוק במה אתה רוצה להעדיף, למשל דיוק לעומת זיכרון (נסה לשרטט אותו ולמדוד את ה- AUC המשויך אליו כדי להשוות מודלים של סיווג שונה לבחירתך).

אני נותן לך את הדוגמה הזו של דיוק לעומת זיכרון, מכיוון שבמקרה הבעייתי שלי עליו אני עובד כרגע, אני בוחר את הסף שלי בהתאם לדיוק המינימלי (או ערך החיזוי החיובי של PPV) שאני רוצה שיהיה למודל שלי בעת חיזוי, אבל לא אכפת לי מאוד משלילי.ככזה אני לוקח את הסף שמתאים לדיוק המבוקש ברגע שאימנתי את המודל שלי.הדיוק הוא האילוץ שלי וזיכרון הוא הביצועים של המודל שלי, כאשר אני משווה למודלים אחרים של סיווג.

ⓘ

שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.

about - legalese

Loading...