שְׁאֵלָה:
כיצד לבצע הגדלת נתונים ואימות פיצול הרכבות?
yangjie
2015-10-05 15:43:17 UTC
view on stackexchange narkive permalink

אני מבצע סיווג תמונות באמצעות למידת מכונה.

נניח שיש לי כמה נתוני אימון (תמונות) ואפצל את הנתונים לערכות אימון ואימות. ואני גם רוצה להגדיל את הנתונים (לייצר תמונות חדשות מהמקוריות) על ידי סיבובים אקראיים והזרקת רעשים. ההגדלה מתבצעת במצב לא מקוון.

איזו הדרך הנכונה לבצע הגדלת נתונים?

  1. תחילה פצל את הנתונים לערכות אימון ואימות, ואז בצע הגדלת נתונים הן בערכות האימון והן במערכות האימות.

  2. תחילה פצל את הנתונים למערכות אימון ואימות, ואז בצע הגדלת נתונים רק על מערך האימונים. li>

    ראשית בצע הגדלת נתונים על הנתונים, ואז פצל את הנתונים לאוסף אימונים ואימות.

ל"הגדלת נתונים "יש יותר ממשמעות אחת;זה יעזור לערוך את השאלה שלך כדי להבהיר מה היא שלך, או סתם לתת דוגמה.
אם אתם מתכננים לעשות TTA, יש להחיל את ההגדלה על מערך האימות לגבי מערך הבדיקה.
שְׁלוֹשָׁה תשובות:
burk
2015-10-07 15:32:20 UTC
view on stackexchange narkive permalink

ראשית פצל את הנתונים לערכות אימון ואימות, ואז בצע הגדלת נתונים על מערך האימונים.

אתה משתמש בערכת האימות שלך כדי לנסות להעריך כיצד השיטה שלך עובדת על נתונים בעולם האמיתי, ולכן היא צריכה מכילים רק נתוני עולם אמיתי. הוספת נתונים מוגברים לא תשפר את דיוק האימות. במקרה הטוב זה יגיד משהו על מידת ההתייחסות לשיטתך להגדלת הנתונים, ובמקרה הרע יהרוס את תוצאות האימות ופירושם.

אני די סקרן לגבי משהו בתשובתך.אם הקריטריון שלי להפסיק להכשיר CNN מפחית את אובדן האימות, האם אתה סבור כי הגדלת נתונים על נתוני האימות היא בחירה טובה?
לא, אני עדיין חושב שזה "יהרוס את תוצאות האימות ואת הפרשנות", מכיוון שדיוק האימות כבר אינו מקור טוב לדיוק בנתונים לא נראים חדשים אם תגדיל את נתוני האימות.
אז אנחנו בכלל לא צריכים ליישם הגדלת נתונים על אימות ובדיקת נתונים?
@AadnanFarooqA לא. בדרך כלל עליך לבצע את אותן פעולות בנתוני הבדיקה והאימות שלך כפי שאתה מתכוון לבצע על נתונים בלתי נראים כאשר אתה משתמש במודל שלך לחיזויים.
מה שאני מבין מהתגובה שלך הוא ראשית עלינו להפריד את הנתונים לאימות אימונים ובדיקות.מאשר להחיל הגדלה על בדיקות אימות ואימות בנפרד.זה נכון?
@AadnanFarooqA בדרך כלל אתה צריך להחיל הגדלה על נתוני האימון, לאחר הפיצול.
eyaler
2016-01-04 19:03:05 UTC
view on stackexchange narkive permalink

לעולם אל תעשה 3, מכיוון שתקבל דליפה. למשל נניח שההגדלה היא משמרת של 1 פיקסל שמאלה. אם הפיצול לא מודע להגדלה, ייתכן שתקבל דוגמאות נתונים דומות מאוד ברכבת וגם באימות.

Dawny33
2015-10-05 15:47:13 UTC
view on stackexchange narkive permalink

הגדלת נתונים פירושו הוספת נתונים / מידע חיצוניים לנתונים הקיימים שמנותחים.

לכן, מכיוון שכל הנתונים המוגדלים ישמשו למידת מכונה, אז התהליך הבא יהיה מתאים יותר:

הגדל נתונים -> פיצול נתונים

תודה על התשובה.האם זה בסדר שמדגם והמדגם המוגדל, שדומה למדי למקור, נמרחים בערכות שונות?
אתה מתכוון לנתונים הקיימים כמערכת אימונים ולנתונים המוגברים כמערכת אימות?אז לא**
הפיצול הוא אקראי, לכן אני מתכוון שאם אני מבצע הגדלת נתונים ואז מפצל את הנתונים, סביר להניח שחלק מהנתונים הקיימים (לא כולם) מפוצלים לערכת האימונים, בעוד הנתונים המוגדלים עוברים לערכת האימות.
באמצעות הגדלה, אתה מתכוון לצרף?נתונים מוגברים הם הנתונים התומכים בנתונים הנוכחיים בכל הנקודות. לכן, אם הפיצול הוא אקראי, הרי שהפיצול יביא לכמות זהה של נתוני augmente בשתי הערכות, כמו זו של הנתונים הקיימים
האם יש לכך הפניה של נייר?


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.
Loading...