אתה בדרך הנכונה.
סטייה פירושה שאתה יכול לזהות אובייקט כאובייקט, גם כשהמראה שלו משתנה ב בדרך כלשהי. זה בדרך כלל דבר טוב מכיוון שהוא שומר על זהות האובייקט, קטגוריה וכו 'על פני שינויים בפרטי הקלט החזותי, כמו מיקומים יחסית של הצופה / המצלמה והאובייקט.
התמונה למטה מכילה תצוגות רבות של אותו פסל. אתם (ורשתות עצביות מאומנות היטב) יכולים לזהות כי אותו אובייקט מופיע בכל תמונה, למרות שערכי הפיקסלים בפועל שונים לגמרי.
שים לב של תרגום כאן יש משמעות ספציפית בחזון, מושאל מגיאומטריה. זה לא מתייחס לשום סוג של המרה, שלא כמו לומר, תרגום מצרפתית לאנגלית או בין פורמטים של קבצים. במקום זאת, המשמעות היא שכל נקודה / פיקסל בתמונה הועברו באותה הכמות באותו כיוון. לחלופין, אתה יכול לחשוב על המקור כאילו הועבר כמות שווה בכיוון ההפוך. לדוגמה, אנו יכולים ליצור את התמונות השנייה והשלישית בשורה הראשונה מהראשונה על ידי הזזת כל פיקסל 50 או 100 פיקסלים ימינה.
אפשר להראות שמפעיל הפיתול נוסע ביחס לתרגום. אם אתה משלב
$ f $ עם
$ g $ , זה לא משנה אם אתה מתרגם את הפלט המפותל
$ f * g $ , או אם אתה מתרגם
$ f $ או
$ g $ תחילה, ואז כנס אותם. בויקיפדיה יש
קצת יותר.
גישה אחת לזיהוי אובייקטים תרגום-משתנה היא לקחת "תבנית" של האובייקט ולכנס אותו לכל מיקום אפשרי של האובייקט בתמונה. אם אתה מקבל תגובה גדולה במיקום, זה מציע שאובייקט הדומה לתבנית ממוקם באותו מקום. גישה זו מכונה לעיתים קרובות התאמת תבניות .
סטייה לעומת שיווי משקל
התשובה של סנטנו_פטאניאק () כאן) מציין כי יש הבדל בין תרגום סטייה לבין תרגום שיווי משקל . משמעות סטטוס התרגום היא שהמערכת מייצרת את אותה התגובה בדיוק, ללא קשר לאופן שבו הקלט שלה מועבר. לדוגמה, גלאי פנים עשוי לדווח על "FACE FOUND" עבור כל שלוש התמונות בשורה העליונה. משווה המשמעות היא שהמערכת עובדת באותה מידה בין עמדות, אך תגובתה עוברת עם מיקום היעד. לדוגמא, במפת חום של "פנים-פנים" יהיו בליטות דומות מצד שמאל, מרכז וימין כאשר היא מעבדת את שורת התמונות הראשונה.
זוהי לעיתים הבחנה חשובה, אך אנשים רבים מכנים את שתי התופעות "בלתי משתנות", במיוחד מכיוון שלרוב זה טריוויאלי להמיר תגובה שווה ערך לתופעה שאינה משתנה - פשוט התעלם מכל מידע העמדה).