כיצד לדמיין מה עושה ניתוח המתאם הקנוני (בהשוואה למה שעושה ניתוח המרכיבים העיקרי)?

figure

2013-07-27 01:28:16 UTC

view on stackexchange narkive permalink

ניתוח מתאם קנוני (CCA) הוא טכניקה הקשורה לניתוח רכיבים עיקריים (PCA). אמנם קל ללמד PCA או רגרסיה לינארית באמצעות עלילת פיזור (ראו כמה אלפי דוגמאות בחיפוש תמונות בגוגל), אך לא ראיתי דוגמה דו-ממדית אינטואיטיבית דומה עבור CCA. כיצד להסביר חזותית מה עושה CCA לינארי?

באיזה אופן CCA מכליל את ה- PCA? לא הייתי אומר שזו הכללה שלה. PCA עובד עם קבוצה אחת של משתנים, CCA עובד עם שניים (או יותר, יישומים מודרניים) וזהו ההבדל העיקרי.

ובכן, בקפדנות _ קשורה_ עשויה להיות בחירה טובה יותר של מילה. בכל מקרה, PCA פועל על מטריצת משתנות, ו- CCA על מטריצה בין-משתנית. אם יש לך רק מערך נתונים אחד, חישוב ההשתתפויות שלו מול עצמו בסופו של דבר חזר למקרה הפשוט יותר (PCA).

ובכן, כן, "קשור" עדיף. CCA לוקח בחשבון הן את הבין-משתנות והן את השונות.

יש שהציעו לדמיין קשרים קנוניים באמצעות הליוגרפים. כדאי לקרוא את העיתון http://ti.arc.nasa.gov/m/profile/adegani/Composite_Heliographs.pdf

רכיבים עיקריים

משתנים $ X_1 $ ו- $ X_2 $ מתואמים באופן חיובי: יש להם זווית חדה ביניהם. המרכיבים העיקריים $ P_1 $ ו- $ P_2 $ שוכנים באותו שטח "מישור X" המשתרע על ידי השניים משתנים. הרכיבים הם גם משתנים, רק אורתוגונליים הדדיים (לא מתואמים). הכיוון של $ P_1 $ הוא כזה שמקסם את סכום שני העומסים בריבוע של רכיב זה; ו $ P_2 $ , הרכיב הנותר, עובר אורטוגונלית ל $ P_1 $ במישור X. האורכים בריבוע מכל ארבעת הווקטורים הם השונות שלהם (השונות של רכיב היא הסכום הנ"ל של העומסים בריבוע שלו). עומסי רכיבים הם הקואורדינטות של המשתנים על הרכיבים - $ a $ מוצגים בתמונה השמאלית. כל משתנה הוא השילוב הליניארי נטול השגיאות של שני המרכיבים, כאשר העומסים המקבילים הם מקדמי הרגרסיה. ו להיפך כל רכיב הוא השילוב הליניארי נטול השגיאות של שני המשתנים; מקדמי הרגרסיה בשילוב זה ניתנים על ידי קואורדינטות הטיה של הרכיבים אל המשתנים - $ b $ מוצגים בתמונה הנכונה. גודל מקדם הרגרסיה בפועל יהיה $ b $ חלקי תוצר האורכים (סטיות התקן) של הרכיב החזוי ומשתנה החיזוי, למשל. $ b_ {12} / (| P_1 | * | X_2 |) $ . [הערת שוליים: ערכי הרכיבים המופיעים לעיל שני שילובים לינאריים הם ערכים סטנדרטיים, st. dev. = 1. זאת מכיוון שהמידע על השונות שלהם נלכד על ידי ה עומסים . כדי לדבר במונחים של ערכי רכיבים לא סטנדרטיים, $ a $ בתמונה לעיל צריכים להיות ערכי ווקטורים עצמיים, שאר הנימוקים. להיות זהה.]

רגרסיה מרובה

בעוד שב- PCA הכל טמון במישור X, ברגרסיה מרובה מופיע משתנה תלוי $ Y $ שלרוב אינו שייך למישור X, שטח המנבאים $ X_1 $ , $ X_2 $ . אבל $ Y $ מוקרן בניצב על מישור X, וההקרנה $ Y '$ , ה $ Y $ הגוון, הוא החיזוי על ידי או שילוב לינארי של שני $ X $ . בתמונה, אורך הריבוע של $ e $ הוא שונות השגיאה. הקוסינוס שבין $ Y $ ו- $ Y '$ הוא מקדם המתאם המרובה. כמו שהיה עם PCA, מקדמי הרגרסיה ניתנים על ידי הקואורדינטות המוטות של החיזוי ( $ Y '$ ) על המשתנים - $ b $ . גודל מקדם הרגרסיה בפועל יהיה $ b $ חלקי האורך (סטיית התקן) של משתנה החיזוי, למשל. $ b_ {2} / | X_2 | $ .

מתאם קנוני

ב- PCA, קבוצה של משתנים מנבאת את עצמם: הם מדגמנים רכיבים עיקריים אשר בתורם מדגמים את המשתנים, אתה לא משאיר את שטח המנבאים (אם אתה משתמש בכל הרכיבים) החיזוי הוא ללא שגיאות . ברגרסיה מרובה, קבוצת משתנים מנבאת משתנה חיצוני אחד ולכן קיימת שגיאת ניבוי כלשהי. ב- CCA, המצב דומה למצב ברגרסיה, אך (1) המשתנים הזרים הם מרובים, ויוצרים מערך משלהם; (2) שתי הסטים מנבאים זה את זה בו זמנית (מכאן מתאם ולא רגרסיה); (3) מה שהם חוזים זה בזה הוא דווקא תמצית, משתנה סמוי, מאשר הניבוי הנצפה של רגרסיה ( ראה גם).

בואו נשתמש בקבוצת המשתנים השנייה $ Y_1 $ ו- $ Y_2 $ כדי לתאם קנונית עם שלנו ערכת $ X $ . יש לנו רווחים - כאן, מישורים - X ו- Y. יש להודיע שכדי שהמצב יהיה לא פרטי - כמו זה היה למעלה עם רגרסיה שם $ Y $ מחוץ למישור X - על המישורים X ו- Y להצטלב רק בנקודה אחת, המקור. למרבה הצער אי אפשר לצייר על נייר מכיוון שמצגת 4D היא הכרחית. בכל מקרה, החץ האפור מציין ששני המקורות הם נקודה אחת והיחיד המשותף לשני המטוסים. אם זה נלקח, שאר התמונה דומה למה שהיה עם רגרסיה. $ V_x $ ו- $ V_y $ הם צמד המשתנים הקנוניים. כל משתנה קנוני הוא השילוב הליניארי של המשתנים המתאימים, כמו ש $ Y '$ היה. $ Y '$ הייתה ההקרנה האורתוגונאלית של $ Y $ למישור X. כאן $ V_x $ היא השלכה של $ V_y $ במישור X ובו זמנית $ V_y $ היא הקרנה של $ V_x $ במישור Y, אך הם לא תחזיות אורתוגונליות. במקום זאת הם נמצאים (חולצו) כדי למזער את הזווית $ \ phi $ בין אותם . קוסינוס של זווית זו הוא המתאם הקנוני. מכיוון שהתחזיות אינן צריכות להיות אורתוגונליות, אורכים (ומכאן שונות) של המשתנים הקנוניים אינם נקבעים אוטומטית על ידי האלגוריתם המתאים והם כפופים למוסכמות / אילוצים אשר עשויים להיות שונים ביישומים שונים. מספר זוגות המשתנים הקנוניים (ומכאן מספר המתאמים הקנוניים) הוא מינימלי (מספר $ X $ s, מספר $ Y $ s). וכאן מגיע הזמן שבו CCA דומה ל- PCA. ב- PCA, אתה גולש על רכיבים עיקריים אורתוגונליים הדדית (כאילו) רקורסיבית עד ש הכל המיצוי הרב-משתני מוצה. באופן דומה, ב- CCA מופקים זוגות אורטוגונליים הדדיים של משתנים בקורלציה מקסימאלית עד שכל השונות ה רב-משתנית שניתן לחזות במרחב הקטן יותר (ערכה פחותה) מוגמרת. בדוגמה שלנו עם $ X_1 $ $ X_2 $ לעומת $ Y_1 $ $ Y_2 $ נשאר הצמד הקנוני השני והחלש יותר $ V_ {x (2)} $ (מאונך ל $ V_x $ ) ו- $ V_ {y (2)} $ (מאונך ל $ V_y $ ).

מה היתרון של מתאם קנוני על קשרים בודדים של פירסון של זוגות משתנים משתי המערכות? (התשובה שלי היא בתגובות).