שְׁאֵלָה:
האם PCA ואחריו סיבוב (כגון varimax) עדיין PCA?
Roman Luštrik
2010-07-25 19:31:32 UTC
view on stackexchange narkive permalink

ניסיתי להעתיק מחקר (באמצעות PCA) מ- SPSS ב- R. מניסיוני, principal () פונקציה מחבילה psych הייתה הפונקציה היחידה שהתקרבה (או אם הזיכרון שלי משרת אותי נכון, מת) כדי להתאים לפלט. כדי להתאים לאותן תוצאות כמו ב- SPSS, הייתי צריך להשתמש בפרמטר principal (..., rotate = "varimax") . ראיתי מאמרים מדברים על איך הם עשו PCA, אך בהתבסס על תפוקת SPSS ושימוש בסיבוב, זה נשמע יותר כמו ניתוח גורמים.

שאלה: האם PCA, גם לאחר סיבוב (באמצעות varimax ), עדיין PCA? התרשמתי שייתכן ומדובר בניתוח גורמים ... למקרה שלא, אילו פרטים חסרים לי?

מבחינה טכנית, כל מה שיש לך לאחר הסיבוב אינם רכיבים * עיקריים * יותר.
סיבוב עצמו לא משנה אותו. מסובב או לא, הניתוח הוא מה שהוא. PCA אינו _ FA_ בהגדרה הצרה של "ניתוח גורמים", ו- PCA _ הוא_ FA בהגדרה רחבה יותר של "ניתוח גורמים". http://stats.stackexchange.com/a/94104/3277
שלום @Roman!סקרתי את השרשור הישן הזה, ואני מופתע שסימנת את תשובתו של ברט כמקובלת.שאלת האם סיבוב PCA + הוא עדיין PCA, או שהוא FA;התשובה של ברט לא אומרת מילה אחת על סיבובים!זה גם לא מציין את הפונקציה 'המנהל' ששאלת עליה.אם תשובתו אכן ענתה לשאלתך, אז אולי שאלתך אינה מנוסחת כראוי;היית שוקל לערוך?אחרת אני מוצא שתשובת הדוקטורט קרובה הרבה יותר לענות על שאלתך.שימו לב שתוכלו לשנות את התשובה המקובלת בכל עת.
אני צריך להוסיף שאני עובד על תשובה חדשה ומפורטת יותר לשאלתך, ולכן אני סקרן לדעת אם אתה באמת עדיין מעוניין בנושא זה.אחרי הכל, ארבע ועברו שנים ...
אחרים עשויים להתעניין ב @amoeba,, אז אם יש משהו שאתה חושב שתוכל לתרום בתשובה חדשה, הייתי אומר לך על זה!זה היופי של האתר הזה.
@amoeba לצערי העתיד אני לא יכול לענות מדוע קיבלתי את התשובה.סקרתי את החיה הישנה 4.5 שנים מאוחר יותר, הבנתי שאף אחת מהתשובות לא מתקרבת.mbq מתחיל להבטיח אך לא נופל מהסבר.אך לא משנה, הנושא מבלבל מאוד, כנראה בזכות מינוח שגוי בתוכנות סטטיסטיות פופולריות למדעי החברה שלא אציין בקיצור של ארבע אותיות.אנא שלח תשובה ופינג אותי, אני אקבל אותה אם אמצא אותה קרוב יותר לענות על שאלתי.
שמונה תשובות:
#1
+54
amoeba
2015-02-09 22:58:47 UTC
view on stackexchange narkive permalink

שאלה זו עוסקת במידה רבה בהגדרות של PCA / FA, כך שהדעות עשויות להיות שונות. דעתי היא ש- PCA + varimax לא צריך להיקרא לא PCA או FA, bur אלא להתייחס במפורש למשל. כ- "PCA המסתובב עם varimax".

אני צריך להוסיף שזה נושא מבלבל למדי. בתשובה זו אני רוצה להסביר מהו למעשה סיבוב ; זה ידרוש קצת מתמטיקה. קורא מזדמן יכול לדלג ישירות על האיור. רק אז נוכל לדון האם יש לקרוא או לא לקרוא לסיבוב PCA + "PCA".

התייחסות אחת היא ספרו של ג'וליף "ניתוח מרכיבים עיקריים", סעיף 11.1 "סיבוב רכיבים עיקריים", אך אני מוצא אותו יכול להיות ברור יותר.


תן ל- $ \ mathbf X $ להיות מטריצת נתונים $ n \ פעמים p $ שאנו מניחים שהיא מרוכזת. סכומי ה- PCA ( ראו את תשובתי כאן) לפירוק של ערך יחיד: $ \ mathbf X = \ mathbf {USV} ^ \ top $. ישנן שתי תצוגות שוות ערך אך משלימות על הפירוק הזה: תצוגה "השלכה" יותר בסגנון PCA ותצוגה "משתנים סמויים" יותר בסגנון FA.

על פי התצוגה בסגנון PCA, מצאנו חבורה של כיוונים אורתוגונליים $ \ mathbf V $ (אלה הם ווקטורים עצמיים של מטריצת המשתנות, המכונה גם "כיוונים עיקריים" או "צירים"), ו"רכיבים עיקריים "$ \ mathbf {US} $ (נקראים גם" ציוני רכיב עיקרי " ) הם תחזיות הנתונים על כיוונים אלה. הרכיבים העיקריים אינם מתואמים, הראשון כולל שונות אפשרית מקסימלית וכו '. אנו יכולים לכתוב: $$ \ mathbf X = \ mathbf {US} \ cdot \ mathbf V ^ \ top = \ text {Scores} \ cdot \ text {Principal הוראות}. $$

על פי ההשקפה בסגנון FA, מצאנו כמה "גורמים סמויים" שלא מתואמים עם היחידות המניבים את המשתנים שנצפו באמצעות "עומסים". ואכן, $ \ widetilde {\ mathbf U} = \ sqrt {n-1} \ mathbf {U} $ הם רכיבים עיקריים סטנדרטיים (לא מתואמים ועם שונות יחידה), ואם אנו מגדירים עומסים כ $ \ mathbf L = \ mathbf { VS} / \ sqrt {n-1} $, ואז $$ \ mathbf X = \ sqrt {n-1} \ mathbf {U} \ cdot (\ mathbf {VS} / \ sqrt {n-1}) ^ \ למעלה = \ widetilde {\ mathbf U} \ cdot \ mathbf L ^ \ top = \ text {ציונים סטנדרטיים} \ cdot \ text {Loadings}. $$ (שים לב ש $ \ mathbf {S} ^ \ top = \ mathbf { S} $.) שתי התצוגות שוות ערך. שים לב שהעומסים הם וקטורים עצמיים המוגדלים על ידי הערכים העצמיים המתאימים ($ \ mathbf {S} / \ sqrt {n-1} $ הם ערכים עצמיים של מטריצת המשתנות). ש PCA $ \ ne $ FA; FA שואף במפורש למצוא גורמים סמויים הממופים באופן לינארי למשתנים שנצפו באמצעות עומסים; הוא גמיש יותר מ- PCA ומניב עומסים שונים. לכן אני מעדיף קרא לעיל "תצוגה בסגנון FA ב- PCA" ולא FA, למרות שיש אנשים שלוקחים זאת כאחת משיטות ה- FA.)

עכשיו, מה עושה סיבוב? למשל. סיבוב אורתוגונלי, כגון varimax. ראשית, הוא מתחשב רק ברכיבי $ k<p $, כלומר: $$ \ mathbf X \ approx \ mathbf U_k \ mathbf S_k \ mathbf V_k ^ \ top = \ widetilde {\ mathbf U} _k \ mathbf L ^ \ top_k. $$ ואז זה לוקח ריבוע אורתוגונאלי $ k \ פעמים k $ מטריקס $ \ mathbf T $, ומחבר $ \ mathbf T \ mathbf T ^ \ top = \ mathbf I $ לפירוק זה: $$ \ mathbf X \ approx \ mathbf U_k \ mathbf S_k \ mathbf V_k ^ \ top = \ mathbf U_k \ mathbf T \ mathbf T ^ \ top \ mathbf S_k \ mathbf V_k ^ \ top = \ widetilde {\ mathbf U} _ \ mathrm {rot} \ mathbf L ^ \ top_ \ mathrm {rot}, $$ כאשר העומסים המסובבים ניתנים על ידי $ \ mathbf L_ \ mathrm {rot} = \ mathbf L_k \ mathbf T $, והציונים הסטנדרטיים המסובבים ניתנים על ידי $ \ widetilde {\ mathbf U} _ \ mathrm {rot} = \ widetilde {\ mathbf U} _k \ mathbf T $. (המטרה של זה היא למצוא $ \ mathbf T $ כך ש $ \ mathbf L_ \ mathrm {rot} $ התקרבו להיות דלילים ככל האפשר, כדי להקל על פירושו.)

שים לב שמה שמסתובב הם: (1) ציונים סטנדרטיים, (2) עומסים. אבל לא הציונים הגולמיים ולא הכיוונים העיקריים! אז הסיבוב קורה במרחב ה סמוי , ולא במרחב המקורי. זה מכריע בהחלט.

מנקודת מבט בסגנון FA, שום דבר לא קרה הרבה. (א) הגורמים הסמויים עדיין אינם מתואמים ומתוקננים. (ב) הם עדיין ממופים למשתנים שנצפו באמצעות עומסים (מסובבים). (ג) כמות השונות שנתפסה על ידי כל רכיב / גורם ניתנת על ידי סכום הערכים בריבוע של עמודת העומסים המתאימה ב- $ \ mathbf L_ \ mathrm {rot} $. (ד) מבחינה גיאומטרית, העומסים עדיין מתפרשים על אותו שטח משנה $ k $ -ממדי ב- $ \ mathbb R ^ p $ (שטח המשנה המשתרע על ידי הווקטורים העצמיים הראשונים של $ k $ PCA). (ה) הקירוב ל- $ \ mathbf X $ ושגיאת השחזור כלל לא השתנו. (ו) מטריצת השונות היא עדיין מקורבת באותה מידה: $$ \ boldsymbol \ Sigma \ approx \ mathbf L_k \ mathbf L_k ^ \ top = \ mathbf L_ \ mathrm {rot} \ mathbf L_ \ mathrm {rot} ^ \ top. $$

אבל נקודת המבט בסגנון PCA כמעט קרסה. עומסים מסובבים אינם תואמים יותר לכיוונים / צירים אורתוגונליים ב- $ \ mathbb R ^ p $, כלומר עמודות של $ \ mathbf L_ \ mathrm {rot} $ אינן אורתוגונליות! גרוע מכך, אם אתה מקרין [באופן אורתוגונלי] את הנתונים לכיוונים שניתנו על ידי העומסים המסובבים, תקבל תחזיות מתואמות (!) ולא תוכל לשחזר את הציונים. [במקום זאת, כדי לחשב את הציונים הסטנדרטיים לאחר הסיבוב, צריך להכפיל את מטריצת הנתונים ב פסאודו-הפוך של העומסים $ \ widetilde {\ mathbf U} _ \ mathrm {rot} = \ mathbf X (\ mathbf L_ \ mathrm {rot} ^ +) ^ \ top $. לחלופין, אפשר פשוט לסובב את הציונים הסטנדרטיים המקוריים בעזרת מטריצת הסיבוב: $ \ widetilde {\ mathbf U} _ \ mathrm {rot} = \ widetilde {\ mathbf U} \ mathbf T $.] כמו כן, הרכיבים המסתובבים עושים לא קולט ברציפות את כמות השונות המרבית: השונות מתחלקת מחדש בין הרכיבים (למרות שכל הרכיבים המסתובבים $ k $ תופסים שונות בדיוק כמו כל הרכיבים העיקריים $ k $ המקוריים).

הנה המחשה. הנתונים הם אליפסה דו-ממדית הנמתחת לאורך האלכסון הראשי. הכיוון העיקרי הראשון הוא האלכסון הראשי, השני הוא אורתוגונלי אליו. וקטורי טעינה של PCA (ווקטורים עצמיים המוגדלים לפי הערכים העצמיים) מוצגים באדום - מצביעים לשני הכיוונים וגם נמתחים על ידי גורם קבוע לראות. ואז יישמתי סיבוב אורתוגונלי ב- $ 30 ^ \ circ $ על העומסים. וקטורי טעינה כתוצאה מוצגים במגנטה. שים לב איך הם לא אורתוגונליים (!).

PCA rotation

אינטואיציה בסגנון FA הנה כדלקמן: דמיין "מרחב סמוי" שבו נקודות ממלאות מעגל קטן ( מגיעים מגאוסי דו-ממדי עם שונות יחידה). חלוקת נקודות אלה נמתחת לאורך עומסי ה- PCA (אדום) כדי להפוך לאליפסה של הנתונים שאנו רואים באיור זה. עם זאת, את אותה התפלגות הנקודות ניתן לסובב ואז למתוח לאורך עומסי ה- PCA המסובבים (מגנטה) כדי להפוך ל אותו אליפסה של נתונים .

[ כדי למעשה לראות כי סיבוב עומסים אורתוגונלי הוא סיבוב , צריך להסתכל על דו-כיווני PCA; שם הווקטורים / קרניים המתאימים למשתנים מקוריים פשוט יסתובבו.]


תן לנו לסכם. לאחר סיבוב אורתוגונלי (כגון varimax ), הצירים "הראשיים המסובבים" אינם אורתוגונליים, והקרנות אורתוגונליות עליהם אינן הגיוניות. אז צריך דווקא להפיל את נקודת המבט של כל הצירים / ההשלכות האלה. זה יהיה מוזר עדיין לקרוא לזה PCA (שכולו תחזיות עם שונות מקסימאלית וכו ').

מנקודת מבט בסגנון FA, פשוט סובבנו את הגורמים הסמויים שלנו (הסטנדרטיים והלא מתואמים), היא פעולה תקפה. אין "תחזיות" ב- FA; במקום זאת, גורמים סמויים מייצרים את המשתנים הנצפים באמצעות טעינה. ההיגיון הזה עדיין נשמר. עם זאת, התחלנו עם רכיבים עיקריים, שאינם למעשה גורמים (מכיוון ש- PCA אינו זהה ל- FA). אז זה יהיה מוזר לקרוא לזה גם FA.

במקום להתלבט אם "צריך" דווקא לקרוא לזה PCA או FA, הייתי מציע להקפיד על ציון ההליך המדויק ששימש: "PCA ואחריו סיבוב varimax". Postscriptum. ניתן לשקול הליך סיבוב חלופי, שבו $ \ mathbf {TT} ^ \ top $ מוכנס בין $ \ mathbf {US} $ ו- $ \ mathbf V ^ \ top $. זה יסובב את ציוני הגלם ואת הווקטורים העצמיים (במקום ציונים ועומסים סטנדרטיים). הבעיה הגדולה ביותר בגישה זו היא שאחרי "סיבוב" כזה, הציונים כבר לא יהיו מתואמים, וזה די קטלני עבור PCA. אחד יכול לעשות את זה, אך לא בדרך כלל מבינים ומיישמים סיבובים.

לא הבנתי לגמרי את הטקסט סביב התמונה.אתה משתמש ב"עומס "מספר פעמים:` וקטורי טעינה של PCA ... מוצגים באדום`, `נמתחים לאורך עומסי ה- PCA המסובבים (מגנטה)`.מעניין כיצד ניתן להראות "עומסים" או ה"ווקטור "שלהם כצירים במפזר הנתונים.אתה יכול בבקשה להבהיר את זה יותר?והרעיון של "מתיחות"?תודה.
זה עשוי להיות קשור לדיון הארוך שקיימנו לאחרונה על עומסים "המשתרעים על שטח משנה" במרחב המשתנה או לא.בתשובה זו השתמשתי ב"ווקטור טעינה "(או פשוט" העמסות ") כדי להתייחס לעמודה אחת של מטריצת העומסים.בדוגמה שלי הנתונים הם דו-ממדיים כלומר יש שני משתנים, ולכן העומסים הם וקטורים דו-ממדיים.מכאן שאני יכול לשרטט אותם בפיזור הנתונים (הגדלתי אותם לפי גורם קבוע כלשהו לראות).ב- PCA, העומסים כמובן הם אורתוגונליים (הם פרופורציוניים לווקטורים העצמיים).אחרי varimax, הם כבר לא.
את הפיסקה על "מתיחות" (מיד אחרי התמונה) עלי כנראה להמחיש טוב יותר;אני יכול לראות שזה לא מאוד ברור.
חשבתי שאם אתה שואף לשרטט אורתוגונליות או אי-מרתחות של וקטורים מסוימים (כגון עומסים) אתה צריך לצייר אותם כחצים.או אולי אני לא מבין אותך?
אני מסכים ששימוש בחצים יהיה טוב יותר, השמטתי רק את "ראשי החץ" לנוחות התכנון.אני יכול לעשות שוב את הנתון הזה כדי להוסיף אותם.כמו כן, ציירתי כל וקטור המצביע לשני הכיוונים כי הסימנים שלהם לא חשובים.
#2
+29
Brett
2010-07-28 00:22:33 UTC
view on stackexchange narkive permalink

ניתוח רכיבים עיקריים (PCA) וניתוח גורמים נפוצים (CFA) הם שיטות מובחנות. לעיתים קרובות הם מניבים תוצאות דומות ו- PCA משמש כשיטת החילוץ המוגדרת כברירת מחדל בשגרות ניתוח גורמי ה- SPSS. אין ספק שזה מביא לבלבול רב לגבי ההבחנה בין השניים.

בשורה התחתונה מדובר בשני מודלים שונים מבחינה רעיונית. ב- PCA, הרכיבים הם שילובים ליניאריים אורתוגונליים הממקסמים את השונות הכוללת. ב- FA, הגורמים הם שילובים ליניאריים שממקסמים את החלק המשותף של השונות - ביסוד "קונסטרוקציות סמויות". לכן FA מכונה לעתים קרובות "ניתוח גורמים נפוצים". FA משתמש במגוון שגרות אופטימיזציה והתוצאה, בניגוד ל- PCA, תלויה בשגרת האופטימיזציה בה נעשה שימוש ובנקודות המוצא לשגרה זו. פשוט אין פתרון ייחודי אחד.

ב- R, הפונקציה factanal () מספקת ל- CFA מיצוי סבירות מקסימלי. לכן, אתה לא צריך לצפות שהיא תשחזר תוצאת SPSS המבוססת על מיצוי PCA. זה פשוט לא אותו מודל או היגיון. אני לא בטוח אם היית מקבל את אותה תוצאה אם ​​תשתמש במיצוי הסבירות המקסימלית של SPSS כיוון שהם עשויים לא להשתמש באותו אלגוריתם.

לטוב ולרע ב R, עם זאת, תוכל לשחזר את "ניתוח הגורמים" המעורב ש- SPSS מספק כברירת מחדל. הנה התהליך ב- R. בעזרת קוד זה, אני יכול לשחזר את התוצאה "ניתוח גורמים" של רכיב SPSS באמצעות מערך נתונים זה. (למעט השלט שאינו קובע). לאחר מכן ניתן יהיה לסובב את התוצאה באמצעות כל אחת משיטות הסיבוב הזמינות של Rs. pfa.eigen<-eigen (cor (attitude)) # הדפס ושים לב שערכים עצמיים הם אלה המופקים על ידי SPSS. # שימו לב גם כי SPSS יחלץ שני רכיבים כערכים עצמיים > 1 = 2pfa.eigen $ ערכים # קבע ערך למספר הגורמים (לבהירות) גורמים <-2 # חילץ והפוך שני רכיבים. וקטורי pfa.eigen $ [, 1: גורמים]% *% + diag (sqrt (pfa.eigen $ ערכים [1: גורמים]), גורמים, גורמים)

+1 על כך שבאמת עוזר להרגיע את הבלבול סביב SPSS לעומת R כאן. נותרו שתי שאלות: מה עושה 'prcomp' או 'princomp' של R בהשוואה לגישה המעורבת של SPSS? מה SPSS בעצם עושה על ידי מיצוי?
אה, והאם אוכל להוסיף כיצד לחשב ציונים למשל PC1 לפיתרון שלך: תקן 'zz <- סולם (יחס, T, T)' ו- 'pc1 <- zz% *% לפתור (cor (יחס), למבה [, 1])'. איפה למבדה היא תוצאה של השורה האחרונה של דוגמא @Brett Magills.
-1.למרות שיש בתשובה זו הרבה מידע שימושי, אני מוצא שהוא כלל לא עונה על השאלה המקורית.השאלה המקורית הייתה האם סיבוב PCA + עדיין יכול להיחשב ל- PCA (או ליתר דיוק FA).התשובה שלך אפילו לא מזכירה סיבובים!אז איך זו יכולה להיות תשובה?
יכול להיות מועיל לציין כי ניתוח גורמים משותפים * אינו * זהה לניתוח גורמים מאשרים (גם CFA) שהוא הליך שונה לחלוטין.
#3
+11
ttnphns
2016-01-29 09:14:38 UTC
view on stackexchange narkive permalink

תשובה זו היא להציג, בצורה של תרשים נתיב, דברים עליהם נימקה @amoeba בתשובתו העמוקה (אך מעט המסובכת) בשרשור זה (אני סוג של מסכים איתה ב- 95%) וכיצד הם נראים לי.

PCA בצורתו המינימלית הנכונה הוא הסיבוב האורתוגונאלי הספציפי של נתונים מתואמים לצורתו שאינה מתואמת, כאשר הרכיבים העיקריים גולשים ברצף פחות ופחות מהסך הִשׁתַנוּת. אם צמצום הממדים הוא כל מה שאנחנו רוצים בדרך כלל לא מחשבים עומסים וכל מה שהם גוררים אחריהם. אנו מרוצים מהרכיב העיקרי (הגולמי) של $ \ bf P $. [שים לב שהסימונים בתרשים אינם עוקבים במדויק אחרי @ amoeba, - אני עומד במה שאני מאמץ בכמה מהתשובות האחרות שלי.]

בתרשים אני לוקח דוגמה פשוטה לשני משתנים. p = 2 והשתמש בשני הרכיבים העיקריים שחולצו. אם כי בדרך כלל אנו שומרים רק כמה רכיבי m<p ראשונים, אולם לשאלה התיאורטית שאנו שוקלים ("האם PCA עם סיבוב הוא PCA או מה?") אין שום הבדל אם לשמור על m או את כל p ; לפחות בתשובה המסוימת שלי.

הטריק של עומסים הוא למשוך את הסולם (גודל, שונות, אינרציה $ \ bf L $) מהרכיבים (ציונים גולמיים) ולעלות המקדמים $ \ bf V $ (ווקטורים עצמיים) משאירים את הראשון להיות "מסגרת" חשוף $ \ bf P_z $ (ציוני רכיבים יחודיים סטנדרטיים) והאחרונים להיות בשרניים $ \ bf A $ (עומסים). אתה משחזר את הנתונים באותה מידה עם שניהם: $ \ bf X = PV '= P_zA' $. אך העומסים פותחים את הסיכויים: (ט) לפרש את הרכיבים; (ii) להיות מסובב; (iii) כדי לשחזר מתאמים / משתנים של המשתנים. כל זה נובע מכך שהשונות של הנתונים נכתבה בעומסים, כעומס שלהם.

והם יכולים להחזיר את העומס הזה לנקודות הנתונים בכל עת - עכשיו או אחרי סיבוב . אם אנו רואים סיבוב אורתוגונלי כגון varimax זה אומר שאנחנו רוצים שהרכיבים יישארו ללא קורלציה לאחר ביצוע הסיבוב. רק נתונים עם מטריצה ​​של משתנות כדורית, כאשר הם מסובבים אורתוגונלית, משמרים חוסר קורלציה. וואלה, ה רכיבים העיקריים הסטנדרטיים (אשר בלמידת מכונה מכונים לעתים קרובות "נתונים הלבנים PCA") $ \ bf P_z $ הם שנתוני קסם ($ \ bf P_z $ הם למעשה פרופורציונאליים לשמאל כלומר שורת וקטורים עצמיים של הנתונים). בזמן שאנחנו מחפשים את מטריצת הסיבוב של varimax $ \ bf Q $ כדי להקל על הפרשנות של העומסים, נקודות הנתונים מחכות באופן פסיבי בספירותיות החזה שלהן זהות & (או "לובן").

אחרי $ \ bf Q $ נמצא, סיבוב של $ \ bf P_z $ על ידי זה שווה לדרך הרגילה חישוב ציוני רכיבים עיקריים סטנדרטיים דרך ההפך הכללי של מטריצת הטעינה, - הפעם, של ה מסובב עומסים, $ \ bf A_r $ (ראה תרשים). המרכיבים העיקריים שנוצרו ב- varimax, $ \ bf C_z $, אינם מתואמים, כמו שרצינו, בנוסף הנתונים משוחזרים על ידם כמו לפני הסיבוב: $ \ bf X = P_zA '= C_zA_r' $. לאחר מכן אנו עשויים להחזיר להם את קנה המידה שלהם שהופקד (ובהתאם לסובב) ב- $ \ bf A_r $ - כדי לא לתקנן אותם: $ \ bf C $.

עלינו להיות מודעים לכך ש"רכיבים עיקריים המופעלים על ידי varimax. "אינם עוד רכיבים עיקריים: השתמשתי בסימון Cz, C במקום Pz, P, כדי להדגיש זאת. הם רק "רכיבים". מרכיבים עיקריים הם ייחודיים, אך רכיבים יכולים להיות רבים. סיבובים שאינם varimax יניבו משתנים חדשים אחרים הנקראים גם רכיבים וגם לא קשורים, מלבד אלה $ \ bf C $.

כמו גם לומר, רכיבים עיקריים המסתובבים ב- varimax (או מסתובבים בצורה אורתוגונלית אחרת) (כיום רק "רכיבים"), בעוד שהם נותרים ללא קורלציה, אורתוגונליים, אינם מרמזים על כך ש העומסים שלהם עדיין אורתוגונליים. עמודות של $ \ bf A $ הן אורתוגונליות הדדית (כמו גם הווקטורים העצמיים $ \ bf V $), אך לא עמודות של $ \ bf A_r $ (ראה גם הערת שוליים כאן).

ולבסוף - סיבוב גלם רכיבים עיקריים $ \ bf P $ עם $ \ bf Q $ שלנו אינו פעולה מועילה. נקבל כמה משתנים מתואמים $ \ bf "C" $ עם משמעות בעייתית. $ \ bf Q $ נראה כמטב (באופן ספציפי כלשהו) את התצורה של עומסים אשר ספגה את כל הסקאלה ל אותם. $ \ bf Q $ מעולם לא הוכשר לסובב נקודות נתונים עם כל הסקאלה שנותרה עליהם. $ \ Bf P $ המסתובב עם $ \ bf Q $ יהיה שווה ערך לסיבוב וקטורים עצמיים $ \ bf V $ עם $ \ bf Q $ (ל- $ \ bf V_r $) ואז לחישוב הגולמי רכיבי ציונים הם $ \ bf "C" = XV_r $. "נתיבים" אלה שצוינו על ידי @amoeba בפוסטסקריפטום שלהם.

פעולות אלה המתוארות לאחרונה (חסרות טעם לרוב) מזכירות לנו כי באופן כללי ניתן לסובב את ווקטורים עצמיים, ולא רק עומסים. לדוגמא, ניתן להחיל את הליך varimax עליהם כדי לפשט את המבנה שלהם. אך מכיוון שווקטורים עצמיים אינם מועילים בפירוש משמעותם של הרכיבים כמו העומסים, לעתים רחוקות נעשה סיבוב של ווקטורים עצמיים.

enter image description here

אז, PCA עם סיבוב varimax (או אחר) הבא הוא

  • עדיין PCA
  • שבדרך בדרך נטש רכיבים עיקריים לרכיבים בלבד
  • שהם באופן פוטנציאלי יותר (מאשר מחשבים אישיים) הניתנים לפרשנות כ"תכונות סמויות "
  • אך לא עוצבו בצורה סטטיסטית כאלו (PCA אינו ניתוח גורם הוגן)

לא התייחסתי לניתוח גורמים בתשובה זו. נראה לי שהשימוש של @ amoeba במילה "מרחב סמוי" מעט מסוכן בהקשר לשאלה שנשאלה. עם זאת, אני מסכים כי סיבוב אנליטי של PCA + עשוי להיקרא "תצוגה של FA- סגנון על PCA".

כיצד לחשב את הערכים העצמיים של הרכיבים המסתובבים?
רכיבי @Haga, מסובבים אינם עוד רכיבים _עקרוניים_ ולכן הם לא יכולים לקבל ערכים עצמיים.עם זאת, השונות שלהם שווה לסכומי העמודות בריבועים (עיין בתחתית התרשים שלי - חץ לציונים לא תקניים).
#4
+8
doctorate
2013-03-28 16:38:51 UTC
view on stackexchange narkive permalink

In psych::principal() you can do different types of rotations/transformations to your extracted Principal Component(s) or ''PCs'' using the rotate= argument, like:"none", "varimax" (Default), "quatimax", "promax", "oblimin", "simplimax", and "cluster". You have to empirically decide which one should make sense in your case, if needed, depending on your own appraisal and knowledge of the subject matter under investigation. A key question which might give you a hint: which one is more interpretable (again if needed)?

In the help you might find the following also helpful:

It is important to recognize that rotated principal components are not principal components (the axes associated with the eigen value decomposition) but are merely components. To point this out, unrotated principal components are labelled as PCi, while rotated PCs are now labeled as RCi (for rotated components) and obliquely transformed components as TCi (for transformed components). (Thanks to Ulrike Gromping for this suggestion.)

#5
+7
russellpierce
2010-07-27 08:54:36 UTC
view on stackexchange narkive permalink

ההבנה שלי היא שההבחנה בין ניתוח PCA לבין גורם גורם היא בעיקר האם יש מונח שגיאה. לפיכך PCA יכול, ויהווה, לייצג נאמנה את הנתונים ואילו ניתוח הגורמים נאמן פחות לנתונים שעליו הוא מאומן, אך מנסה לייצג מגמות בסיסיות או קהילות בנתונים. לפי גישה רגילה PCA אינו מסובב, אך ניתן לעשות זאת מתמטית, כך שאנשים עושים זאת מעת לעת. אני מסכים עם המגיבים בכך ש"משמעותם "של שיטות אלה נתפסת במידה מסוימת וכי כנראה שנבון להיות בטוח שהפונקציה בה אתה משתמש עושה את מה שאתה מתכוון - למשל, כפי שאתה מציין ל- R יש כמה פונקציות שמבצעות סוג אחר של PCA מאשר שמשתמשים ב- SPSS מכירים.

#6
+2
user88
2010-07-25 19:56:32 UTC
view on stackexchange narkive permalink

הודות לתוהו ובוהו בהגדרות של שניהם הם למעשה מילים נרדפות. אל תאמין למילים והסתכל עמוק ברציפים כדי למצוא את המשוואות.

אני עדיין מתקשה להבין משוואות (ביולוג אהוי) ולכן פניתי לקהילה כאן בתקווה שזה יעזור לי להסביר את ההבדל במונחי הדיוט.
אני חושב שהאידיאולוגיה היא שה- FA מניח כי התהליך מונע על ידי כמה "גורמים נסתרים", בעוד שהנתונים שבידינו מורכבים מכמה שילובים שלהם. מסיבה זו, הבעיה של FA היא לשחזר איכשהו את הגורמים הנסתרים. ויש גם PCA - שיטה שבונה באופן איטרטיבי משתנים חדשים (PC) על ידי ערבוב הישנים כאלה לחמדנים סופגים את השונות של הנתונים. אפשר לומר שהמחשבים האישיים שווים לגורמי ה- FA, וכאן לא ניתן יהיה להבחין ביניהם. אך ניתן גם לבצע שינויים מסוימים ב- PCA כדי להפוך אותו לבסיס מסוג 'FA אחר' אחר, וכך הבעיה מתחילה.
אז בעצם, עליכם לחשוב מה אתם רוצים לעשות (לא באיזה מילת מפתח שרוצים להשתמש). אני יודע שזה קשה, במיוחד כשיש ביולוגים בסביבה (בחלק מהשימוש ב- buzzword עובד טוב בביולוגיה, אז הם פשוט מניחים שזה משותף לדיסציפלינות אחרות); עדיין זו הדרך שבה צריך לעשות מדע. מאשר להשתמש בגוגל (או באתר זה) כדי להעריך את האלגוריתם הטוב עבורו. לבסוף, השתמש ברציפים כדי למצוא פונקציה / כפתור שעושה זאת והקלד / לחץ עליו.
#7
+1
Gottfried Helms
2015-07-01 20:03:42 UTC
view on stackexchange narkive permalink

למרות שלשאלה זו כבר יש תשובה מקובלת ברצוני להוסיף משהו לנקודת השאלה.

"PCA" - אם אני זוכר נכון - פירושו "ניתוח רכיבים עיקריים"; כך שכל עוד אתה מנתח את המרכיבים העיקריים, יתכן שזה יהיה ללא סיבוב או עם סיבוב, אנו עדיין נמצאים בניתוח של "המרכיבים העיקריים" (שנמצאו על ידי פירוק המטריצה ​​הראשוני המתאים).

הייתי מנסח שאחרי "varimax" - סיבוב על שני המרכיבים העיקריים הראשונים, שיש לנו את "פתרון varimax של שני המחשבים הראשונים" (או משהו אחר), אבל עדיין נמצאים מסגרת הניתוח של מרכיבים עיקריים, או קצרים יותר, הם במסגרת "pca".

כדי להבהיר את דעתי עוד יותר: אני לא מרגיש שהשאלה הפשוטה של ​​סיבוב מכניסה את בעיית ההבחנה בין EFA ו- CFA (האחרון שהוזכר / הציג את הבעיה למשל ב תשובת ברט)

מדוע פתאום הזכרת CFA במשפט האחרון?
@amoeba: הצביעו על המונח הזה על ידי התשובה שהעניקה 23 נקודות של _Brett והרגשתי שכדאי להעיר משהו על כך.אבל אולי עדיף היה לומר "FA" במקום.אני אחשוב על זה ... (כשחושב על זה אני זוכר במעורפל ש" CFA "נתפס כ"ניתוח גורמים מאששים" במקום "נפוץ ..." במחקרים קודמים שלי על שיטה זו, אולי בשנות ה 80או שנות ה -90)
רק ששלושת הפסקאות הראשונות של תשובתך עוסקות ב- PCA לעומת FA, ואז הפסקה האחרונה שנראית כאילו היא מסכמת את הקודמות, פתאום עוסקת ב- EFA לעומת CFA.
@amoeba: האם העריכה האחרונה שלי מבהירה את הכוונה / המשפט שלי?
#8
+1
Dylan_Larkin
2016-01-27 23:39:45 UTC
view on stackexchange narkive permalink

מצאתי שזה מועיל ביותר: עבדי & וויליאמס, 2010, ניתוח רכיבים עיקריים.

ROTATION

לאחר קביעת מספר הרכיבים, וכדי להקל על הפרשנות, הניתוח כולל לעיתים קרובות סיבוב של הרכיבים שנשמרו [ראה למשל, Ref 40 ו- 67, פרטים נוספים]. נעשה שימוש בשני סוגים עיקריים של סיבוב: אורתוגונליים כאשר הצירים החדשים גם הם אורתוגונליים זה לזה, ואלכסוניים כאשר הצירים החדשים אינם נדרשים אורתוגונליים. מכיוון שהסיבובים מתבצעים תמיד בתת-שטח, הצירים החדשים תמיד יסבירו פחות אינרציה מאשר הרכיבים המקוריים (המחושבים כך שהם אופטימליים). עם זאת, החלק של האינרציה המוסבר על ידי שטח המשנה הכולל לאחר הסיבוב זהה לזה שהיה לפני הסיבוב (רק מחיצת האינרציה השתנתה). כמו כן, חשוב לציין כיוון שהריוט מתרחש תמיד במרחב משנה (כלומר, המרחב של הרכיבים השמורים), הבחירה במרחב זה משפיעה מאוד על תוצאת הסיבוב. רכיבים שמורים כדי להעריך את החוסן של הפרשנות לסיבוב. בעת ביצוע סיבוב, העומס המונח כמעט תמיד מתייחס לאלמנטים של מטריצה ​​Q.

(ראה מאמר להגדרת Q).



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...