כיצד להפוך את ה- PCA ולבנות מחדש משתנים מקוריים ממספר מרכיבים עיקריים?

amoeba

2016-08-10 04:52:47 UTC

view on stackexchange narkive permalink

ניתוח רכיבים עיקריים (PCA) יכול לשמש להפחתת מימדיות. לאחר ביצוע הפחתת מימדיות כזו, כיצד ניתן לשחזר בערך את המשתנים / מאפיינים המקוריים ממספר קטן של רכיבים עיקריים?

לחלופין, כיצד ניתן להסיר או להשליך כמה מרכיבים עיקריים מהנתונים?

במילים אחרות, כיצד להפוך את ה- PCA?

בהתחשב בכך ש- PCA קשור קשר רב לפירוק ערך יחיד (SVD), ניתן לשאול את אותה השאלה באופן הבא: כיצד להפוך SVD ?

אני מפרסם את שרשור השאלות והתשובות הזה, כי נמאס לי לראות עשרות שאלות ששואלות את הדבר הזה ולא מצליחים לסגור אותן ככפולות מכיוון שאין לנו חוט קנוני בנושא זה.ישנם כמה שרשורים דומים עם תשובות הגונות, אך נראה שלכולם יש מגבלות רציניות, כמו למשלמתמקד אך ורק ב- R.

אני מעריך את המאמץ - אני חושב שיש צורך קשה לאסוף מידע על PCA, מה הוא עושה, מה הוא לא עושה, לכדי אחד או כמה שרשורים איכותיים.אני שמח שלקחת על עצמך לעשות את זה!

אני לא משוכנע שהתשובה הקנונית הזו "ניקוי" משרתת את מטרתה.מה שיש לנו כאן הוא שאלה ותשובה מעולה * גנרית *, אך לכל אחת מהשאלות היו כמה דקויות לגבי PCA בפועל שאבדו כאן.בעיקרון לקחת את כל השאלות, ביצעת עליהן PCA וזרקת את הרכיבים העיקריים הנמוכים יותר, שם לפעמים מוסתר פרט עשיר וחשוב.יתר על כן, חזרת לספר הלימוד סימון אלגברה לינארית שזה בדיוק מה שהופך את ה- PCA לאטום עבור אנשים רבים, במקום להשתמש בלשון פרנקה של סטטיסטיקאים מזדמנים, שהוא R.

@Thomas תודה.אני חושב שיש לנו אי הסכמה, שמחים לדון בזה [בצ'אט] (http://chat.stackexchange.com/rooms/18/ten-fold) או ב- Meta.בקצרה רבה: (1) אולי עדיף לענות על כל שאלה בנפרד, אך המציאות הקשה היא שזה לא קורה.שאלות רבות פשוט נותרות ללא מענה, כפי שהיה כנראה לשלך.(2) הקהילה כאן מעדיפה מאוד תשובות כלליות שימושיות עבור אנשים רבים;אתה יכול לבדוק איזה סוג של תשובות מצטיינים ביותר.(3) מסכים לגבי מתמטיקה, אבל בגלל זה נתתי כאן קוד R!(4) לא מסכים לגבי לשון פרנקה;באופן אישי, אני לא מכיר את ר.

@amoeba אני חושש שאינני יודע למצוא צ'ט אמר כי מעולם לא השתתפתי בדיוני מטא לפני כן.

@ThomasBrowne ובכן, אתה פשוט לוחץ על הקישור שנתתי למעלה: http://chat.stackexchange.com/rooms/18/ten-fold - וזה לוקח אותך לשוחח.עד עכשיו השיחה על התגובה שלך הלכה ומאחור, אז הנה קישור להיסטוריית הצ'אט הרלוונטית: http://chat.stackexchange.com/transcript/message/31659626#31659626

load fisheririsX = measure; mu = mean (X); [ ווקטורים עצמיים, ציונים] = pca (X); nComp = 2; Xhat = ציונים (:, 1: nComp) * וקטורים עצמיים (:, 1: nComp) '; Xhat = bsxfun (@plus, Xhat, mu); Xhat (1 , :)

ייבא מטומטם כ npimport sklearn.datasets, sklearn. decompositionX = sklearn.datasets.load_iris (). datamu = np.mean (X, axis = 0) pca = sklearn.decomposition.PCA () pca.fit (X) nComp = 2Xhat = np.dot (pca.transform (X ) [:,: nComp], pca.components _ [: nComp,:]) Xhat + = muprint (Xhat [0,])

קשתית האינטרנט, clearpca sep * pet *, רכיבים (2) covariancepredict _seplen _sepwid _petlen _petwid, fitlist in 1 iris seplen sepwid petlen petwid _seplen _sepwid _petlen _petwid setosa 5.1 3.5 1.4 0.2 5.08303 3.5214. / code>

דוגמה לעיבוד תמונה

החזרת SVD

דוגמאות ב- R, Matlab, Python ו- Stata