שְׁאֵלָה:
מדוע ה- ρ של פירסון הוא רק מדד ממצה אסוציאטיבי אם ההתפלגות המשותפת היא נורמלית
user1205901 - Reinstate Monica
2015-07-22 02:00:37 UTC
view on stackexchange narkive permalink

טענה זו הועלתה בתגובה העליונה ל שאלה זו. אני חושב ששאלת 'מדוע' שונה דיה כדי שהיא מצדיקה חוט חדש. חיפוש Google "מידה ממצה של אסוציאציה" לא הניב שום להיטים, ואני לא בטוח מה פירוש הביטוי הזה.

שתיים תשובות:
Glen_b
2015-07-22 07:22:10 UTC
view on stackexchange narkive permalink

ניתן לשייך וריאציות בדרכים שמתאם פירסון הוא עיוור לחלוטין.

בתקינה הרב-משתנית, מתאם פירסון הוא "ממצה" במובן זה ש רק הקשר אפשרי באינדקס של $ \ rho $. אך עבור התפלגויות אחרות (אפילו אלה עם שוליים נורמליים), יכול להיות שיוך ללא מתאם. הנה כמה עלילות של 3 משתנים אקראיים נורמליים (x, y ו- x, z); הם קשורים מאוד (אם תגיד לי את הערך של $ x $ -שונה, אני אגיד לך את השניים האחרים, ואם אתה אומר לי את $ y $ אני יכול להגיד לך את $ z $), אבל הם כל אלה אינם מתואמים.

enter image description here

הנה דוגמה נוספת למשתנים קשורים אך לא קשורים:

enter image description here

(הבסיס נקודה לגבי הפצות, למרות שאני ממחיש זאת עם נתונים כאן.)

גם כאשר המשתנים מתואמים, מתאם פירסון באופן כללי לא אומר לך איך - אתה יכול לקבל צורות שונות מאוד של אסוציאציה שיש להן אותו מתאם פירסון, (אך כאשר המשתנים נורמליים רב-משתניים, ברגע שאגיד לך את המתאם אתה יכול להגיד בדיוק עד כמה משתנים סטנדרטיים קשורים).

כך שמתאם פירסון אינו "ממצה" את הדרכים בהן משויכים משתנים - הם יכולים להיות קשורים אך ללא קורלציה, או שהם יכולים להיות מתואמים אך קשורים בדרכים די מובחנות. [מגוון הדרכים בהן יכולות להתרחש קשר לא מוחלט לחלוטין על ידי מתאם הוא גדול למדי - אך אם אחת מהן מתרחשת, אינך יכול להיות נורמלי רב משתני. שים לב, עם זאת, ששום דבר בדיוני לא מרמז כי זה (שהידיעה $ \ rho $ מגדירה את האסוציאציה האפשרית) מאפיינת את הנורמה הרב-משתנית, למרות שנראה כי ציטוט הכותרת מרמז על כך.]

(מקובל הדרך לטפל בשיוך רב-משתני היא באמצעות קופולות. ישנן שאלות רבות באתר הנוגעות לקופולות; ייתכן שתמצא חלק מהן מועילות)

האם יש נתונים עולמיים אמיתיים עם התפלגויות כאלה?
@what האם ישנם נתונים בעולם האמיתי שאף נלקחים מהתפלגויות רגילות?אני בספק, ולכן (מכיוון שהשוליים שלי היו נורמליים בתרשימים) שהפכו את התשובה ל"לא "באופן מיידי.העניין של הדוגמאות היה להראות בבירור מדוע הקשר בין משתנים אקראיים אינו פשוט כמו שלעתים מניחים (באיזו תדירות אנשים מחשבים מתאם פירסון כדי למדוד קשר? לעיתים קרובות), וגם לציין שיש שוליים נורמליים והיותם רב משתנים.נורמלי הם שונים.דוגמאות אמיתיות מאוד שבהן מתאם פירסון אינו תופס את המתרחש בהחלט קורה.
בואו לא נדבר על הפצות לרגע.כאשר אנו מחשבים קורלציות מענן נקודתי, אנו מניחים מתאם אידיאלי "בעל צורה גיאומטרית" (ליניארית, היפרבולית, לוגריתמית, סינוס וכו ') שממנו חורגות הנקודות בענן עקב "שגיאה" כלשהי.כעת כל הצורות האידיאליות שראיתי מופשטות מנתונים אמיתיים בהן רציפות (ללא הפסקות) ועולות תמיד לאורך ציר אחד לפחות (כלומר, לא למשל מעגלי).הידע שלי בנתונים מוגבל, אז תהיתי אם אכן יש נתונים של עולם אמיתי שהמתאם שלהם אינו רציף או מעגלי.
לדוגמא, יתכנו נתונים שאם אני מתווה זה ייראה כמו שני ענני נקודה.אם אני מחשב באופן עיוור קורלציות על נתונים אלה, אני עלול למצוא אחד, בעוד (או לפחות כך נאמר לי) העלילה מעידה בבירור על כך שחסר לי איזה משתנה מבלבל לא ידוע, שאם הייתי מתחשב בזה, יפתור את הקשר הכוזב שלינתונים.אם הפרופסור שלי היה מסתכל על הדוגמאות שלך בצורת "x" או "y", הוא היה אומר לי שיש לי שתי קבוצות משנה שונות של נתונים מעורבבות.
whuber
2015-07-22 02:31:29 UTC
view on stackexchange narkive permalink

אולי עדיף להבין את "מידת השיוך" בהתפלגות רב-משתנית כך שהיא מורכבת מ כל מאפיינים שנשארים זהים כאשר הערכים מועברים מחדש באופן שרירותי וממוקמים מחדש. פעולה זו יכולה לשנות את האמצעים והשונות לערכים המותרים תיאורטית (השונות חייבת להיות חיובית; אמצעים יכולים להיות כל דבר).

מקדמי המתאם ("$ \ rho $ של פירסון") ואז לחלוטין לקבוע התפלגות נורמלית רב משתנית. אחת הדרכים לראות זאת היא להסתכל על כל הגדרה נוסחתית, כגון נוסחאות לפונקציית הצפיפות או לפונקציה האופיינית. הם כרוכים ב רק אמצעים, השונות וההתמרות - אך ניתן להסיק את ההשתנות והמתאמים זה מזה כאשר אתה מכיר את השונות.

המשפחה הנורמלית הרב-משתנית אינה המשפחה היחידה. של הפצות שנהנות מנכס זה. לדוגמא, לכל חלוקת t רב-משתנית (בדרגות חופש העולות על $ 2 $) יש מטריצת מתאם מוגדרת היטב והיא נקבעת לחלוטין גם על ידי שני הרגעים הראשונים שלה.

האם אני צודק שלפי ההגדרה שאתה מיישם כאן, משתנות לא תהיה מדד לשיוך?מכיוון שהוא נוטה להתרחב ככל שהסטיות מתרחבות.
זה נכון.למרות שבינוניות קשורה כמובן למדד של אסוציאציה, היא אינה עצמה משום שהיא מושפעת גם מגורמים אחרים.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.
Loading...