שְׁאֵלָה:
כיצד להשתמש במתאם פירסון נכון עם סדרות זמן
user1551817
2015-01-13 02:59:15 UTC
view on stackexchange narkive permalink

יש לי שתי סדרות זמן (שתיהן חלקות) שברצוני לקשר בין מתאם כדי לראות עד כמה הן מתואמות.

אני מתכוון להשתמש במקדם המתאם של פירסון. האם זה מתאים?

השאלה השנייה שלי היא שאוכל לבחור לדגום את שתי סדרות הזמן כמו שאני אוהבת. כלומר אני יכול לבחור כמה נקודות נתונים ארצה לנו. האם זה ישפיע על מקדם המתאם המופק? האם עלי להסביר זאת?

לצורך המחשה

  אפשרות (i) [1, 4, 7, 10] & [6, 9, 6, 9 , 6] אפשרות (ii) [1,2,3,4,5,6,7,8,9,10] & [6,7,8,9,8,7,6,7,8,9, 8,7,6]  
מה טיבן של סדרות הזמן?האם הם הולכים באקראי?יַצִיב?סדרות כלכליות?
שְׁלוֹשָׁה תשובות:
Glen_b
2015-01-13 04:51:16 UTC
view on stackexchange narkive permalink

מתאם פירסון משמש משמש לבדיקת מתאם בין סדרות ... אך בהיותם סדרות זמן, מתבונן במתאם על פני פיגורים שונים - פונקציית מתאם צולב.

המתאם המוצלב מושפע מתלות בתוך סדרה, ולכן במקרים רבים יש להסיר את התלות בתוך הסדרה תחילה. אז כדי להשתמש במתאם הזה, במקום ל החלקה הסדרה, זה בעצם נפוץ יותר (כי זה משמעותי) לבחון את התלות בין שאריות - החלק הגס שנשאר אחרי שנמצא מודל מתאים למשתנים .

אתה בטח רוצה להתחיל בכמה משאבים בסיסיים במודלים של סדרות זמן לפני שתעמיק בניסיון להבין אם מתאם פירסון בין סדרות (ככל הנראה) מוחלקות ומוחלקות ניתן לפרשנות.

בפרט, קרוב לוודאי שתרצה לבדוק את התופעה כאן. [בסדרות זמן זה נקרא לפעמים מתאם מזויף , אם כי המאמר בוויקיפדיה על מתאם מזויף תופס השקפה צרה על השימוש במונח באופן שנראה כאילו אינו כולל שימוש זה במונח. סביר להניח שתמצא עוד על הנושאים הנדונים כאן על ידי חיפוש ב רגרסיה מזויפת במקום.]

[עריכה - הנוף בוויקיפדיה ממשיך להשתנות; הפסקה הנ"ל. כנראה שיש לתקן כדי לשקף את מה שיש שם עכשיו.]

למשל ראה כמה דיונים

  1. http://www.math.ku.dk/~sjo/papers/LisbonPaper.pdf (הצעת המחיר הפותחת של יול, במאמר שהוצג בשנת 1925 אך פורסם בשנה שלאחר מכן, מסכם את הבעיה די טוב)

  2. כריסטוס אגיאקלוגלו ואפוסטולוס צימפנוס, מתאם מזעזע לתהליכי AR נייחים (1) http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.611.5055&rep=rep1&type=pdf (זה מראה שאתה יכול אפילו לקבל את הבעיה בין נייח סדרה; ומכאן הנטייה להקדים מחדש)

  3. ההתייחסות הקלאסית של Yule, (1926) [1] שהוזכרה לעיל.

ייתכן שתמצא את הדיון כאן שימושי, כמו גם הדיון כאן

--

שימוש במתאם פירסון בצורה משמעותית בין סדרות הזמן הוא קשה ולעיתים מפתיע להפליא.


חיפשתי מתאם מזויף, אבל לא אכפת לי אם סדרת A שלי היא הגורם לסדרת B שלי או להיפך. אני רק רוצה לדעת אם אתה יכול ללמוד משהו על סדרה A על ידי בחינה מה עושה סדרה B (או להיפך). במילים אחרות - האם יש להם מתאם.

שימו לב להערתי הקודמת על השימוש הצר במונח קורלציה מזויפת במאמר בויקיפדיה.

הנקודה לגבי מתאם מזויף הוא שסדרות יכולות להופיע בקורלציה, אך המתאם עצמו אינו משמעותי. שקול שני אנשים שזורקים שני מטבעות נפרדים המספרים את מספר הראשים עד כה פחות מספר הזנבות עד לערך הסדרה שלהם.

(אז אם אדם 1 זורק $ \ text {HTHH ...} $ יש להם 3-1 = 2 לערך ברביעי שלב הזמן, והסדרה שלהם עוברת $ 1, 0, 1, 2, ... $ .)

ברור שאין קשר בין השניים סִדרָה. ברור ש אף אחד לא יכול לספר לך את הדבר הראשון על האחר!

אבל תראה את סוג הקורלציות שאתה מקבל בין זוגות מטבעות:

enter image description here

אם לא הייתי אומר לך מה היו אלה, והיית לוקח כל זוג מהסדרות האלה לבד, אלה היו מתאמים מרשימים, לא כן?

אבל כולם חסרי משמעות . מזויף לחלוטין. אף אחד משלושת הזוגות אינו קשור זה לזה בצורה חיובית או שלילית יותר מכל האחרים - רק ה רעש המצטבר שלו . ה כזב אינו קשור רק לחיזוי, כל ה רעיון של לשקול קשר בין סדרות מבלי לקחת בחשבון את התלות בתוך הסדרה אינו ממוקם במקום.

כל ה שיש לך כאן הוא בתוך סדרה תלות. אין קשר אמיתי בין סדרות מה שיהיה.

ברגע שאתה מתמודד כראוי עם הנושא שהופך את הסדרות האלו לתלויי אוטומטיות - כולן משולבות ( ברנולי הולך אקראי), אז עליכם להבדיל ביניהם - הקשר "לכאורה" נעלם (המתאם המוחלט הגדול בין הסדרות בין השלושה הוא 0.048).

מה שאומר לך זו האמת - הקשר לכאורה הוא אשליה גרידא הנגרמת מהתלות בתוך הסדרה.

שאלתך שאלה "כיצד להשתמש במתאם פירסון נכון עם הזמן סדרה "- אז אנא הבינו: אם יש תלות בתוך הסדרה ואתם לא מתמודדים עם זה קודם, לא תשתמשו בו נכון.

בהמשך, החלקה לא תפחית את בעיית התלות הסדרתית; להפך - זה מחמיר את זה עוד יותר! להלן המתאמים לאחר החלקה (ברירת מחדל של לוס חלקה - של סדרה לעומת אינדקס - מבוצעת ב- R):

  coin1 coin2 coin2 0.9696378 coin3 -0.8829326 -0.7733559  

כולם הגיעו רחוק מ 0. הם כולם עדיין אינם אלא רעש חסר משמעות , אם כי עכשיו זה רעש מוחלק ומצטבר. (על ידי החלקה, אנו מקטינים את השונות בסדרה שאנו מכניסים לחישוב המתאם, כך שייתכן זו הסיבה שהמתאם עולה.)

[1]: Yule, G.U. (1926) "מדוע אנו מקבלים לפעמים קשקושים בין שטויות בין סדרות הזמן?" J.Roy.Stat.Soc. , 89 , 1 , עמ '1-63

תודה על התשובה הנהדרת.בדקתי מתאם מזויף, אבל לא אכפת לי אם סדרת A שלי היא הסיבה לסדרת B שלי או להיפך.אני רוצה לדעת רק אם אתה יכול ללמוד משהו על סדרה A על ידי בחינה מה עושה סדרה B (או להיפך).במילים אחרות - האם יש להם מתאם.
אנא ראה את תשובתי המעודכנת.
רק הוסף כי ניתן ללמוד קשרים בין סדרות זמן רב-משתנות באמצעות [מטבע-שילוב] (https://en.wikipedia.org/wiki/Cointegration).במסגרת זו ההליכות האקראיות לעיל הן רעש משולב (או מצטבר) עצמאי *, אך המסגרת מאפשרת שילוב תלוי, או שילוב מטבע, גם כן.שילוב מטבעות מתאים יותר ממתאם ללימוד תלות בין סדרות זמן לא נייחות, למשל.סדרות זמן המכילות רכיבי הליכה אקראיים.
@NRH תודה;חשוב להזכיר את שילוב המטבעות;עלי לכלול קטע על כך, מכיוון שעם סדרות משולבות הדברים מתנהלים אחרת ממה שהצהרתי לעיל.עם זאת, ישנן צורות רבות יותר של אי-סטנדרטיות מאשר סדרות משולבות ומטבעות;אלה בהחלט שימושיים, במיוחד בהקשרים מסוימים, אך הם אינם מכסים הכל.(טיולי אקראי של ברנולי) נבחרו מכיוון שהם פשוטים להפקה, ולא בגלל שהם נועדו להיות מייצגים במיוחד.)
".. אז אתה צריך להבדיל ביניהם .." מה זה אומר בדיוק?אולי מבדיל אותם? ..
בנוסף, החלק הזה ".. יותר נפוץ (כי זה משמעותי) להסתכל על תלות בין שאריות .." פירושו שאנחנו לוקחים את השאריות (פלט של המודל - ערכים אמיתיים) ואז שתי סדרות הזמן האלה של שאריות לוקחות את המתאם.שלהם ?..
הבדל - ראה ויקיפדיה [כאן] (https://en.wikipedia.org/wiki/Autoregressive_integrated_moving_average#Differencing) או [חלק זה] (https://www.otexts.org/fpp/8/1) של הספר *חיזוי, עקרונות ותרגול *.בשאלתך הבאה, שארית הפסקה שאתה מצטט אומרת זאת במפורש.(זאת לא האפשרות היחידה, רק לתאר דבר אחד נפוץ למדי שנעשה)
@Glen_b תודה על תשובתך.שאר הפסקה היא "החלק הגס שנשאר לאחר שנמצא מודל מתאים למשתנים" אך האם אין מודלים שיכולים להתאים באופן מושלם למערך האימונים ובכך להפוך את השאריות לאפסית או כמעט לאפסית?פירוט כלשהו בתשובה יהיה מועיל
זה מקיף את המילה * מתאים *.
@Glen_b האם אתה יכול בבקשה לספק את שם העיתון בהפניה השנייה?אני לא מוצא את זה יותר, הקישור מת, ואני לא יודע לאילו מאמרים של המחבר זה מתייחס.
איתרתי את מה שנראה כגרסה אחרת של העיתון, והוספתי כותרת ומחברים
@Glen_b: קודם כל, תודה על תשובה נהדרת.שנית, אני מאמין שאתה ממליץ להבדיל את הסדרה לא רק פעם אחת אלא כמה פעמים עד שנשיג סדרה נייחת.האמנם?אם סדרה A היא I (1) וסדרה B היא I (2), האם המתאם בין סדרה A שהבדלה פעם אחת לבין סדרה B הייתה שונה?הגישה האחרת לקביעת קורלציה בין סדרות זמן - שילוב מטבע, אינה משמעותית בין סדרות בעלות סדרי שילוב שונים.
mic
2015-06-10 21:02:14 UTC
view on stackexchange narkive permalink

כדי להשלים את התשובה של Glen_b והדוגמה שלו בטיולים אקראיים, אם אתה באמת רוצה להשתמש במתאם פירסון בסדרות זמן מסוג זה $ (S_t) _ {1 \ leq t \ leq T} $, עליך ראשית הבדל אותם, ואז חישב את מקדם המתאם במרווחים ($ X_t = S_t - S_ {t-1} $) שהם (במקרה של הליכות אקראיות) עצמאיים ומופצים זהה. אני מציע לך להשתמש במתאם של ספירמן או בקנדל, מכיוון שהם חזקים יותר ממקדם פירסון. פירסון מודד תלות ליניארית ואילו מדד ספירמן וקנדל אינם משתנים על ידי טרנספורמציות מונוטוניות של המשתנים שלך. וריאציות והשנייה יש תמיד שינויים קלים, המתאם שלך בין פירסון יהיה נמוך למדי לעומת ספירמן וקנדל (שהם הערכות טובות יותר לתלות בין סדרות הזמן שלך).

לקבלת טיפול יסודי בנושא זה ולהבנת טוב יותר של תלות, אתה יכול להסתכל ב תיאוריית הקופולה, וב- יישום לסדרות זמנים.

random_guy
2015-01-13 04:41:54 UTC
view on stackexchange narkive permalink

נתוני סדרות הזמן תלויים בדרך כלל בזמן. אולם מתאם פירסון מתאים לנתונים עצמאיים. בעיה זו דומה למה שמכונה רגרסיה מזויפת. המקדם עשוי להיות משמעותי ביותר אך זה נובע רק ממגמת הזמן של הנתונים המשפיעים על שתי הסדרות. אני ממליץ לדגמן את הנתונים ואז לנסות לראות האם הדוגמנות מניבה תוצאות דומות לשתי הסדרות. לעומת זאת, שימוש במקדם המתאם של פירסון יתן תוצאות מטעות לפרשנות מבנה התלות.

האם תוכל לפרט על "מתאם פירסון מתאים לנתונים עצמאיים"?ככל הידוע לי, עבור משתנים בלתי תלויים מתאם פירסון יהיה פשוט אפס (במובן זה שאינך צריך לבצע מתאם פירסון).


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.
Loading...