שְׁאֵלָה:
באילו תנאים צריך להשתמש בניתוח רב-שכבתי / היררכי?
Patrick
2010-08-22 05:22:34 UTC
view on stackexchange narkive permalink

באילו תנאים מישהו צריך לשקול שימוש בניתוח רב-שכבתי / היררכי בניגוד לניתוחים בסיסיים / מסורתיים יותר (למשל, ANOVA, רגרסיה של OLS וכו ')? האם ישנם מצבים בהם זה יכול להיחשב חובה? האם ישנם מצבים שבהם שימוש בניתוח רב-שכבתי / היררכי אינו הולם? לסיום, מהם כמה משאבים טובים למתחילים ללמוד ניתוח רב-שכבתי / היררכי?

ראה גם: http://stats.stackexchange.com/a/38430/5739
שמונה תשובות:
#1
+23
ars
2010-08-22 05:40:31 UTC
view on stackexchange narkive permalink

כאשר מבנה הנתונים שלך הוא באופן היררכי או מקונן באופן טבעי, דוגמנות מרובת רמות היא מועמדת טובה. באופן כללי יותר, זו שיטה אחת למודל אינטראקציות.

דוגמה טבעית היא כאשר הנתונים שלך הם ממבנה מאורגן כגון מדינה, מדינה, מחוזות, שם ברצונך לבחון השפעות ברמות אלה. דוגמא נוספת בה ניתן להתאים מבנה כזה היא ניתוח אורכי, בו יש לך מדידות חוזרות ונשנות של נבדקים רבים לאורך זמן (למשל תגובה ביולוגית כלשהי למינון תרופתי). רמה אחת של המודל שלך מניחה תגובה ממוצעת קבוצתית לכל הנבדקים לאורך זמן. רמה אחרת של המודל שלך מאפשרת הפרעות (תופעות אקראיות) מממוצע הקבוצה, כדי לדגמן הבדלים אישיים.

ספר פופולרי וטוב להתחלה הוא ניתוח הנתונים של גלמן באמצעות רגרסיה ומודלים מרובי רמות / היראכיות .

אני משנה תשובה זו ורק להוסיף עוד התייחסות נהדרת בנושא זה: הטקסט של Singer's Applied Longitudinal Data Text . למרות שהוא ספציפי לניתוח אורכי, הוא נותן סקירה יפה של MLM באופן כללי. מצאתי גם את ניתוח רב המישורי של Snidjers ו- Bosker טוב וקריא . ג'ון פוקס מספק גם מבוא נחמד למודלים אלה ב- R כאן .
תודה לכולכם על תשובותיכם :) כשאלת המשך, האם לא ניתן היה להבין את מרבית הנתונים כהיררכיים / מקוננים באופן טבעי? לדוגמא, במרבית המחקרים הפסיכולוגיים ישנם מספר משתנים תלויים (שאלונים, תגובות גירויים וכו ') המקוננים בקרב אנשים, אשר מקוננים עוד בתוך שתי קבוצות או יותר (באופן אקראי או לא אקראי). האם תסכים שזה מייצג מבנה נתונים היררכי ו / או מקוננות באופן טבעי?
אם מישהו מכם גורו רב-שכבתי / היררכי יכול היה להקדיש כמה דקות, הייתי מאוד אסיר תודה אם תוכלו לשקול את שאלות הניתוח שהוצגו בפוסט אחר (http://stats.stackexchange.com/questions/1799/recommendations-or -הנוהגים הטובים ביותר לניתוח-נתונים שאינם עצמאיים-ספציפיים). באופן ספציפי, האם אתה חושב שנתוני תפיסת הכאב המתוארים באותו פוסט ינותחו טוב יותר על ידי ניתוחים היררכיים מאשר ניתוחים שאינם היררכיים? או שזה לא היה משנה או אפילו לא הולם? תודה
#2
+18
Andy W
2010-08-22 07:48:21 UTC
view on stackexchange narkive permalink
ל

המרכז לדוגמנות מרובת רמות יש כמה מדריכים מקוונים טובים בחינם עבור דוגמנות מרובת רמות, ויש להם מדריכי תוכנה להתאמת דגמים הן בתוכנת MLwiN והן ב- STATA.

קח זאת כפירה, מכיוון שלא קראתי יותר מפרק בספר, אלא מודלים לינאריים היררכיים: יישומים ושיטות ניתוח נתונים מאת סטיבן וו. ראודנבוש, אנתוני ס 'בריק מומלץ מאוד. נשבעתי גם שיש ספר על דוגמנות מרובת רמות באמצעות תוכנת R ב- Springer Use R! סדרה, אבל נראה כי אני לא מצליח למצוא אותה כרגע (חשבתי שהיא נכתבה על ידי אותם אנשים שכתבו את הספר A A Guide of Guide to R).

עריכה: הספר על השימוש ב- R למודלים מרובי רמות הוא מודלים והרחבות של אפקטים מעורבים באקולוגיה עם R מאת Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, סמית ', GM

בהצלחה

#3
+9
Galit Shmueli
2010-12-13 11:08:36 UTC
view on stackexchange narkive permalink
להלן נקודת מבט נוספת על השימוש במודלים מרובי רמות לעומת רגרסיה: במאמר מעניין מאת אפשרטוס ודה ליאו, הם מראים שאם מטרת הדוגמנות היא ניבוי (כלומר לחזות תצפיות חדשות), הבחירה במודל היא שונה ממה שהמטרה היא הסקה (כאשר אתה מנסה להתאים את המודל למבנה הנתונים). המאמר אליו אני מתייחס הוא

Afshartous, D., de Leeuw, J. (2005). חיזוי במודלים מרובי רמות. ג 'חינוך. התנהג. סטטיסטיקה. 30 (2): 109–139.

בדיוק מצאתי כאן מאמר קשור נוסף של מחברים אלה: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf

#4
+6
Cyrus S
2010-12-14 01:08:54 UTC
view on stackexchange narkive permalink

הנה דוגמה שבה מודל רב-שכבתי עשוי להיות "חיוני". נניח שתרצה לדרג את "איכות" ההשכלה הניתנת על ידי קבוצת בתי ספר תוך שימוש בציוני המבחנים של התלמידים. אחת הדרכים להגדיר את איכות בית הספר היא מבחינת ביצועי המבחן הממוצעים לאחר התחשבות במאפייני התלמידים. אתה יכול לתאר זאת כ- $$ y_ {is} = \ alpha_s + X_ {is} '\ beta_s + \ epsilon_ {is}, $$ כאשר $ y_ {is} $ הוא ציון המבחן הרציף לתלמיד $ i $ ב בית הספר $ s $, $ X_ {is} $ הם מאפייני התלמידים שבמרכזם בית הספר, $ \ beta_s $ הוא מקדם ספציפי לבית הספר על מאפיינים אלה, $ \ alpha_s $ הוא "אפקט בית ספרי" המודד את איכות בית הספר ו- $ \ epsilon_ {is} $ הם ייחודיות ברמת התלמיד במבחני ביצוע. העניין כאן מתמקד באמידה של $ \ alpha_s $, המודדים את "הערך המוסף" שבית הספר מעניק לתלמידים לאחר שמחשבים את התכונות שלהם. אתה רוצה לקחת בחשבון תכונות של תלמידים, מכיוון שאתה לא רוצה להעניש בית ספר טוב שנאלץ להתמודד עם תלמידים עם חסרונות מסוימים, ולכן ציוני מבחנים ממוצעים מדכאים בזו ל"ערך המוסף "הגבוה שבית הספר מעניק לתלמידיו.

עם המודל ביד, הנושא הופך להיות הערכה. אם יש לך המון בתי ספר והרבה נתונים לכל בית ספר, המאפיינים הנחמדים של OLS (ראה אנגריסט ופישקה, מזיקים בעיקר ... , לבדיקה נוכחית) מציעים שתרצה להשתמש זאת, עם התאמות מתאימות לשגיאות סטנדרטיות לצורך התחשבות בתלות, ושימוש במשתני דמה ואינטראקציות כדי להשיג השפעות ברמת בית הספר ויירוט ספציפי לבית הספר. OLS אולי לא יעיל, אבל זה כל כך שקוף שאולי יהיה קל יותר לשכנע קהלים סקפטיים אם אתה משתמש בזה. אך אם הנתונים שלך דלים בדרכים מסוימות - במיוחד אם יש לך תצפיות מעטות על בתי ספר מסוימים - ייתכן שתרצה להטיל יותר "מבנה" על הבעיה. ייתכן שתרצה "לשאול כוח" מבתי הספר הגדולים יותר כדי לשפר את ההערכות הרועשות שתקבל בבתי הספר המדגמים הקטנים אם ההערכה נעשתה ללא מבנה. לאחר מכן, תוכל לפנות למודל אפקטים אקראי המוערך באמצעות FGLS, או אולי קירוב לסבירות ישירה בהינתן מודל פרמטרי מסוים, או אפילו בייס במודל פרמטרי.

בדוגמה זו, השימוש במערכת המודל הרב-מפלסי (עם זאת, אולם החלטנו להתאים אותו, בסופו של דבר) מונע על ידי האינטרס הישיר ביירוטים ברמת בית הספר. כמובן שבמצבים אחרים, פרמטרים אלה ברמת הקבוצה עשויים להיות לא יותר מטרד. בין אם אתה צריך להסתגל אליהם ובין אם כן (ולכן עדיין לעבוד עם סוג כלשהו של מודל רב-שכבתי) תלוי בשאלה אם הנחות אקסוגניזם מותנות מסוימות מתקיימות. על כך, אמליץ להתייעץ בספרות האקונומטרית על שיטות נתוני פאנל; רוב התובנות משם עוברות להקשרים נתונים כלליים מקובצים.

זהו פתיל ישן, אך למקרה שקראתם זאת: OLS עם משתני דמה ואינטראקציות אינו שואל כוח כמו הטכניקות האחרות שאתם מזכירים, נכון? יש לי כמה נתונים ששברתי את הניתוח שלי לשני חלקים והשתמשתי בשתי פקודות lm (מודל ליניארי R) כדי לדגמן את שני החלקים. הצגתי משתנה דמה כדי לציין את שני החלקים, ואז השתמשתי ב- lm שוב במודל "מאוחד" זה והתשובות קרובות, אך לא זהות. השאלה שלי תהיה: האם התשובה הזו "טובה יותר", או פשוט שונה בגלל האלגוריתם?
@Wayne: אם השתמשת בבובות ובמערכת האינטראקציות המלאה בשנייה, הערכות הנקודה צריכות להיות זהות. שגיאות סטנדרטיות עשויות להיות שונות מכיוון שהשיטה השנייה עשויה להניח דרגות חופש גבוהות יותר, אך תרצה לבדוק האם זו הנחת דוגמנות נכונה.
#5
+6
probabilityislogic
2011-05-22 09:40:26 UTC
view on stackexchange narkive permalink

דוגמנות מרובת רמות מתאימה, כפי שהשם מרמז, כאשר לנתונים שלך יש השפעות המתרחשות ברמות שונות (פרטני, לאורך זמן, על תחומים וכו '). דוגמנות ברמה אחת מניחה שהכל מתרחש ברמה הנמוכה ביותר. דבר נוסף שעושה מודל רב-מפלסי הוא להציג התאמות בין יחידות מקוננות. אז יחידות רמה 1 בתוך אותה יחידת רמה 2 יהיו מתואמות.

במובן מסוים אתה יכול לחשוב על דוגמנות רב-מפלסית כמציאת דרך הביניים בין "הכשל האינדיבידואליסטי" לבין "הכשל האקולוגי. ". כשל אינדיבידואליסטי הוא כאשר מתעלמים מ"אפקטים קהילתיים "כמו למשל התאמה של סגנון המורה לסגנון הלמידה של התלמיד, למשל (ההנחה היא שההשפעה מגיעה מהפרט בלבד, אז פשוט תעשה רגרסיה ברמה 1). ואילו "כשל אקולוגי" הוא ההפך, ויהיה כמו להניח שהמורה הטוב ביותר היה שהתלמידים היו בעלי הציונים הטובים ביותר (וכדי שלא יהיה צורך ברמה 1, פשוט עשו רגרסיה לחלוטין ברמה 2). ברוב ההגדרות, אף אחד מהם אינו מתאים (התלמיד-מורה הוא דוגמא "קלאסית").

שים לב שבדוגמה הבית ספרית היה נתונים על אשכולות או מבנה "טבעי". אך זו אינה תכונה מהותית של דוגמנות רב-מפלגתית / היררכית. עם זאת, האשכול הטבעי מקל על המתמטיקה והחישובים. המרכיב העיקרי הוא המידע הקודם האומר כי ישנם תהליכים המתרחשים ברמות שונות. למעשה אתה יכול להמציא אלגוריתמי אשכולות על ידי הטלת מבנה רב-מפלסי על הנתונים שלך עם חוסר וודאות לגבי איזו יחידה היא באיזו רמה גבוהה יותר. אז יש לך $ y_ {ij} $ כשהמנוי $ j $ אינו ידוע.

#6
+4
user28
2010-08-22 06:04:55 UTC
view on stackexchange narkive permalink

באופן כללי, דיבור של ניתוח Bayesian (HB) היררכי יוביל להערכות יעילות ויציבות של רמות אישיות, אלא אם כן הנתונים שלך הם כאלה שהשפעות ברמה האישית יהיו הומוגניות לחלוטין (תרחיש לא מציאותי). אומדני היעילות והפרמטר היציבים של דגמי HB הופכים לחשובים מאוד כשיש לך נתונים דלילים (למשל, פחות או יותר אובססיביות ממספר הפרמטרים ברמה האישית) וכאשר אתה רוצה לאמוד הערכות ברמה בודדת. > עם זאת, לא תמיד קל להעריך את דגמי HB. לכן, בעוד שניתוח HB בדרך כלל מנצח ניתוח שאינו HB, עליך לשקול את העלויות היחסיות לעומת התועלת על סמך ניסיון העבר שלך וסדרי העדיפויות הנוכחיים שלך מבחינת זמן ועלות.

עם זאת, אם אינך נמצא אם אתה מעוניין בהערכות ברמה בודדת, תוכל פשוט לאמוד מודל רמה מצטבר, אך גם בהקשרים אלה אומדן מודלים צבירים באמצעות HB באמצעות הערכות ברמה בודדת עשוי להיות הגיוני מאוד. לסיכום, התאמת דגמי HB היא הגישה המומלצת כל עוד יש לך זמן וסבלנות להתאים אותם. לאחר מכן תוכל להשתמש במודלים מצטברים כמדד להערכת הביצועים של מודל ה- HB שלך.

תודה על תשובתך המפורטת Srikant :) כרגע אני לא מכיר את הניתוחים של Bayesian, אבל אני אחד הנושאים שהתכוונתי לחקור. האם ניתוח בייארסי היררכי שונה משאר הניתוחים הרב-מישוריים / היררכיים הנדונים בעמוד זה? אם כן האם יש לך משאב מומלץ למתעניינים ללמוד יותר?
מנקודת מבט אנליטית ניתוח HB = מודלים מרובי רמות. עם זאת, המונח מודלים מרובי רמות משמש כאשר יש לך רמות שונות המתרחשות באופן טבעי (ראה את הדוגמה של @ars). משתמשים במונח מודלים HB כאשר אין בהכרח רמות שונות במצב. לדוגמה, אם אתה מדגמן את התגובה של הצרכן למשתנים שיווקיים שונים (למשל, מחיר, הוצאות אדפה וכו ') יתכן שיהיה לך את המבנה הבא ברמת הצרכן: $ β_i \ sim N (\ bar {\ beta}, \ Sigma ) $ ו- $ \ bar {\ beta} \ sim N (.,.) $ ברמת האוכלוסייה. להפניות: עיין בתשובות האחרות.
#7
+4
Chris Beeley
2010-12-13 13:47:49 UTC
view on stackexchange narkive permalink

למדתי מ- Snijders ו- Bosker, ניתוח רב-שכבתי: מבוא לדוגמנות רב-שכבתית בסיסית ומתקדמת. אני חושב שזה טוב מאוד למתחילים, זה חייב להיות בגלל שאני עבה בכל מה שקשור לדברים האלה וזה היה הגיוני בעיני.

אני משני גם את גלמן והיל, ממש מבריק ספר.

#8
+1
StatisticsDoc Consulting
2012-11-20 11:01:29 UTC
view on stackexchange narkive permalink

יש להשתמש במודלים מרובי רמות כאשר הנתונים מקוננים במבנה היררכי, במיוחד כאשר ישנם הבדלים משמעותיים בין יחידות ברמה גבוהה יותר במשתנה התלוי (למשל, כיוון הישגי התלמידים משתנה בין התלמידים, וגם בין הכיתות עם אשר התלמידים מקוננים). בנסיבות אלה, תצפיות מקובצות במקום עצמאיות. אי התחשבות באשכולות מובילה לזלזל בשגיאות הערכות הפרמטרים, בדיקת משמעות מוטה ונטייה לדחות את האפס כאשר יש לשמור עליו. הרציונל לשימוש במודלים מרובי רמות, כמו גם הסברים מעמיקים כיצד לבצע את הניתוחים, ניתנים על ידי

Raudenbush, S. W. Bryk, A. S. (2002). מודלים ליניאריים היררכיים: יישומים ושיטות ניתוח נתונים. מהדורה שנייה. ניוברי פארק, קליפורניה: סייג.

ספר R & B משולב היטב גם בחבילת התוכנה HLM של המחברים, המסייעת רבות בלימוד החבילה. הסבר מדוע מודלים רב-מפלסיים נחוצים ועדיפים על פני חלופות מסוימות (כמו קידוד דמה של היחידות ברמה הגבוהה יותר) ניתן במאמר קלאסי

הופמן, ד 'א. (1997). סקירה כללית על ההיגיון והרציונל של מודלים לינאריים היארכיים. Journal of Management, 23, 723-744.

ניתן להוריד את עיתון הופמן בחינם אם אתה מחפש בגוגל "הופמן 1997 HLM" וניגש למסמך PDF באופן מקוון.



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...