שְׁאֵלָה:
הסבירו את ההבדל בין רגרסיה מרובה לרגרסיה רב-משתנית, תוך שימוש מינימלי בסמלים / מתמטיקה
Neil McGuigan
2010-09-03 23:54:17 UTC
view on stackexchange narkive permalink

האם רגרסיה מרובה ורב משתנים באמת שונה? מה הוא בכל מקרה משתנה?

חָמֵשׁ תשובות:
#1
+57
chl
2010-09-04 00:03:08 UTC
view on stackexchange narkive permalink

מהר מאוד הייתי אומר: 'מרובה' חל על מספר המנבאים שנכנסים למודל (או שווה ערך למטריצת העיצוב) עם תוצאה אחת (תגובת Y), בעוד ש'רב משתנים 'מתייחס למטריצה ​​של וקטורי תגובה . לא זוכר את המחבר שמתחיל את קטע ההיכרות שלו עם דוגמנות רב-משתנית עם שיקול זה, אבל אני חושב שזה בריאן אוורט בספר הלימוד שלו An R ו- S-Plus Companion to Multivariate Analysis. לדיון מעמיק בנושא, הייתי מציע להסתכל בספרו האחרון, מודלים רב משתנים וניתוח רב משתני למדעי ההתנהגות.

ל'משתנה ', הייתי אומר זאת היא דרך נפוצה להתייחס לכל משתנה אקראי העוקב אחר התפלגות ידועה או משוערת, למשל אנו מדברים על משתנים גאוסיים $ X_i $ כסדרה של תצפיות השואבות מהתפלגות נורמלית (עם פרמטרים $ \ mu $ ו- $ \ sigma ^ 2 $). במונחים הסתברותיים, אמרנו שמדובר ב מימושים אקראיים של X, עם ציפייה מתמטית $ \ mu $, וכ- 95% מהם צפויים לנוח בטווח $ [\ mu-2 \ סיגמא; \ mu + 2 \ sigma] $.

אפילו https://www.coursera.org/learn/machine-learning/home/week/2 משתמש במונח רגרסיה רב משתנית במקום רגרסיה מרובה ...
אני חושב שאותו בלבול נוצר עם אנשים המשתמשים במונח GLM למודל לינארי כללי (למשל, במחקרי הדמיה נוירו) לעומת מודל לינארי כללי.ראיתי מקרים רבים של "רגרסיה לוגיסטית רב משתנית" שבהם יש רק תוצאה אחת, ואני לא חושב שזה כל כך חשוב כל עוד המונח מוגדר בבירור על ידי המחבר.
#2
+47
user28
2010-09-04 00:27:21 UTC
view on stackexchange narkive permalink
להלן שתי דוגמאות הקשורות זו לזו הממחישות את הרעיונות. הדוגמאות ממוקדות במידה מסוימת בארה"ב, אך ניתן להפיץ את הרעיונות למדינות אחרות. שהם מכניסים תלמידים 'טובים' יותר. כמו כן, נניח כי ממוצע הציונים של הסטודנט (GPA) הוא מה שהאוניברסיטה רוצה להשתמש בו כמדד ביצועים לסטודנטים. יש להם כמה קריטריונים בחשבון כגון GPA בתיכון (HSGPA), ציוני SAT (SAT), מגדר וכו 'ורוצים לדעת איזה אחד מהקריטריונים האלה חשוב מבחינת GPA.

פתרון: רגרסיה מרובה

בהקשר שלעיל, יש משתנה אחד תלוי (GPA) ויש לך מספר משתנים עצמאיים (HSGPA, SAT, Gender וכו '). אתה רוצה לברר איזה אחד מהמשתנים הבלתי תלויים הוא מנבא טוב עבור המשתנה התלוי שלך. היית משתמש ברגרסיה מרובה כדי לבצע הערכה זו.

דוגמה 2

במקום המצב הנ"ל, נניח שמשרד הקבלה רוצה לעקוב אחר ביצועי התלמידים לאורך זמן ורוצה לקבוע איזה מהקריטריונים שלהם מניע את ביצועי התלמידים לאורך זמן. במילים אחרות, יש להם ציוני GPA במשך ארבע השנים שבהן התלמיד שוהה בבית הספר (נניח, GPA1, GPA2, GPA3, GPA4) והם רוצים לדעת איזה אחד מהמשתנים הבלתי תלויים מנבא ציוני GPA טוב יותר בשנה לשנה- בסיס שנה. במשרד הקבלה מקווים לגלות שה משתנים הבלתי תלויים עצמאים חוזים ביצועים בכל ארבע השנים, כך שבחירתם בקריטריונים לקבלה מבטיחה כי ביצועי התלמידים יהיו גבוהים באופן עקבי בכל ארבע השנים. פתרון: רגרסיה רב משתנית

בדוגמה 2, יש לנו מספר משתנים תלויים (כלומר, GPA1, GPA2, GPA3, GPA4) ומשתנים עצמאיים מרובים. במצב כזה, היית משתמש ברגרסיה רב משתנית.

תמיד יש אחד שעונה כראוי על השאלה בדוגמאות :)
100% התשובה הטובה ביותר שאתה באמת יכול להבין
#3
+26
stackoverflowuser2010
2016-07-18 08:29:33 UTC
view on stackexchange narkive permalink

רגרסיה פשוטה מתייחסת למשתנה תלוי אחד ($ y $) ו משתנה עצמאי ($ x $): $ y = f (x) $

רגרסיה מרובה (aka רגרסיה רב משתנית) מתייחס למשתנה תלוי ו משתנים בלתי תלויים : $ y = f (x_1, x_2, ..., x_n) $

רגרסיה רב-משתנית נוגעת ל משתנים תלויים מרובים משתנים חזקים> עצמאיים: $ y_1, y_2, ..., y_m = f (x_1, x_2, ..., x_n) $. אתה עלול להיתקל בבעיות בהן המשתנים התלויים והבלתי תלויים מסודרים כמטריצות של משתנים (למשל $ y_ {11}, y_ {12}, ... $ ו- $ x_ {11}, x_ {12}, ... $ ), כך שהביטוי יכול להיכתב כ- $ Y = f (X) $, כאשר אותיות רישיות מציינות מטריצות.

קריאה נוספת:

אני מבין את ההגדרה.אך מה ההשפעה של התייחסות לרגרסיה מרובת משתנים כמערכת של רגרסיות חד-משתנות?
@LKS: ייתכן שתרצה לשאול את זה בשאלה נפרדת לחלוטין.
https://stats.stackexchange.com/questions/254254/why-do-we-need-multivariate-regression-as-opposed-to-a-bunch-of-univariate-regr
האם התשובה ב- Quora התייחסה לדף זה?: פ
#4
+4
thecity2
2017-03-04 03:44:58 UTC
view on stackexchange narkive permalink

אני חושב שהתובנה המרכזית (והמבדיל) כאן מלבד מספר המשתנים משני צידי המשוואה היא שבמקרה של רגרסיה רב-משתנית, המטרה היא לנצל את העובדה שיש (בדרך כלל) מתאם בין תגובהמשתנים (או תוצאות).לדוגמא, בניסוי רפואי, מנבאים עשויים להיות משקל, גיל וגזע, ומשתני התוצאה הם לחץ דם וכולסטרול.היינו יכולים, בתיאוריה, ליצור שני מודלים של "רגרסיה מרובה", אחד המסיג את לחץ הדם במשקל, בגיל ובגזע, ומודל שני בהחזרת כולסטרול על אותם גורמים.עם זאת, לחלופין, נוכל ליצור מודל רגרסיה יחיד משתנה המנבא גם לחץ דם וגם כולסטרול בו זמנית בהתבסס על שלושת משתני המנבא.הרעיון הוא שמודל הרגרסיה הרב-משתני עשוי להיות טוב יותר (מנבא יותר) במידה שהוא יכול ללמוד יותר מהקורלציה בין לחץ הדם לכולסטרול בחולים.

נקודה נהדרת.תהיתי אם ניתן לעשות רגרסיה רב-משתנית עם R. באמצעות מנובה, אני מסוגל לעשות ANOVA רב-משתני, אך לא מסוגל לקבל מקדמים כמו רגרסיה חד-משתנית.
#5
+1
Bhabesh Mahanta
2019-03-04 19:56:59 UTC
view on stackexchange narkive permalink

ברגרסיה רב משתנית ישנם יותר ממשתנה תלוי אחד עם שונות (או התפלגויות) שונות.משתני החיזוי עשויים להיות יותר מאחד או מרובים.אז זה יכול להיות רגרסיה מרובה עם מטריצה של משתנים תלויים, כלומר.ה.שונות מרובה. אך כשאנחנו אומרים רגרסיה מרובה, הכוונה היא רק למשתנה תלוי אחד עם התפלגות או שונות אחת.משתני החיזוי הם יותר מאחד. לסיכום מרובה מתייחס ליותר ממשתני ניבוי אחד אך רב משתני מתייחס ליותר ממשתנים תלויים אחד.



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...