שְׁאֵלָה:
גרף מתאים להמחשת התפשטות הנתונים
Kumar Vaibhav
2013-06-30 14:36:06 UTC
view on stackexchange narkive permalink

יש לי כמה נתונים כמו

  A 2A 4A 76B 8B 13 .. ....  

בעיקרון, מה התפשטות A, B וכו 'מה יהיה גרף מתאים להמחשת מידע כזה ב- R?

האם תוכל לספק מידע נוסף על הנתונים שלך. כמה נקודות יכולות להיות עבור "A", "B" וכו '? האם ככל הנראה הערכים בעמודה השנייה הם רצופים?
בטוח. תודה על תגובתך. הערכים המספריים הם גיל, ולכן הנתונים המספריים אינם רציפים אלא בדידים. יכול להיות מספר נקודות כלשהו עבור A, B וכו ', נע בין 1 ל -150.
כמה ערכים בכל קבוצה?
לכן, יכול להיות מספר ערכים משתנה בכל קבוצה. נגיד, 20 ל- A ואז 100 ל- B ואז אולי 67 ל- C, וכן הלאה.
שְׁלוֹשָׁה תשובות:
Glen_b
2013-06-30 14:48:48 UTC
view on stackexchange narkive permalink

ישנם מספר רב של תצוגות אפשריות, תלוי מה אתה רוצה באופן ספציפי יותר.

דוגמה אחת תהיה תיבת מגרש לכל קבוצה (A, B, ...) (בהנחה שיש מספיק ערכים בכל קבוצה כדי לתמוך בקבוצה *):

  boxplot (len ~ supp, data = ToothGrowth, horizontal = TRUE, boxwex = .7)  

boxp

אבל אולי רוצה להסתכל על היסטוגרמות, ecdfs או מספר אפשרויות אחרות

* עריכה: מהתגובות המאוחרות יותר שלך נראה שיש מספיק נתונים לתיבות תיבות.

מְעוּלֶה! תן לי לנסות את זה!
כמה אפשרויות אחרות שעדיין לא הוזכרו בתשובות כוללות חלקות Q-Q, חלקות כוורת / כוורת וחלקות כינור
Gala
2013-06-30 17:10:25 UTC
view on stackexchange narkive permalink

כבר קיבלת תשובות מעולות, אבל הרשה לי להציע עלילה נוספת שטרם הוזכרה (זו דוגמה שיצרתי כדי לענות על שאלה אחרת):

Dot plot

ב- R, זה זמין למשל דרך תרשים רצועה () או geom_point () של ggplot2 או geom_jitter () . (ג'יטר מוסיף מעט רעש כדי למנוע חפיפה רבה מדי.) העלילה הזו מאפשרת לכם להסתכל על הנתונים בצורה קצת יותר ישירה מאשר היסטוגרמות (מה שעלול להטעות מאוד, ראו את התשובה הנהדרת של Glen_b לשאלה אחרת. ) או תיבות קופסא (שהן נהדרות אך קצת יותר מסובכות להבנה ולהסבר).

ב- GGPlot, ניתן גם לשלב קופסאות עלילות ונקודות מעוותות, ראה התיעוד.

+1. יש הרבה מאוד שמות לעלילה הזו. חלקות או תרשימים מנקודת רצועה הם שניים מהנפוצים ביותר. מכיוון ש"נקודה "נמצאת בשימוש נרחב במובנים אחרים, אולי עדיף על אלמנט השם" רצועה ", לפחות בחיפוש אחר יישומים (יש כמה, לא רק ב- R אלא גם בכל החבילות או השפות המובילות, למשל Stata` stripplot` ).
זה מדהים!
@NickCox +1 תודה על הדיוק, הייתי כל כך מבולבל מהשמות שהתאמצתי מאוד לא לבחור אחד ... התגובה שלך הזכירה לי פונקציית R אחרת ליצור רשימת חשפנות (הוסיפה עכשיו לתשובה שלי).
אבל איך אוכל לעשות זאת אם לאחד הצירים אין נתונים מספריים?
אין בעיה שעשיתי את זה - ggplot () + geom_point (data = mydata, mapping = aes (x = mydata [, 3], y = mydata [, 2])) + coord_cartesian (xlim = c (5, 90)) + xlab ("גיל") + ylab ("משהו") + ggtitle ("ניתוח דמוגרפי של גיל ומשהו")
ככל שמספר הנקודות גדל, הייתי מציע גם להוסיף שקיפות * וגם * ריצוד. לחלופין, ניתן להשתמש במעגלים חלולים .... אלה נוצרים מעט, כברירת מחדל, כאשר משתמשים בפונקציה 'צפיפות מגרש ()' מ"סריג ".
Ananda Mahto
2013-06-30 14:56:14 UTC
view on stackexchange narkive permalink

כאמור על ידי Glen_b, ישנן מספר אפשרויות.

הנה דוגמה להיסטוגרמה ולעלילת צפיפות באמצעות חבילת "סריג". סיפקתי גם כמה נתוני דוגמה.

  set.seed (1) mydf <- data.frame (V1 = sample (LETTERS [1: 5], 500, להחליף = TRUE), V2 = מדגם (0:50, 500, החלף = TRUE)) ראש (mydf) ספריית זנב (mydf) (סריג) היסטוגרמה (~ V2 | V1, data = mydf)  

enter image description here

  צפיפות מגרש (~ V2 | V1, data = mydf)  

enter image description here

שניהם הוחלו על הגדרות ברירת המחדל .



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.
Loading...