שְׁאֵלָה:
אילו שיטות עבודה מומלצות עלי לנקוט בעת הכנת חלקות?
user28
2010-07-21 16:00:45 UTC
view on stackexchange narkive permalink

בדרך כלל אני עושה בחירות אידיוסינקרטיות משלי בעת הכנת עלילות. עם זאת, אני תוהה אם יש שיטות עבודה מומלצות לייצור מגרשים.

הערה: הערתו של רוב לתשובה ל שאלה זו רלוונטית מאוד כאן.

חֲמֵשׁ עֶשׂרֵה תשובות:
#1
+24
Peter Smit
2010-07-21 16:18:56 UTC
view on stackexchange narkive permalink

עקרונות הטופה הם פרקטיקות טובות מאוד בעת הכנת חלקות. ראה גם את ספרו עדות יפה

העקרונות כוללים:

  • שמור על יחס דיו נתונים גבוה
  • הסר תרשים זבל
  • תן לאלמנט גרפי פונקציות מרובות
  • זכור את צפיפות הנתונים

המונח לחיפוש הוא ויזואליזציה של מידע

התצוגה החזותית של Tufte של מידע כמותי (http://www.amazon.com/o/ASIN/0961392142/ref=nosim/gettgenedone-20) טובה יותר מ- IMO של עדות יפה. עם זאת כל ארבעת ספריו טובים, ואם יש לך הזדמנות להשתתף באחד מהקורסים שלו, עשה זאת.
אני מסכים עם רוב מה שטופט אומר, אבל אני חייב לומר, [הנתונים הנמוכים שלו: תיבות דיו] (http://indiemaps.com/blog/2008/02/props-to-box-plots/) הם פשוט אִידיוֹטִי. אני חושב שלוקח לי זמן רב יותר פי 3-4 להבין מאשר מגרשים רגילים. ברירות המחדל של R הרבה יותר טובות (אם כי הקווים בקצות הזנבות מיותרים). למגרשי תיבות מסורתיים יש יתרון נוסף בכך שהם יכולים לייצג גודל מדגם (עם רוחב), וסטיות תקן (עם חריצים).
+1 @ naught101 כמה אחרים חולקים את הדעה הזו ב- `SO`: http://stackoverflow.com/questions/6973394/functions-available-for-tufte-boxplots-in-r#comment8320383_6973394
#2
+15
Shane
2010-07-21 16:16:55 UTC
view on stackexchange narkive permalink

נוכל להישאר כאן כל היום לציון שיטות עבודה מומלצות, אך עליך להתחיל לקרוא את Tufte. ההמלצה העיקרית שלי:

שמור על זה פשוט.

לעתים קרובות אנשים מנסים להעלות מידע על התרשימים שלהם. אבל באמת צריך להיות לך רק רעיון עיקרי אחד שאתה מנסה להעביר ואם מישהו לא מקבל את המסר שלך כמעט מיד, אז אתה צריך לחשוב מחדש איך הצגת אותו. אז אל תתחיל לעבוד על התרשים שלך עד שההודעה עצמה אינה ברורה. מכונת הגילוח של אוקאם חלה גם כאן.

אני מסכים עם רוב הנקודה הזו, אבל אני חושב "שמור על זה פשוט." יכול להיות לא ברור. הנקודה העיקרית שלך היא שאתה צריך לדעת מה אתה רוצה שהתרשים יעביר. "תשאיר את זה פשוט." מעלה כמה רעיונות אחרים, כמו "יחס הנתונים: הדיו צריך להיות גבוה.", אשר Tufte מעודד, ו- "Present לא יותר משלושה משתנים.", אשר Tufte מייאש.
ברור שהעצה הזו טובה בהרבה מההפך.אך ישנם מצבים בהם גרף הוא בהכרח מסובך ודורש מחקר מפורט, זהיר, מתחשב.אבל הסיבוך צריך להיות פשוט ככל האפשר.לדוגמא, 25 עלילות במטריצה של 5 x 5 עשויות להזדקק למחקר ממושך, אך הרעיון שכל אחת מהן מציגה רק חלק מהנתונים קל יחסית לתפיסה.
#3
+12
Ian Turner
2010-07-21 16:20:45 UTC
view on stackexchange narkive permalink

כלל אצבע שלא תמיד אני עוקב אחריו, אך לפעמים מועיל הוא לקחת בחשבון שסביר להניח שהעלילה שלך תהיה בשלב כלשהו בעתיד

  • נשלח בפקס,
  • מצולם, ו / או
  • משוכפל בשחור-לבן.

אתה צריך לנסות ולהעלות את העלילות שלך מספיק ברור שגם אם הם ישוחזרו בצורה מדויקת בעתיד, המידע שהעלילה מנסה להעביר עדיין קריא.

אני חושב שאתה מתכוון שנשלח בפקס בשלב כלשהו ** בעבר **;)
+1 לכך. עלילת הזרע שלך, לב העיתון שלך, לא צריכה להיות לגמרי לא מובנת מכיוון שהדפסתי אותה.
[תשובה זו] (http://stats.stackexchange.com/a/11460/9007) מטפלת בבעיה דומה.
#4
+8
Benjamin Bannier
2010-07-21 18:01:40 UTC
view on stackexchange narkive permalink

בנוסף להעברת מסר ברור אני תמיד מנסה לזכור את העלילה:

  • גדלי הגופנים עבור תוויות ואגדות צריכים להיות גדולים מספיק, רצוי שאותו גודל גופן וגופן שימשו בגמר פרסום.
  • רוחבי הקו צריכים להיות גדולים מספיק (שורות 1 נק 'נוטות להיעלם אם מגרשים מצטמצמים רק מעט). אני מנסה לעבור לרוחבי קו של 3 עד 5 נק '.
  • אם מתכננים מערכי נתונים / עקומות מרובים עם צבע וודאו שניתן להבין אותם אם מודפסים בשחור-לבן, למשל. על ידי שימוש בסמלים או סגנונות שונים בנוסף לצבע.
  • השתמש תמיד בפורמט ללא הפסד (או קרוב ללא הפסד), למשל. פורמט וקטורי כמו pdf, ps או svg או png או gif ברזולוציה גבוהה (jpeg לא עובד בכלל ומעולם לא תוכנן עבור אמנות קו).
  • הכינו גרפיקה ביחס הגובה הסופי לשימוש הפרסום. שינוי יחס הגובה-רוחב מאוחר יותר יכול להעניק צורות גופן או סמל מרגיזות.
  • תמיד הסר עומס חסר תועלת מתוכנית העלילה כמו מידע היסטוגרמי שאינו בשימוש, שורות מגמה (כמעט לא שימושיות) או כותרות ברירת מחדל. >

    הגדרתי את תוכנת העלילה שלי (matplotlib, ROOT או root2matplotlib) לבצע את רוב הזכות הזו כברירת מחדל. לפני שהשתמשתי ב gnuplot שנדרש טיפול נוסף כאן.

#5
+8
user88
2010-07-22 01:11:03 UTC
view on stackexchange narkive permalink

בתחום הפיזיקה קיים כלל שכל המאמר / הדוח צריכים להיות מובנים רק מתוך התבוננות מהירה על העלילות. אז הייתי מייעץ בעיקר שיהיו להם הסבר עצמי.
זה גם מרמז שעליך לבדוק תמיד אם הקהל שלך מכיר איזושהי עלילה - פעם עשיתי טעות גדולה בהנחה שכל מדען יודע אילו תיבות עלילות הם ואז בזבזו שעה כדי להסביר את זה.

סימפטיות על חוויית העלילה של הקופסה, אך מה שמשמעות הדבר היא (א) שימוש בגרסה פשוטה יחסית (למשל הצגת חציון, רבעונים, 5% ו 95% נקודות וכל נקודות הנתונים מעבר) במקום להציג כל דבר המבוסס על הוועידה שבמרכזה1.5 מנת משכל;(ב) הוספת כיתוב המבהיר מוסכמות.
#6
+6
Bossykena
2010-07-21 22:26:15 UTC
view on stackexchange narkive permalink

הנה ההנחיות שלי, המבוססות על השגיאות הנפוצות ביותר שאני רואה (בנוסף לכל שאר הנקודות הטובות שהוזכרו)

  • השתמש בתרשימי פיזור, ולא במגרשי קווים, אם סדר האלמנטים אינו רלוונטי.
  • בעת הכנת מגרשים המיועדים להשוואה, השתמש באותו גורם קנה מידה עבור כולם.
  • אפילו טוב יותר - מצא דרך לשלב את הנתונים בגרף אחד (למשל: תיבות קופסאות הן יותר ממספר היסטוגרמות כדי להשוות מספר גדול של התפלגויות).
  • אל תשכח כדי לציין יחידות
  • השתמש במקרא רק אם אתה חייב - בדרך כלל ברור יותר לתייג עקומות ישירות.
  • אם עליך להשתמש באגדה, הזז אותה בתוך העלילה, באזור ריק.
  • עבור גרפי קווים, כוון ליחס גובה-רוחב המניב קווים שהם בערך ב 45o עם הדף.
* "תיבות תיבות הן יותר ממספר היסטוגרמות כדי להשוות בין מספר גדול של התפלגויות" * - זה נכון רק אם הנתונים שלך אינם חד-מודלים, ואין בהם קורטוזיס או תכונות אחרות שלא ניתן לתפוס על ידי תיבות ..
#7
+6
visnut
2010-08-13 06:30:32 UTC
view on stackexchange narkive permalink

התבונן בספריית הגרפיקה R, ggplot2. הפרטים מופיעים בדף האינטרנט http://had.co.nz/ggplot2/ חבילה זו מייצרת מגרשי ברירת מחדל טובים מאוד, העוקבים אחר עקרונות Tufte, הנחיות קליבלנד וחבילת הצבעים של Ihaka.

#8
+6
Andrej Panjkov
2011-06-02 08:51:32 UTC
view on stackexchange narkive permalink

אם זוממים בצבע, קח בחשבון שאנשים עיוורי צבעים עשויים להתקשות להבחין בין אלמנטים לפי צבע בלבד. אז:

  • השתמש בסגנונות קו כדי להבחין בין קווים.
  • השתמש במשקל נוסף באלמנטים, הפוך את רוחב הקו לפחות ל -2 נק 'וכו'.
  • השתמש שונה סמנים כמו גם צבעים כדי להבחין בנקודות.
  • השתמש בתוויות וביאורים, תוך התייחסות גם למיקום ולסגנון.
  • כאשר אתה מתייחס לאלמנטים העלילתיים בטקסט, תאר אותם לפי צבע, מיקום יחסי וסגנון: "העקומה האדומה, העליונה, מקף הנקודה"
  • השתמש בפלטה ידידותית לעיוור צבעים. ראה http://www.vischeck.com/vischeck/,, http://jfly.iam.u-tokyo.ac.jp/color/#pallet. יש לי יישום פשוט של פיתון של הפלטה בהפניה האחרונה ב- code.google.com, חפש פיתון- cudtools
שקול גם את העובדה שמישהו יצטרך להדפיס אותו במדפסת בגווני אפור. עשיתי זאת בעבר - השתמשתי בצבעי ברירת מחדל של ggplot2 (שנראים נהדר על גבי המסך) למשימה, אותה הדפסתי אז בשחור לבן, ולא ניתן היה להבדיל מחצית מהצבעים מהאחרים! \*לְהַסמִיק\*
#9
+4
Frank Harrell
2011-06-02 17:47:18 UTC
view on stackexchange narkive permalink

אלה הצעות נפלאות. אספנו הרבה חומר בכתובת http://biostat.mc.vanderbilt.edu/StatGraphCourse. קבוצה של סטטיסטיקאים בתעשיית הפארמה, האקדמיה וה- FDA יוצרת גם משאב שיהיה שימושי מאוד לניסויים קליניים ומחקרים קשורים. חומר חדש ייחשף בעוד חודש אבל הרבה כבר קיים - http://www.ctspedia.org/do/view/CTSpedia/PageOneStatGraph

המועדף האישי עליי ספר הגרפיקה הוא אלמנטים של נתוני גרפים מאת ויליאם קליבלנד.

מבחינת תוכנה, לדעתי קשה לנצח את חבילות ggplot2 וסריג של R. סטאטה תומך גם בכמה גרפיקה מצוינת.

#10
+3
Matti Pastell
2010-07-22 16:05:55 UTC
view on stackexchange narkive permalink

זה תלוי גם היכן לא תרצה לפרסם את העלילות שלך. תוכלו לחסוך לעצמכם הרבה צרות על ידי התייעצות עם המדריך למחברים לפני שתעלו עלילות לכתב העת.

שמור גם את העלילות בפורמט שקל לשנות או לשמור את הקוד בו השתמשת ליצירתן. רוב הסיכויים שאתה צריך לבצע תיקונים.

#11
+3
Pablo Marin-Garcia
2011-06-01 00:35:02 UTC
view on stackexchange narkive permalink

אל תשתמש בעלילות דינמיט: http://pablomarin-garcia.blogspot.com/2010/02/why-dynamite-plots-are-bad.html, השתמש בעלילות כינור או דומה (משפחת boxplots)

#12
+2
Freya Harrison
2010-07-22 18:41:54 UTC
view on stackexchange narkive permalink

אוסיף כי בחירת העלילה צריכה לשקף את סוג הבדיקה הסטטיסטית המשמשת לניתוח הנתונים. במילים אחרות, כל המאפיינים של הנתונים ששימשו לניתוח צריכים להיות מוצגים באופן חזותי - כך שתראה אמצעים ושגיאות סטנדרטיות אם השתמשת במבחן t אבל קופסאות אם השתמשת במבחן מאן וויטני.

#13
+2
David J.
2011-12-07 09:12:54 UTC
view on stackexchange narkive permalink

התשובות האחרות נוסחאיות מכדי לשכנע, אז תן לי לתת תשובה כללית יותר. נאבקתי בשאלה הזו זמן מה. אני מציע את התהליך הזה:

  1. דע את המסר שלך
  2. הכיר את הקהל שלך
  3. דע את האילוצים שלך
  4. התאם את המסר שלך ל קהל בהתחשב באילוצים שלך

אני ספקן לגבי טענות גורפות כמו "שמור על זה פשוט" - מה זה אומר? ובכן, זה תלוי בקהל. יש קהלים שיאכלו את סגנון הטופטה. אבל יש קהלים שמעריכים מדי פעם זבל גרפי קטן. יש אנשים שמשועממים מפיזורים. יש אנשים שאוהבים רקעים צבעוניים. האם זה כל כך שגוי לעסוק בהם קצת גם אם אתה מתפשר על טוהר "אסתטי"? זה תלוי בך להחליט.

תגובת הקהל שלך תהיה משוב חשוב, אך לא היחיד. אם תמצא דרך למדוד את ההבנה שלהם לפני ו אחרי המצגת שלך, אז תתחיל להבין את ההשפעה שהשמת.

תשובה "נכונה" תהיה תלויה בשאלות מסוג זה:

  • באיזה מדיה תשתמש?

  • האם אתה יוצר סטטי או עלילות אינטראקטיביות?

  • האם אתה מנסה לספר סיפור מוגדר מראש (אקספוזיציה) או לעודד ניסויים (חקר)?

  • באיזו מידה אתה רוצה שהקהל יסיק מסקנות משלו?

  • באיזו מידה אתה רוצה שהקהל ילווה בעקבותיו וישתכנע מהסיפור שלך?

  • באיזו מידה אתה רוצה שהקהל יאתגר את הממצאים שלך?

לסיכום, עיצוב החומרים שלך נתנו בכוונה את המסר, הקהל והמגבלות שלך.

"לעסוק", או להסיח את הדעת? צבע יכול להיות בסדר, אבל בסופו של דבר אתה כאן לגבי נתונים, והאסתטיקה צריכה לשרת את הנתונים, ולא להיפך.
#14
+2
naught101
2012-04-20 06:29:44 UTC
view on stackexchange narkive permalink

נראה כי דבר אחד אני זוכר שטופטה הזכיר, שאינו נמצא בתשובות האחרות, הוא מיפוי - כלומר, הפוך מיקום, כיוון, גודל וכו 'בתרשים מציאות . מה שמופיע בגרף צריך להיות קיים בעולם האמיתי. מה שגדול צריך להיות גדול (יש לזכור כי אזורים צריכים לייצג אזורים, ונפחי נפח. לעולם אל תנסו לייצג ערך סקלרי לפי אזור, זה מאוד לא ברור!). זה חל גם על צבעים, צורות וכו ', אם הם רלוונטיים.

דוגמה מעניינת היא גרף "סדרת החצאית" כאן: http: // a-little-book-of-r -for-time-series.readthedocs.org/en/latest/src/timeseries.html. אמנם טכנית זה נכון, ואורך החצאית "גבוה יותר" תופס מיקום גבוה יותר בגרף, אבל זה די מבלבל, מכיוון שאורך החצאית מתחיל מ העליון , ויורד למטה (בניגוד לבני אדם, או עצים, שם אנו מודדים את הגובה מהקרקע). כך שאורך החצאית המוגדל מייצג למעשה ערך נמוך יותר:

  חצאיות <- scan ("http://robjhyndman.com/tsdldata/roberts/skirts.dat", skip = 5) skirtsseries <- ts (חצאיות, start = c (1866)) plot.ts (skirtsseries, ylim = c (max (חצאיות), min (חצאיות)))  

enter image description here

יש, כמו תמיד, קשיים. לדוגמא, אנו בדרך כלל רואים זמן להתקדם, ובמערב, לפחות, אנו קוראים משמאל לימין, ולכן גרפי סדרות הזמן שלנו לרוב גם זורמים משמאל לימין ככל שהזמן גדל. אז מה קורה אם אתה רוצה לייצג משהו שמוצג בצורה הטובה ביותר לרוחב (למשל מדידות מזרח-מערב של משהו) לאורך זמן? במקרה כזה, אתה צריך להתפשר, או לתאר את הזמן שנע למעלה או למטה (איזה מהם תלוי שוב בתפיסות תרבותיות, אני מניח), או לבחור למפות את המשתנה הצדדי שלך למעלה / למטה על הגרף שלך.

דוגמה לסחר בזמן / מרחב היא בספר, ביצוע מפות (דיון קריטי ודוגמאות [מובא כאן] (http://freegeographytools.com/2011/making-maps-a-visual-guide-to-map -עיצוב-ל-גיס-סקירה-של המהדורה השנייה).
דוגמה נחמדה (איומה)! מפות מעלות פשרה נוספת וקשה יותר: ניסיון לייצג 2 ממדים + זמן בדף דו ממדי (למשל מפות של סחף יבשת). די קשה. אבל אני מניח שבשביל זה אנימציות מיועדות :)
הדוגמה המספרת שלך מאפשרת אזכור של שתי נקודות נוספות העולות לעתים קרובות.1. עם ציר זמן, כותרת או תווית כמו "TIme" בדרך כלל מיותרת.2. תמיד ניתן לשפר כותרות או תוויות כמו "חצאיות" בעזרת הסבר נמרץ אך אינפורמטיבי, כולל יחידות מידה במידת הצורך.
#15
+1
Baltimark
2010-07-21 23:11:59 UTC
view on stackexchange narkive permalink

זה תלוי באופן הדיון בעלילות.

למשל, אם אני שולח עלילות לפגישה קבוצתית שתיעשה עם מתקשרים ממקומות שונים, אני מעדיף להרכיב אותם ב- Powerpoint בניגוד ל- Excel, ולכן קל יותר להתהפך.

לשיחות טכניות אחד על אחד, אשים משהו ב- Excel, כך שהלקוח יוכל להזיז עלילה הצידה ולהציג את הנתונים הגולמיים. לחלופין, אני יכול להזין ערכי p לתאים לאורך מקדמי רגרסיה צדדיים, למשל.

זכור: עלילות הן זולות, במיוחד להצגת שקופיות, או למשלוח דוא"ל לקבוצה. אני מעדיף ליצור 10 עלילות ברורות שנוכל לדפדף בהן מאשר 5 עלילות בהן אני מנסה להציב קבוצות ברורות (למשל "זכרים ונקבות") באותו גרף.



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...