שְׁאֵלָה:
השלם דוגמאות מהותיות למחקר הניתן לשחזור באמצעות R
Jeromy Anglim
2010-08-21 09:58:12 UTC
view on stackexchange narkive permalink

השאלה: האם ישנן דוגמאות טובות ל מחקר לשחזור באמצעות R הזמינות באופן חופשי באינטרנט?

דוגמה אידיאלית: באופן ספציפי, דוגמאות אידיאליות יספקו:

  • הנתונים הגולמיים (ובאופן אידיאלי מטא נתונים המסבירים את הנתונים),
  • כל קוד R כולל ייבוא ​​נתונים, עיבוד, ניתוחים , ויצירת פלט,
  • Sweave או גישה אחרת לקישור הפלט הסופי למסמך הסופי,
  • הכל בתבנית הניתנת להורדה בקלות וניתנת למחיקה של קורא.

באופן אידיאלי, הדוגמה תהיה מאמר בכתב עת או תזה שבה הדגש הוא על נושא יישומי ממשי, לעומת דוגמא להוראה סטטיסטית.

סיבות להתעניינות: אני מתעניין במיוחד בנושאים יישומיים במאמרי כתבי עת ובתזות, מכיוון שבמצבים אלה מתעוררות כמה סוגיות נוספות:

  • נוצרות סוגיות הקשורות לניקוי ועיבוד נתונים
  • נושאים מתעוררים קשורים לניהול מטא-נתונים,
  • כתבי-עת ותזות לעיתים קרובות כוללים ציפיות של מדריכי סגנונות בנוגע למראה ולעיצוב של טבלאות ודמויות. לגבי זרימת עבודה (כלומר, כיצד לבצע רצף ניתוחים) וזמן עיבוד (למשל, סוגיות של ניתוח מטמון וכו ').

ראיית דוגמאות עבודה מלאות יכולה לספק חומר הדרכה טוב לחוקרים המתחילים עם מחקר לשחזור.

חֲמֵשׁ עֶשׂרֵה תשובות:
#1
+15
Dirk Eddelbuettel
2010-08-21 19:03:04 UTC
view on stackexchange narkive permalink

פרנק הראל מכה על התוף במחקרים ודיווחים הניתנים לשחזור במשך שנים רבות. תוכל להתחיל בעמוד וויקי זה המפרט שפע של משאבים אחרים, כולל מחקרים שפורסמו ומכסה גם את העמוד של צ'רלס גייר.

#2
+12
Spacedman
2011-07-28 13:08:34 UTC
view on stackexchange narkive permalink

לכתב העת Biostatistics יש עורך חבר לשחזור, וכל מאמריו מסומנים:

מחקר לשחזור

מדיניות המחקר שלנו לשחזור מיועד למאמר העיתונים לסמן עפיפונים D אם הנתונים עליהם הם מבוססים זמינים באופן חופשי, C אם קוד הכותבים זמין באופן חופשי, ו- R אם הנתונים והקוד זמינים, והעורך השותף שלנו לשחזור מסוגל להשתמש בהם בכדי לשחזר את התוצאות בעיתון. נתונים וקוד מתפרסמים באופן אלקטרוני באתר כתב העת כחומרים משלימים.

http://biostatistics.oxfordjournals.org/

כיצד רעיון טוב זה?

http://biostatistics.oxfordjournals.org/content/12/1/18.abstract מגיע עם חבילת R בתוספות שעושה את ניתוח - עוד לא ניסיתי את זה בעצמי. כמו כן, לא מצליח לגלות היכן מוגדר דירוג הפתיחות. שולחת דוא"ל לעורך השותף עם כמה שאלות ...

[עריכה]

רוג'ר פנג העורך השותף אומר לי שכנראה אין דרך למצוא את העיתונים הניתנים לשחזור מבלי לקבל את ה- PDF. הוא הצביע עלי על זה שיש עליו 'R' גדול ונחמד (שאינו אומר דירוג R כמו סרטים) לצורך שחזור:

http://biostatistics.oxfordjournals.org/ content / 10/3 / 409.abstract

כמובן שכתב העת עצמו אינו בחינם ... #fail

Barry

זה נהדר לראות יומן העדיף לשחזור. האם ראית דוגמאות טובות למאמרים המסומנים R?
הם לא נותנים עדיפות לפרסום, אני חושב שהם רק רוצים להדגיש את זה. אני אערוך את תשובתי בדוגמה.
#3
+10
John D. Cook
2010-09-02 16:15:56 UTC
view on stackexchange narkive permalink

חוסר הפיכה של NCI60 מנבאים לכימותרפיה

זהו ניתוח לשחזור המראה את היעדר ההעתקה של מאמר שהיה בחדשות. ניסוי קליני שהתבסס על מסקנות שווא של הנייר שאינו ניתן להפקה הושעה, הוחזר מחדש, הושעה שוב, ... זו דוגמה טובה לניתוח לשחזור בחדשות.

#4
+10
Jake
2010-11-12 03:30:56 UTC
view on stackexchange narkive permalink

יש לי כמה דוגמאות כאלה בדף עבודות המחקר שלי. (אסור לפרסם יותר מהיפר-קישור אחד כחבר חדש. אז רק אתאר את המאמרים באתר זה).

(1) "הפיכת אפקטים למניפסט בניסויים אקראיים" משתמשת בווינייט של ר. מערכת.

(2) "ייחוס השפעות לקמפיין של אקסטרא-יציאה מהצבעה באופן אקראי" היה מאמר מורכב יותר שכלל כמה סימולציות. השתמשנו במערכת מבוססת Makefile ופרסמנו אותה ל- Dataverse

(3) "EDA for HLM" היה הניסיון המוקדם ביותר שלי. כאן פשוט שמתי את הנתונים וקבצי ה- Sweave המשויכים לטארבול.

בעיה אחת שגילינו בעת יצירת ארכיון ה- JASA שלנו הייתה שגרסאות וברירות מחדל של חבילות CRAN השתנו. לכן, בארכיב זה אנו כוללים גם את גרסאות החבילות בהן השתמשנו. המערכת המבוססת על וינטג 'תקלקל ככל הנראה כאשר אנשים מחליפים את החבילות שלהם (לא בטוחים כיצד לכלול חבילות נוספות בתוך החבילה שהיא Compendium).

לבסוף, אני תוהה מה לעשות כאשר R עצמה משתנה. האם יש דרכים לייצר, למשל, מכונה וירטואלית המשחזרת את כל סביבת החישוב המשמשת לנייר כך שהמכונה הווירטואלית אינה ענקית?

בכל מקרה, אני מקווה שהדוגמאות הללו יעזרו. לפחות הם מראים כמה מהניסויים שלי באזור זה.

(הנה כמה קישורי טקסט רגיל.)

 [2]: http://jakebowers.org/manifesteffects- compendium-howto.txt [3]: http://hdl.handle.net/1902.1/12174 [4]: ​​http://hdl.handle.net/1902.1/13376 
אתה מעלה כמה שאלות מעניינות. פרסמתי שאלה נפרדת המצטטת אותך: http://stats.stackexchange.com/questions/4466/how-to-increase-longer-term-reproducibility-of-research- besonnesch- use-r-and
#5
+9
Jeromy Anglim
2010-11-11 12:22:29 UTC
view on stackexchange narkive permalink

Koenker ו- Zeileis מספקים דף אינטרנט עם דוגמה שלמה יחסית. הם חולקים:

  • Rnw (קוד Sweave)
  • קוד ניתוח R
  • PDF סופי
  • דיון בבעיות בקרת גרסאות
#6
+8
csgillespie
2010-08-22 02:59:56 UTC
view on stackexchange narkive permalink

כתבנו מאמר שמסביר כיצד להשתמש ב- R / Bioconductor בעת ניתוח נתוני מיקרו מערך. הנייר נכתב ב- Sweave וכל הקוד המשמש להפקת הגרפים נכלל כחומר משלים.

Gillespie, CS, Lei, G., Boys, RJ, Greenall, AJ, Wilkinson, DJ, 2010 . ניתוח נתוני מיקרו-מערך במהלך זמן שמרים באמצעות BioConductor: מחקר מקרה באמצעות שמרים 2 מערכי Affymetrix הערות מחקר BMC, 3:81.

#7
+7
ars
2010-08-21 10:47:10 UTC
view on stackexchange narkive permalink

בעמוד ה של צ'רלס גייר ב- Sweave יש דוגמה מתזה, העונה על חלק מהדרישות שלך (הנתונים הגולמיים הם פשוט מחבילה R, אך קוד ה- R / sweave וה- PDF הסופי זמינים. ):

מאמר על התיאוריה בתזה של יון ג'ו סונג, מסקנת הסיכוי למונטה קרלו על מודלים חסרים נתונים (הדפסה מוקדמת) הכיל דוגמאות מחשוב. כל מספר בעיתון ובכל עלילה נלקח (על ידי גזירה והדבקה, אני חייב להודות) ממסמך "חומרים משלימים" שנעשה ב- Sweave.

(המקור קובץ מקושר תחת החלק "חומרים משלימים לנייר".)

אני יודע שנתקלתי בדוגמה אחת לפחות של R בגלישה ב חומר ReproducibleResearch.net a דף קודם, אך למרבה הצער לא סימנתי אותו.

#8
+5
Jeromy Anglim
2011-06-16 20:12:18 UTC
view on stackexchange narkive permalink

לסימון ג'קמן יש דוגמה שימושית במיוחד לניתוח תוצאות הסקר: "אמריקאים ואוסטרלים 10 שנים אחרי 11 בספטמבר". יש לו מספר דוגמאות לשילוב טבלאות ודמויות.

הוא הכין את מסמך Sweave ו דו"ח PDF באמצעות פוסט בבלוג זה.

While הנתונים הגולמיים אינם מסופקים (ככל שיכולתי לדעת), ולכן לא ניתן להריץ את הדוגמאות בפועל של Sweave, אני חושב שאפשר ללמוד מעט מהלימוד של קוד Sweave.

#9
+5
Jeromy Anglim
2011-07-28 12:11:43 UTC
view on stackexchange narkive permalink

ניל סונדרס ניתח אינטראקציות מקוונות הקשורות לכנס. כמה מאפיינים שהופכים אותו לדוגמא Sweave שימושית כוללים:

  • מסופק קובץ Rnw
  • גרפים נוצרים באמצעות ggplot
  • גודל טוב ותחום מובן בקלות

החומרים זמינים כאן:

#10
+4
Shane
2010-08-21 12:15:44 UTC
view on stackexchange narkive permalink

מצאתי טובות בעבר ואפרסם ברגע שאחפור אותן, אך כמה הצעות כלליות מהירות:

  1. יתכן שתוכל למצוא דוגמאות מעניינות על ידי חיפוש בגוגל עם מילות מפתח ו- ext: rnw (שיחפש קבצים עם סיומת sweave). הנה דוגמה לחיפוש. זו התוצאה השלישית מחיפושי: http://www.ne.su.se/paper/araietal_source.Rnw. הנה דוגמה נוספת מהחיפוש שלי: http://www.stat.umn.edu/geyer/gdor/.
  2. חבילות R רבות כוללות ויגונות מעניינים שבעצם מסתכמים באותו הדבר. דוגמה: https://r-forge.r-project.org/scm/viewvc.php/paper/maxLik.Rnw
#11
+4
user88
2010-08-21 12:30:48 UTC
view on stackexchange narkive permalink

עיין גם ב Journal Of Statistical Software; הם מעודדים הכנת ניירות ב- Sweave.

לא, לא באופן רשמי - הגשת LaTeX מעודדת אך אם אתה מסתכל על [דף ההוראות] (http://www.jstatsoft.org/instructies) הוא אינו מכיל את המילה Sweave. מחברים אמנם משתמשים בו ו / או שולחים את קוד ה- R עם הנייר, אך בעיניי זה מהדהד את הנקודה של שיין בנוגע לווינטות חבילה.
אוקי, עדיין רוב המגישים משתמשים בו (גם סגנון היומן כולל את Swave.sty); הבעיה העיקרית היא שלא פורסמו Rnws, עדיין ניירות שנעשו על ידי Sweave מגיעים עם פלט Stangle.
#12
+4
Jeromy Anglim
2011-01-01 16:35:18 UTC
view on stackexchange narkive permalink

רוברט ג'נטלמן כתב מאמר בשם "Research Reproducible: A Bioinformatics Case Study"

הוא מיישם מערך ניתוחים קצר כחבילה R ומשתמש ב- Sweave. השימוש ב- Sweave באופן כללי יותר.

עיין בסעיף "קבצים קשורים" בעמוד המאמר לקבלת קובץ ארכיון של כל הקבצים והתיקיות המשמשים.

התייחסות:

  • ג'נטלמן, רוברט (2005) "מחקר לשחזור: מחקר מקרה ביואינפורמטיקה," יישומים סטטיסטיים בגנטיקה וביולוגיה מולקולרית: כרך א '. 4: גיליון 1, סעיף 2.
  • DOI: 10.2202 / 1544-6115.1034
  • להשיג ב: http://www.bepress.com/sagmb/vol4/iss1/art2
#13
+4
Tim
2011-08-31 06:51:26 UTC
view on stackexchange narkive permalink

http://genome.cshlp.org/content/early/2011/06/09/gr.117523.110/suppl/DC1

נייר נחמד, מאת חבר למעבדה שלי. ה- PI שלנו היה די מרוצה כשמשהו דומה לדואר מעריצים נכנס לשם כך. כעת לכל הפרסומים מהקבוצה יש את השיטות המשלימות המפורטות ב- LaTeX / Sweave. גם חלק מהעיתונים (לא מצליחים להחליט אם לשמור את שלי ב- LyX / Sweave או לקפל ופשוט לבצע את התוספים ב- Sweave).

#14
+3
zzr
2010-11-05 17:26:46 UTC
view on stackexchange narkive permalink

חיפוש דוגמאות ופרקטיקות הוא דרך טובה ללמוד, אך רק רציתי להזכיר כי לשחזור יש לא רק צד טכני / סקריפט, אלא גם סגנון קוד והיבט מבנה, מזעור תופעות לוואי בתפקודי הליבה וכו '. מצא באופן אישי כי Chambers ספר תוכנה לניתוח נתונים מאפשר להבין לעומק טכניקות המסייעות להימנע מבעיות אמינות ושחזור ברמת קוד R.

#15
+2
WojciechF
2017-03-23 19:00:50 UTC
view on stackexchange narkive permalink

אם אתה עדיין זקוק לדוגמא מצוינת לניתוח ניתן לשחזור מלא בתוספת PAPER, השתמש ב רפו זה.

ה- @ jscamac עשה עבודה נהדרת בכך שהוא הפך את הניתוח שלו לניצור ואני אימתתי אותו באופן אישי.

אתה יכול להישען על אופן השימוש בפונקציות ספציפיות של R כמו החבילה remake כדי להבטיח יכולת לשחזר.

היזהר / לוקח לחישובים כשעה להשלים.

בסך הכל כתוב וייצור נייר LaTeX בסופו של דבר עם דמויות.



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...