שְׁאֵלָה:
פייתון כספסל עבודה לסטטיסטיקה
Fabian Fagerholm
2010-08-12 15:46:45 UTC
view on stackexchange narkive permalink

הרבה אנשים משתמשים בכלי ראשי כמו Excel או גיליון אלקטרוני אחר, SPSS, Stata או R לצרכי הסטטיסטיקה שלהם. הם עשויים לפנות לחבילה ספציפית כלשהי לצרכים מיוחדים מאוד, אך ניתן לעשות הרבה דברים באמצעות גיליון אלקטרוני פשוט או חבילת סטטיסטיקה כללית או סביבת תכנות סטטיסטיקה.

תמיד אהבתי את פייתון כתכנות. לשפה ולצרכים פשוטים קל לכתוב תוכנית קצרה המחשבת את מה שאני צריכה. Matplotlib מאפשר לי לשרטט את זה.

האם מישהו עבר לגמרי, נגיד R, לפייתון? ל- R (או לכל חבילת סטטיסטיקה אחרת) פונקציונליות רבה הספציפית לסטטיסטיקה, ויש לה מבני נתונים המאפשרים לך לחשוב על הסטטיסטיקה שאתה רוצה לבצע ופחות על הייצוג הפנימי של הנתונים שלך. לפיתון (או שפה דינמית אחרת) היתרון בכך שהוא מאפשר לי לתכנת בשפה מוכרת וברמה גבוהה, והיא מאפשרת לי לקיים אינטראקציה תכנתית עם מערכות בעולם האמיתי בהן הנתונים שוכנים או שמהם אוכל לבצע מדידות. אבל לא מצאתי שום חבילת פייתון שתאפשר לי להביע דברים ב"טרמינולוגיה סטטיסטית "- מסטטיסטיקה תיאורית פשוטה לשיטות רב-משתנות מורכבות יותר.

על מה אתה יכול להמליץ ​​אם הייתי רוצה להשתמש בפייתון כ "שולחן עבודה סטטיסטי" להחלפת R, SPSS וכו '.?

מה הייתי מרוויח ומפסיד, על סמך הניסיון שלך?

לידיעתך, יש נתונים סטטיסטיים חדשים של פיתון subreddit שיוצא לדרך: http://www.reddit.com/r/pystats
כשאתה צריך להזיז דברים בשורת הפקודה, pythonpy (https://github.com/Russell91/pythonpy) הוא כלי נחמד.
26 תשובות:
#1
+313
ars
2010-08-13 10:30:09 UTC
view on stackexchange narkive permalink

קשה להתעלם מעושר החבילות הסטטיסטיות הקיימות ב- R / CRAN. עם זאת, אני מבלה הרבה זמן בארץ פייתון ולעולם לא אניא מישהו מלהיות כמוני. :) הנה כמה ספריות / קישורים שעשויים להועיל לך בעבודה סטטיסטית.

  • NumPy / Scipy אתה בטח כבר יודע על אלה. אבל הרשו לי לציין את ספר הבישול שבו תוכלו לקרוא על מתקנים סטטיסטיים רבים שכבר קיימים ועל רשימת הדוגמאות שהיא התייחסות נהדרת לפונקציות (כולל מניפולציה בנתונים ופעולות אחרות) . התייחסות שימושית נוספת היא הפצות ב- Scipy של ג'ון קוק.

  • פנדות זוהי ספרייה ממש נחמדה לעבודה עם נתונים סטטיסטיים - נתונים טבלאיים, סדרות זמן, נתוני פאנל. כולל פונקציות מובנות רבות לסיכומי נתונים, קיבוץ / צבירה, ציר. יש לו גם ספריית סטטיסטיקה / אקונומטריה.

  • larry מערך שכותרתו שמשחק יפה עם NumPy. מספק פונקציות סטטיסטיות שאינן קיימות ב- NumPy וטובות למניפולציה של נתונים.

  • python-statlib מאמץ די חדש ששילב מספר ספריות סטטיסטיקה מפוזרות. שימושי לסטטיסטיקה בסיסית ותיאורית אם אינך משתמש ב- NumPy או בפנדות.

  • statsmodels דוגמנות סטטיסטית: מודלים לינאריים, GLM, בין היתר.

  • scikits חבילות מחשוב סטטיסטיות ומדעיות - בעיקר החלקה, אופטימיזציה ולמידת מכונה.

  • PyMC לצרכי הדוגמנות של Bayesian / MCMC / היררכי. מומלץ בחום.

  • PyMix דגמי תערובות.

  • ביופיתון שימושי לטעינת הנתונים הביולוגיים שלך לפייתון ומספק כמה כלים סטטיסטיים / למידת מכונה ראשוניים לניתוח.

אם המהירות הופכת לבעיה, שקול Theano - משמש בהצלחה טובה על ידי אנשי הלמידה העמוקה.

יש המון דברים אחרים שם בחוץ, אבל זה מה שאני הכי שימושי לפי הקווים שציינת.

כל התשובות היו מועילות ושימושיות, ויהיה כולן ראויות להתקבל. זה, לעומת זאת, עושה עבודה טובה מאוד במענה לשאלה: עם Python, אתה צריך להרכיב הרבה חתיכות כדי לעשות מה שאתה רוצה. המצביעים הללו ללא ספק יהיו שימושיים מאוד לכל מי שרוצה לעשות סטטיסטיקה / דוגמנות וכו '. עם פייתון. תודה לכולם!
@ars בבקשה אתה יודע מה הדרך הטובה ביותר להשתמש בפייתון עם Windows?
@StéphaneLaurent בדרך כלל אני מתקין את החלקים השונים בעצמי, אך לשם התחלה / התקנה מהירים, כדאי לשקול: [pythonxy] (http://code.google.com/p/pythonxy/).
סקריפט זה מתקין רבות מהספריות שצוטטו לעיל: http://fonnesbeck.github.com/ScipySuperpack/
Pythonxy זה נחמד אבל זה יכול להיות מעצבן אם אתה רוצה לעשות חישובים גדולים מכיוון שהוא זמין רק ל -32 ביט. להלן קבצים בינאריים לא רשמיים להתקנת חבילות פיתון רבות. הם יכולים להיות שימושיים למדי אם תחליט לעבוד תחת חלונות. http://www.lfd.uci.edu/~gohlke/pythonlibs/ @StéphaneLaurent
מישהו צריך ליצור קיקסטארטר לאפליקציית GUI דמוי פיתון לצורך ביצוע סטטיסטיקה עם כל הכלים האלה המובנים. אם אצטרך להשתמש בסטטה עוד דקה, אני פשוט עלול להרוג מישהו ...
האם ["rpy2"] (http://rpy2.bitbucket.org/) מוסתר אי שם שם?זה מרגיש חיוני אם אתה רוצה להפעיל R מ- python
כן .. אתה יכול להפעיל R מ- python, בקלות יחסית, באופן מקורי או דרך ספריות אחרות.נראה שהטיעון העיקרי עבור R הוא שרוב הפונקציות בהכרח כבר ארוזות ב- R או זמינות ב- CRAN.לפייתון יש גם ספיידר, אנקונדה, למרות שפייטון, מחברות Jupyter ... ובימים אלה הייתי מצפה שעם הפופולריות של פיתון, רוב הפונקציות הזמינות ב- R כבר כנראה זמינות בפייתון. נראה שהתשובות הקודמות הן ממש מזמן.תוהה אם R עדיין עדיף על פייתון .. האם זה יותר על שווה?
גם לאלו מכם שממליצים בחום על R, האם ניסיתם יכולות תכנות של Pythons OO?האם לא משתמש ביכולות ה- OO בפייתון, בעצם נותן לו יכולות דומות כמו R?
כיצד משתווה לארי ל- [xarry] (http://xarray.pydata.org/en/stable/why-xarray.html)?
תיאנו די מיושן.רוב האנשים משתמשים ב- Tensorflow כעת.
#2
+144
gappy
2011-10-13 21:41:40 UTC
view on stackexchange narkive permalink

כפלטפורמה מספרית ותחליף ל- MATLAB, Python הגיע לבגרות לפני 2-3 שנים לפחות, וכעת הוא הרבה יותר טוב מ- MATLAB מבחינות רבות. ניסיתי לעבור לפייתון מ- R בערך באותה תקופה ונכשלתי כישלון חרוץ. יש פשוט יותר מדי חבילות R בהן אני משתמש על בסיס יומי שאין להן מקבילה לפייתון. היעדר ggplot2 מספיק בכדי להיות סטופר, אבל יש הרבה יותר. בנוסף לכך, ל- R תחביר טוב יותר לניתוח נתונים. שקול את הדוגמה הבסיסית הבאה:

פייתון :

  results = sm.OLS (y, X) .fit ()  

R :

  תוצאות <- lm (y ~ x1 + x2 + x3, data = A)  

מה לדעתך יותר אקספרסיבי? ב- R, אתה יכול לחשוב במונחים של משתנים, ויכול להרחיב בקלות מודל, למשל,

  lm (y ~ x1 + x2 + x3 + x2: x3, data = A) 

בהשוואה ל- R, Python היא שפה ברמה נמוכה לבניית מודלים.

אם היו לי פחות דרישות לפונקציות סטטיסטיות מתקדמות וכבר קידדתי את Python על גדול יותר פרויקט, הייתי מחשיב את פייתון כמועמד טוב. הייתי שוקל זאת גם כאשר יש צורך בגישה עצם חשופה, או בגלל מגבלות מהירות, או מכיוון שחבילות R אינן מספקות יתרון.

לאלו שעושים סטטיסטיקה מתקדמת יחסית עכשיו , התשובה אינה מובהקת, ו לא . למעשה, אני מאמין שפייתון יגביל את הדרך בה אתה חושב על ניתוח נתונים. זה ייקח כמה שנים ומאמצים של שנת אדם רבים לייצר את תחליפי המודולים עבור 100 חבילות ה- R החיוניות, וגם אז, פייתון ירגיש כמו שפה שעליה הושתקו יכולות ניתוח נתונים. מכיוון ש- R כבר תפס את החלק היחסי הגדול ביותר של סטטיסטיקאים יישומיים בכמה תחומים, אני לא רואה שזה קורה בקרוב. עם זאת, זו מדינה חופשית ואני מכיר אנשים שעושים סטטיסטיקה ב- APL ו- C.

+1 אני פשוט אוהב את התגובה הזו בגלל הדגש ששמת על R כשפה סטטיסטית לעבודה עם נתונים באמצעות נוסחאות וכדומה. עם זאת, אני מצפה להשפעה חיובית רבה של פנדות (בשילוב עם מודלים סטטיסטיים) בקהילת פייתון.
בקהילת פיתון, patsy נותן מענה לצורך ב"נוסחה ", אותה אתה מתאר, ולעיתים משפר את מה שמציעה R: http: //patsy.readthedocs.org/en/v0.1.0/index.html מה נחמד בפייתון הוא שכל ההיבטים הללו מטופלים באופן אורתוגונלי. פנדות ידאגו לסידורי זמן ולייצוג מסגרות נתונים / סדרות. סבלנות לנוסחאות. קהה לייצוג מערך ולקטוריזציה. דוגמאות סטטיסטיות עוטף. קלוש לאופטימיזציה ולחבורה של דברים אחרים. התוצאה היא ממשקים נקיים יותר. R, לעומת זאת, הוא בוגר יותר, אבל הוא כדור שיער. ../ ..
../ .. אני חושב שבטווח הארוך הכוחות ידחקו לכיוון של יותר ויותר אינטגרציה של פיתון ותגלו שזה יהפוך למתחרה למדי ל- R. ניקוי נתונים ב- R הוא כזה PIA לעומת Python, ו זה אף פעם לא חלק של מה בכך. - [blais] (http://stats.stackexchange.com/users/13247/blais)
אני מעדיף פיתון לכריית טקסטים ולקידוד אינטנסיבי אחר ואילו למטרות גרפיות וסטטיסטיות, האמת, אני לא אראה את עצמי עובר לשום פלטפורמה אחרת מ- R. אבל קידוד בפייתון הוא מהנה וכשפת תכנות מן המניין, אני לא לא רואה שום נזק בלימוד זה יחד עם R ו- Matlab.
כעדכון: הדוגמא הראשונה בתיעוד statsmodels היא כעת `results = smf.ols ('Lottery ~ Literacy + np.log (Pop1831)', data = dat) .fit () '. Statsmodels עדיין נמצא הרחק מאחור של חבילות סטטיסטיות אחרות כמו R מבחינת הכיסוי, אבל יש יותר ויותר דברים שאתה יכול לעשות בפייתון לפני שתצטרך לתפוס שפה אחרת או חבילה סטטיסטית. (GEE ו- Mixed יהיו במהדורה הבאה.)
"מה שנחמד בפייתון הוא שכל ההיבטים הללו מטופלים אורתוגונלית ...". אני לא מסכים במספר סעיפים. יש חפיפה משמעותית בין מודלים קהות, סקיפי, סטטיסטיות. העיצוב של R הוא הרבה יותר מודולרי וכלכלי. חוץ מזה, בעיקר לא בכל החידושים הרעיוניים בשפות מכוונות נתונים (לא רק נוסחאות, אלא גם מסגרות נתונים, דקדוק גרפיקה, תואר כדקדוק של מדליות, knitr, ודקדוק הנתונים המתמשך של dplyr) מקורם ב- R. קהילת הפיתון נראית תמיד צעד מאחור וממוקדת מדי בביצועים.
@gappy: זה בגלל שפיתון הוא שפת תכנות כללית, ויש הרבה שימושים אחרים שדורשים ביצועים.זה לא מפתיע שזה מסתנן לקהילת הסטטיסטיקה של פיתון.חוץ מזה יש בימינו כל כך הרבה קריאות לניתוח נתונים גדולים (גם אם זה אומר מערכי נתונים של 2 ג'יגה-בייט במחשב נייד), עד שניתן להבין שקהילה סטטיסטית רוצה להתמקד ביעילות.
#3
+95
Josh Hemann
2010-08-25 10:19:47 UTC
view on stackexchange narkive permalink

ראשית, תן לי לומר שאני מסכים עם התשובה של ג'ון די קוק: פייתון אינה שפה ספציפית לתחום כמו R, ובהתאם לכך, יש הרבה יותר שתוכל לעשות עם זה בהמשך הדרך. כמובן, R להיות DSL פירושו שהאלגוריתמים האחרונים שפורסמו ב- JASA יהיו כמעט בוודאות ב- R. אם אתה עושה בעיקר עבודה אד-הוק ורוצה להתנסות בטכניקת הרגרסיה האחרונה של לאסו, נניח, R קשה לנצח. אם אתה עושה יותר עבודות אנליטיות ייצור, משתלב בתוכנות וסביבות קיימות, ודואג למהירות, להרחבה ולתחזוקה, פייתון ישמש אותך הרבה יותר טוב.

שנית, ars נתן תשובה נהדרת עם קישורים טובים. להלן מספר חבילות נוספות הנראות בעיני חיוניות לעבודה אנליטית בפייתון:

  • matplotlib עבור גרפיקה יפהפייה באיכות פרסום.
  • IPython לקונסולת Python אינטראקטיבית משופרת. חשוב לציין, IPython מספקת מסגרת חזקה למחשוב אינטראקטיבי ומקביל בפייתון.
  • Cython לכתיבה קלה של סיומות C בפייתון. חבילה זו מאפשרת לך לקחת חלק מקוד פייתון אינטנסיבי מבחינה חישובית ולהמיר אותו בקלות לתוסף C. לאחר מכן תוכל לטעון את סיומת C כמו כל מודול Python אחר אך הקוד יפעל מהר מאוד מכיוון שהוא נמצא ב- C.
  • PyIMSL Studio לאוסף של מאות של אלגוריתמים מתמטיים וסטטיסטיים המתועדים ונתמכים ביסודיות. אתה יכול להתקשר לאותם אלגוריתמים בדיוק מ- Python ו- C, כמעט עם אותו API ותקבל את אותן התוצאות. גילוי מלא: אני עובד על מוצר זה, אבל אני גם משתמש בו הרבה.
  • xlrd לקריאה בקבצי Excel בקלות.

אם אתה רוצה IDE / מסוף אינטראקטיבי דמוי MATLAB, עיין ב Spyder, או התוסף PyDev עבור Eclipse.

עוד תשובה נהדרת! PyIMSL Studio נשמע מעניין, חבל שהוא לא קוד פתוח. יש חפיפה מסוימת עם NumPy / SciPy. בכל מקרה, אני חושב שאלה היו טיפים טובים לכל מי שרוצה להרכיב את שולחן העבודה הסטטיסטי של פייתון!
זה בחינם כמו בבירה (לשימוש לא מסחרי), אבל אבוי, לא חופשי כמו בדיבור.
R אינו DSL במובן הרגיל של המונח. זו שפת תכנות מלאה ומלאת טיורינג.
@hadley: אולי אני משתמש ב" DSL "באופן עמוק מדי, אך לשם מה זה שווה, דף הוויקיפדיה ב- DSL מפרט במפורש S + ו- R כדוגמאות ל- DSL ול- Python כשפת מטרה כללית. ראה http://en.wikipedia.org/wiki/Domain-specific_language. באותה המידה, SAS הוא טיורינג-שלם (רק אם משתמשים ברכיב המאקרו IML), אך בקושי הייתי קורא לזה שפה שלמה במובן המעשי. אני מוצא ש- R לא יסולא בפז בעבודתי, אך אני מנסה לקודד בעזרת שפות כלליות ככל האפשר ולא לנסות לעשות הכל ב- R (או באקסל לצורך העניין).
אני חושב שזה לא הוגן לכלול את R ו- S באותה רשימה כמו אותן שפות אחרות בויקיפדיה - אין שום דבר שאתה לא יכול לעשות ב- R שאתה יכול לעשות בפייתון. כמובן שיש הרבה דברים שמתאימים יותר לשפת תכנות אחרת, אך הדבר נכון גם לגבי פייתון.
אני לא יכול לראות את המוזכרים במאמר WP בנושא DSL. נראה כי דוגמה סטטיסטית נכונה יותר היא באגים / זינוק. אוסיף אותם.
אהה, האדלי הסיר את R ו- S + מדף הוויקיפדיה באותו יום שהחלפנו הערות, 13 באוקטובר 2011. לכן, לעתים קרובות אני שומע את המנטרה "R פותחה על ידי ועבור סטטיסטיקאים" ככוח היסוד שלה. כנראה שעכשיו זו גם שפה למטרות כלליות ...
ובכן, האם אוכל לקבל קוד מרובה הליכים עם R?קלט / פלט אסינכרוני ברשת?תאמין לי, מקרי השימוש הללו מתעוררים למעשה במחשוב מדעי.R הוא לדעתי DSL.זה חזק בסטטיסטיקה, ורע ברוב הדברים האחרים.
@hadley: סביר להניח שאתה צריך להסיר סקריפטים של מעטפת, PostScript, HTML + CSS3, [תבניות MediaWiki ועוד] (http://beza1e1.tuxen.de/articles/accidentally_turing_complete.html) גם מאותו דף.
אני מגלה שבייצור, אם הישן לא עושה את העבודה, לפעמים החדש עושה זאת.וזה לא שהיסודות לא נאפים גם ב- R.
@hadley המצטט את ויקיפדיה: * "שפה ספציפית לתחום (DSL) היא שפת מחשב המתמחה בתחום יישומי מסוים. זאת בניגוד לשפה ייעודית כללית (GPL), הניתנת להחלה רחבה בכל התחומים, וחסרה תכונות מיוחדות.עבור תחום מסוים. "* קשה להצדיק R ו- S + אינם נופלים בתחום ההגדרה הזו.
אני אוהב פיתון ומשתמש בו, אבל אם R הוא DSL ופייתון לא, מדוע אני עדיין נאבק גם היום למצוא חבילה טובה שיכולה פשוט להתאים ל- OLS עם מספר רב של תגובות ולקבל סטטיסטיקה ראויה.זה אמור להיות מסוגל להחליק את כנפיו לכל מקום.יש כמה דברים שהבשילו בפייתון ויש דברים אחרים שהבשילו ב- R. היום, אני חושב שזה הצטרפות לדברים למטרה שכן R ופיתון הם בסך הכל כלי לביצוע עבודה כלשהי.
#4
+61
csgillespie
2010-08-12 15:59:17 UTC
view on stackexchange narkive permalink

אני לא חושב שיש שום טענה שמגוון החבילות הסטטיסטיות ב- cran ו- Bioconductor עולה בהרבה על כל מה שמוצע משפות אחרות, אולם זה לא הדבר היחיד שיש לקחת בחשבון.

במחקר שלי אני משתמש ב- R כשאני יכול אבל לפעמים R פשוט איטי מדי. לדוגמה, הפעלת MCMC גדולה.

לאחרונה שילבתי פייתון ו- C בכדי להתמודד עם בעיה זו. סיכום קצר: התאמת מודל אוכלוסיה סטוכסטי גדול עם ~ 60 פרמטרים והסקת כ -150 מדינות סמויות באמצעות MCMC.

  1. קרא את הנתונים בפייתון
  2. בנה את מבני הנתונים C בפייתון באמצעות ctypes.
  3. שימוש בפייתון עבור loop, התקשר לפונקציות C שעדכנו פרמטרים וחישבו את הסבירות.

חישוב מהיר הראה שהתוכנית הוציאה 95% בפונקציות C. עם זאת, לא הייתי צריך לכתוב קוד C כואב כדי לקרוא נתונים או לבנות מבני נתונים C.


אני יודע שיש גם rpy, שם פיתון יכול לקרוא R פונקציות. זה יכול להיות שימושי, אבל אם אתה "סתם" עושה סטטיסטיקה אז הייתי משתמש ב- R.

הכנסת תקע חסר בושה ל- Rcpp :)
סקרן אם ניסית את PyMC ואיך הביצועים משתווים (ביחס לפיתון / C) עבור הדגמים שלך.
@ars: במקרה שלעיל, כל איטרציה (של 10 ^ 8 איטרציות) כללה פתרון של 5 ODEs. זה באמת היה צריך להיעשות ב- C. שאר הקוד היה פשוט למדי ולכן קוד C היה פשוט. היישום שלי לא היה סטנדרטי ולכן PyMC לא היה ישים - גם זה היה לפני שנתיים.
#5
+40
Jeromy Anglim
2010-08-12 15:58:37 UTC
view on stackexchange narkive permalink

הדיונים הבאים של StackOverflow עשויים להיות שימושיים

כל הדיונים הללו הוסרו :-(. אולי צריך להסיר גם את התשובה הזו?
זה עצוב. עדכנתי את הקישורים להתייחסות לעותקי מכונות דרך חזרה.
#6
+36
Gael Varoquaux
2011-02-05 16:49:46 UTC
view on stackexchange narkive permalink

לא ראיתי את scikit-learning המוזכר במפורש בתשובות לעיל. זו חבילת פייתון ללימוד מכונה בפייתון. זה צעיר למדי אך צומח במהירות רבה (הצהרה: אני מפתח scikit-learning). המטרות הן לספק כלים אלגוריתמיים סטנדרטיים ללימוד מכונה בממשק מאוחד עם דגש על מהירות ושימושיות. ככל הידוע לי, אינך יכול למצוא דבר דומה במתלאב. הנקודות החזקות הן:

Matlab הוא כלי נהדר, אבל בעבודתי, scipy + scikit-learning מתחיל לתת לי יתרון על Matlab מכיוון שפייתון עושה עבודה טובה יותר עם זיכרון בשל השקפתו (ויש לי נתונים גדולים), ומכיוון שה- scikit-learning מאפשר לי להשוות בקלות רבה בין גישות שונות.

#7
+29
John D. Cook
2010-08-12 17:43:41 UTC
view on stackexchange narkive permalink

יתרון אחד במעבר לפייתון הוא האפשרות לעשות יותר עבודה בשפה אחת. Python הוא בחירה סבירה לכפיפת מספרים, כתיבת אתרי אינטרנט, סקריפטים אדמיניסטרטיביים וכו '. אם אתה מבצע את הנתונים הסטטיסטיים שלך ב- Python, לא תצטרך להחליף שפות כדי לבצע משימות תכנות אחרות. ב- 26 בינואר 2011, Microsoft Research הכריזה על Sho, סביבה חדשה מבוססת פיתון לניתוח נתונים. עדיין לא הייתה לי הזדמנות לנסות את זה, אבל זה נשמע כמו אפשרות מעניינת אם ברצונך להפעיל את Python וגם לקיים אינטראקציה עם ספריות .NET.

עשיתי הרבה ריסוק מספרים, אתר אחד וכמה סקריפטים ניהוליים ב- R והם עובדים די נחמד.
#8
+28
Griffith Rees
2011-09-13 21:05:45 UTC
view on stackexchange narkive permalink

אולי תשובה זו מרמה, אך נראה שזה מוזר שאיש לא הזכיר את פרויקט rpy, המספק ממשק בין R ו- Python. אתה מקבל ממשק API פיתוני לרוב הפונקציונליות של R תוך שמירה על התחביר (הייתי טוען יותר נחמד), עיבוד נתונים ובמקרים מסוימים מהירות של פייתון. אין זה סביר שלפייתון יהיו אי פעם כמה כלים סטטיסטיים של קצה מדמם כמו R, רק מכיוון ש- R הוא dsl וקהילת הסטטיסטיקה מושקעת יותר ב- R מאשר בכל שפה אחרת.

אני רואה בכך אנלוגי ל שימוש ב- ORM למינוף היתרונות של SQL, תוך מתן פייתון להיות פייתון ו- SQL להיות SQL.

חבילות שימושיות אחרות במיוחד עבור מבני נתונים כוללות:

  • pydataframe משכפל data.frame וניתן להשתמש בו עם rpy. מאפשר לך להשתמש בסינון ובתפעול כמו R.
  • pyTables משתמש בסוג הנתונים המהיר hdf5 שמתחת, קיים כבר גילאים
  • h5py גם hdf5, אך מכוון במיוחד לשיתוף פעולה עם קהות חושים
  • פנדות פרויקט נוסף שמנהל data.frame כמו נתונים, עובד עם rpy, pyTables ו- numpy
תמיד מצאתי רפי מרושל לעבוד איתו. זה דורש שורות גדולות של קודים עם כמה פונקציות פשוטות, למשל.
אולי התוסף rmagic עבור IPython (כפי שציין @CarlSmith) יכול להקל על העבודה עם rpy2? ראה http://ipython.org/ipython-doc/dev/config/extensions/rmagic.html.
#9
+26
Carl Smith
2012-07-24 06:09:46 UTC
view on stackexchange narkive permalink

בכל אופן אין צורך לוותר על R עבור פייתון. אם אתה משתמש ב- IPython עם ערימה מלאה, יש לך סיומות R, Octave ו- Cython, כך שתוכל להשתמש בשפות האלה בקלות ובנקייה במחברות ה- IPython שלך. יש לך גם תמיכה בהעברת ערכים בינם לבין מרחב השמות שלך בפייתון. אתה יכול להפיק את הנתונים שלך כמגרשים, באמצעות matplotlib, וכביטויים מתמטיים שניתנו כראוי. יש טונות של תכונות אחרות, ואתה יכול לעשות את כל זה בדפדפן שלך.

IPython עשתה דרך ארוכה :)

#10
+26
Fomite
2011-08-15 18:52:43 UTC
view on stackexchange narkive permalink

ברצוני לומר שמנקודת מבטו של מישהו הנשען במידה רבה על מודלים לינאריים לצורך עבודתי הסטטיסטית, ואוהב את פייתון עבור היבטים אחרים של עבודתי, הייתי מאוכזב מאוד מפייתון פלטפורמה לעשות הכל חוץ מסטטיסטיקה בסיסית למדי.

לדעתי ל- R יש הרבה יותר תמיכה מהקהילה הסטטיסטית, הרבה יותר טוב ליישם מודלים ליניאריים, ולהיות גלוי לב מהצד הסטטיסטי, אפילו עם מצוין הפצות כמו Enthought, Python מרגיש קצת כמו המערב הפרוע.

ואלא אם אתה עובד סולו, הסיכויים שיש לך משתפי פעולה המשתמשים ב- Python לסטטיסטיקה, בשלב זה, הם די קלושים.

#11
+26
fonnesbeck
2011-10-13 22:34:22 UTC
view on stackexchange narkive permalink

אני ביוסטטיסטיקאי במהותו חנות R (~ 80 אנשים משתמשים ב- R ככלי העיקרי שלהם). ובכל זאת, אני מבלה כ- 3/4 מזמני בעבודה בפייתון. אני מייחס זאת בעיקר לעובדה שעבודתי כוללת גישות של למידה סטטיסטית בייסיאנית ומכונה. פייתון פוגע קרוב יותר לנקודה המתוקה של ביצועים / פרודוקטיביות מאשר ל- R, לפחות בשיטות סטטיסטיות איטרטיביות או מבוססות סימולציה. אם הייתי מבצע ANOVAS, רגרסיות ובדיקות סטטיסטיות, אני בטוח שהייתי משתמש בעיקר ב- R. רוב מה שאני צריך, עם זאת, אינו זמין כחבילה R משומרת.

+1 להבחנה באיזה תחום סטטיסטיקה אתה עובד. ישנם תחומי מחשוב סטטיסטיים (למשל ניתוח טקסט לא מובנה וראיית מחשב) שקיימת פונקציונליות רבה בפייתון, ופייתון הוא לכאורה השפה הפרטית באותם תת תחומים. אני חושב שאיפה שקהילת פייתון צריכה להתעדכן היא לשפר את מבני הנתונים והסמנטיקה סביב הדוגמנות הסטטיסטית הקלאסית שהעיצוב של R כל כך טוב בהם. מפתחי scikits.statsmodels מתקדמים מאוד בחזית זו: http://scikits.appspot.com/statsmodels
#12
+19
Adam
2011-10-13 00:40:10 UTC
view on stackexchange narkive permalink

מה שאתה מחפש נקרא Sage: http://www.sagemath.org/

זהו ממשק מקוון מצוין לשילוב בנוי היטב של Python כלים למתמטיקה.

החלק המבריק בסייג הוא שהוא למעשה האיחוד של מספר כלים נהדרים בחינם למתמטיקה, סטטיסטיקה, ניתוח נתונים, וכו '. זה יותר מסתם פייתון; יש לו גישה ל- R, maxima, GLPK, GSL, ועוד.
#13
+18
pythOnometrist
2013-04-06 01:59:03 UTC
view on stackexchange narkive permalink

Rpy2 - play with R stay in Python...

Further elaboration per Gung's request:

Rpy2 documentation can be found at http://rpy.sourceforge.net/rpy2/doc-dev/html/introduction.html

From the documentation,The high-level interface in rpy2 is designed to facilitate the use of R by Python programmers. R objects are exposed as instances of Python-implemented classes, with R functions as bound methods to those objects in a number of cases. This section also contains an introduction to graphics with R: trellis (lattice) plots as well as the grammar of graphics implemented in ggplot2 let one make complex and informative plots with little code written, while the underlying grid graphics allow all possible customization is outlined.

Why I like it:

I can process my data using the flexibility of python , turn it into a matrix using numpy or pandas and do the computation in R, and get back r objects to do post processing. I use econometrics and python simply will not have the bleeding edge stats tools of R. And R will unlikely ever be as flexible as python. This does require you to understand R. Fortunately, it has a nice developer community.

Rpy2 itself is well supported and the gentleman supporting it frequents the SO forums. Windows installation maybe a slight pain - https://stackoverflow.com/questions/5068760/bizzarre-issue-trying-to-make-rpy2-2-1-9-work-with-r-2-12-1-using-python-2-6-un?rq=1 might help.

ברוך הבא לאתר, @pythOnometrist. אני חושד שזו תרומה מועילה. אכפת לך לתת סיכום קצר של Rpy2, כך שהקוראים יוכלו להחליט אם זה מה שהם מחפשים?
#14
+17
Turukawa
2010-08-27 15:10:36 UTC
view on stackexchange narkive permalink

אני משתמש בפייתון לניתוח סטטיסטי וחיזוי. כפי שצוין על ידי אחרים לעיל, Numpy ו- Matplotlib הם סוסי עבודה טובים. אני משתמש גם ב- ReportLab להפקת פלט PDF.

כרגע אני מסתכל על Resolver ו- Pyspread שהם יישומי גליונות אלקטרוניים דמויי Excel המבוססים על Python. Resolver הוא מוצר מסחרי אך Pyspread הוא עדיין קוד פתוח. (מתנצל, אני מוגבל רק לקישור אחד)

שוב כמה כלים מעניינים. ידעתי על Numpy, Matplotlib ו- ReportLab, אבל Pyspread נראה כמו רעיון מעניין. לפחות הייתי רוצה להקליד ביטויי פיתון בתאי גיליון אלקטרוני. למרות שזה לא פותר את כל הבעיות האפשריות, זה יכול להיות טוב לאב טיפוס ולשחק עם נתונים.
+1 וואו גיליונות אלקטרוניים של פיתון! עוד לא שמעתי על אלה. תמיד רציתי ש- OpenOffice / LibreOffice באמת יאמץ וישלב סקריפטים של פיתון בתוכנת הגיליונות האלקטרוניים שלהם.
#15
+15
kgarten
2011-02-06 00:31:42 UTC
view on stackexchange narkive permalink

סקירה מעולה עד כה. אני משתמש בפיתון (במיוחד scipy + matplotlib) כתחליף ל- matlab מאז 3 שנים שעבדתי באוניברסיטה. לפעמים אני עדיין חוזר כי אני מכיר ספריות ספציפיות, למשל. חבילת הגלים של matlab היא מדהימה לחלוטין.

אני אוהב את הפצה http://enthought.com/ של פיתון. זה מסחרי, אך עם זאת בחינם למטרות אקדמיות, וככל הידוע לי הוא קוד פתוח לחלוטין. כיוון שאני עובד עם הרבה סטודנטים, לפני שהשתמשתי במחשבה זה היה לפעמים מטריד אותם להתקין מטומטם, סקיפי, ipython וכו '. Enthought מספק מתקין עבור Windows, Linux ו- Mac.

שתי חבילות אחרות ראוי להזכיר:

  1. ipython (מגיע כבר עם מחשבה) מעטפת מתקדמת נהדרת. מבוא טוב נמצא ב- showmedo http://showmedo.com/videotutorials/series?name=PythonIPythonSeries

  2. nltk - ערכת הכלים לשפה הטבעית http://www.nltk.org/ חבילה נהדרת למקרה שתרצו לעשות קצת סטטיסטיקה / למידת מכונה על כל קורפוס.

#16
+12
Steve Lawford
2012-10-08 19:26:14 UTC
view on stackexchange narkive permalink

זו שאלה מעניינת, עם כמה תשובות נהדרות.

אולי תמצא איזה דיון שימושי במאמר שכתבתי עם רוזלין בילינה. הגרסה הסופית נמצאת כאן: http://www.enac.fr/recherche/leea/Steve%20Lawford/papers/python_paper_revised.pdf (מאז היא הופיעה, כמעט בצורה זו, כ"פייתון " למחקר מאוחד באקונומטריה וסטטיסטיקה ", בסקירות אקונומטריות (2012), 31 (5), 558-591).

#17
+10
JMS
2011-02-06 10:09:24 UTC
view on stackexchange narkive permalink

אולי לא קשור ישירות, אבל ל- R יש סביבת GUI נחמדה להפעלות אינטראקטיביות (עריכה: ב- Mac / Windows). IPython הוא טוב מאוד, אך עבור סביבה קרובה יותר ל- Matlab תוכלו לנסות את Spyder או IEP. היה לי מזל טוב באיחור של שימוש ב- IEP, אך ספיידר נראה מבטיח יותר.

IEP: http://code.google.com/p/iep/

Spyder: http://packages.python.org/spyder/

ואתר IEP כולל השוואה קצרה של תוכנות קשורות: http: / /code.google.com/p/iep/wiki/Alternatives

#18
+9
Wojciech Walczak
2014-05-07 21:36:30 UTC
view on stackexchange narkive permalink

אף אחד לא הזכיר את כתום לפני כן:

כריית נתונים באמצעות תכנות חזותי או תסריט פייתון. רכיבים ללימוד מכונה. תוספות לביואינפורמטיקה וכריית טקסטים. ארוז בתכונות לניתוח נתונים.

אני לא משתמש בו על בסיס יומי, אבל זה חובה לראות עבור כל מי שמעדיף GUI על פני ממשק שורת פקודה.

גם אם אתה מעדיף את האחרונים, כתום הוא דבר טוב להכיר, מכיוון שאתה יכול לייבא בקלות פיסות תפוז לתסריטים של פייתון שלך למקרה שאתה זקוק לפונקציונליות מסוימת שלו.

#19
+8
pnewhook
2011-10-13 04:52:18 UTC
view on stackexchange narkive permalink

עלי להוסיף צעקה ל- Sho, סביבת המחשוב המספרית הבנויה על IronPython. אני משתמש בזה עכשיו לשיעור למידת מכונות בסטנפורד וזה היה מאוד מועיל. זה נבנה בחבילות אלגברה ליניאריות וביכולות תרשים. בהיותך .Net קל להרחיב אותו עם C # או כל שפת .Net אחרת. היה לי הרבה יותר קל להתחיל איתו, להיות משתמש ב- Windows, מאשר Python ו- NumPy ישר.

#20
+8
padawan
2013-03-17 00:13:02 UTC
view on stackexchange narkive permalink

מצאתי כאן מבוא נהדר לפנדות שאני מציע לבדוק. Pandas הוא ערכת כלים מדהימה ומספקת את יכולות ניתוח הנתונים ברמה הגבוהה של R עם הספריות הנרחבות ואיכות הייצור של Python.

פוסט בבלוג זה מעניק מבוא נהדר לפנדות מנקודת מבט של מתחיל שלם:

http://manishamde.github.com/blog/2013/03/07/pandas-and-python-top-10/

האם אתה יכול בבקשה לכתוב כמה מילים על איכויות שהופכות אותו ל"מעולה ", כך שהקוראים יוכלו לקבוע מראש אם צפייה בו מתאימה להם?
מצטער. בדיוק הבנתי שצירפתי את הקישור הלא נכון בפוסט המקורי שלי.
#21
+7
JKP
2012-08-10 02:13:57 UTC
view on stackexchange narkive permalink

שים לב של- SPSS Statistics יש ממשק פייתון משולב (גם R). אז אתה יכול לכתוב תוכניות פייתון המשתמשות בהליכי סטטיסטיקה ולהפיק את פלט הסטטיסטיקה הרגיל המעוצב יפה או להחזיר תוצאות לתוכנית שלך לעיבוד נוסף. לחלופין, תוכל להפעיל תוכניות Python בזרם הפקודה Statistics. אתה עדיין צריך לדעת את שפת הפקודה סטטיסטיקה, אך תוכל לנצל את כל ניהול הנתונים, פלט המצגות וכו 'שהסטטיסטיקה מספקת וכן את ההליכים.

#22
+6
Learner
2015-05-15 12:15:02 UTC
view on stackexchange narkive permalink

השוואה אחרונה מ- DataCamp מספקת תמונה ברורה לגבי R ו- Python.

השימוש בשתי השפות הללו בתחום ניתוח הנתונים. בדרך כלל משתמשים בפייתון כאשר יש לשלב את משימות ניתוח הנתונים עם אפליקציות אינטרנט או אם צריך לשלב קוד סטטיסטי במאגר ייצור. R משמש בעיקר כאשר משימות ניתוח הנתונים דורשות מחשוב עצמאי או ניתוח בשרתים בודדים.

מצאתי שזה כל כך שימושי ב בלוג הזה ואני מקווה שזה יעזור לאחרים להבין גם את המגמות האחרונות בשתי השפות הללו. ג'וליה עולה גם היא באזור. מקווה שזה יעזור!

#23
+6
Digio
2015-07-23 17:35:45 UTC
view on stackexchange narkive permalink

לפייתון יש דרך ארוכה לפני שניתן להשוות אותה ל- R. יש לה פחות חבילות מ- R ובאיכות נמוכה יותר. אנשים שעומדים ביסודות או מסתמכים רק על הספריות המותאמות אישית שלהם יכולים כנראה לעשות את עבודתם אך ורק בפייתון, אך אם אתה מישהו שזקוק לפתרונות כמותיים מתקדמים יותר, אני מעז לומר ששום דבר לא מתקרב ל- R שם בחוץ.

יש לציין גם שעד היום אין לפייתון IDE מדעי מתאים בסגנון Matlab השווה ל- R-Studio (בבקשה אל תגיד ספיידר) ואתה צריך לעבוד על הכל על המסוף. באופן כללי, כל חווית הפיתון דורשת כמות טובה של "חנון" שלרוב האנשים חסר להם ולא אכפת להם.

אל תבינו אותי לא נכון, אני אוהב את פייתון, זו למעשה השפה האהובה עלי , בניגוד ל- R, היא שפת תכנות אמיתית. ובכל זאת, כשמדובר בניתוח נתונים טהור אני תלוי ב- R, שהוא ללא ספק הפיתרון המיוחד והמפותח ביותר עד כה. אני משתמש בפייתון כשאני צריך לשלב ניתוח נתונים עם הנדסת תוכנה, למשל. צור כלי שיבצע אוטומציה בשיטות שתכננתי לראשונה בתסריט R מלוכלך. בהרבה מקרים אני משתמש ב- rpy2 כדי להתקשר ל- R מ- Python מכיוון שברוב המכריע של המקרים חבילות R כל כך הרבה יותר טובות (או בכלל לא קיימות ב- Python). בדרך זו אני מנסה להשיג את המיטב משני העולמות.

אני עדיין משתמש במטלב כלשהו לפיתוח אלגוריתמים טהור מכיוון שאני אוהב את התחביר והמהירות שלו בסגנון מתמטי.

#24
+6
Gene Burinsky
2016-04-06 07:38:23 UTC
view on stackexchange narkive permalink

אני מאמין שפייתון הוא שולחן עבודה מעולה בתחומי. אני עושה הרבה גירודים, התגוששויות נתונים, עבודות נתונים גדולות, ניתוח רשת, דוגמנות בייסיאנית וסימולציות. כל הדברים האלה בדרך כלל זקוקים למהירות וגמישות ולכן אני מוצא שפייתון יעבוד טוב יותר מ- R במקרים אלה. להלן מספר דברים על פייתון שאני אוהב (חלקם מוזכרים לעיל, נקודות אחרות אינן):

- תחביר ניקוי; קוד קריא יותר. אני מאמין שפייתון היא שפה מודרנית יותר ועקבית תחבירית.

ל- Python יש מחברת, Ipython וכלים מדהימים אחרים לשיתוף קוד, שיתוף פעולה, פרסום.

המחברת של iPython מאפשרת להשתמש ב- R בקוד ה- Python שלך, כך שתמיד אפשר לחזור ל- R.

-מהותית מהירה יותר ללא שימוש ב- C. שימוש ב- Cython, NUMBA, ושיטות אחרות לשילוב C יביאו את הקוד שלך למהירויות השוות לטהור C. זה, עד כמה שידוע לי, לא ניתן להשיג ב- R.

-Pandas, Numpy ו- Scipy מכה תקן R של המים. כן, יש כמה דברים ש- R יכולה לעשות בשורה אחת אך לוקח את פנדה 3 או 4. באופן כללי, עם זאת, פנדה יכולה להתמודד עם מערכי נתונים גדולים יותר, קלה יותר לשימוש ומספקת גמישות מדהימה ביחס לאינטגרציה עם פיתון אחרים. חבילות ושיטות.

-Python יציב יותר. נסה לטעון מערך נתונים של 2gig ל- RStudio.

-חבילה אחת מסודרת שלא נראית מוזכרת לעיל היא PyMC3 - חבילה כללית נהדרת עבור מרבית הדוגמניות של Bayesian. פִּיתוֹן. אם השתמשת אי פעם בפונקציות הגרפים של Matlab ו / או השתמשת ב- matplotlib ב- Python, אז תדע שהאפשרויות האחרונות בדרך כלל יכולות הרבה יותר מ- ggplot2.

עם זאת, אולי קל יותר ללמוד על R ואני משתמש בה לעתים קרובות במקרים בהם אני עדיין לא מכיר יותר מדי את הליכי הדוגמנות. במקרה זה, עומק הספריות הסטטיסטיות של R הוא ללא תחרות. באופן אידיאלי, הייתי מכיר את שניהם מספיק טוב כדי להיות מסוגל להשתמש לפי צורך.

#25
+5
Yu-Yang
2015-03-18 21:54:20 UTC
view on stackexchange narkive permalink

למי שצריך לעבוד תחת Windows, אנקונדה ( https://store.continuum.io/cshop/anaconda/) באמת עוזרת מאוד. התקנת חבילות תחת Windows הייתה כאב ראש. Anaconda מותקן, אתה יכול להגדיר סביבת פיתוח מוכנה לשימוש עם קו אחד.

לדוגמה, עם

  conda create -n stats_env python pip numpy pandas matplotlib scipy  

כל החבילות הללו יועברו ויותקנו באופן אוטומטי.

#26
  0
Adrian Keister
2020-04-01 01:58:47 UTC
view on stackexchange narkive permalink

חשבתי להוסיף תשובה עדכנית יותר מאלה שניתנו. אני בחור פיתון, דרך-דרך, והנה הסיבה:

  1. פייתון הוא בקלות התחביר האינטואיטיבי ביותר של כל שפת תכנות שאי פעם השתמשתי בה, למעט אולי LabVIEW. אני לא יכול לספור את מספר הפעמים שניסיתי פשוט 20-30 שורות קוד בפייתון, והן עבדו . זה בהחלט יותר ממה שניתן לומר על כל שפה אחרת, אפילו LabVIEW. זה גורם ל זמן פיתוח מהיר ביותר.

  2. פייתון הוא ביצועי. זה הוזכר בתשובות אחרות, אך הדבר חוזר על עצמו. אני מוצא שפייתון פותח מערכי נתונים גדולים באופן אמין.

  3. החבילות בפייתון משיגות במהירות את החבילות של R. אין ספק ששימוש בפייתון עלה במידה ניכרת על השימוש ב- R בשנים האחרונות, אם כי מבחינה טכנית טיעון זה הוא כמובן אוכלוסיית מודעות.

  4. יותר ויותר, אני מוצא שקריאות היא בין התכונות החשובות ביותר שקוד טוב יכול להחזיק, ופייתון היא השפה הקריאה ביותר אי פעם (בהנחה שאתה מקפיד על נוהלי קידוד טובים למדי, כמובן). חלק מהתשובות הקודמות ניסו לטעון ש- R הוא קריא יותר, אך הדוגמאות שהראו כולן מוכיחות את ההפך מבחינתי: פייתון הוא קריא יותר מ- R, וזה הרבה יותר מהר ללמוד. למדתי פייתון בסיסי בשבוע אחד!

  5. Lambda Labs Stack הוא כלי חדש יותר מ- Anaconda, וחד פעמי לדעתי. החיסרון: ניתן להתקין אותו רק באובונטו 16.04, 18.04 ו- 20.04, ונגזרות אובונטו בגרסאות אלה. הפוך: אתה מקבל את כל החבילות המואצות של GPU המנוהלות עבורך, עד למנהלי החומרה. אנקונדה לא עושה את זה. מחסנית Lambda Labs שומרת על מספרי גרסאות תואמים לאורך כל הדרך החל מגרסת Theano או Keras ועד גרסת מנהל ההתקן של NVIDIA GPU. כפי שאתה בטח מודע, זו לא משימה של מה בכך. כשמדובר בלימוד מכונה, פייתון הוא המלך, ידיים למטה. והאצת GPU היא דבר שרוב אנשי המקצוע נתונים מוצאים שהם לא יכולים להסתדר בלעדיו.

  6. לפייתון יש IDE מחושב במיוחד: PyCharm. לדעתי, זה מה שמפתחי פיתון רציניים צריכים להשתמש בהם - בהחלט לא מחברות Jupyter. בעוד שאנשים רבים משתמשים בקוד Visual Studio, אני מוצא ש- PyCharm הוא ה- IDE הטוב ביותר עבור Python. אתה מקבל את כל מה שאתה יכול למעשה - IPython, מסוף, כלי ניפוי באגים מתקדמים כולל מחשבון בזיכרון ושילוב בקרת קוד המקור.

  7. אנשים רבים אמרו שחבילות הסטטיסטיקה של Python אינן שלמות כמו R. אין ספק שזה עדיין נכון במקצת (אם כי ראה 3 לעיל). מצד שני, אני, למשל, לא נזקק לחבילות הסטטיסטיקה המתקדמות להפליא האלה. אני מעדיף לחכות לניתוח סטטיסטי מתקדם עד שאבין היטב את השאלה העסקית הנשאלת. פעמים רבות, אלגוריתם פשוט יחסית לחישוב מדד הוא הפתרון לבעיה, ובמקרה זה פייתון עושה כלי מעולה לחישוב מדדים.

  8. הרבה אנשים אוהבים לסמן את היכולת של R לעשות דברים חזקים בשורת קוד אחת בלבד. לדעתי זה לא טיעון נהדר. האם שורת קוד אחת ניתנת לקריאה? קוד אופייני נכתב פעם אחת, וקוראים אותו עשר פעמים! הקריאות נחשבת, כפי שמגדיר זאת זן הפיתון. אני מעדיף שיהיו לי כמה שורות של קוד פיתון קריא מאשר שורה קודנית אחת של קוד R (לא שאלה הן הבחירות היחידות, כמובן; אני רק רוצה להצביע על כך שפחות שורות קוד אינן שוות לקריאות גדולה יותר).

  9. אגב, אני פשוט לא יכול להתאפק להגיב על SAS, למרות שזה מעט מחוץ לנושא. כפי שאמרתי בנקודה קודמת, למדתי פייתון בסיסי בשבוע אחד. ואז ניסיתי את SAS. עשיתי את דרכי בערך שלושה פרקים בספר בן 11 פרקים על SAS, ולקח לי חודשיים! יתר על כן, בכל פעם שניסיתי משהו, זה מעולם לא עבד בפעם הראשונה. הייתי מאוד קורא לך לנטוש את SAS בהקדם האפשרי. יש לו תחביר מפותל ביותר, הוא לא סלחני במיוחד וכו '. הדבר היחיד הטוב שאפשר לומר עליו הוא שהיכולות הסטטיסטיות שלו שלמות כמו של R. Whoopty do.

אז הנה לך. פייתון כל הדרך!



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...