שְׁאֵלָה:
מה ההבדל בין נתונים בדידים לנתונים רציפים?
Albort
2010-07-20 08:53:55 UTC
view on stackexchange narkive permalink

מה ההבדל בין נתונים בדידים לנתונים רציפים?

ניסית קודם את גוגל? מבחינתי זה נותן את [זה] (https://web.archive.org/web/20130510121554/http://infinity.cos.edu/faculty/woodbury/stats/tutorial/Data_Disc_Cont.htm).
הנה סרטון נחמד שעונה על שאלתך. https://www.youtube.com/watch?v=MIX3ZpzEOdM
רק תחשוב דיגיטלי לעומת אנלוגי.אותו דבר - שמות שונים.
אני באמת לא יודע מה ההבדל בין נתונים "בדידים" ל"נתונים רציפים ".מסיבות מסוימות נראה שכיתות מבוא ממש נהנות לגרום לתלמידים לשנן כללים כדי להבדיל בין שני הדברים הללו.עד כמה שהצלחתי להבין, ההבדלים אינם בנתונים - אלא באופן בו אנו בוחרים לדגמן את הנתונים.
זו הייתה התוצאה המובילה בגוגל, @robingirard.
כל הנתונים הקיימים בפועל והפיזית, בין אם הם מאוחסנים בכתב, בקלטת, בדיסק או במוח הם נפרדים במרחב ובזמן לפחות כל עוד אנו מחזיקים את ה- QFT יותר בסיסי מאשר ניוטון, כלומר נתונים רציפים אינםבאמת קיים, אך ניתן להפיק אותו מנתונים נפרדים.
עשר תשובות:
#1
+64
walkytalky
2010-07-20 09:16:53 UTC
view on stackexchange narkive permalink

נתונים בדידים יכולים לקחת רק ערכים מסוימים. ייתכן שיש מספר אינסופי של ערכים אלה, אך כל אחד מהם נבדל ואין שטח אפור ביניהם. נתונים בדידים יכולים להיות מספריים - כמו מספר תפוחים - אך הם יכולים להיות קטגוריים - כמו אדום או כחול, או זכר או נקבה, או טובים או רעים.

נתונים רציפים חזק> אינם מוגבלים לערכים נפרדים מוגדרים, אך יכולים לתפוס כל ערך בטווח רציף. בין שני ערכי נתונים רצופים, ייתכן שיש אינסוף אחרים. נתונים רציפים הם תמיד מספריים במהותם.

לפעמים זה הגיוני ל להתייחס לנתונים בדידים כאל רציפים ולהיפך :

  • לדוגמא, משהו כמו גובה הוא רציף, אך לעתים קרובות לא ממש אכפת לנו מהבדלים זעירים, ובמקום זאת הוא מתגבש למספר פחים נפרדים - כלומר רק מדידת מטרים - -.

  • לעומת זאת, אם אנו סופרים כמויות גדולות של ישות נפרדת כלשהי
    - כלומר גרגרי אורז, או טרמיטים, או אגורות במשק - אנו עשויים לבחור שלא לחשוב על 2,000,006 ו -2,000,008 כעל ערכים שונים באופן מכריע אלא במקום כנקודות סמוכות על רצף משוער של

לפעמים זה יכול להיות שימושי ל להתייחס לנתונים מספריים כקטגוריים לדוגמא: תת משקל, נורמלי, השמנת יתר. בדרך כלל זהו רק סוג אחר של תקלות.

לעתים רחוקות הגיוני להחשיב נתונים קטגוריים כרציפים.

@walktalky כפי ש- @jeromy רומז, לפחות בפסיכולוגיה, על משתנים קטגוריים כמו חזרה לשאלות נחשבים לרוב לייצוג של תכונה בסיסית, כך שבמובן זה נתוני קטגוריות נתפסים לעיתים כרצופים.
@richiemorrisroe אפשר היה לברר לגבי ההבדל בין הנתונים לתכונה המשוערת, אבל כמובן שאתה צודק. כמה נקודות מעניינות מאוד הועלו בתגובה ל [שאלת המשך זו] (http://stats.stackexchange.com/questions/539/does-it-ever-make-sense-to-treat-categorical-data- כמו-רציף).
תודה על הקישור, התשובות הללו אכן מעניינות מאוד.
> "* יתכן שיש מספר אינסופי של ערכים אלה, אך כל אחד מהם נבדל ואין שטח אפור בין *" - זה בהחלט אפשרי לקבל התפלגות דיסקרטית עם ערכים מובחנים, ובכל זאת * , בכל שני ערכים נפרדים שתבחר, תמיד יש יותר ערכים ביניהם ('אזור אפור' במובן מסוים). הם לא עולים כל כך הרבה פעמים בפועל, אבל זה בהחלט אפשרי עבורם לעלות אמיתית; אכן אני יכול לחשוב על שתי דוגמאות מובחנות (אם קשורות) שיכולות להתעורר בקלות.
אז כדי להבהיר, גם אם היו לך 10 מיליארד שורות של נתוני Ohlc עבור נכס מניות, זה עדיין ייחשב בדיד?אבל אז לא יכול המחיר של נכס להיות בין 1 לאינסוף, איך לחשוב במצב מסוג זה?
#2
+23
Jeromy Anglim
2010-07-20 09:19:12 UTC
view on stackexchange narkive permalink

הנתונים תמיד נפרדים. בהינתן מדגם של ערכי n על משתנה, המספר המרבי של ערכים מובחנים שהמשתנה יכול לקחת הוא שווה ל- n . ראה ציטוט זה

כל רווחי המדגם בפועל נפרדים, ולכל המשתנים האקראיים הנצפים יש התפלגויות נפרדות. ההתפלגות הרציפה היא קונסטרוקציה מתמטית, המתאימה לטיפול מתמטי, אך לא נצפית באופן מעשי. E.J.G. Pitman (1979, עמ '1).

בדרך כלל מניחים שנתונים על משתנה נמשכים ממשתנה אקראי. המשתנה האקראי רציף על פני טווח אם יש אינסוף ערכים אפשריים שהמשתנה יכול לקחת בין שתי נקודות שונות בטווח. לדוגמה, גובה, משקל וזמן בדרך כלל מניחים שהם רציפים. כמובן, כל מדידה של משתנים אלה תהיה מדויקת לחלוטין ובמובן מסוים נפרדת.

כדאי להבחין בין משתנים מסודרים (כלומר, מסודרים), לא מסודרים (כלומר, נומינליים),
ומשתנים בדידים בינאריים.

ספרי לימוד מסוימים מבלבלים בין משתנה רציף לבין משתנה מספרי. לדוגמה, ציון במשחק מחשב הוא דיסקרטי למרות שהוא מספרי.

ספרי לימוד מסוימים מבלבלים בין משתנה יחס לבין משתנים רציפים. משתנה ספירה הוא משתנה יחס, אך הוא אינו רציף.

בפועל בפועל, לעיתים קרובות מתייחסים למשתנה כאל רציף כאשר הוא יכול לקבל מספר גדול מספיק של ערכים שונים.

הפניות

  • Pitman, EJG 1979. תיאוריה בסיסית כלשהי להסקה סטטיסטית. לונדון: צ'פמן והול. הערה: מצאתי את הציטוט בהקדמת פרק 2 לספרו של מוריי איטקין מסקנה סטטיסטית: גישה משולבת בייסיאנית / סבירות
גם הסתברות היא "קונסטרוקציה מתמטית" ולא "ניתנת לצפייה ישירה". האם זה אומר שההסתברות לא קיימת? בסך הכל, תשובה מעניינת זו נראית מבוססת על הנחת יסוד בלתי נשמעת כי הנתונים צריכים להיות מאופיינים בערכים שיש להם * ולא * בערכים שהמודל המתמטי מאפשר להם לקבל. האחרון הוא המאפיין המכריע, לא הראשון. כל זה מרמז שמה שחשוב בהבחנה המתמשכת / בדידה הוא * כיצד אנו חושבים על הנתונים * (כלומר כיצד אנו מודלים אותם).
יש אגדה קטנה וחכמה הממחישה את @whuber's point: Lord (1953), "על הטיפול הסטטיסטי במספרי כדורגל", * פסיכולוג אמריקאי *, ** 8 **, עמ '750-51.
תודה לך, @Scortchi. גרסאות אינטרנט זמינות באמצעות [חיפוש מלומדים בגוגל] (https://www.google.com/search?q=On+the+statistical+treatment+of+football+numbers). לורד מתייחס לתפיסה מוטעית, שעליה התדיינו בחריפות לפני 60 שנה, באיזו מידה "תורת המדידה" צריכה להשפיע (או אפילו להגביל את היקף הניתוח הסטטיסטי). הנקודה שלי הייתה שונה לגבי ההבחנה בין מבני מודל לתצפיות.
#3
+12
Neil McGuigan
2010-07-20 09:07:11 UTC
view on stackexchange narkive permalink

הטמפרטורות רציפות. זה יכול להיות 23 מעלות, 23.1 מעלות, 23.100004 מעלות.

סקס הוא דיסקרטי. אתה יכול להיות רק זכר או נקבה (בכל מקרה בחשיבה קלאסית). משהו שאתה יכול לייצג עם מספר שלם כמו 1, 2 וכו '

ההבדל חשוב מכיוון שאלגוריתמים סטטיסטיים וכריית נתונים רבים יכולים להתמודד עם סוג אחד אך לא אחר. למשל ברגרסיה קבועה, ה- Y חייב להיות רציף. ברגרסיה לוגיסטית ה- Y הוא דיסקרטי.

כשאתה מקליט טמפרטורה בדרגה הקרובה ביותר, זה יכול להיחשב בדיד - ואולי * צריך להתחשב כך בצורות ניתוח מסוימות. כמו כן, ברגרסיה "רגילה" (OLS?), $ Y $ לא צריך להיות רציף: רבים - ובעצם כל המאפיינים השימושיים שלו - חלים על סוגים רבים של נתונים נפרדים, אפילו תגובות בינאריות. מה שנקודות ונקודות הנגד הללו מתחילות להצביע על כך ש * נתונים * אינם בהכרח בדידים או רציפים, אלא * הליכים סטטיסטיים * הם בדידים או רציפים.
#4
+11
Subrato Mukherjee
2012-07-03 21:28:12 UTC
view on stackexchange narkive permalink

נתונים בדידים יכולים לקחת רק ערכים מסוימים.

דוגמה: מספר התלמידים בכיתה (לא יכול להיות לך חצי תלמיד).

נתונים רציפים הם נתונים שיכולים לקחת כל ערך (בטווח)

דוגמאות:

  • גובה האדם: יכול להיות כל ערך (בטווח הגבהים האנושיים), לא רק גבהים קבועים מסוימים,
  • זמן במרוץ: אתה יכול אפילו למדוד אותו לשברירי שנייה,
  • משקל של כלב,
  • אורך עלה,
  • משקלו של אדם,
תוכל גם לומר לנו מהיכן העתקת את התשובה: https://www.mathsisfun.com/data/data-discrete-continuous.html
מתואר יפה.
#5
+1
Tony
2011-05-16 07:19:18 UTC
view on stackexchange narkive permalink

במקרה של מסד נתונים, תמיד נשמור את הנתונים בדידים, אפילו אופי הנתונים הוא רציף. מדוע עלי להדגיש את אופי הנתונים? עלינו לקחת את הפצת הנתונים שיכולה לעזור לנו לנתח את הנתונים. אם אופי הנתונים הוא רציף, אני מציע לך להשתמש בהם על ידי ניתוח מתמשך.

קח דוגמה לרציפות ודיסקרטיות: MP3. אפילו סוג ה"צליל "הוא אנלוגיה, אם הוא מאוחסן בפורמט דיגיטלי. עלינו לנתח את זה תמיד בצורה אנלוגית.

#6
  0
Rafa_Mas
2017-08-30 11:01:44 UTC
view on stackexchange narkive permalink
מצד אחד, מבחינה מעשית אני מסכים עם התשובה של ג'רומי אנגלים. בסופו של דבר אנו עוסקים לרוב במשתנים בדידים - אם כי מבחינה תיאורטית הם רציפים - ויש לכך השפעה ממשית למשל על הסיווג. נזכר במאמרו של סטרובל המציין כי יערות אקראיים מוטים על משתנים בעלי נקודות חיתוך מרובות (דיוק גבוה יותר אך בעל אופי דומה). מנסיוני האישי רשתות עצביות הסתברותיות עשויות להוות הטיה גם כאשר משתנים מציגים דיוק שונה אלא אם הם מאותו סוג (כלומר, רציפים). מצד שני, מנקודת מבט תיאורטית הסיווג הקלאסי (למשל, רציף, דיסקרטי, נומינלי וכו ') הוא, IMHO, נכון. בהתאם אני חושב ששם המקור של המאמר של קווינלן המתאר את האלגוריתם M5, שהוא 'רגרסור', הוא בחירה מצוינת. כך שההגדרה וההשלכות של רציף לעומת בדיד רלוונטיים בהתאם ל"סביבה ".

התייחסויות:

קווינלן ג'יי אר (1992). למידה בשיעורים רצופים. בתוך: הוועידה המשותפת האוסטרלית החמישית בנושא AI. סידני (אוסטרליה), 343–348.

Strobl C., Boulesteix A.-L., Zeileis A., & Hothorn T. (2007). הטיה במדידת חשיבות משתנה ביער אקראי: איורים, מקורות ופתרון. BMC ביואינפורמטיקה, 8, 25. doi: 10.1186 / 1471-2105-8-25

#7
-1
Ahmad ibraheem
2013-11-20 21:18:25 UTC
view on stackexchange narkive permalink

נתונים בדידים לוקחים ערכים מסוימים, בעוד שנתונים רציפים אינם מוגבלים לערכים נפרדים.

נתונים בדידים נבדלים ואין שטח אפור ביניהם, בעוד נתונים רציפים תופסים ערך כלשהו על פני ערך נתונים רציף.

#8
-3
manuella
2015-02-04 01:54:22 UTC
view on stackexchange narkive permalink

נתונים בדידים הם יכולים לקחת ערכים מסוימים. הם מספריים.

ברוכים הבאים לקורות החיים!תודה לענות, אך אנא הקדיש זמן לבחון את התשובות הקודמות ולשקול אם אתה מוסיף משהו שימושי.
#9
-4
Graham Cookson
2010-07-23 20:18:34 UTC
view on stackexchange narkive permalink

נתונים בדידים יכולים לקבל רק ערכים שלמים ואילו נתונים רציפים יכולים לקבל כל ערך. למשל מספר חולי הסרטן המטופלים בבית חולים מדי שנה הוא נפרד אך משקלכם רציף. חלק מהנתונים הם רצופים אך נמדדים בצורה נפרדת למשל. הגיל שלך. נהוג לדווח על גילך כאמור, 31.

הנתונים יכולים להיות נפרדים מבלי להיות מוגבלים למספרים שלמים. או מספרים, לצורך העניין. תמיד ניתן * לייצג * נתונים בדידים עם מספרים שלמים, אבל זה לא אומר שהנתונים יכולים לקחת רק ערכים כאלה.
#10
-5
Md.Shahid
2013-08-22 06:54:48 UTC
view on stackexchange narkive permalink

נתונים בדידים מדברים במיוחד על הערכים הסופיים ונתונים רציפים מדברים על ערכים אינסופיים .....

דואגים לפרט?


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...