שְׁאֵלָה:
מה ההבדל בין "סבירות" ל"הסתברות "?
Douglas S. Stones
2010-09-14 08:24:01 UTC
view on stackexchange narkive permalink

בדף ויקיפדיה טוענים כי הסבירות וההסתברות הם מושגים מובחנים.

בשפה שאינה טכנית, "סבירות" היא בדרך כלל מילה נרדפת ל"הסתברות ". אך בשימוש סטטיסטי קיימת הבחנה ברורה בפרספקטיבה: המספר המהווה את ההסתברות לחלק מהתוצאות הנצפות בהינתן סט ערכי פרמטר נחשב לסבירות לקבוצת ערכי הפרמטרים בהתחשב בתוצאות הנצפות.

האם מישהו יכול לתת תיאור יותר קרקעי למה זה אומר? בנוסף, כמה דוגמאות לאופן שבו "הסתברות" ו"סבירות "אינן מסכימות יהיו נחמדות.

שאלה נהדרת. הייתי מוסיף שם גם "סיכויים" ו"סיכוי ":)
אני חושב שכדאי שתסתכל על השאלה הזו http://stats.stackexchange.com/questions/665/whats-the-difference-between-probability-and-statistics/675#675 כי הסבירות היא למטרה סטטיסטית ולהסתברות הִסתַבְּרוּת.
וואו, אלה כמה תשובות טובות באמת. אז תודה גדולה על כך! נקודה מסוימת בקרוב, אני אבחר בתשובה שאני אוהב במיוחד כתשובה "המקובלת" (אם כי יש כמה שלדעתי ראויים באותה מידה).
שים לב גם ש"יחס הסבירות "הוא למעשה" יחס הסתברות "שכן הוא פונקציה של התצפיות.
אחת עשרה תשובות:
#1
+381
user28
2010-09-14 11:08:03 UTC
view on stackexchange narkive permalink

התשובה תלויה אם אתה עוסק במשתנים אקראיים בדידים או רציפים. לכן, אחלק את תשובתי בהתאם. אניח שאתה רוצה קצת פרטים טכניים ולאו דווקא הסבר באנגלית רגילה.

משתנים אקראיים בדידים

נניח שיש לך תהליך סטוכסטי לוקח ערכים בדידים (למשל, תוצאות של השלכת מטבע 10 פעמים, מספר לקוחות שמגיעים לחנות תוך 10 דקות וכו '). במקרים כאלה, אנו יכולים לחשב את ההסתברות לקבוצת קבוצה מסוימת של תוצאות על ידי הנחות יסוד מתאימות לגבי התהליך הסטוכסטי הבסיסי (למשל, ההסתברות לראשי נחיתת מטבע היא $ p $ span > וכי הטלות מטבעות אינן תלויות).

ציין את התוצאות הנצפות לפי $ O $ ואת מכלול הפרמטרים המתארים את התהליך הסטוכסטי כ $ \ theta $ . לפיכך, כאשר אנו מדברים על הסתברות אנו רוצים לחשב $ P (O | \ theta) $ . במילים אחרות, נתון לערכים ספציפיים עבור $ \ theta $ , $ P (O | \ theta) $ היא ההסתברות שנצפה בתוצאות המיוצגות על ידי $ O $ .

עם זאת, כאשר אנו מדגמנים תהליך סטוכסטי בחיים האמיתיים, לעתים קרובות איננו מכירים את $ \ theta $ . אנו פשוט צופים ב $ O $ והמטרה היא להגיע לאומדן ל $ \ theta $ ש תהיה אפשרות סבירה בהתחשב בתוצאות שנצפו $ O $ . אנו יודעים כי בהינתן ערך של $ \ theta $ ההסתברות להתבונן ב- $ O $ היא $ P (O | \ theta) $ . לפיכך, תהליך הערכה 'טבעי' הוא לבחור את הערך של $ \ theta $ שיגדיל את ההסתברות שנצפה בפועל על $ O $ . במילים אחרות, אנו מוצאים את ערכי הפרמטר $ \ theta $ הממקסמים את הפונקציה הבאה:

$ L (\ theta | O) = P (O | \ theta) $

$ L (\ theta | O) $ span > נקרא פונקציית הסבירות. שימו לב כי בהגדרה פונקציית הסבירות מותנית ב $ O $ שנצפה ושהיא פונקציה של הפרמטרים הלא ידועים $ \ theta $ .

משתנים אקראיים מתמשכים

במקרה הרציף המצב דומה עם הבדל חשוב אחד. אנחנו כבר לא יכולים לדבר על ההסתברות שצפינו ב $ O $ בהינתן $ \ theta $ מכיוון שב מקרה רציף $ P (O | \ theta) = 0 $ . מבלי להיכנס לטכניקות, הרעיון הבסיסי הוא כדלקמן:

ציין את פונקציית צפיפות ההסתברות (pdf) המשויכת לתוצאות $ O $ כ: $ f (O | \ תטא) $ span>. לפיכך, במקרה הרציף אנו מעריכים את $ \ theta $ התוצאות הנצפות $ O $ על ידי מקסימום התוצאות הבאות פונקציה:

$ L (\ theta | O) = f (O | \ theta) $

במצב זה , אנחנו לא יכולים לטעון טכנית שאנחנו מוצאים את ערך הפרמטר שממקסם את ההסתברות שנצפה ל $ O $ כאשר אנו ממקסמים את ה- PDF המשויך לתוצאות שנצפו "מיכל מתמטיקה"> $ O $ .

ההבחנה בין משתנים בדידים ורציפים נעלמת מנקודת מבטה של ​​תורת המידות.
@whuber כן אבל תשובה תוך שימוש בתורת המידות אינה נגישה לכולם.
@Srikant: מוסכם. ההערה הייתה לטובת ה- OP, שהוא מתמטיקאי (אך אולי לא סטטיסטיקאי) כדי להימנע מהטעיה לחשוב שיש משהו מהותי בהבחנה.
ניתן לפרש צפיפות רציפה זהה למקרה הנפרד אם $ O $ מוחלף ב- $ dO $, במובן שאם אנו מבקשים $ Pr (O \ in (O ', O' + dO ') | \ theta ) $ (כלומר ההסתברות שהנתונים $ O $ כלולים באזור זעיר בערך $ O '$) והתשובה היא $ f (O' | \ theta) dO '$ ($ dO' $ מבהיר זאת שאנחנו מחשבים את השטח של "סל" דק לא קטן של היסטוגרמה).
אני מאחר יותר מ -5 שנים למסיבה, אבל אני חושב שמעקב מכריע מאוד לתשובה זו יהיה http://stats.stackexchange.com/questions/31238/what-is-the-reason-that-a-סבירות-פונקציה-אינה- pdf אשר מדגישה את העובדה כי פונקציית הסבירות $ L (\ theta) $ אינה קובץ pdf ביחס ל- $ \ theta $.$ L (\ theta $) הוא אכן קובץ PDF של נתונים בהתחשב בערך הפרמטר, אך מכיוון שה- מאז $ L $ הוא פונקציה של $ \ theta $ בלבד (כאשר הנתונים מוחזקים כקבועים), זה לא רלוונטי ש- $ L (\ theta) $ הוא קובץ PDF של הנתונים שניתן $ \ theta $.
@whuber תגובה מעניינת מאוד לגבי תורת המידות.אני בטוח שאני לא לבד, 1) שאין לי רקע בתחום הזה, 2) סקרן איך להבין את הצהרתך.האם יש כמה טקסטים שימושיים שתוכלו להמליץ עליהם?
@DJohnson ההקדמה העדינה והאינטואיטיבית ביותר, אך המחמירה ביותר שראיתי, היא כי ב'חשבון הסטוכסטי למימון '* כרך ב' של סטיבן שרב.מה שאתה צריך זה בתריסר העמודים הראשונים.אם זה נראה כבד מתמטי מדי, עיין בכרך I. אם יש לך עניין ביישומים של סבירות למימון, אז כרך I שווה את הזמן שלך - וזה קצר להפליא.
כתבת $ L (\ theta | O) = P (O | \ theta) $ האם זה אומר $ P (O | \ theta) $ לא משתלב ב- 1 כי זה לא הסתברות?אז מדוע אנו משתמשים ב- $ P $ כאן, עלינו לשמור שזה יהיה $ L $ אחרת זה מבלבל.
OP: * מישהו יכול לתת תיאור יותר ארצי *.תשובה זו: * כאן בענן 11 תוכלו לראות .. *
#2
+158
whuber
2010-09-14 20:45:09 UTC
view on stackexchange narkive permalink

זו סוג השאלה שכמעט כולם הולכים לענות עליה ואני מצפה שכל התשובות יהיו טובות. אבל אתה מתמטיקאי, דאגלס, אז תן לי להציע תשובה מתמטית.

מודל סטטיסטי צריך לחבר שתי ישויות מושגיות נפרדות: נתונים שהם אלמנטים $ x $ של קבוצה כלשהי (כגון שטח וקטורי), ו מודל כמותי אפשרי של התנהגות הנתונים. מודלים מיוצגים בדרך כלל על ידי נקודות $ \ theta $ על סעפת ממדים סופית, סעפת עם גבול או מרחב פונקציה (האחרון נקרא "לא פרמטרי" הבעיה).

הנתונים $ x $ מחוברים לדגמים האפשריים $ \ theta $ באמצעות פונקציה $ \ Lambda (x, \ theta) $ . לכל $ \ theta $ , $ \ Lambda (x, \ theta) $ מיועד להיות ההסתברות (או צפיפות ההסתברות) של $ x $ . לעומת זאת, עבור $ x $ , $ \ Lambda (x, \ theta) $ ניתן לראות כפונקציה של $ \ theta $ ובדרך כלל מניחים שיש להם מאפיינים נחמדים מסוימים, כמו למשל להיות מובחנים ברציפות. הכוונה להציג $ \ Lambda $ בדרך זו ולהעלות הנחות אלו מוכרזת על ידי קריאה ל $ \ Lambda $ טווח> "הסבירות".

זה ממש כמו ההבחנה בין משתנים ופרמטרים במשוואה דיפרנציאלית: לפעמים אנחנו רוצים ללמוד את הפתרון (כלומר, אנו מתמקדים במשתנים כטענה) ולפעמים אנחנו רוצים ללמוד כיצד הפתרון משתנה עם הפרמטרים. ההבחנה העיקרית היא שבסטטיסטיקה אנו זקוקים לעיתים רחוקות לחקור את השונות בו זמנית של שתי קבוצות הטיעונים; אין אובייקט סטטיסטי התואם באופן טבעי גם את הנתונים $ x $ והן את פרמטרי המודל $ \ theta $ טווח>. לכן אתה שומע יותר על דיכוטומיה זו ממה שהיית עושה בהגדרות מתמטיות מקבילות.

+1, איזו תשובה מגניבה. אנלוגיה עם משוואות דיפרנציאליות נראית מאוד מתאימה.
ככלכלן, למרות שתשובה זו אינה מתייחסת באותה המידה למושגים שלמדתי, הייתה התשובה האינפורמטיבית ביותר במובן האינטואיטיבי.הרבה תודות.
למעשה, הצהרה זו אינה ממש נכונה "אין אובייקט סטטיסטי התואם באופן טבעי גם את הנתונים x וגם את פרמטרי המודל θ.".יש, זה נקרא "החלקה, סינון וחיזוי", במודלים ליניאריים הוא מסנן קלמן, במודלים לא לינאריים, יש להם את המסננים הלא לינאריים המלאים, https://en.wikipedia.org/wiki/Kushner_equation וכו '
כן, תשובה נהדרת!עד כמה שזה נשמע צולע, על ידי בחירה ב- $ \ Lambda \ left (x, \ theta \ right) $ במקום בסימון הסטנדרטי של $ P \ left (x, \ theta \ right) $, זה הקל עלי לראותשאנחנו מתחילים עם הסתברות משותפת שניתן להגדיר אותה כסיכוי או הסתברות מותנית.בנוסף, ההערה "מאפיינים נחמדים מסוימים" עזרה.תודה!
@Mike אתה מוזמן.אך שימו לב כי $ \ Lambda $ אינו בדרך כלל "הסתברות משותפת" אלא בדגמים בייסיאניים.אני מקווה שהחשבון שלי לא היה מבלבל בקשר לזה.
@whuber כן, אני יודע ש $ \ Lambda $ אינו הסימון הרגיל.בדיוק בגלל זה זה עזר!הפסקתי לחשוב שזה חייב להיות בעל משמעות מסוימת ובמקום זאת פשוט הלכתי אחר ההיגיון.;-p
האם $ \ Lambda $ כאן נחשב לחלוקת הסתברות מותנית (מותנית בפרמטרים $ \ theta $)?
@Iamanon לא בהכרח: הוא מחליף משפחה של התפלגויות הסתברות.אתה עשוי לחשוב על זה כפונקציה (רציפה, לפחות) ממרחב פרמטר $ \ Theta $ למרחב של התפלגויות הסתברות, תוך לקיחת $ \ theta \ in \ Theta $ להפצה עם צפיפות $ x \ ל- \ Lambda (x, \ theta). $ זה דורש מדד משותף לגביו שלכל ההפצות יש אכן צפיפות.
#3
+126
Thylacoleo
2010-09-14 13:45:33 UTC
view on stackexchange narkive permalink

אנסה למזער את המתמטיקה בהסבר שלי מכיוון שיש כבר כמה הסברים מתמטיים טובים.

כפי שמגיב רובין ג'ירארד, ההבדל בין הסתברות וסבירות קשור קשר הדוק ל בין הסתברות לסטטיסטיקה. במובן מסוים ההסתברות והסטטיסטיקה עוסקות בבעיות הפוכות או הפוכות זו לזו.

שקול הטלת מטבע. (התשובה שלי תהיה דומה ל דוגמה 1 בוויקיפדיה.) אם אנו יודעים שהמטבע הוגן ( $ p = 0.5 $ ) טיפוסי שאלת ההסתברות היא: מה ההסתברות לקבל שני ראשים ברצף. התשובה היא $ P (HH) = P (H) \ times P (H) = 0.5 \ times0.5 = 0.25 $ .

שאלה סטטיסטית אופיינית היא: האם המטבע הוגן? כדי לענות על זה עלינו לשאול: עד כמה המדגם שלנו תומך בהשערה ש $ P (H) = P (T) = 0.5 $ ? P הנקודה הראשונה שיש לציין היא כי כיוון השאלה התהפך. בהסתברות אנו מתחילים בפרמטר משוער ( $ P (head) $ ) ומעריכים את ההסתברות לדגימה נתונה (שני ראשים ברצף). בסטטיסטיקה אנו מתחילים בתצפית (שני ראשים ברצף) ועושים INFERENCE לגבי הפרמטר שלנו ( $ p = P (H) = 1- P (T) = 1 - q $ ).

דוגמה 1 בוויקיפדיה מראה לנו כי אומדן הסבירות המקסימלי של $ P (H) $ לאחר 2 ראשים ברציפות הוא $ p_ {MLE} = 1 $ . אך הנתונים בשום אופן לא שוללים את ערך הפרמטר האמיתי $ p (H) = 0.5 $ (בואו לא נדאג לפרטים כרגע). אכן רק ערכים קטנים מאוד של $ p (H) $ ובמיוחד $ p (H) = 0 $ ניתן לחסל באופן סביר לאחר $ n = 2 $ (שתי זריקות של המטבע). אחרי ש השלישית השלישית עולה זנבות, אנו יכולים כעת לבטל את האפשרות ש $ P (H) = 1.0 $ (כלומר זה לא שניים מטבע ראשי), אך רוב הערכים שביניהם יכולים להיות נתמכים באופן סביר על ידי הנתונים . (מרווח ביטחון מדויק של 95% בינומי עבור $ p (H) $ הוא 0.094 עד 0.992.

לאחר 100 זריקות מטבעות (נניח) 70 ראשים, כעת יש לנו בסיס סביר לחשד שהמטבע אינו הוגן למעשה. רווח סמוי מדויק של 95% ב- $ p (H) $ הוא כעת 0.600 עד 0.787 וההסתברות להתבונן בתוצאה קיצונית כמו 70 ראשים (או זנבות) ומעלה מ- 100 זריקות שניתנו $ p (H) = 0.5 $ היא 0.0000785.

למרות שלא השתמשתי במפורש בחישובי הסבירות דוגמה זו לוכדת את מושג הסבירות: סבירות היא מדד למידת המדגם המספק תמיכה בערכים מסוימים של פרמטר במודל פרמטרי .

תשובה טובה!במיוחד שלוש הפסקאות האחרונות מאוד שימושיות.איך היית מרחיב זאת לתיאור המקרה הרציף?
מבחינתי, התשובה הטובה ביותר.בכלל לא אכפת לי למתמטיקה, אבל * בשבילי * מתמטיקה היא * כלי * שנשלט על ידי מה שאני רוצה (אני לא נהנה ממתמטיקה לשמה, אלא בשביל מה שהיא עוזרת לי לעשות).רק עם התשובה הזו אני מכיר את האחרונה.
#4
+73
ars
2010-09-14 10:16:18 UTC
view on stackexchange narkive permalink

אתן לך את הפרספקטיבה מנקודת המבט של תורת הסבירות שמקורה ב- פישר - והיא הבסיס להגדרה הסטטיסטית במאמר הוויקיפדיה שצוטט.

נניח שיש לך משתנים אקראיים $ X $ הנובעים מהתפלגות פרמטרית $ F (X; \ theta) $, כאשר $ \ theta $ הוא הפרמטר המאפיין $ F $. ואז ההסתברות ל- $ X = x $ תהיה: $ P (X = x) = F (x; \ theta) $, עם $ \ theta $ ידוע.

לעתים קרובות יותר, יש לך נתונים $ X $ ו- $ \ theta $ אינם ידועים. בהתחשב במודל המשוער $ F $, הסבירות מוגדרת כהסתברות לנתונים שנצפו כפונקציה של $ \ theta $: $ L (\ theta) = P (\ theta; X = x) $. שים לב ש- $ X $ ידוע, אך $ \ theta $ אינו ידוע; למעשה המוטיבציה להגדרת הסבירות היא לקבוע את פרמטר ההתפלגות.

למרות שנראה שפשוט כתבנו מחדש את פונקציית ההסתברות, תוצאה מרכזית לכך היא שפונקציית הסבירות עושה זאת לא לציית לחוקי ההסתברות (למשל, זה לא קשור למרווח [0, 1]). עם זאת, פונקציית הסבירות פרופורציונאלית להסתברות הנתונים שנצפו.

מושג סבירות זה מוביל למעשה לאסכולת מחשבה אחרת, "סבירות" (להבדיל מתדירות ובייסיאנית) ואתה יכול לחפש בגוגל את כל הוויכוחים ההיסטוריים השונים. אבן היסוד היא עקרון הסבירות שאומר בעצם שאנחנו יכולים לבצע הסקה ישירות מהפונקציה הסבירה (לא בייזיאנים ולא תכופים מקבלים זאת מכיוון שזה לא הסקה מבוססת הסתברות). בימינו הרבה ממה שנלמד כ"תדירות "בבתי הספר הוא למעשה מיזוג של חשיבה תכופה וסבירות.

לקבלת תובנה מעמיקה יותר, התחלה יפה והתייחסות היסטורית היא הסבירות של אדוארדס. לקבלת תמונה מודרנית, אמליץ על המונוגרפיה הנפלאה של ריצ'רד רויאל, עדויות סטטיסטיות: פרדיגמת סבירות.

תשובה מעניינת, אני באמת חשבתי ש"בית הספר הסבירות "הוא בעצם" המתמחים שלא מתכננים בית ספר לדוגמאות ", ואילו" בית הספר לעיצוב "הוא שאר התושבים. אני בעצם מתקשה בעצמי לומר איזה "בית ספר" אני, מכיוון שיש לי מעט ידע מכל בית ספר. בית הספר "הסתברות כהגיון מורחב" הוא האהוב עלי ביותר (ד"ה), אך אין לי מספיק ניסיון מעשי להחיל אותו על בעיות אמיתיות כדי להיות דוגמטי לגביו.
+1 עבור "פונקציית הסבירות אינה מצייתת לחוקי ההסתברות (למשל, היא אינה קשורה לרווח [0, 1]). עם זאת, פונקציית הסבירות פרופורציונאלית לסבירות הנתונים שנצפו."
"פונקציית הסבירות אינה מצייתת לחוקי ההסתברות" יכולה להשתמש בבירור נוסף, במיוחד שכן הוא נכתב כ- θ: L (θ) = P (θ; X = x), כלומר משווים להסתברות!
-1
בעיני בתור מתמטיקאי לא, זה קורא כמו מתמטיקה דתית, עם אמונות שונות שמביאות לערכים שונים לסיכויי אירועים.האם אתה יכול לנסח את זה, כך שיהיה קל יותר להבין מהן האמונות השונות ולמה הן הגיוניות, במקום שהאחת פשוט לא נכונה והשנייה / האמונה השנייה נכונה?(הנחה שיש * דרך אחת נכונה * לחישוב הסיכויים להתרחשות אירועים)
#5
+66
Gypsy
2013-04-14 01:49:40 UTC
view on stackexchange narkive permalink

בהתחשב בכל התשובות הטכניות המשובחות לעיל, הרשה לי להחזיר אותה לשפה: הסתברות מכמתת ציפייה (לתוצאה), סבירות מכמתת אמון (במודל).

נניח שמישהו מאתגר אותנו ל'רווחית ' משחק הימורים '. לאחר מכן, ההסתברויות ישמשו אותנו לחישוב דברים כמו הפרופיל הצפוי של הרווחים וההפסדים שלך (ממוצע, מצב, חציון, שונות, יחס מידע, ערך בסיכון, מהמר מהמר, וכן הלאה). לעומת זאת, הסבירות תשמש אותנו לכמת האם מלכתחילה אנו סומכים על ההסתברויות הללו; או אם אנו 'מריחים עכברוש'.


אגב - מכיוון שמישהו לעיל הזכיר את דתות הסטטיסטיקה - אני סבור שיחס הסיכוי הוא חלק בלתי נפרד מהעולם הביסאי כמו גם מהעולם. אחד תכופים: בעולם בייס, נוסחת בייס פשוט משלבת קודם עם סבירות לייצר אחורי.

התשובה הזו מסכמת את זה בשבילי.הייתי צריך לחשוב מה המשמעות כשקראתי שהסיכוי הוא לא הסתברות, אך המקרה הבא עלה בדעתי.מה הסבירות שמטבע הוגן, בהתחשב בכך שאנחנו רואים ארבעה ראשים ברצף?איננו יכולים לומר כאן דבר על הסתברות, אך המילה "אמון" נראית הולמת.האם אנו מרגישים שאנחנו יכולים לסמוך על המטבע?
בתחילה זו הייתה אולי המטרה ההיסטורית המיועדת לסבירות, אך כיום הסבירות היא כל חישוב בייזיאני, וידוע כי ההסתברויות יכולות לאחד אמונות וסבירות, ולכן נוצרה תיאוריית דמפסטר-שאפר, כדי להבהיר את שתי הפרשנויות.
#6
+58
Yaroslav Bulatov
2010-09-14 11:04:27 UTC
view on stackexchange narkive permalink

נניח שיש לך מטבע עם הסתברות $ p $ לנחות ראשים ו $ (1-p) $ תוחלת> להנחית זנבות. תן ל $ x = 1 $ לציין ראשים ו $ x = 0 $ לציין זנבות. הגדר $ f $ באופן הבא

$$ f (x, p) = p ^ x ( 1-p) ^ {1-x} $$

$ f (x, 2/3) $ היא ההסתברות של x נתון $ p = 2/3 $ , $ f (1, p) $ הוא הסיכוי ל $ p $ ניתן $ x = 1 $ . בעיקרון הסבירות לעומת ההסתברות אומרת לך איזה פרמטר של צפיפות נחשב למשתנה

השלמה נחמדה להגדרות התיאורטיות המשמשות לעיל!
אני רואה ש- $ C ^ n_kp ^ n (1-p) ^ {k-n} $ נותן את ההסתברות שיהיו $ n $ ראשים בניסויים של $ k $.$ P ^ x שלך (1-p) ^ {1-x} $ נראה כמו שורש $ k $ -th של זה: $ x = n / k $.מה זה אומר?
@LittleAlien מה זה $ C_k ^ n $ במשוואה שלך?
@GENIVI-LEARNER $ C ^ n_k $ הוא המקדם הבינומי (ראה https://en.wikipedia.org/wiki/Binomial_coefficient).זה מאפשר לך לחשב את ההסתברות לראות שילובים שונים של ראשים וזנבות (לדוגמא: $ HTT $, $ THT $, $ TTH $ עבור $ n = 3 $, $ k = 1 $), במקום כל הראשים או כולםזנבות באמצעות הנוסחה הפשוטה יותר $ f (x, p) = p ^ x (1-p) ^ {nk} $.
#7
+55
John
2010-09-14 08:44:11 UTC
view on stackexchange narkive permalink

אם יש לי מטבע הוגן (ערך פרמטר) אז ההסתברות שהוא יעלה לראשים היא 0.5. אם אני הופך מטבע 100 פעמים והוא עולה לראשים 52 פעמים אז יש לו סבירות גבוהה להיות הוגן (הערך המספרי של הסבירות שעלול ללבוש מספר צורות).

התשובה של זה ושל צועני צריכה להיות בראש!אינטואיציה ובהירות מעל קפדנות מתמטית יבשה, שלא לומר משהו יותר גנאי.
האם יש הסבר אינטואיטיבי לנוסחה לחישוב הסבירות, כמו שיש לנו לנוסחת התפלגות בינומית המחשבת את ההסתברות?
זה נשמע כאילו צריך לפרסם אותו כשאלה משלו
#8
+31
Lenar Hoyt
2015-11-27 19:41:29 UTC
view on stackexchange narkive permalink
ניתן לראות את

$ P (x | \ theta) $ משתי נקודות מבט:

  • כפונקציה של $ x $, טיפול ב- $ \ theta $ כידוע / נצפה. אם $ \ theta $ אינו משתנה אקראי, אז $ P (x | \ theta) $ נקרא ההסתברות ( פרמטר ) של $ x $ בהתחשב בפרמטרים המודל $ \ theta $, שלפעמים כתוב גם $ P (x; \ theta) $ או $ P _ {\ theta} (x) $. אם $ \ theta $ הוא משתנה אקראי, כמו בסטטיסטיקה בייסיאנית, אז $ P ( x | \ theta) $ היא הסתברות של מותנה המוגדרת כ $ {P (x \ cap \ theta)} / {P (\ theta)} $.
  • כפונקציה של $ \ theta $, טיפול ב- $ x $ כפי שנצפה. לדוגמה, כאשר אתה מנסה למצוא מטלה מסוימת $ \ hat \ theta $ עבור $ \ theta $ שממקסמת $ P (x | \ theta) $ ואז $ P (x | \ hat \ theta) $ נקרא הסבירות המקסימלית של $ \ theta $ בהתחשב בנתונים $ x $, לפעמים נכתבים כ $ \ mathcal L (\ כובע \ תטא | x) $. לכן, המונח הסבירות הוא רק ראוי לציון ההסתברות $ P (x | \ theta) $ עבור נתונים מסוימים $ x $ הנובעים מהקצאת ערכים שונים ל- $ \ theta $ (למשל כאשר חוצים את שטח החיפוש של $ \ תטא $ לפיתרון טוב). לכן, הוא משמש לעתים קרובות כפונקציה אובייקטיבית, אך גם כמדד ביצועים להשוואה בין שני מודלים כמו ב השוואה בין מודלים בייסיאניים.

לעיתים קרובות, ביטוי זה הוא עדיין פונקציה של שני טיעוניו, ולכן מדובר דווקא בהדגשה.

במקרה השני, חשבתי שאנשים כותבים בדרך כלל P (תטא | x).
במקור באופן אינטואיטיבי כבר חשבתי ששניהם מילים לאותו דבר עם הבדל בפרספקטיבה או ניסוח שפה טבעית, אז אני מרגיש כמו "מה? צדקתי כל הזמן ?!"אך אם זה המצב, מדוע הבחנה ביניהם כה חשובה? אנגלית אינה שפת האם שלי, גדלתי עם מילה אחת בלבד לשני המונחים לכאורה (או שמעולם לא נתקלתי בבעיה בה אני צריך להבחין במונחים?) ומעולם לא ידעתי שיש הבדל.רק עכשיו, שאני יודע שני מונחים באנגלית, אני מתחיל לפקפק בהבנתי את הדברים האלה.
נראה כי התשובה שלך מקיפה מאוד וקל להבנה.אני תוהה, מדוע היו לה כל כך מעט הצבעות.
שים לב ש- P (x | $ \ theta $) היא הסתברות ** מותנית ** רק אם $ \ theta $ הוא משתנה אקראי, אם $ \ theta $ הוא פרמטר אז פשוט ההסתברות ל- x שעושה פרמטרציה על ידי $ \ theta$.
אני חושב שזו התשובה הטובה ביותר מבין כולם
#9
+7
schotti
2019-06-28 03:37:29 UTC
view on stackexchange narkive permalink

האם אתה מכיר את הפיילוט לסדרת הטלוויזיה "num3ers" בה ה- FBI מנסה לאתר את בסיס הבית של פושע סדרתי שנראה שבוחר באופן אקראי בקורבנותיו?

היועץ המתמטי של ה- FBI ואחיו של הסוכן האחראי פותרים את הבעיה בגישה סבירות מקסימאלית. ראשית, הוא מניח איזו "gugelhupf" probability $ p (x | \ theta) $ שהפשעים מתרחשים במקומות $ x $ אם הפושע גר במקום $ \ theta $ . (ההנחה של gugelhupf היא שהפושע לא יבצע פשע בסביבתו הקרובה ולא יגיע רחוק במיוחד בכדי לבחור את הקורבן האקראי הבא שלו.) מודל זה מתאר את probabilities עבור $ x $ קיבל קבוע $ \ theta $ . במילים אחרות, $ p _ {\ theta} (x) = p (x | \ theta) $ הוא פונקציה של $ x $ עם פרמטר קבוע $ \ theta $ .

כמובן, ה- FBI אינו יודע את מקום מגוריו של העבריין, ואינו רוצה לחזות את זירת הפשע הבאה. (הם מקווים למצוא את הפושע קודם!) זה הפוך, ה- FBI כבר מכיר את זירות הפשע $ x $ ורוצה לאתר את ביתו של הפושע $ \ theta $ .

כך שאחיו המבריק של סוכן ה- FBI צריך לנסות למצוא את סביר ביותר $ \ theta $ בין כל הערכים האפשריים, כלומר ה $ \ theta $ שממקסם $ p (x | \ theta) $ עבור שנצפה בפועל x $ . לכן כעת הוא מחשיב את $ l_x (\ theta) = p (x | \ theta) $ כפונקציה של $ \ theta $ עם פרמטר קבוע $ x $ . באופן פיגורטיבי, הוא דוחף את הגוגלהופף שלו על המפה עד שהוא "מתאים" אופטימלי לזירות הפשע הידועות $ x $ . לאחר מכן ה- FBI דופק על הדלת במרכז $ \ hat {\ theta} $ של gugelhupf.

כדי להדגיש את שינוי הפרספקטיבה הזה, $ l_x (\ theta) $ נקרא likelihood (פונקציה) של $ \ theta $ , ואילו $ p _ {\ theta} (x) $ היה probability (פונקציה) של . שניהם הם למעשה אותה פונקציה $ p (x | \ theta) $ אך נראים מנקודות מבט שונות ועם $ x $ ו $ \ theta $ החלפת תפקידיהם כמשתנה ופרמטר, בהתאמה.

#10
+5
Response777
2017-11-06 15:45:56 UTC
view on stackexchange narkive permalink

מבחינתי, ההבחנה החשובה ביותר היא שהסבירות אינה הסתברות (של $ \ theta $).

בבעיית הערכה, ה- X ניתן ואת הסבירות $ P (X | \ theta) $ מתאר הפצה של X ולא $ \ theta $.כלומר, $ \ int P (X | \ theta) d \ theta $ הוא חסר משמעות, מכיוון שהסיכוי אינו pdf של $ \ theta $, אם כי הוא מאפיין במידה מסוימת את $ \ theta $.

כפי שמציינת התשובה של @Lenar Hoyt, אם התטא הוא משתנה אקראי (שהוא יכול להיות), אז הסבירות היא סבירות.כך שנראה שהתשובה האמיתית היא שהסבירות יכולה להיות הסתברות, אך היא לפעמים לא.
@MikeWise, אני חושב שתמיד ניתן היה לראות בתטא כמשתנה "אקראי", בעוד שרוב הסיכויים שהוא פשוט לא "אקראי" כל כך ...
#11
+2
Ahmad
2019-11-06 18:00:39 UTC
view on stackexchange narkive permalink

אם נשים את פרשנות ההסתברות המותנית בצד, אתה יכול לחשוב זאת בצורה כזו:

  • ב הסתברות אתה בדרך כלל רוצה למצוא את ההסתברות לאירוע אפשרי על סמך מודל / פרמטר / התפלגות הסתברות וכו '

  • ב סבירות ראית תוצאה כלשהי, לכן ברצונך למצוא / ליצור / לאמוד את ה מקור / מודל / פרמטר / הפצת הסתברות סביר ביותר שממנוהאירוע הזה העלה.

זה נראה לי מתגעגע לעניין לחלוטין.אין להבדיל בין הסתברות וסבירות.(העריכות שלי לשוניות בלבד).
@NickCox מה הבעיה?זו פשוט אינטואיציה, לא תשובה פורמלית, אחרת נתנה את התשובות הרשמיות.
@NickCox שיניתי את זה קצת, אנא בדוק זאת שוב.
מצטערים, אך סגנון פורמלי או לא פורמלי אינו הנושא.ההבחנה אינה מבחינת העבר והעתיד.זה רק מוסיף בלבול לשרשור, וציינתי אם לא בסדר.
@NickCox אני לא סטטיסטיקאי, אבל האם ההסתברות לגבי אירועים איננו יודעים את התוצאה ** לפני כן **?וסבירות לגבי תצפיות?והתבוננות היא אירוע!אני בעצמי לא רוצה להיות מאוד פדנטי, פשוט אינטואיציה שעובדת ברוב המצבים.
לשרשור יש כבר כמה תשובות מצויינות ומעוררות בהרבה.זה לא מצב שמי שאינו בטוח במומחיותו זקוק או צריך להוסיף עוד מצב.עניין כלשהו בעתיד אינו הנושא שכן בפועל הן ההסתברות והן הסבירות מחושבות מנתונים שכבר נמסרו.
@NickCox קראתי אותם, אבל ככה מצאתי את זה יותר אינטואיטיבי עבור עצמי ואני מפרסם את תשובתי למי שעשוי לראות את המצב מנקודת מבטי.כן, יש לנו את שני הנתונים, אלה נועדו רק לחישוב ההסתברות, הם לא לשימוש ב- pdf.הדרך בה אתה חושב על הסתברות שונה מהדרך בה אתה חושב על הסבירות.זאת הנקודה שלי.פשוט כפי שכתבתי הסתברות היא ההסתברות לאירוע.כמה סביר שהאירוע הזה יתרחש;מידת חוסר הוודאות שלנו לתוצאה (דבר שאיננו יכולים לחזות באופן דטרמיניסטי).
@NickCox אך סביר להניח שאיננו מודאגים מאירוע שיתרחש וכמה הוא סביר, האירוע כבר קרה והשאיר לנו תצפית כלשהי כדי לשער את התהליך ההסתברותי שמתחת.
-1 תשובות אינטואיטיביות טובות - כשהן נכונות.זה פשוט מטעה ושגוי.
@whuber לאדם אחר היה גם הרעיון שלך, אבל ניסיתי לשכנע אותו, והוא לא הוסיף שום דבר.אנא קרא את הדיון שלנו, ואם יש לך משהו להוסיף תשמח לשמוע.רק תגיד שמשהו לא בסדר לא עושה את זה לא בסדר.עם זאת, המטרה שלי היא לא לתת תשובה רשמית או מלאה.רק רמז מהיר ומשאיר את ההצדקה למשתמש.אז אתה גם חופשי להבין את העניין או לנסות להיות דייקן.
@whuber אגב, שיניתי כמה מילים לפי מילים טכניות יותר למי שעלול להטעות ולא מקבל את הקשר
@whuber ניסיתי לשפר את התשובה שלי אבל זה איבד לחלוטין את כל הנקודות האינטואיטיביות כדי להיות הגדרה חסרת טעם, אז אני הולך להסיר אותה.אני רק יכול להגיד שאתה אתר מאוד מייאש וראשוני.
אני לא שמח שיש לך רושם שלילי מהאתר שלנו אבל מרתיע תשובות שגויות או לא רלוונטיות הוא חלק מאיך שהאתר עובד, למרבה הצער עבורך במקרה זה.רישום הערותי יכול לעמוד בפני כל קוראים אחרים בניסיון להסביר בקצרה כיצד תשובתך לא הצליחה לעזור.
@NickCox תודה שהבנת!אין בעיה.אני יודע שאתה גם עושה את העבודה שלך בכוונה טובה.למדתי כמה נקודות, והייתי צריך להשקיע יותר זמן בתשובה שלי, אולם ההתמקדות שלי הייתה רק לתת פרספקטיבה חדשה אפילו לא מדויקת במקום לחזור על פרשנויות ברורות או מקובלות, אבל זה התגלה כמסורבל.בכל אופן תודה לך
יש לך כיווניות שגויה, אחמד: תשובה שגויה מצדיקה כי היא שגויה.כדי להבין מדוע ההודעה שלך שגויה - מכיוון שתגובות @Nick's לא הספיקו - כל שעליך לעשות הוא להפנות לרשות להגדרות או תיאורים של סבירות והסתברות.(אם כי תתקשה למצוא אחד שמבדיל את זמנך, מכיוון שלא הסתברות ולא סבירות מבדילים בין עבר, הווה או עתיד.) קריאת התשובות האחרות בשרשור זה תהיה התחלה טובה.
@whuber "תשובה" היא אובייקט מעורפל למונח שגוי.בכל מקרה, על סמך ההיגיון שלך, אני רק יכול לומר שאתה טועה!לא הבנת את העניין ולא מדובר בעבר, בעתיד וכו '. אם אתה רוצה לדעת למה אתה יכול לקרוא את הדיון ביני לבין ניק קוקס.הסברתי את זה מספיק!עם זאת אני הולך למחוק את התשובה שלי.
אני מבין למה אתה עדיין מרגיש כואב מאוד מההחלפה הזו, אבל זה לא תירוץ להיות מנומס כלפי @whuber.ברור שהוא קרא את הערותיי, כשהוא מתייחס אליהן, וזה אבסורד לרמוז שהוא טיפש או בור מכדי לראות את הנקודה שלך.אפילו שתוקנה באופן דרסטי התשובה שלך מעלה יותר בעיות ממה שהיא פותרת.בתחילת הדרך, האפיון לפיו "ככל הנראה אתה משער את ההסתברות לאירוע אפשרי" מתייחס לכל היותר להסתברות קודמת ואינו משמש כמועיל באופן כללי.אני עוצר שם.
@whuber, NickCox, סליחה, אני חושב שהייתי אימפולסיבי בתגובה הקודמת שלי ולא שמתי לב לכמה רמזים שמסרת.ראשית הדחף שלי נבע מהמשפט הראשון, כן, "תשובה שגויה מצדיקה כי היא שגויה, אך הקביעה על משהו שגוי אינה מרמזת על כך שהיא שגויה או לא נכונה".בכל מקרה, אני לא אוהב להתווכח, אני מעדיף ללמוד וחשבתי שאתה לא מציע את ההיגיון שלך.עם זאת, כעת אני רואה שהמילה "הבחנה זמנית" הייתה רמז.זה משהו שאפשר לדון בו.
וההבחנה שלי הייתה יותר ככלל אצבע / רמז / (אני לא מכיר את הביטוי) כדי להקל על הבחנה בידי מי שאינו מומחה. עם זאת, אני מסכים שזה זקוק לטרמינולוגיה מדויקת יותר.אני עשוי לשנות או להסיר את תשובתי מאוחר יותר, אולם בשלב זה עלי להשאיר אותה שם.תודה.
@Nick אנא בדוק את התגובות החדשות שלי.
זו בחירתך, אלא אם כן הצבעות נוספות למחיקה יכריעו את העניין. נכון לעכשיו יש לך שתי הצבעות מטה (@whuber והכרזנו על עצמנו) והצבעה אחת ממישהו שונה לגמרי
@NickCox, האם השינוי הנוכחי בתשובה זו הופך אותה ל"נכונה במקצת "?לדעתי אני חושב שזה עושה כי הסבירות היא לקבוע מהו מערך ההשערה של תוצאה שנצפתה והסיכוי המקסימלי נקבע כדי לקבוע השערה אחת המסבירה בצורה הטובה ביותר את התוצאה.בהקשר זה הוא כתב "ככל הנראה" כדי להגדיר סבירות ולא סבירות מקסימאלית שלדעתי היא המושג המטעה "היחיד" כאן.ימין?
@GENIVI-LEARNER אני לא חושב שזו עדיין תשובה מועילה.אף כמות אינה מוגדרת היטב על ידי הגישה שיש לך כביכול כאשר אתה משתמש בה.לדוגמא, ניתן להעריך את ההסתברויות בתיאור מבלי לחשוב על שום מודל רשמי.
@NickCox, ובכן נראה כי הסבירות מעט מורכבת יותר.יש לך תובנה טובה על זה, אנא בדוק אם תוכל לתרום [גם לזה] (https://stats.stackexchange.com/questions/445928/probability-and-likelihood-from-another-angle).שילבתי אותו מחדש בתרחיש קונקרטי.
@NickCox, גם כשאמרת ** ניתן להעריך את ההסתברויות באופן תיאורי ללא כל מודל פורמלי בראש ** האם אתה אומר כי סביר להניח שתמיד צריכה להיות השערה או מודל אנליטי או מספרי כלשהו בהישג יד?אם כן, אני חושב שהיבט מבוסס-מודל זה של סבירות יכול להגדיר באופן ייחודי עד כמה הסבירות שונה מההסתברות.ימין?
עמדתי נותרה כי יש כאן כמה תשובות טובות במיוחד ואין לי מה לומר שהוא שונה או יהיה מנוסח טוב יותר.יש גם סבירות אמפירית, לא שאני יודע על זה מספיק כדי לפרסם.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.
Loading...