איך משווים את הסיכוי לזרוק את הקוביות הגבוהות ביותר? (חִידָה)

KaPy3141

2019-11-20 23:34:09 UTC

view on stackexchange narkive permalink

הרגע המצאתי את החידה הבאה ועשיתי עבודה סטטיסטית. (אני באמת צריך את התשובה!)

Riddle:

דמיין משחק קוביות במטרה לזרוק את הקוביות הגבוהות ביותר. הקוביות מיוחדות ויש להן צדדים אינסופיים עם מספרים שנעים בין 0 ל -1! (מדים, ללא הטיה)

ישנם 2 שחקנים: לשחקן A יש 3 קוביות לזרוק, לשחקן B יש 7 קוביות. זה אומר שלשחקן B יש סיכוי לזכות ב -7 / 10, כלומר לזרוק את המספר הגבוה ביותר מבין כל 10.

כעת, כדי להביא לגינות במצב, השחקנים מסכימים להכפיל כל מספר נזרק על ידי שחקן A על ידי קבוע מסוים. מה הערך של זה קבוע, כך שלכל שחקן יש סיכוי של 50% לזכות?

האם תוכל למצוא נוסחה כללית לקביעת קבוע זה, בהתבסס על כמויות הקוביות שיש לשני השחקנים?

(ובמקרה שזו בעיה ידועה: האם אתה יודע איך זה נקרא?)

Considerations / Spoiler: קבוע ההתאמה אינו תלוי רק ביחס הטלות (3: 7 במקרה זה); במקום זאת, המספר המוחלט חשוב. לדוגמא, אם לשחקנים היו 300 ו -700 זריקות, הקבוע הזה יהיה הרבה יותר קרוב ל -1.

האינטואיציה שלי: אני חושב שהערכה טובה היא להניח התפלגות הומוגנית של הטלות: למשל, 3 ההטלות הן בעשרונים 0.25, 0.5 ו- 0.75! עכשיו המספר הגבוה ביותר יהיה 0.75! בצע את אותו הדבר עם שחקן B ותקבל את יחסי המספרים הגבוהים ביותר הצפויים (-> קבוע ההתאמה). לצערי זו רק האינטואיציה שלי ואני לא בטוח אם זה נכון.

EDIT: אני אסיר תודה על כל התשובות אבל הופתעתי שאיש לא השתמש בגישה דומה לזו שתיארתי. לשם השלמות, כאן אני מסביר היכן טעיתי:

הנחתי שמקסימום הזריקות הצפוי יהיה 1-1 / (n + 1), וזה נכון, כפי שמדמה התסריט הבא:

  ייבא numpy כ- np יבוא matplotlib.pyplot כ- plt
x, y, y2 = [], [], [] עבור n בטווח (1,21):
    x.append (n)
    y2.append (1-1 / (n + 1))
    temp = []
    עבור _ בטווח (10000):
        sample = np.random.random_sample (n,)
        temp.append (max (sample))
    y.append (np.mean (temp))


פיזור plt. (x, y)
מגרש plt. (x, y2)
plt.title ("ממוצע מקסימום = 1 / (n + 1)")
plt.xlabel ("מספר זריקות")
plt.ylabel ("ממוצע מקסימום של זריקות")
plt.show ()

מה שאומר שאם היינו משתמשים ב- c קבוע כדי להכפיל כל אחת מהזריקות n של שחקן A, המקסימום הצפוי יהיה שווה לזריקות m של שחקן A, אם נשתמש בנוסחה זו עבור c:

(או)

אבל זה לא נכון, כי החידה לא מנסה להשוות את mean של המקסימום. במקום זאת היא רוצה להשוות את סכום הדירוג של שתי חלוקות השחקנים של מקסימום. (אם דירגנו כל מקסימום לאורך שתי ההפצות)

הנה, רק לצורך המחשה, אני מראה כיצד הנוסחה שלי אינה מסוגלת להתאים במדויק לחציון המקסימום:

על שאלה זו נענה על ידי השוואה בין שתי התפלגויות בטא המעורבות, מכיוון ששתי המקסימום עוקבות אחר הפצות ביתא $ (n, 1) $ (עבור $ n $ שונות).

@Dougal נכון - הבנתי שברגע שפרסמתי את התגובה המקורית שלי.

אני רואה.נתונים אמיתיים בפורמט זה יבואו לפי חלוקת בטא שאצטרך להעריך.(תודה למדתי משהו!) אבל במקרה זה, אני לא חושב שיש צורך בהפצת בטא!רק נניח התפלגות הומוגנית לחלוטין!

לא משנה איך אתה ניגש אליו, הפתרון האנליטי הופך פונקציה היפר-גיאומטרית.למרות שניתן לבטא פונקציה זו כפולינום במכפיל הלא ידוע, מספר המונחים פרופורציונלי ישירות למספר הקוביות הכולל והוא מתחלף בסימן, מה שהופך את הגישה הזו לא פרודוקטיבית לניתוח או לחישוב.

אני מפרסם את הפתרון שלי להשוואה ללא גזירה.ציין $ m $ הוא מספר הקוביות עבור השחקן עם יותר קוביות ו- $ n = xm $ הוא מספר הקוביות של השחקן האחר.קבוע הכפל הוא אז $ c = 2 ^ {(1 / n)} (1 + x) ^ {- (1 / n)} $.הגדרת $ m = 7, n = 3 $ ו- $ x = 3/7 $ נקבל $ c = (7/5) ^ {(1/3)} $.

@COOLSerdash, פרסמתי תשובה המכילה פיתרון מדויק אשר מסכים באופן מושלם עם הערתך.

set.seed (1120) x1 = לשכפל (10 ^ 5, מקסימום (runif (3))) ממוצע (x1) [1] 0.7488232 # aprx E (X1) = 3/4 par (mfrow = c (1,3)) היסט (x1, prob = T, col = "skyblue2") עקומה (dbeta (x, 3,1), הוסף = T, col = "אדום", n = 10001) x2 = לשכפל (10 ^ 5, מקסימום (runif (7))) ממוצע (x2) [1] 0.8746943 # aprx E (X2) = 7/8 היסט (x2, prob = T, col = "skyblue2") עקומה (dbeta (x, 7,1), הוסף = T, col = "כחול", n = 10001) ממוצע (x1 ^ (3/7)) [1] 0.8743326 # aprx 7/8 היסט (x1 ^ (3/7), prob = T, col = "skyblue2") עקומה (dbeta (x, 7,1), הוסף = T, col = "כחול", n = 10001) par (mfrow = c (1,1))

הכפל ב $ \ left (\ frac {2 (7)} {3 + 7} \ right) ^ {1/3} = 1.1187 $