הרגע המצאתי את החידה הבאה ועשיתי עבודה סטטיסטית. (אני באמת צריך את התשובה!)
Riddle:
דמיין משחק קוביות במטרה לזרוק את הקוביות הגבוהות ביותר. הקוביות מיוחדות ויש להן צדדים אינסופיים עם מספרים שנעים בין 0 ל -1! (מדים, ללא הטיה)
ישנם 2 שחקנים: לשחקן A יש 3 קוביות לזרוק, לשחקן B יש 7 קוביות. זה אומר שלשחקן B יש סיכוי לזכות ב -7 / 10, כלומר לזרוק את המספר הגבוה ביותר מבין כל 10.
כעת, כדי להביא לגינות במצב, השחקנים מסכימים להכפיל כל מספר נזרק על ידי שחקן A על ידי קבוע מסוים. מה הערך של זה קבוע, כך שלכל שחקן יש סיכוי של 50% לזכות?
האם תוכל למצוא נוסחה כללית לקביעת קבוע זה, בהתבסס על כמויות הקוביות שיש לשני השחקנים?
(ובמקרה שזו בעיה ידועה: האם אתה יודע איך זה נקרא?)
Considerations / Spoiler: קבוע ההתאמה אינו תלוי רק ביחס הטלות (3: 7 במקרה זה); במקום זאת, המספר המוחלט חשוב. לדוגמא, אם לשחקנים היו 300 ו -700 זריקות, הקבוע הזה יהיה הרבה יותר קרוב ל -1.
האינטואיציה שלי: אני חושב שהערכה טובה היא להניח התפלגות הומוגנית של הטלות: למשל, 3 ההטלות הן בעשרונים 0.25, 0.5 ו- 0.75! עכשיו המספר הגבוה ביותר יהיה 0.75! בצע את אותו הדבר עם שחקן B ותקבל את יחסי המספרים הגבוהים ביותר הצפויים (-> קבוע ההתאמה). לצערי זו רק האינטואיציה שלי ואני לא בטוח אם זה נכון.
EDIT: אני אסיר תודה על כל התשובות אבל הופתעתי שאיש לא השתמש בגישה דומה לזו שתיארתי. לשם השלמות, כאן אני מסביר היכן טעיתי:
הנחתי שמקסימום הזריקות הצפוי יהיה 1-1 / (n + 1), וזה נכון, כפי שמדמה התסריט הבא:
ייבא numpy כ- np יבוא matplotlib.pyplot כ- plt
x, y, y2 = [], [], [] עבור n בטווח (1,21):
x.append (n)
y2.append (1-1 / (n + 1))
temp = []
עבור _ בטווח (10000):
sample = np.random.random_sample (n,)
temp.append (max (sample))
y.append (np.mean (temp))
פיזור plt. (x, y)
מגרש plt. (x, y2)
plt.title ("ממוצע מקסימום = 1 / (n + 1)")
plt.xlabel ("מספר זריקות")
plt.ylabel ("ממוצע מקסימום של זריקות")
plt.show ()
מה שאומר שאם היינו משתמשים ב- c קבוע כדי להכפיל כל אחת מהזריקות n של שחקן A, המקסימום הצפוי יהיה שווה לזריקות m של שחקן A, אם נשתמש בנוסחה זו עבור c:
אבל זה לא נכון, כי החידה לא מנסה להשוות את mean של המקסימום. במקום זאת היא רוצה להשוות את סכום הדירוג של שתי חלוקות השחקנים של מקסימום. (אם דירגנו כל מקסימום לאורך שתי ההפצות)
הנה, רק לצורך המחשה, אני מראה כיצד הנוסחה שלי אינה מסוגלת להתאים במדויק לחציון המקסימום: