Покажем, что вероятность в правой части (1) убывает, когда i возрастает, а вероятность в левой части (1) возрастает с возрастанием i, и потому существует выбор шага i, после которого предпочтительнее удержать максимальное приданое, нежели продолжать испытания. Вычисляя затем вероятность выигрыша для такой стратегии, найдем оптимальный выбор значения s.
После нескольких первых ходов в этой игре мы можем еще прибегнуть ко всем стратегиям, определяемым последующими вытаскиваниями, так как мы всегда можем пропустить часть билетов, пока не достигнем нужного нам числа билетов. Следовательно, вероятность в правой части неравенства (1) не возрастает с ростом i. При i = 0 это искомая оптимальная вероятность, а при i = n − 1 эта вероятность равна 1/n как вероятность выигрыша при выборе на последнем шагу.
Вероятность того, что на i-м шагу максимальное приданое больше всех имеющихся, равна вероятности того, что наилучший номер находится на одном из первых i билетов, а именно, равна i/n, что является строго возрастающей от 1/n до 1 функцией от i. Поэтому значение i/n в какой-то точке превосходит вероятность выигрыша при продолжении испытаний. Таким образом, оптимальная стратегия может быть задана следующим правилом: пропустить s − 1 первых номеров и выбрать затем первого лидера, т. е. первый номер, который больше всех предыдущих. Сосчитаем вероятность выигрыша для такой стратегии. Вероятность правильного решения есть вероятность появления ровно одного лидера между s-м шагом и n-м. Вероятность того, что наилучший билет появился на k-м шагу, равна 1/n. Вероятность того, что максимум первых k − 1 номеров появился среди первых s − 1 номеров, есть (s − 1)/(k − 1). Произведение (s − 1)/[n·(k − 1)] дает вероятность того, что мы выиграем при выборе k, s ≤ k ≤ n. Суммируя эти числа, получим вероятность π(s, n) получения наилучшего приданого при оптимальной стратегии
(2)
Так как первое вытаскивание всегда дает максимальный номер, то π(1, n) = 1/n. Заметим, что при n = 4, s = 2 имеем π(1, n) = 11/24, как и в нашем примере.
Оптимальное значение s, скажем, s*, есть минимальное s, для которого имеет место неравенство (1), т. е. это наименьшее s, для которого
(3)
или, что равносильно, такое s, для которого
(4)
| n | s | π(s, n) | n | s | π(s, n) |
| 1 | 1 | 1.000 | 10 | 4 | 0.399 |
| 2 | 1 | 0.500 | 20 | 8 | 0.384 |
| 3 | 2 | 0.500 | 50 | 19 | 0.374 |
| 4 | 2 | 0.458 | 100 | 38 | 0.371 |
| 5 | 3 | 0.433 | ∞ | n/e | 1/e ≈ 0.368 |
Эта таблица дает оптимальные значения s и соответствующие им вероятности правильного решения для небольших значений n. Для n = 100 следует пропустить 37 приданных и выбрать после этого первое максимальное.
Для больших значений n мы можем аппроксимировать сумму выражением ln(n) + C, где С — постоянная Эйлера. Используя это приближение в формуле (2) для больших s и n, получаем
(5)
Аналогично приближения для правой и левой частей неравенства (4) показывают, что ln(n/s) ≈ 1, и, значит, s ≈ n/e. Подставляя эти результаты в (5), находим
Подводя итог, видим, что для больших значений n оптимальная стратегия пропускает приблизительно 1/e часть билетов и останавливается после этого на первом максимальном приданом, причем вероятность правильного решения равна приближенно 1/e.