Описание метода «критерий Келли» и его свойства
Допустим, мы играем с бесконечно богатым противником, который будет делать повторяющиеся ставки на независимые события — броски монеты. Далее, предположим, что при каждом броске наша вероятность победы p> ½, а вероятность потери q = 1 — p. Наш начальный капитал — XO. Предположим, что наша цель — максимизация ожидаемой величины E (Xn) через n попыток. Сколько мы поставим, Bk, на k-ой попытке… Читать ещё >
Описание метода «критерий Келли» и его свойства (реферат, курсовая, диплом, контрольная)
В этой главе рассматриваются свойства критерия Келли. Для простоты, проиллюстрируем его на примере самого простейшего случая — подбрасывания монеты, но концепция и выводы легко обобщаются.
Допустим, мы играем с бесконечно богатым противником, который будет делать повторяющиеся ставки на независимые события — броски монеты. Далее, предположим, что при каждом броске наша вероятность победы p> ½, а вероятность потери q = 1 — p. Наш начальный капитал — XO. Предположим, что наша цель — максимизация ожидаемой величины E (Xn) через n попыток. Сколько мы поставим, Bk, на k-ой попытке? Пусть Tk = 1, если k-я попытка — выигрышная и Tk = -1, если она проиграна, тогда Xk =Xk-1 + Tk Bk для k = 1,2,3., и Xn = XO + Уnk=1TkBk. Тогда
Так как игра имеет положительное ожидание, то есть p-q> 0, в этой ситуации равных выплат, для того, чтобы максимизировать Е (Хn), мы должны были бы максимизировать E (Bk) для каждой попытки. Таким образом, чтобы максимизировать ожидаемый рост мы должны ставить все наши ресурсы в каждой попытке. Таким образом, B1 = X0, и, если мы выигрываем первую ставку, B2 = 2X0, и т. д. Однако, вероятность краха при этом будет 1 — pN и при p < 1, lim n>? [1 —рn] = 1, так что крах почти неизбежен. Таким образом, «смелый» критерий ставок для максимизации ожидаемого роста обычно нежелателен.
Аналогично, если наша стратегия состоит в том, чтобы минимизировать вероятность возможного краха (а «крах» происходит, если XK = 0 на k-ой попытке), мы должны делать минимальную ставку на каждой попытке, но это, к сожалению, также минимизирует и ожидаемый рост. Таким образом, «робкая» система ставок также непривлекательна.
Это предполагает существование промежуточной стратегия, которая лежит где-то между максимизацией E (Xn) (и верным крахом) и уменьшением вероятности краха (и уменьшением E (Хn)). Асимптотически оптимальная стратегия была впервые предложена Джном Келли в 1956 году.
Так как вероятности и выплаты при каждой ставке в описанной игре с подбрасыванием монеты одинаковы, кажется вполне правдоподобно, что «оптимальная» стратегия потребует всегда делать ставки на одну и ту же долю f вашего капитала. Чтобы это было возможным сделать, мы предполагаем далее, что капитал может бесконечно дробиться.
Стратегия, в которой ставки делаются согласно Bi = f Xi-1, где 0? f? 1, иногда называется стратегией «фиксированной доли». Пусть S и F — числа успехов и проигрышей в n попытках соответственно, тогда наш капитал после n попыток равен Xn = Xo(1+ f)S (1-f)F, где S + F = n. При f в интервале 0 < f < 1, Рr (Хn = 0) = 0. Таким образом, «краха», понимаемом в техническом смысле как разорение игрока, произойти не может. «Крах» будет означать, что для произвольно маленького положительного е, limn>?[Рr (Xn ? е)] = 1. В этом смысле, как мы увидим, крах все-таки может случиться при некоторых обстоятельствах.
Отметим, что так как.
величина.
измеряет экспоненциальную скорость роста за попытку. Келли максимизировал ожидаемую величину коэффициента скорости роста, g (f), где.
Получается, что g (f) = (1/n)E[logXn]- (1/n)logX0, поэтому, для фиксированного n, максимизация g (f) — то же самое, что максимизация E[logXn]. Вычислим производную:
когда f = f * = p — q.
Так как.
то g' (f) убывает строго монотонно на [0, 1],.
так как g' (0) = p-q > 0 и lim f>1 — g'(f) = - ?. Вследствие непрерывности g'(f), g (f) имеет единственный максимум в точке f=f *,.
где g (f *) = p log p + q log q + log 2 > 0. Более того, поскольку g (0) = 0 и lim f>1 — g{f) = - ?, то существует единственное fC > 0, такое что 0 < f* < fC < 1 и g (fC) = 0.
Построим график функции g (f) от f (рисунок 3.1).
Рисунок 3.1. График функции g (f).
Исходя из максимизации функции g (f), Джоном Келли были сформулированы следующие свойства:
- — Если g (f) > 0, тогда почти достоверно, что limn>? Хn = ?, то есть для каждого М, Pr [lim n>? inf Хn > М] = 1. Это свойство показывает что, если бы не конечное время, благосостояние игрока XN превысило бы любой установленный предел М, когда f выбрано в интервале (0, fс).
- — Если g (f) < 0, тогда почти достоверно, что limn>? Хn = 0, то есть для каждого е>0, Pr [lim n>? sup Хn < е] = 1, получается, что крах неизбежен .
- — Если g (f) = 0, тогда почти достоверно, что lim n>? sup Хn= ? и lim n>? inf Хn = 0. Это утверждение демонстрирует, что, если g (f) = 0, тогда почти достоверно, что lim n>? sup Хn= ? и lim n>? inf Хn = 0.
- — Для заданной стратегии Ф*, которая максимизирует E[log Xn] и любой другой «существенно иной» стратегии Ф (не обязательно стратегии фиксированных дробных ставок) почти достоверно, что limn>? Хn(Ф*)/Хn (Ф) = ?.
- — Ожидаемое время, необходимое чтобы текущий капитал Xn достиг заранее установленного значения С будет, асимптотически, наименьшим при стратегии, которая максимизирует E[log Xn].
- — Если предположить, что отдача от одной ставки на i-ой попытке — биноминальная случайная переменная Ui, далее предположим, что вероятность успеха pi, где ½ < pi < 1. Тогда E[log Xn] максимизируется выбором значением для ставки при каждой попытке доли f *i = pi — qi которая максимизирует E[ log (1+fiUi)]. Эта часть устанавливает справедливость использования метода Kelly выбора fi* при каждой попытке (даже если от одной попытки к следующей меняется вероятность) для максимизации E[log Xn].