Теорема про довільну зупинку

Матеріал з testwiki
Версія від 05:22, 3 грудня 2024, створена imported>MalarzBOT (MalarzBOT: Видаляю непотрібні шаблони {{link-interwiki}}/{{Не перекладено}})
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Сирий переклад Шаблон:Distinguish Шаблон:Refimprove У теорії ймовірностей теорема про необов'язкову зупинку (іноді також теорема Дуба про необов'язкове вибіркове спостереження, на честь американського ймовірнісника Шаблон:Li) стверджує, що, за певних умов, математичне сподівання мартингала в момент зупинки дорівнює його початковому математичному сподіванню. Оскільки мартингали можуть використовуватись для моделювання статку гравця в чесній грі, теорема про необов'язкову зупинку стверджує, що в середньому нічого не можна виграти, зупиняючи гру на основі інформації, доступної до цього моменту (тобто без погляду в майбутнє). Для правильності цього результату необхідні певні умови. Зокрема, теорема застосовується до Шаблон:Li.

Теорема про необов'язкову зупинку є важливим інструментом математичних фінансів у контексті Шаблон:Li.

Твердження

Нижче наведено версію теореми для дискретного часу, де Шаблон:Math позначає множину натуральних чисел, включаючи нуль.

Нехай Шаблон:Math є дискретним мартингал, а Шаблон:Mathчас зупинки з значеннями у Шаблон:Math}, обидва відносно фільтрації Шаблон:Math. Припустимо, що виконується одна з наступних трьох умов:

(Шаблон:EquationRef) Час зупинки Шаблон:Math є майже напевно обмеженим, тобто існує константа Шаблон:Math, така що Шаблон:Math майже напевно.
(Шаблон:EquationRef) Час зупинки Шаблон:Math має скінченне математичне сподівання, і умовні математичні сподівання абсолютної величини приростів мартингала майже напевно обмежені, а саме 𝔼[τ]< і існує константа Шаблон:Math, така що 𝔼[|Xt+1Xt||t]c майже напевно на події Шаблон:Math} для всіх Шаблон:Math.
(Шаблон:EquationRef) Існує константа Шаблон:Math, така що Шаблон:Math майже напевно для всіх Шаблон:Math де Шаблон:Math позначає оператор мінімуму.

Тоді Шаблон:Math є майже напевно добре визначеною випадковою величиною, і 𝔼[Xτ]=𝔼[X0].

Аналогічно, якщо стохастичний процес Шаблон:Math є субмартингалом або супермартингалом і виконується одна з наведених умов, то

𝔼[Xτ]𝔼[X0],

для субмартингала, і

𝔼[Xτ]𝔼[X0],

для супермартингала.

Примітка

За умови (Шаблон:EquationNote) можливо, що Шаблон:Math відбувається з позитивною ймовірністю. У цьому випадку Шаблон:Math визначається як майже напевно існуюча точкова границя Шаблон:Math, див. докази нижче для деталей.

Застосування

  • Теорему про необов'язкову зупинку можна використати для доведення неможливості успішних стратегій ставок для гравця з обмеженим часом життя (що дає умову (Шаблон:EquationNote)) або обмеженням на ставки (умова (Шаблон:EquationNote)). Припустимо, що гравець може ставити до c доларів на чесне підкидання монети на часах 1, 2, 3 і т.д., виграючи свою ставку, якщо монета випаде орлом, і програючи її, якщо монета випаде решкою. Припустимо також, що він може припинити гру коли завгодно, але не може передбачити результат ще не зіграних підкидань. Тоді статок гравця з часом є мартингалом, а час Шаблон:Math, коли він вирішує припинити гру (або йому доводиться припинити через банкрутство), є часом зупинки. Таким чином, теорема стверджує, що Шаблон:Math. Іншими словами, гравець залишає гру з такою ж кількістю грошей в середньому, як і при початку. (Той самий результат діє, якщо у гравця замість обмеження на окремі ставки є обмеження на його кредитну лінію або на те, наскільки далеко він може зайти в борг, хоча це легше показати за допомогою іншої версії теореми.)
  • Припустимо, що випадковий блукач починається в Шаблон:Math і рухається вгору або вниз на одиницю з рівною ймовірністю на кожному кроці. Припустимо також, що блукання зупиняється, якщо воно досягає Шаблон:Math або Шаблон:Math; час, коли це вперше відбувається, є часом зупинки. Якщо відомо, що очікуваний час закінчення блукання є скінченним (скажімо, з теорії ланцюгів Маркова), теорема про необов'язкову зупинку передбачає, що очікувана кінцева позиція дорівнює початковій позиції Шаблон:Math. Розв'язуючи Шаблон:Math для ймовірності Шаблон:Math того, що блукання досягне Шаблон:Math до Шаблон:Math, отримуємо Шаблон:Math.
  • Тепер розглянемо випадковий блукач Шаблон:Math, що починається з Шаблон:Math і зупиняється, якщо він досягає Шаблон:Math або Шаблон:Math, і використаємо мартингал Шаблон:Math з розділу прикладів. Якщо Шаблон:Math — це час, коли Шаблон:Math вперше досягає Шаблон:Math, то Шаблон:Math. Це дає Шаблон:Math.
  • Однак, слід бути обережним, щоб забезпечити виконання хоча б однієї з умов теореми. Наприклад, припустимо, що в останньому прикладі було використано 'однобічний' час зупинки, так що зупинка відбувається лише при Шаблон:Math, а не при Шаблон:Math. Тоді значення Шаблон:Math в цей час зупинки буде Шаблон:Math. Тому очікуване значення Шаблон:Math повинно також дорівнювати Шаблон:Math, що, здається, суперечить теоремі, яка дає Шаблон:Math. Невиконання теореми про необов'язкову зупинку показує, що всі три умови не виконуються.

Доведення

Нехай Шаблон:Math позначає Шаблон:Li, який також є мартингалом (або субмартингалом чи супермартингалом відповідно). За умовами (Шаблон:EquationNote) або (Шаблон:EquationNote) випадкова величина Шаблон:Math є добре визначеною. За умовою (Шаблон:EquationNote) зупинений процес Шаблон:Math обмежений, отже, за теоремою Шаблон:Li він сходиться майже напевно до випадкової величини, яку ми позначаємо як Шаблон:Math.

Якщо виконано умову (Шаблон:EquationNote), то зупинений процес Шаблон:Math обмежений сталою випадковою величиною Шаблон:Math. В іншому випадку, розглядаючи зупинений процес як

Xtτ=X0+s=0τ1t1(Xs+1Xs),t0,

отримуємо Шаблон:Math для всіх Шаблон:Math, де

M:=|X0|+s=0τ1|Xs+1Xs|=|X0|+s=0|Xs+1Xs|𝟏{τ>s}.

За допомогою теорема монотонної збіжності

𝔼[M]=𝔼[|X0|]+s=0𝔼[|Xs+1Xs|𝟏{τ>s}].

Якщо виконано умову (Шаблон:EquationNote), то ця сума має лише кінчену кількість ненульових членів, тому Шаблон:Math є інтегрованим.

Якщо виконано умову (Шаблон:EquationNote), то продовжуємо, вставляючи умовне математичне сподівання та використовуючи, що подія Шаблон:Math} відома в час Шаблон:Math (зауважте, що Шаблон:Math є часом зупинки щодо фільтрації), отже

𝔼[M]=𝔼[|X0|]+s=0𝔼[𝔼[|Xs+1Xs||s]𝟏{τ>s}c𝟏{τ>s} a.s. by (b)]𝔼[|X0|]+cs=0(τ>s)=𝔼[|X0|]+c𝔼[τ]<,

де використано представлення математичного сподівання для випадкових величин, що набувають ненегативних цілих значень для останнього рівняння.

Отже, за будь-якою з трьох умов теореми зупинений процес домінує інтегрованою випадковою величиною Шаблон:Math. Оскільки зупинений процес Шаблон:Math сходиться майже напевно до Шаблон:Math, теорема теорема домінованої збіжності дає

𝔼[Xτ]=limt𝔼[Xtτ].

За властивістю мартингала зупиненого процесу

𝔼[Xtτ]=𝔼[X0],t0,

отже

𝔼[Xτ]=𝔼[X0].

Аналогічно, якщо Шаблон:Math є субмартингалом або супермартингалом, відповідно, змінюється рівність у останніх двох формулах на відповідну нерівність.

Посилання

Шаблон:Reflist

  1. Шаблон:Cite book
  2. Шаблон:Cite book

Зовнішні посилання