Алгоритм шансів

Матеріал з testwiki
Версія від 19:28, 22 липня 2024, створена imported>Vlasenko D (оформлення)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

У теорії рішень алгоритм шансів (або алгоритм Брюсса) — це математичний метод обчислення оптимальних стратегій для класу задач, які належать до області задач оптимальної зупинки. Їх розв'язок випливає зі стратегії шансів, а важливість стратегії шансів полягає в її оптимальності, як пояснюється нижче.

Алгоритм шансів застосовується до класу задач, які називаються задачами останнього успіху. Формально метою цих задач є максимізація ймовірності ідентифікації в послідовності незалежних подій саме останньої події, яка задовольняє певному критерію («специфічна подія»). Ця ідентифікація повинна бути зроблена в момент спостереження. Повернення до попередніх спостережень не дозволяється. Зазвичай особлива подія визначається особою, яка приймає рішення, як подія, що становить справжній інтерес з погляду «зупинки» для здійснення чітко визначеної дії. Такі задачи виникають у кількох ситуаціях.

Приклади

Дві різні ситуації є прикладами зацікавленості в максимізації ймовірності зупинитися на останній події.

  1. Припустимо, що автомобіль виставлено на продаж тому, хто запропонує найвищу ціну (найкращу «пропозицію»). Нехай n потенційних покупців відгукнулися і попросили показати їм машину. Кожен з них наполягає на негайному рішенні продавця прийняти пропозицію чи ні. Визначимо пропозицію як цікаву і закодуємо її 1, якщо вона краща за всі попередні пропозиції, і 0 в іншому випадку. Пропозиції формують Шаблон:Нп з 0 та 1. Тільки 1 цікавлять продавця, який може побоюватися, що кожна наступна 1 може стати останньою. З визначення випливає, що остання 1 є найвищою ставкою. Отже, максимізація ймовірності продажу за останньою одиницею означає максимізацію ймовірності продажу за найкращою ціною.
  2. Лікар, застосовуючи спеціальне лікування, може використовувати код 1 для успішного лікування, 0 — у протилежному випадку. Лікар лікує послідовність з n пацієнтів однаковим чином і хоче мінімізувати будь-які страждання, а також вилікувати кожного пацієнта, який реагує на лікування. Зупинившись на останній 1 у такій випадковій послідовності 0 і 1, він досягне цієї мети. Оскільки лікар не пророк, його мета — максимізувати ймовірність зупинки на останній 1 (див. Шаблон:Нп).

Визначення

Розглянемо послідовність n незалежних подій. Пов'яжемо із цією послідовністю іншу послідовність незалежних подій I1,I2,,In зі значеннями 1 або 0. Тут Ik=1, що називається успіхом, означає подію, що k-те спостереження є цікавим (як визначено особою, яка приймає рішення), і Ik=0 для нецікавих. Ці випадкові величини I1,I2,,In спостерігаються послідовно, і мета полягає в тому, щоб правильно вибрати останній успіх, коли він спостерігається.

Нехай pk=P(Ik=1) ймовірність того, що k-та подія є цікавою. Далі нехай qk=1pk і rk=pk/qk. Зауважимо, що rk представляє Шаблон:Нп на те, що k-та подія виявиться цікавою, пояснюючи назву алгоритму шансів.

Алгоритмічна процедура

Алгоритм шансів підсумовує шанси у зворотному порядку

rn+rn1+rn2+,

доки ця сума вперше не досягне або не перевищить значення 1. Якщо це відбувається з індексом s, зберігається s і відповідна сума

Rs=rn+rn1+rn2++rs.

Якщо сума шансів не досягає 1, встановлюється s = 1. Водночас він обчислює

Qs=qnqn1qs.

Вихід є

  1. s, поріг зупинки
  2. w=QsRs, ймовірність виграшу.

Стратегія шансів

Стратегія шансів — це правило спостереження за подіями одна за одною та зупинка на першій цікавій події від індексу s (якщо є), де s — поріг зупинки результату a.

Важливість стратегії шансів, а отже й алгоритму шансів, полягає в наступній теоремі шансів.

Теорема шансів

Теорема шансів стверджує, що

  1. Стратегія шансів є оптимальною, тобто вона максимізує ймовірність зупинки на останній 1.
  2. Імовірність виграшу стратегії шансів дорівнює w=QsRs
  3. Якщо Rs1, ймовірність виграшу w завжди принаймні Шаблон:Math. і ця нижня межа є найкращою з можливих.

Особливості

Алгоритм шансів обчислює оптимальну стратегію та оптимальну ймовірність виграшу одночасно. Крім того, кількість операцій алгоритму шансів є (суб)лінійною по n. Отже, не може існувати швидшого алгоритму для всіх послідовностей, так що алгоритм шансів водночас є оптимальним як алгоритм.

Джерела

Алгоритм шансів розробив Шаблон:Harvnb року, який і придумав його назву. Він також відомий як алгоритм (стратегія) Брюсса. Реалізації з відкритим кодом можна знайти в Інтернеті.

Застосування

Застосування алгоритму шансів охоплюють медичні питання в клінічних випробуваннях, проблеми з продажем, задачі пошуку співробітника, вибір портфоліо, (односторонні) стратегії пошуку, проблеми траєкторії та Шаблон:Нп до проблем онлайн-обслуговування тощо.

Також існує теорема шансів для безперервних процесів надходження з Шаблон:Нп, таких як процес Пуассона Шаблон:Harv. У деяких випадках шанси не обов'язково відомі заздалегідь (як у прикладі 2 вище), тому застосування алгоритму шансів безпосередньо неможливо. У цьому випадку кожен крок може використовувати Шаблон:Нпні шансів. Це має сенс, якщо кількість невідомих параметрів невелика порівняно з кількістю спостережень n. Питання оптимальності тоді є складнішим, однак, і вимагає додаткових досліджень. Узагальнення алгоритму шансів дозволяють отримати різну винагороду за невдалу і помилкову зупинку, а також замінити припущення про незалежність на слабші Шаблон:Harv.

Варіації

Шаблон:Harvnb обговорювали проблему вибору останніх k успіхів.

Шаблон:Harvnb довів теорему про мультиплікативні шанси, яка розглядає проблему зупинки на будь-якому з останніх успіхів.

Жорстка нижня межа ймовірності виграшу отримана за формулою Шаблон:Harvnb.

Шаблон:Harvnb обговорили проблему вибору k з останніх і отримали жорстку нижню межу ймовірності виграшу. Коли =k=1, задача еквівалентна задачі Брюсса про шанси. Якщо =k1, задача еквівалентна задачі в Шаблон:Harvnb. Задача, що розглядається в Шаблон:Harvnb отримується за умови, що k=1.

Проблема множинного вибору

Гравцеві дозволено r виборів, і він виграє, якщо будь-який вибір є останнім успішним. Для класичної проблеми секретаря Шаблон:Harvnb обговорили випадки r=2,3,4. Проблема шансів з r=2,3 обговорюється Шаблон:Harvnb. Додаткові випадки проблеми шансів див. у Шаблон:Harvnb.

Оптимальна стратегія для цієї задачі належить до класу стратегій, визначених набором порогових чисел (a1,a2,...,ar), де a1>a2>>ar.

Зокрема, уявіть, що у вас є r листів-зобов'язань, позначених від 1 до r. У вас буде r працівників, кожен з яких тримає одну літеру. Ви продовжуєте проводити співбесіди з кандидатами й заносите їх у таблицю, яку бачить кожен з них. Зараз працівник i надсилає лист-відповідь про прийняття на роботу першому кандидату, який виявився кращим за всіх інших кандидатів 1 до ai. (Невідправлені листи про прийняття за замовчуванням віддаються останнім заявникам, так само як і у стандартній задачі про секретаря).

Коли r=2, Шаблон:Harvnb показали, що нижня межа ймовірності виграшу дорівнює e1+e32. Для загального натурального числа r, Шаблон:Harvnb довели, що нижня межа ймовірності виграшу є ймовірністю виграшу у варіанті задачі секретаря, де потрібно вибрати k кращих кандидатів, використовуючи лише k спроб.

Коли r=3,4,5, нижні межі ймовірностей виграшу дорівнюють e1+e32+e4724, e1+e32+e4724+e27611152 і e1+e32+e4724+e27611152+e41626371474560, відповідно.

Щодо подальших числових випадків для r=6,...,10, а також алгоритму для загальних випадків, див. Шаблон:Harvnb.

Див. також

Список літератури

Шаблон:Reflist

Посилання