Логарифмічна ймовірність

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Логарифмічна ймовірність (Шаблон:Lang-en) в теорії ймовірностей та інформатиці, це просто логарифм імовірності[1]. Його використання означає представлення ймовірності в логаритмічній шкалі (inf,0], замість звичайного одиничного інтервалу [0,1].

Так як ймовірності незалежних подій перемножуються, а логарифми перетворюють множення на додавання, логарифмічні ймовірності незалежних подій додаються. Через це вони доволі зручні для обчислень, і мають інтуїтивне представлення в теорії інформації: від'ємне значення середньої логарифмічної ймовірності, є інформаційною ентропією події. Подібно, функція правдоподібності перетворюються в логарифмічний масштаб і логарифмічну правдоподібність можна інтерпретувати як міру до якої подія підтримує статистичну модель. Логарифм ймовірності часто застосовується в задачах обробки природньої мови.

Переваги

Представлення ймовірності в цьому форматі має кілька практичних переваг:

  1. Швидкість. Множення обчислювально дорожче ніж додавання, тому отримання ймовірності багатьох подій часто швидше, якщо вони представлені в логарифмічній формі. (Саме логарифмічне перетворення складне, але виконується лише раз)
  2. Точність. Використання логарифмів покращує числову стійкість, коли ймовірності дуже малі, через формат задання чисел в комп'ютері[1].
  3. Простота. Багато розподілів ймовірностей мають експоненційну форму. Якщо взяти логарифм цих розподілів, експоненційна функція пропадає. Наприклад, логарифм густини ймовірності нормального розподілу це ((xmx)/σm)2+C замість C2exp(((xmx)/σm)2).

Проблеми з представленням

Функція логарифму не визначена для нуля, тому логарифмічні ймовірності не можуть задавати неможливі події.

Основні операції

Позначимо логарифмічні ймовірності штрихом:

x=log(x)
y=log(y)

Добуток ймовірностей xy відповідає додаванню в логарифмічному просторі.

log(xy)=log(x)+log(y)=x+y.


Додавання

log(x+y)=log(x+xy/x)=log(x+xexp(log(y/x)))=log(x(1+exp(log(y)log(x))))=log(x)+log(1+exp(log(y)log(x)))=x+log(1+exp(yx))

Формула вище є точнішою за log(ex+ey), особливо якщо скористатися асиметрією. Як x краще використати більше (менш негативне) значення. Правильно обране x також дає коректні значення, якщо один з аргументів - -INF, що відповідає нульовій ймовірності.

+log(1+exp(y()))=+. Це значення невизначене, і дасть NaN.
x+log(1+exp(x))=x+0. Це правильне значення.

Використання тільки цієї формули даватиме невизначені результати якщо обидва аргументи дорівнюють . Цей випадок треба розглядати окремо і повертати .

Також, для обчислення log(1+x) краще використовувати спеціалізовану функцію log1p[2].

Див. також

Зноски