Теорема Цибенка

Матеріал з testwiki
Версія від 08:28, 19 березня 2024, створена 188.163.115.124 (обговорення) (Формальне викладення)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Теорема Цибенка, Універсальна теорема апроксимації — теорема, доведена Джорджем Цибенком (George Cybenko) в 1989 році, яка стверджує, що штучна нейронна мережа прямого зв'язку (Шаблон:Lang-en; у яких зв'язки не утворюють циклів) з одним прихованим шаром може апроксимувати будь-яку неперервну функцію багатьох змінних з будь-якою точністю. Умовами є достатня кількість нейронів прихованого шару, вдалий підбір 𝐰1,𝐰2,,𝐰N,α, і θ, де

  • 𝐰i — ваги між вхідними нейронами і нейронами прихованого шару
  • α — ваги між зв'язками від нейронів прихованого шару і вихідним нейроном
  • θ — коефцієнт «упередженості» для нейронів прихованого шару.

Формальне викладення

Нехай φ будь-яка непрервна сигмоїдна функція, наприклад, φ(ξ)=1/(1+eξ). Тоді, якщо дана будь-яка неперервна функція дійсних змінних f на [0,1]n (або будь яка інша компактна підмножина Rn) і ε>0, тоді існують вектори 𝐰𝟏,𝐰𝟐,,𝐰𝐍,α,θ та параметризована функція G(,𝐰,α,θ):[0,1]nR, така, що

|G(𝐱,𝐰,α,θ)f(𝐱)|<ε для всіх 𝐱[0,1]n,

де

G(𝐱,𝐰,α,θ)=i=1Nαiφ(𝐰iT𝐱+θi),

та 𝐰iRn, αi,θiR, 𝐰=(𝐰1,𝐰2,𝐰N), α=(α1,α2,,αN), та θ=(θ1,θ2,,θN).

Посилання

Див. також

Шаблон:Диференційовні обчислення