Теорема Цибенка

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Теорема Цибенка, Універсальна теорема апроксимації — теорема, доведена Джорджем Цибенком (George Cybenko) в 1989 році, яка стверджує, що штучна нейронна мережа прямого зв'язку (Шаблон:Lang-en; у яких зв'язки не утворюють циклів) з одним прихованим шаром може апроксимувати будь-яку неперервну функцію багатьох змінних з будь-якою точністю. Умовами є достатня кількість нейронів прихованого шару, вдалий підбір 𝐰1,𝐰2,,𝐰N,𝜶, і 𝜽, де

  • 𝐰i — ваги між вхідними нейронами і нейронами прихованого шару
  • 𝜶 — ваги між зв'язками від нейронів прихованого шару і вихідним нейроном
  • 𝜽 — коефцієнт «упередженості» для нейронів прихованого шару.

Формальне викладення

Нехай φ будь-яка непрервна сигмоїдна функція, наприклад, φ(ξ)=1/(1+eξ). Тоді, якщо дана будь-яка неперервна функція дійсних змінних f на [0,1]n (або будь яка інша компактна підмножина Rn) і ε>0, тоді існують вектори 𝐰𝟏,𝐰𝟐,,𝐰𝐍,𝜶,𝜽 та параметризована функція G(,𝐰,𝜶,𝜽):[0,1]nR, така, що

|G(𝐱,𝐰,𝜶,𝜽)f(𝐱)|<ε для всіх 𝐱[0,1]n,

де

G(𝐱,𝐰,𝜶,𝜽)=i=1Nαiφ(𝐰iT𝐱+θi),

та 𝐰iRn, αi,θiR, 𝐰=(𝐰1,𝐰2,𝐰N), 𝜶=(α1,α2,,αN), та 𝜽=(θ1,θ2,,θN).

Посилання

Див. також

Шаблон:Диференційовні обчислення