Теорема Цибенка

Теорема Цибенка, Універсальна теорема апроксимації — теорема, доведена Джорджем Цибенком (George Cybenko) в 1989 році, яка стверджує, що штучна нейронна мережа прямого зв'язку (Шаблон:Lang-en; у яких зв'язки не утворюють циклів) з одним прихованим шаром може апроксимувати будь-яку неперервну функцію багатьох змінних з будь-якою точністю. Умовами є достатня кількість нейронів прихованого шару, вдалий підбір $𝐰_{1}, 𝐰_{2}, \dots, 𝐰_{N}, 𝜶,$ і $𝜽$ , де

$𝐰_{i}$ — ваги між вхідними нейронами і нейронами прихованого шару
$𝜶$ — ваги між зв'язками від нейронів прихованого шару і вихідним нейроном
$𝜽$ — коефцієнт «упередженості» для нейронів прихованого шару.

Формальне викладення

Нехай $φ$ будь-яка непрервна сигмоїдна функція, наприклад, $φ (ξ) = 1 / (1 + e^{- ξ})$ . Тоді, якщо дана будь-яка неперервна функція дійсних змінних $f$ на $[0, 1]^{n}$ (або будь яка інша компактна підмножина $R^{n}$ ) і $ε > 0$ , тоді існують вектори $𝐰_{𝟏}, 𝐰_{𝟐}, \dots, 𝐰_{𝐍}, 𝜶, 𝜽$ та параметризована функція $G (\cdot, 𝐰, 𝜶, 𝜽) : [0, 1]^{n} \to R,$ така, що

| G (𝐱, 𝐰, 𝜶, 𝜽) - f (𝐱) | < ε

для всіх

𝐱 \in [0, 1]^{n},

де

G (𝐱, 𝐰, 𝜶, 𝜽) = \sum_{i = 1}^{N} α_{i} φ (𝐰_{i}^{T} 𝐱 + θ_{i}),

та $𝐰_{i} \in R^{n}, α_{i}, θ_{i} \in R, 𝐰 = (𝐰_{1}, 𝐰_{2}, \dots 𝐰_{N}), 𝜶 = (α_{1}, α_{2}, \dots, α_{N}),$ та $𝜽 = (θ_{1}, θ_{2}, \dots, θ_{N})$ .

Посилання

Cybenko, G.V. (1989). Approximation by Superpositions of a Sigmoidal function, Mathematics of Control, Signals and Systems, vol. 2 no. 4 pp. 303-314.
Hassoun, M. (1995) Fundamentals of Artificial Neural Networks MIT Press, p. 48

Див. також

Шаблон:Диференційовні обчислення

Теорема Цибенка

Формальне викладення

Посилання

Див. також

Навігаційне меню

Пошук