Модель авторегресії — ковзного середнього
У статистичному аналізі часових рядів моделі авторегресії — ковзного середнього (АРКС, Шаблон:Lang-en) пропонують економний опис (слабко) стаціонарного стохастичного процесу в термінах двох многочленів, одного для авторегресії (АР), а другого — для Шаблон:Нп (КС). Загальну модель АРКС було описано 1951 року в дисертації Шаблон:Нп «Перевірка гіпотез в аналізі часових рядів» і популяризовано в книзі Шаблон:Нп та Шаблон:Нп 1970 року.
Для заданого часового ряду даних Xt модель АРКС є інструментом для розуміння та, можливо, передбачування майбутніх значень цього ряду. Частина АР передбачає регресування цієї змінної за її власними запізнюваними (тобто, минулими) значеннями. Частина КС передбачає моделювання члену похибки як лінійної комбінації членів похибки, що стаються в поточний момент та в різні моменти часу в минулому. На цю модель зазвичай посилаються як на модель АРКС(p, q), де p — порядок частини АР, а q — порядок частини КС (як визначено нижче).
Моделі АРКС може бути оцінювано за допомогою Шаблон:Нп.
Авторегресійна модель
Позначення АР(p) стосується авторегресійної моделі порядку p. Модель АР(p) записують як
де є параметрами, є сталою, а випадкова величина є білим шумом.
Щоби ця модель залишалася стаціонарною, для значень цих параметрів необхідні деякі обмеження. Наприклад, процеси в моделі АР(1) за стаціонарними не є.
Модель ковзного середнього
Позначення КС(q) стосується моделі ковзного середнього порядку q:
де є параметрами моделі, є математичним сподіванням (що часто вважають рівним 0), а , , … є, знов-таки, членами похибки білого шуму.
Модель АРКС
Позначення АРКС(p, q) стосується моделі з p авторегресійними членами та q членами ковзного середнього. Ця модель містить моделі АР(p) та КС(q),
Загальну модель АРКС було описано 1951 року в дисертації Шаблон:Нп, який використовував математичний аналіз (ряд Лорана та аналіз Фур'є) та статистичне висновування.[1][2] Моделі АРКС було популяризовано книгою 1970 року Шаблон:Нп та Шаблон:Нп, які виклали ітераційний метод (Шаблон:Нп) для їхнього вибирання та оцінювання. Цей метод був корисним для многочленів нижчих порядків (третього або нижчого ступеня).[3]
Зауваження про члени похибки
Члени похибки , як правило, вважають незалежними однаково розподіленими випадковими величинами (НОР), відбираними з нормального розподілу з нульовим середнім: ~ N(0, σ2), де σ2 є дисперсією. Ці припущення може бути послаблено, але це змінить властивості моделі. Зокрема, зміна припущення про НОР призведе до принципової відмінності.
Визначення в термінах оператора запізнювання
В деяких текстах ці моделі визначатимуть у термінах оператора запізнювання L. В цих термінах модель АР(p) подають як
де представляє многочлен
Модель КС(q) подають як
де θ представляє многочлен
Нарешті, об'єднану модель АРКС(p, q) подають як
або, лаконічніше,
або
Альтернативний запис
Деякі автори, включно з Шаблон:Нп, Шаблон:Нп та Рейнзелем, використовують іншу угоду щодо коефіцієнтів авторегресії.[4] Це дозволяє всім многочленам, до яких входить оператор запізнювання, всюди мати подібний вигляд. Таким чином модель АРКС буде записано як
Більше того, якщо ми встановимо та , то отримаємо ще елегантніше формулювання:
Пристосовування моделей
Вибір р та q
Пошук відповідних значень p та q в моделі АРКС(p, q) може бути полегшено шляхом побудови Шаблон:Нп задля оцінки p, а також використання автокореляційних функцій задля оцінки q. Додаткову інформацію можливо підбирати, розглядаючи ті ж функції для залишків моделі, пристосованої початковим вибором p та q.
Броквел та Девіс для пошуку р та q радять застосовувати інформаційний критерій Акаіке (ІКА).[5]
Оцінювання коефіцієнтів
Моделі АРКС після вибору р та q загалом може бути пристосовувано за допомогою регресії найменших квадратів задля знаходження значень параметрів, які мінімізують член похибки. Загалом доброю практикою вважають знаходити найменші значення р та q, які забезпечують прийнятну пристосованість до даних. Для чистої моделі АР для забезпечення пристосованості можна використовувати рівняння Юла-Вокера.
Втілення в статистичних пакетах
- В R функцію arima (зі стандартного пакунку stats) описано в ARIMA Modelling of Time Series Шаблон:Webarchive. Пакунки розширення містять пов'язану та розширену функціональність, наприклад, пакунок tseries містить функцію arma, описану в «Fit ARMA Models to Time Series»; пакунок fracdiff Шаблон:Webarchive містить fracdiff() для дробово інтегрованих АРКС-процесів тощо. Перегляд задач CRAN на Time Series Шаблон:Webarchive містить посилання на більшість із них.
- Mathematica має повну бібліотеку функцій часових рядів, включно з АРКС.[6]
- MATLAB містить такі функції, як arma Шаблон:Webarchive та ar Шаблон:Webarchive для оцінювання моделей АР, АРК (авторегресійні екзогенні) та АРКСК. Для отримання додаткової інформації див. System Identification Toolbox Шаблон:Webarchive та Econometrics Toolbox Шаблон:Webarchive.
- Julia має деякі підтримувані спільнотою пакунки, що втілюють пристосовування за допомогою моделі АРКС, такі як arma.jl Шаблон:Webarchive.
- Модуль Python Statsmodels містить багато моделей та функцій для аналізу часових рядів, включно з АРКС. Колишня частина scikit-learn, він тепер є автономним і добре поєднується з pandas. Докладніше див. тут Шаблон:Webarchive.
- Шаблон:Нпні має втілення моделей АРКС на основі Python, включно з баєсовими моделями АРКС.
- Чисельні бібліотеки IMSL — це бібліотеки функціональності чисельного аналізу, включно з процедурами АРКС та АРІКС, втіленими стандартними мовами програмування, такими як C, Java, C# .NET та Fortran.
- Шаблон:Нп також може оцінювати моделі АРКС, див. тут, де про це згадувано Шаблон:Webarchive.
- GNU Octave може оцінювати моделі АР за допомогою функцій з додаткового пакунку octave-forge Шаблон:Webarchive.
- Stata містить функцію arima, яка може оцінювати моделі АРКС та АРІКС. Докладніше див. тут Шаблон:Webarchive.
- Шаблон:Нпні — це бібліотека Java чисельних методів, включно з комплексними статистичними пакунками, в яких одновимірні/багатовимірні моделі АРКС, АРІКС, АРКСК та ін. втілено за допомогою об'єктно-орієнтованого підходу. Ці втілення описано в «SuanShu, a Java numerical and statistical library» Шаблон:Webarchive.
- Шаблон:Нп має економетричний пакунок, ETS, який оцінює моделі АРІКС. Докладніше див. тут.
Застосування
АРКС є доречною, коли система є функцією як ряду не спостережуваних струсів (частина КС, або ковзне середнє), так і своєї власної поведінки. Наприклад, ціни акцій можуть струшуватися основною інформацією, а також демонструвати технічні прямування та ефекти Шаблон:Нп через учасників ринку.Шаблон:Citation needed
Узагальнення
Якщо не вказано інше, то залежність Xt від минулих значень та членів похибки εt вважається лінійною. Якщо ця залежність є нелінійною, то модель спеціально називають моделлю нелінійного ковзного середнього (НКС, Шаблон:Lang-en), нелінійної авторегресії (НАР, Шаблон:Lang-en) або нелінійної авторегресії — ковзного середнього (НАРКС, Шаблон:Lang-en).
Моделі авторегресії — ковзного середнього може бути узагальнювано й іншими способами. Див. також моделі авторегресії — умовної гетероскедастичності (АРУГ, Шаблон:Lang-en) та моделі авторегресії — інтегрованого ковзного середнього (АРІКС, Шаблон:Lang-en). Якщо потрібно пристосовуватися до декількох часових рядів, то можна пристосовувати векторну модель АРІКС (або ВАРІКС, Шаблон:Lang-en). Якщо часовий ряд, про який йдеться, демонструє довгу пам'ять, то може бути доцільним дробове (Шаблон:Lang-en) моделювання АРІКС (ДАРІКС, Шаблон:Lang-en, інколи зване АРДІКС, Шаблон:Lang-en): див. Шаблон:Нп. Якщо вважається, що дані містять сезонні ефекти, то їх можна моделювати моделлю САРІКС (сезонна АРІКС, Шаблон:Lang-en), або періодичною (Шаблон:Lang-en) моделлю АРКС.
Іншим узагальненням є багатомасштабна авторегресійна (БАР, Шаблон:Lang-en) модель. Модель БАР індексовано вузлами дерева, тоді як стандартну авторегресійну модель (дискретного часу) індексовано цілими числами.
Зауважте, що модель АРКС є одновимірною моделлю. Розширеннями для багатовимірного випадку є векторна авторегресія (ВАР, Шаблон:Lang-en) та векторна авторегресія — ковзне середнє (ВАРКС, Шаблон:Lang-en).
Шаблон:AnchorШаблон:Anchor Модель авторегресії — ковзного середнього з екзогенними входами (модель АРКСК, ARMAX)
Позначення АРКСК(p, q, b) стосується моделі з p авторегресійними членами, q членами ковзного середнього та b членами екзогенних входів. Ця модель містить моделі АР(p) та КС(q), а також лінійну комбінацію останніх b членів відомих і зовнішніх часових рядів . Її задають як
де — параметри екзогенного входу .
Було визначено деякі нелінійні варіанти моделей з екзогенними змінними: див., наприклад, нелінійну авторегресійну екзогенну модель.
Статистичні пакети втілюють модель АРКСК за допомогою «екзогенних», або «незалежних» змінних. При інтерпретуванні виходу цих пакетів слід бути обережними, оскільки оцінювані параметри зазвичай (наприклад, в R[7] та gretl) стосуються регресії
де до mt входять всі екзогенні (або незалежні) змінні:
Див. також
- Авторегресійне інтегроване ковзне середнє (АРІКС, ARIMA)
- Експоненційне згладжування
- Лінійне передбачувальне кодування
- Шаблон:Нп
Примітки
Література
- ↑ Шаблон:Cite book Шаблон:Ref-en
- ↑ Шаблон:Cite book Шаблон:Ref-en
Шаблон:Cite book Шаблон:Ref-en
- Перевидано як Шаблон:Cite book Шаблон:Ref-en
- ↑ Шаблон:Harvtxt : Шаблон:Cite book
- ↑ Шаблон:Cite book Шаблон:Ref-en
- ↑ Шаблон:Cite book Шаблон:Ref-en
- ↑ Функції часових рядів в Mathematica Шаблон:Webarchive Шаблон:Ref-en
- ↑ ARIMA Modelling of Time Series Шаблон:Webarchive, документація R