Синтетичний контроль

Матеріал з testwiki
Перейти до навігації Перейти до пошуку
Порівняння реального добробуту жителів ФРН після об'єднання з НДР у 1990 та гіпотетичного, якби об'єднання не відбулося, з опорою на дані інших країн ОЕСР[1].

Синтетичний контроль (Шаблон:Lang-en, SCM) — економетричний метод аналізу даних у рамках Шаблон:Iw, що дозволяє проводити Шаблон:Iw в порівняльних кейс-стаді. Метод спрямований на оцінення результатів досліджуваного впливу (наприклад, економічної реформи) на прикладі невеликої кількості кейсів за допомогою моделювання їхніх кількісних показників у гіпотетичній ситуації, де впливу не було, на основі обмеженого кола схожих контрольних спостережень за допомогою присвоєння цим змінним певних ваг.

Формальне виведення

Розглянемо i-й регіон, або якийсь інший об'єкт спостереження, причому i=1,,J+1, де J+1 — число регіонів, серед яких 1 зазнав досліджуваної дії, а інші J — ні і є контрольною групою (їх сукупність називають «пулом донорів», Шаблон:Lang-en), за період часу t, де t=1,,T.

Нехай досліджувана дія відбулася в період

T0+1

, де

1T0<T

, і тоді

T0

 — число періодів до дії. Позначимо відгук показника в регіоні

i

в період часу

t

за відсутності досліджуваної дії через

YitN

, а за її наявності —

YitI

. Припустимо, що за

t=1T0

,

YitN=YitI

: до настання досліджуваної дії, вона не впливає на відгук у вибраному регіоні. Також припустимо, що дія, яка мала місце в розглянутому регіоні, не впливає на регіони з контрольної групи. Ефект досліджуваної дії позначимо як

ait=YitIYitN

. Оскільки дія має місце тільки в

i=1

і

t>T0

, метою синтетичного контролю є визначення

a1t=Y1tIY1tN

, де

Y1tI=Y1t

 — власне, показник, що спостерігається в розглянутому регіоні, а

Y1tN

 — неспостережуваний відгук, який можна подати як таку факторну модель:

YitN=δt+θt𝐙i+λtμi+ϵit,

де

δt

 — загальний для всіх регіонів фактор,

𝐙i

 — вектор спостережуваних, незалежних від дії коваріат,

θt

 — вектор їхніх оцінених для даної вибірки регіонів коефіцієнтів,

λt

 — вектор неспостережуваних латентних факторів,

μi

 — вектор відповідних їм факторних навантажень і

ϵit

 — специфічності, або шум. Цю модель можна переписати у вигляді:

jwjYitN=δt+θtjwj𝐙i+λtjwjμi+jwjϵit,

де

wj

 — це

j

-те значення вектора

𝐖=(w2,,wJ+1)

, такого, що

j:wj>0jwj=1

. Метод синтетичного контролю полягає у підборі такого набору ваг

(w~2,,w~J+1)

, що за

tT0

,

jw~jYjt=Yjt

(тобто до дії ваги зберігають спостережуване значення відгуку незмінним) і

jw~j𝐙j=𝐙1

(і при цьому ці ваги дозволяють точно моделювати коваріати регіону, що розглядається, через кваріати регіонів контрольної групи). У літературі показано, що, якщо відхилення специфічностей

ϵit

незначні за даного

T0

, розміру періоду до дії,

Y1tNjwjYit0

, тобто різниця між модельованим, неспостережуваним відгуком без дії і зваженим, але спостережуваним за його присутності, в таких умовах мізерна. Відповідно, пропонується така оцінка ефекту дії (

ait=YitIYitN

)[2]Шаблон:Rp:

a^1t=Y1tjw~jYjt

Оптимізація алгоритму

З обчислювальної точки зору, розрахунок шуканих ваг пов'язаний із мінімізацією за вектором ваг 𝐖 норми 𝐗1𝐗0𝐖, де 𝐗1 — вектор значень коваріатів для досліджуваного регіону до моменту T0+1, а 𝐗0 — матриця значень коваріатів для контрольних регіонів. Незалежно від вибору дослідником додатноозначеної матриці 𝐕, оптимізована норма розкривається як 𝐗1𝐗0𝐖𝐕=(𝐗1𝐗0𝐖)𝐕(𝐗1𝐗0𝐖)[2]Шаблон:Rp.

Для того, щоб отримати кінцеве значення 𝐕, проводять зовнішню оптимізацію за параметром 𝐕 з використанням коефіцієнта дисконтування β, що підвищує вагу недавніх спостережень Цю оптимізацію можна описати так: t=1TβTt(Y1tj=2J+1W~j(V)Yjt)2min, де 𝐖~ — вектор мінімальних ваг, отриманий на попередньому етапі[3]Шаблон:Rp.

Статистична значущість результатів

Визначення статистичної значущості одержаних оцінок можна провести різними способами. У статті 2003 року, що оцінює вплив тероризму та інших проявів політичного насильства на економіку Країни Басків, розрахований ефект піддали так званому плацебо-тесту (placebo test), що полягав у застосуванні ідентичного алгоритму синтетичного контролю до Каталонії, яка також відома значним сепаратистським рухом, але не мала проблем, пов'язаних із терористичними проявами цього руху[4].

Плацебо-тести в літературі, яка використовує метод синтетичного контролю, є прикладом непараметричних пермутаційних тестів. Моделювання синтетичного відгуку для всіх контрольних кейсів у вибірці дозволяє в явному вигляді працювати з імовірнісним розподілом і перевіряти нульову гіпотезу про відсутність казуальних ефектів у кейсі. При цьому немає необхідності асимптотично наближати розподіл цих ефектів у контрольних кейсів до того чи іншого розподілу, що робить тести подібного типу пермутаційними[5].

Синтетичний контроль як метод передбачення

У літературі запропоновано використовувати синтетичний контроль не лише для оцінки причинно-наслідкових зв'язків, але й для побудови прогнозів. У рамках пілотного дослідження була спроба спрогнозувати економічне зростання в США, однак «пул донорів», використовуваний для отримання ваг, складався вже не з країн зі схожими характеристиками, а з показників економічного зростання з певним часовим лагом[3]Шаблон:Rp.

Синтетичний контроль та інші методи

Синтетичний контроль поєднує елементи інших каузальних статистичних методів: Шаблон:Iw і Шаблон:Iw.

У порівнянні з різницею різниць синтетичний контроль пропонує упорядкованішу процедуру підбору ваг для спостережень із контрольної групи, використовує більший часовий проміжок перед дією і вимагає в ході підбору ваг максимально можливого наближення характеристик контрольної групи до характеристик досліджуваного об'єкта.

Метод синтетичного контролю має низку спільних рис із лінійною регресією. Так і синтетичний контроль, і регресійний аналіз припускають лінійну комбінацію ваг і змінних (в останньому ваги, як правило, називають регресійними коефіцієнтами), причому сума ваг дорівнює 1. Основною відмінністю є те, що в синтетичному контролі значення цих ваг належать [0,1], тоді як у регресійному аналізі такого обмеження немає і коефіцієнти практично не інтерпретуються як ваги[1]Шаблон:Rp. Так контрфактуальну Німеччину з дослідження 2015 року[1] «синтезовано» на підставі подушного ВВП, рівня інвестицій, торговельної відкритості, кількості шкіл і частки промисловості в доданому продукті Австрії (42 %), США (22 %), Японії (16 %), Швейцарії (11 %) і Нідерландів (9 %)[6].

Симуляції показали, що панельний метод Сяо (фіксовані ефекти з ефектами взаємодії) для дослідження каузальних ефектів є менш робастним до зміни в пулі донорів, ніж синтетичний контроль, хоча використання обох підходів дає задовільні результати. Зазначалося, що синтетичний контроль є кращим, якщо дослідник має дані за додаткові часові періоди[7]Шаблон:Rp[8].

Застосування

Галузь застосування методу синтетичного контролю охоплює дослідження політики у сфері охорони здоров'я[9], кримінологія[10], політичну науку[1], різні розділи економіки.

У політології синтетичний контроль розглядається як компроміс між конвенціональними кількісними і якісними методами, що дозволяє поєднувати фокус на одному або декількох кейсах зі строгими критеріями їх підбору. За допомогою цього методу вивчалися: об'єднання Німеччини для власне ФРН[1], наслідки федеративної реформи в Бельгії для витрат на соціальне забезпечення[11].

У географії синтетичний контроль використовують у дослідженнях антропогенних ландшафтів (у рамках Шаблон:Нп)[12]Шаблон:Rp.

У статистичних пакунках

Існують пакунки статистичного програмного забезпечення для аналізу даних за допомогою методу синтетичного контролю. Для мови R розроблено пакунок Synth[13].

Див. також

Примітки

Шаблон:Reflist Шаблон:Бібліоінформація