Testwiki:Проєкт:Популярність/Дослідження/2011.02 — Відвідуваність на символ

Матеріал з testwiki
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку
Предмет
Дослідження питань річної популярності статей на основі випадкової вибірки. Параметр «відвідуваність на символ»
Дані

Серед 263 статей (~0,1% усіх статей укрВікі) отриманих через посилання Спеціальна:Random ботом були обрані ті, які створені не раніше 1 січня 2011 (виключенням є статті 1436, 1836, 1936, які додано до вибірки невипадково). По них було отримано наступні дані: Шаблон:Приховати

id title date pop size_s size_b is_d iwiki refs links imag bot year
1 1936 2004-03-04 3098 7461 11039 0 145 2564 154 0 0 1
2 1836 2004-03-03 1438 2515 3197 0 125 689 23 0 0 1
3 1436 2004-05-07 508 1537 1729 0 107 67 0 0 0 1
4 .org 2007-11-07 744 2257 3173 0 34 10 6 1 0 0
5 Монтегю (Ена) 2009-11-28 108 2006 2824 0 14 819 12 0 1 0
6 NGC 110 2006-11-02 117 883 1183 0 9 8 6 0 0 0
7 Ла-Бажол 2008-06-24 131 9639 13062 0 14 71 44 0 0 0
8 Інамі 2008-08-22 89 410 691 1 0 1 5 0 0 0
9 Аня Губер 2010-06-08 96 1914 2943 0 7 6 13 0 0 0
10 Анансі 2008-04-11 402 4463 7371 0 15 1 28 1 0 0
11 Одеський регіональний центр оцінювання якості освіти 2008-01-26 607 1328 2355 0 0 9 14 0 0 0
12 Тхутоб Намґ'ял 2009-01-31 110 1963 3134 0 3 4 17 1 0 0
13 Сейлор Мун 2010-07-25 759 2507 3819 0 43 4 6 1 0 0
14 Сен-Ремі-ан-Бузмон-Сен-Жене-е-Іссон 2010-01-11 274 3669 5034 0 15 623 11 0 0 0
15 Юца 2009-11-12 240 2479 4060 0 2 3 10 0 0 0
16 Андре Буаклер 2007-02-03 276 2298 3700 0 13 9 8 1 0 0
17 Дисплазія 2009-10-01 984 1910 3195 0 16 6 12 0 0 0
18 Церква Мадонна делл'Орто 2008-02-26 217 2563 3945 0 8 55 11 1 0 0
19 Даргінська мова 2009-05-13 257 3540 5749 0 18 15 9 0 0 0
20 Торе-сюр-Уш 2009-10-29 87 2707 3770 0 13 707 11 0 1 0
21 Шидлівці (Чемеровецький район) 2008-07-08 248 1540 2198 0 1 75 3 0 0 0
22 Афанасьєв Георгій Омелянович 2010-05-17 171 3055 5102 0 0 3 11 0 0 0
23 Поліграфічні матеріали 2009-09-13 1082 3967 6688 0 0 8 12 2 0 0
24 Купе (значення) 2010-01-12 124 382 593 1 3 3 8 0 0 0
25 Боротьба (Прилуцький район) 2008-05-23 188 1527 2185 0 0 103 3 0 0 0
26 Говори української мови 2006-08-16 1158 3808 6827 0 0 31 46 0 0 0
27 Байт 2004-10-08 4844 2027 2810 0 59 61 4 0 0 0
28 Рейд Джеймсона 2010-06-20 168 14041 24433 0 8 5 33 4 0 0
29 Артемівка (Васильківський район) 2007-12-26 170 2213 3361 0 1 86 8 0 0 0
30 Верін Сзнек 2010-07-06 74 3395 4665 0 4 46 7 0 0 0
31 Юррета 2010-12-20 25 2494 3525 0 15 112 7 2 0 0
32 Сапожников Сергій Романович 2009-11-01 57 438 735 0 0 0 7 0 0 0
33 Охнівка 2008-03-17 206 2816 4240 0 1 80 30 0 0 0
34 NGC 6813 2006-11-03 106 869 1212 0 4 8 8 0 0 0
35 Мінський Михайло 2007-05-08 333 5913 10258 0 6 6 26 1 0 0
36 Джозеф Генрі 2007-11-24 425 3028 4705 0 29 10 31 0 0 0
37 Ухожани 2007-08-09 149 2614 3970 0 1 67 19 0 0 0
38 Ромашкове (Білозерський район) 2008-03-26 138 1426 2001 0 1 60 5 0 0 0
39 Пустомити 2005-03-06 5257 15899 27005 0 7 236 86 0 0 0
40 Чемпіонат світу з футболу 1998 2005-11-20 2422 32499 40114 0 51 418 108 1 0 0
41 Вевр-е-Монтуаль 2010-11-05 31 2738 3848 0 14 548 10 0 0 0
42 IC 1415 2007-01-16 91 1668 2285 0 1 8 5 0 0 0
43 Диморфізм 2007-07-26 437 339 475 0 5 8 2 0 0 0
44 Народні пісні греків Приазов'я 2008-07-27 256 4228 7534 0 0 2 21 0 0 0
45 Гранд-Готель (Пальма) 2011-01-01 37 1117 1773 0 3 1 10 1 0 0
46 Ле-Петі-Борнан-ле-Гльєр 2010-05-07 78 2147 2974 0 11 298 12 1 0 0
47 Корчине 2008-07-08 105 1563 2260 0 1 54 3 0 0 0
48 Дерло 2009-04-12 132 1498 2388 0 0 2 13 0 0 0
49 Шатійон-ле-Дюк 2010-10-20 36 2124 2980 0 14 596 11 0 1 0
50 Цінності України в закордонних музеях 2006-03-09 1075 10748 16695 0 0 9 45 0 0 0
51 Премія «Оскар» найкращому помічнику режисера 2010-05-17 166 3408 5087 0 10 29 32 0 0 0
52 Підок 2008-06-13 106 1636 2312 0 1 86 3 0 0 0
53 .af 2006-11-20 690 2403 3196 0 74 260 10 0 0 0
54 Індіанські мови 2010-08-31 488 12117 21801 0 1 29 39 0 0 0
55 Верняки 2008-09-01 161 1707 2448 0 0 80 7 0 0 0
56 Гудзій Наталія 2009-05-12 860 5757 8449 0 2 5 35 1 0 0
57 Історія Боснії і Герцеґовини 2009-05-27 1007 13271 22651 0 35 58 103 3 0 0
58 Михалківці (Ярмолинецький район) 2008-07-08 156 1529 2172 0 1 65 3 0 0 0
59 Каливиця 2008-03-21 182 1400 2002 0 1 50 6 0 0 0
60 Кам'янка (Ізяславський район) 2008-06-29 259 1841 2623 0 2 104 7 0 0 0
61 Тевтонський орден 2007-02-16 3946 21416 33764 0 56 174 153 2 0 0
62 Кадмій 2004-11-24 2893 12297 19104 0 84 202 91 3 0 0
63 Тре (Буш-дю-Рон) 2010-05-31 164 1984 2808 0 16 121 12 0 1 0
64 Сумський полк 2005-04-05 641 4511 7042 0 1 70 26 1 0 0
65 Монту-сюр-Шер 2009-10-14 73 2074 2944 0 12 293 10 0 1 0
66 Фрітц фон Опель 2010-05-29 90 626 801 0 8 4 4 1 0 0
67 Шимановський район 2009-10-10 113 1067 1592 0 1 32 5 1 0 0
68 Гіперболічні функції 2007-10-31 2869 9002 11063 0 28 26 15 4 0 0
69 Луппі-ле-Шато 2010-10-05 39 2148 3025 0 12 503 12 0 1 0
70 Стара Гута (Баранівський район) 2008-01-24 196 1440 2024 0 1 66 4 0 0 0
71 Список найбільших озер світу 2004-06-08 542 7325 9854 0 16 45 93 0 0 0
72 Магнітна аномалія 2007-09-15 1108 867 1386 0 4 11 2 0 0 0
73 Волго-Донська вулиця (Київ) 2010-09-17 69 1588 2646 0 0 6 12 0 0 0
74 Уссурійська затока 2010-08-09 65 1170 1825 0 13 3 11 0 0 0
75 Сюань Є 2004-12-02 137 260 430 0 0 6 6 0 0 0
76 Чака Хан 2008-04-07 492 3797 5531 0 19 7 19 0 0 0
77 Водоприплив 2007-02-01 91 916 1530 0 0 2 9 0 0 0
78 Гнатюк Дмитро Михайлович 2006-09-11 2504 5938 10200 0 3 41 42 0 0 0
79 Туркевич-Мартинець Ірина 2005-01-28 80 513 844 0 0 2 5 0 0 0
80 Бінарний 2006-12-26 840 793 1178 1 11 6 5 0 0 0
81 Лісовчики 2008-12-03 803 9218 16187 0 6 5 32 3 0 0
82 Бородіна Анастасія Валеріївна 2008-12-27 117 814 1230 0 1 3 8 0 0 0
83 Копчак (Гагаузія) 2010-08-02 112 2141 3275 0 4 35 16 0 0 0
84 Жан Батіст Люллі 2010-08-01 516 12160 16818 0 43 8 38 1 0 0
85 Українське Робітниче Фермерське Освітнє Товариство 2005-01-29 15 436 755 0 0 0 0 0 0 0
86 Хорас Парнелл Таттл 2010-11-01 60 2549 3802 0 15 34 10 1 0 0
87 Гаусові числа 2007-02-27 274 1724 2692 0 14 12 17 0 0 0
88 Драупаді 2009-11-11 204 2022 3403 0 23 4 16 1 0 0
89 Daewoo Matiz 2007-04-19 1247 4640 6407 0 22 30 40 6 0 0
90 Союз-32 2010-11-30 55 5080 7658 0 14 70 41 0 0 0
91 Ващук Оксана Олегівна 2010-02-10 118 1262 2052 0 1 4 17 0 0 0
92 Воля (Доманівський район) 2008-07-09 97 1487 2110 0 1 65 3 0 0 0
93 Список лауреатів літературного конкурсу видавництва «Смолоскип» 2010-06-01 497 6148 9908 0 0 6 16 0 0 0
94 Новоселівка (Арцизький район) 2008-04-30 144 1309 1810 0 1 30 5 0 0 0
95 Збірна Словенії з хокею із шайбою 2010-04-09 262 9948 13052 0 13 21 92 0 0 0
96 Криголам (гурт) 2008-12-08 231 4891 8166 0 1 5 32 0 0 0
97 НДІ «Перетворювач» 2009-03-14 170 2152 3906 0 0 2 5 0 0 0
98 Степнянська сільська рада (Богодухівський район) 2007-04-23 106 1115 1704 0 0 3 7 0 0 0
99 PlayStation 2 2009-09-16 1321 3793 4493 0 51 136 31 2 0 0
100 Летсіє III 2010-03-15 300 1915 2967 0 29 6 6 0 0 0
101 Кам'янське (Василівський район) 2008-05-19 233 1500 2111 0 0 41 3 0 0 0
102 Осмій самородний 2008-03-07 171 729 1206 0 0 3 7 1 0 0
103 Милош Обренович 2008-07-15 241 1268 1698 0 19 11 8 1 0 0
104 Основи мовленнєвої діяльності 2007-05-26 351 1115 2028 0 0 0 2 0 0 0
105 Братолюбівка (Веселівський район) 2008-05-19 147 1461 2063 0 0 33 3 0 0 0
106 Завадів (Стрийський район) 2008-05-19 442 1467 2042 0 1 74 3 0 0 0
107 Магнітострикційний перетворювач 2010-12-14 41 830 1499 0 0 1 5 0 0 0
108 Бременська ратуша 2010-03-10 275 4953 7748 0 19 1 32 1 0 0
109 Озеленення відвалів 2008-01-28 156 1126 1954 0 0 2 2 0 0 0
110 IC 4560 2007-01-16 91 1718 2341 0 1 8 5 0 1 0
111 Внутрішня точка 2008-12-06 311 1983 2930 0 19 9 11 1 0 0
112 Дхарма 2006-12-07 2615 1553 2300 0 44 99 10 0 0 0
113 Шуа 2010-11-03 33 1872 2724 0 15 547 12 0 1 0
114 Конвеєризація 2007-07-25 316 367 515 0 0 3 2 0 0 0
115 Лема Бореля-Кантеллі 2009-08-16 116 3221 4291 0 16 1 4 0 0 0
116 Фені 2010-11-13 45 2228 3059 0 13 651 11 1 1 0
117 Бодр (Ендр) 2009-10-10 7 1848 2658 0 14 249 12 0 1 0
118 Budweiser Budvar 2010-06-11 185 8841 14134 0 14 4 19 4 0 0
119 План «А» 2009-05-10 479 1454 2256 0 0 6 11 0 0 0
120 Привільне (Новобогданівська сільська рада) 2008-05-19 116 1507 2141 0 0 70 3 0 0 0
121 Морозов Микола Олександрович 2010-01-01 207 1546 2424 0 6 4 18 1 0 0
122 Гергеїт 2008-03-27 70 1032 1475 0 1 3 14 0 0 0
123 Прапор Каталонії 2008-06-07 311 5749 8921 0 10 9 37 2 0 0
124 Левонкур (Мез) 2010-10-05 39 1986 2836 0 11 503 12 0 1 0
125 Джіванмукта 2010-11-07 43 1894 2781 0 6 1 12 0 0 0
126 В'язень сумління 2007-09-02 538 3235 5036 0 15 16 29 0 0 0
127 Амвросіївська стоянка 2007-01-08 274 2862 4880 0 1 3 12 1 0 0
128 Етабле 2010-04-26 73 1688 2431 0 14 370 12 0 0 0
129 NGC 2772 2006-11-02 94 1002 1338 0 8 8 8 0 0 0
130 Іво Андрич 2004-06-02 620 4787 7098 0 56 129 35 1 0 0
131 Малики 2008-06-02 148 1559 2231 0 1 78 3 0 0 0
132 Зоря (Машівський район) 2008-06-03 142 1541 2177 0 1 43 3 0 0 0
133 NGC 5809 2006-11-03 35 959 1297 0 7 8 8 0 0 0
134 Паризька зелень 2006-07-07 181 517 755 0 5 1 4 1 0 0
135 Спільна часткова власність 2004-11-04 517 300 534 0 0 1 4 0 0 0
136 NGC 7008 2006-11-03 93 931 1260 0 8 8 6 0 1 0
137 Гра престолів 2007-11-20 15 3592 5672 0 14 10 13 0 0 0
138 Сейсмограф 2006-10-06 1036 2259 3114 0 44 23 7 1 0 0
139 2010-04-23 81 2388 3086 0 0 2 19 0 0 0
140 Двір Ценських 2010-04-19 163 2471 3626 0 0 5 8 0 0 0
141 Лугове (Близнюківський район) 2008-06-24 97 1490 2119 0 1 100 3 0 0 0
142 Лапуебла-де-Лабарка 2010-12-11 21 2268 3051 0 17 51 7 2 1 0
143 Ефеб 2010-10-17 202 7214 12105 0 12 13 63 4 0 0
144 Касевич Степан Данилович 2007-11-11 67 1684 2724 0 0 6 12 0 0 0
145 Місячні породи 2007-12-13 824 4161 6611 0 23 10 58 1 0 0
146 Веселе (Магдалинівський район) 2007-12-27 151 1552 2190 0 0 62 2 0 0 0
147 Нове (Гаївська сільська рада) 2008-05-05 142 1241 1728 0 0 89 4 0 0 0
148 NGC 7253-2 2006-11-03 82 855 1149 0 2 8 6 0 0 0
149 Лінкольн (Онтаріо) 2007-10-05 88 731 1066 0 3 4 5 1 0 0
150 Пологи-Чобітки 2008-04-12 247 1922 2970 0 1 55 5 0 0 0
151 Украдене щастя (фільм) 2006-11-27 785 88 132 1 0 1 2 0 0 0
152 Пальник 2008-02-17 568 2424 4215 0 8 6 3 0 0 0
153 Червоний Поділ (Олександрійський район) 2008-07-13 51 1735 2502 0 1 82 3 0 0 0
154 Російсько-Таджицький (Слов'янський) університет 2010-06-16 94 3676 5855 0 2 1 11 2 0 0
155 Шатору-лез-Альп 2010-05-31 75 2256 3171 0 13 178 12 0 1 0
156 Радіо «Свобода» 2005-03-07 932 9876 16731 0 34 103 39 0 0 0
157 Сямісен 2009-11-22 390 1752 2706 0 28 14 15 1 0 0
158 Міра (альбом) 2007-06-29 2022 2161 3180 0 2 35 17 0 0 0
159 Неможлива подія 2009-06-18 477 1500 2477 0 3 3 9 0 0 0
160 Шомон-сюр-Ер 2010-10-05 40 2004 2850 0 13 502 12 0 1 0
161 Рибу 2010-06-07 170 1840 2693 0 12 154 12 0 1 0
162 Центр групи 2009-08-05 169 3934 5874 0 9 6 20 0 0 0
163 1152 2004-05-14 499 1385 1575 0 96 53 0 0 0 1
164 Пушкін Юхим Григорович 2010-05-08 168 8641 13868 0 1 0 74 2 0 0
165 Аньоне 2009-05-07 124 2060 2873 0 21 60 20 0 0 0
166 Мирони (Балтський район) 2007-08-03 172 2988 4562 0 1 68 25 0 0 0
167 Напірні води 2007-12-25 197 1178 1913 0 0 5 6 0 0 0
168 Мешхед 2010-01-12 409 2482 3457 0 47 33 7 1 0 0
169 Баричні системи 2007-04-18 188 1476 2586 0 0 1 13 0 0 0
170 Тейде 2010-10-17 289 2477 3662 0 42 5 12 0 0 0
171 Пост Північний (платформа) 2010-03-21 230 2485 4241 0 1 2 7 0 0 0
172 Другий корпус УГА 2009-05-17 307 995 1683 0 1 19 12 0 0 0
173 Шиї (Арденни) 2009-12-09 102 2079 2983 0 14 465 12 0 1 0
174 Вік-ле-Конт 2010-03-02 111 2713 3814 0 12 472 11 0 1 0
175 Брошантит 2007-01-04 138 1848 2785 0 12 5 13 0 0 0
176 Миргородський краєзнавчий музей 2010-06-04 307 6819 10612 0 0 13 26 10 0 0
177 Зоофілія 2010-09-23 2277 5824 10203 0 42 11 10 0 0 0
178 Фонтен-д'Озіяк 2010-02-02 87 2084 2970 0 13 471 12 0 1 0
179 Матешко Анатолій Миколайович 2009-10-30 62 1638 2801 0 0 1 4 0 0 0
180 Копань (Перемишлянський район) 2008-05-15 206 1516 2160 0 0 92 4 0 0 0
181 Міжнародний аеропорт Центральна Греція 2010-01-21 117 3417 4547 0 4 3 17 0 0 0
182 Озідда 2009-06-03 147 1782 2438 0 23 57 12 0 1 0
183 Амне 2010-03-23 108 1602 2326 0 12 377 12 0 1 0
184 Пирятин 2006-01-11 3553 13674 22259 0 8 159 94 7 0 0
185 Синдактилія 2009-05-19 368 1224 1907 0 7 1 2 1 0 0
186 Левкович Василь Михайлович 2008-03-14 241 3193 5524 0 1 7 27 1 0 0
187 Бартолініт 2007-04-19 371 906 1359 0 9 3 6 0 0 0
188 Therion 2006-08-16 1331 19250 29180 0 30 16 169 0 0 0
189 Гіпоспадія 2006-06-02 2261 1351 2024 0 15 1 4 0 0 0
190 Магстат-ле-Ба 2010-11-24 33 2203 3068 0 16 381 12 0 1 0
191 Матч смерті 2007-12-30 1744 4568 7510 0 11 10 21 1 0 0
192 Левітація 2008-08-24 1517 1331 2009 0 3 13 15 1 0 0
193 NGC 6818 2006-11-03 111 991 1344 0 10 8 6 0 0 0
194 Тичинка 2006-05-10 1137 2279 3494 0 43 92 21 2 0 0
195 Mbale 2007-07-11 89 498 742 0 1 1 2 0 0 0
196 Нижні Гаї 2006-11-15 355 1228 1722 0 0 79 3 0 0 0
197 Adobe 2006-08-14 1947 12131 16604 0 51 52 176 2 0 0
198 Граубюнден 2008-10-05 566 3805 5456 0 56 54 8 0 0 0
199 Острозький краєзнавчий музей 2010-10-05 210 2917 4848 0 0 3 16 0 0 0
200 Циків (Мостиський район) 2008-05-14 227 1408 1968 0 0 118 3 0 0 0
201 Білгород (значення) 2009-05-15 65 221 356 1 2 1 5 0 0 0
202 Збірна Нідерландів з футболу 2006-06-19 2117 11205 17691 0 60 459 82 0 0 0
203 Бичваров Стоян 2007-05-24 91 870 1448 0 1 3 19 0 0 0
204 Південно-Бацький округ 2010-08-09 123 3054 4100 0 21 18 16 0 0 0
205 Тихонов Віктор Миколайович 2007-09-15 1731 5030 8405 0 1 40 11 1 0 0
206 Херон (острів) 2008-06-12 183 1653 2458 0 3 4 12 1 0 0
207 NGC 1187 2006-11-02 92 1115 1467 0 13 8 8 0 1 0
208 Двоє справедливих курчат 2010-05-23 172 1956 3353 0 0 1 5 1 0 0
209 Еліот Несс 2009-06-19 396 5539 9056 0 16 8 31 1 0 0
210 Решетников Анатолій Георгійович 2009-11-02 95 1230 2035 0 0 4 10 0 0 0
211 Історичне джерело 2010-04-03 4518 2665 4350 0 23 4 12 0 0 0
212 Аглютинація 2006-11-20 2144 93 147 1 1 22 2 0 0 0
213 Прохід 2008-03-23 209 1402 1954 0 2 70 5 0 0 0
214 Промисловість рідкісних і напівпровідникових металів 2008-05-19 277 3398 5908 0 0 1 4 0 0 0
215 Леніногорська вулиця 2010-03-02 22 1192 1959 0 0 4 13 0 0 0
216 Кільце (алгебра) 2005-02-07 2091 11619 17630 0 46 99 38 0 0 0
217 Національний університет «Острозька академія» 2005-04-28 12727 16937 29377 0 7 85 52 5 0 0
218 Волинська височина 2006-12-18 1558 2786 4557 0 7 21 30 0 0 0
219 Ґетап 2010-02-06 14 326 480 1 4 4 8 0 0 0
220 Муасьє-сюр-Долон 2010-04-01 134 2032 2862 0 14 536 12 0 0 0
221 1077 2004-04-28 640 1387 1579 0 96 70 0 0 0 1
222 Г'ю Лорі 2009-04-21 1537 11960 15635 0 43 44 39 0 0 0
223 Валера-Фратта 2009-05-17 136 1995 2718 0 19 69 15 0 0 0
224 Нантюа 2010-04-18 125 2479 3333 0 29 420 12 1 1 0
225 Ле-Репозуар 2010-05-07 88 2204 3100 0 12 296 12 1 1 0
226 Печія 2010-05-12 966 2020 3227 0 14 5 10 0 0 0
227 Романські церкви з долини Буї 2008-06-28 363 4160 5684 0 7 12 17 1 0 0
228 Ле-Меній-Льєбре 2010-12-12 21 1937 2766 0 12 748 9 0 1 0
229 Темрюк (значення) 2006-10-31 77 617 994 1 1 1 19 0 0 0
230 Ханар 2010-03-30 81 2496 4047 0 0 1 15 0 0 0
231 Людендорф 2007-07-06 108 335 488 1 4 1 2 0 0 0
232 Сепо 2009-11-05 89 2576 3645 0 11 457 10 0 1 0
233 Яфет 2006-06-06 613 750 994 0 34 14 9 0 0 0
234 Шрамченко Леонтій 2005-01-22 134 1830 3082 0 0 5 42 0 0 0
235 Ластоногі 2008-11-14 2175 2637 3749 0 54 31 20 0 0 0
236 Заводи 2008-05-16 231 5040 8034 0 1 63 26 0 0 0
237 Ялтинські провізорії 2010-05-30 151 5695 8874 0 1 1 16 7 0 0
238 NGC 714 2006-11-02 103 921 1218 0 9 8 6 0 0 0
239 Бурбулатове 2008-06-24 88 1512 2166 0 1 99 3 0 0 0
240 Кубок Білорусі з хокею із шайбою 2010-07-28 186 1696 2780 0 2 120 11 0 0 0
241 Лорг 2010-06-07 172 1992 2859 0 14 154 12 0 1 0
242 Сабадель-Латронк'єр 2010-08-14 53 2092 2970 0 13 342 12 0 1 0
243 Берестейська область 2007-07-12 1279 7498 11814 0 34 155 36 0 0 0
244 Гафурі Мажит 2009-07-13 57 3890 6654 0 0 0 36 0 0 0
245 Доза-сюр-Водабль 2010-03-02 104 1967 2723 0 12 472 11 0 1 0
246 Газовик (Червоний Донець) 2007-09-12 132 437 730 0 0 2 6 0 0 0
247 Вишенне 2007-12-16 151 1347 1874 0 1 83 3 0 0 0
248 Чайківка (Дергачівський район) 2008-06-27 135 1498 2137 0 1 66 3 0 0 0
249 Ялиця біла 2005-07-28 2997 6608 10952 0 32 11 3 3 0 0
250 Міжнародна кооперація 2004-10-14 1522 702 1287 0 0 2 1 0 0 0
251 Вілларгуа 2009-10-29 89 2188 3139 0 13 710 11 0 1 0
252 Чортомлик (острів) 2006-06-24 315 382 666 0 0 3 4 0 0 0

|}

Де:

  • title — назва статті
  • date — дата створення статті
  • pop — відвідуваність за 12 місяців від лютого 2010 до січня 2011
  • size_s — розмір тексту у символах
  • size_b — розмір тексту у байтах
  • is_d — стаття належить до типу «багатозначні терміни»
  • iwiki — кількість інтервікі посилань зі статті
  • refs — кількість посилань на статтю
  • links — кількість внутрішніх посилань зі статті
  • imag — кількість малюнків у статті (конструкцій типу [[Файл: … ]])
  • bot — стаття редагувалася виключно ботами
  • year — стаття є статтею про рік.
Модель

Модель для регресивного аналізу побудовано на наступних припущеннях:

  • при збільшенні розміру статті лінійно збільшується відвідуваність статті через лінійне зростання інформативності
  • при доданні нових слів у статтю виникає ефект збільшення кількості пошукових комбінацій, за якими можна знайти статтю. Цей ефект чинить нелінійне до розміру статті збільшення популярності статті
  • при збільшенні розміру статті частота додання нових слів у статтю зменшується (закон Хіпса)
  • два попередніх ефекти частково врівноважують один одного
  • занадто короткі статті можуть не з'являтися на перших сторінках пошукових систем
  • статті, на які посилаються інші статті, є популярнішими
  • статті з ілюстраціями є популярнішими
Аналіз

Аналізуємо наведені дані в статистичному пакеті STATA:

* Одразу відкидаємо статті створені пізніше січня 2010
drop if date>="2010-02" 
* Генеруємо натуральний логарифм відвідуваності
gen lpop = log(pop)
* Генеруємо чистий розмір: розмір у символах без очікуваної кількості символів у інтервікі
gen size_c = size_s - iwiki*(7+length(title))
* Оцінюємо модель
reg lpop size_c iwiki imag bot
vif

Отримуємо наступну регресію (всі параметри статистично значимі, мультиколінеарності немає):

------------------------------------------------------------------------------
        lpop |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      size_c |   .0000996   .0000188     5.29   0.000     .0000624    .0001367
       iwiki |   .0180857   .0028677     6.31   0.000     .0124271    .0237443
        imag |   .2789515   .0726161     3.84   0.000     .1356632    .4222398
         bot |  -1.170051   .2768036    -4.23   0.000    -1.716248   -.6238532
       _cons |   5.098489   .0883892    57.68   0.000     4.924077    5.272901
------------------------------------------------------------------------------

Однак проаналізувавши графік залежності логпопулярносі (lpop) від чистого розміру (size_c):


помічаємо, що залежність між змінними не є лінійною. Це підтверджується наступними регресіями:

reg lpop size_c iwiki imag bot if size_c>2000
reg lpop size_c iwiki imag bot if size_c>4000

— зі збільшенням порогу знижується коєфіцієнт при size_c.

Відтак, генеруємо логарифм чистого розміру статей та проводимо нову регресію:

gen lsize_c = log(size_c)
reg lpop lsize_c iwiki imag bot
vif

— усі параметри знову виявляються статистично значимими, мультиколінеарність не виникла. Але залежність стала лінійнішою:


Із графіка помічаємо, що спостереження поділяються на дві групи — до e7,6=2000 символів та понад. Регресуємо:

reg lpop lsize_c iwiki imag bot if size_c<2000
reg lpop lsize_c iwiki imag bot if size_c>2000

Справді — отримуємо дві різні оцінки. Для малих статей (<2000 символів чистого тексту):

lpop ~ -.0751066*lsize_c + .0209184*iwiki + .2745386*imag - 1.057415*bot

однак параметри lsize_c та iwiki виявляються статистично незначимими, тому вилучивши їх отримуємо остаточну закономірність:

lpop ~ .0216376*iwiki - 1.135947*bot 

Для «не малих» статей (>2000 символів чистого тексту) отримуємо закономірність:

lpop ~ .8016047*lsize_c + .0119115*iwiki + .2346847*imag - 1.093695*bot

параметр bot виявляється статистично незначимим. Вилучивши отримуємо:

lpop ~ .8531931*lsize_c + .0117708*iwiki + .2396645*imag

При збільшенні порогу:

reg lpop lsize_c iwiki imag if size_c>4000
reg lpop lsize_c iwiki imag if size_c>6000

отримуємо подібні результати.

Тепер згенеруємо параметр «відвідуваність на символ» (питома популярність) та проаналізуємо за двома класами статей — «статті про роки» та «багатозначний термін»:

gen vps0 = pop/size_c
reg vps year
reg vps year if id>3
reg vps year if size_с>500
reg vps is_d

В двох останніх випадках параметри вийшли статистично значимими. Результати регресій вказують на те, що статті про роки в 1,6—2,2 рази відвідуваніші на символ чистого тексту ніж усі інші статті, у той час як статті типу «багатозначний термін» в 5,7 разів відвідуваніші на символ чистого тексту ніж усі інші.

Тепер проаналізуємо «відвідуваність на символ» за двома визначеними вище класами статей — «малими» та «не малими» — в залежності від чистого розміру:

reg vps size_c if size_c<2000
reg vps size_c if size_c>2000

В першому випадку залежність виявляється негативною та статистично значимою, в другому — позитивною та незначимою всупереч тому, що змінна vps залежить від size_c за побудовою. Відтак збільшення розміру «не малої» статті не зменшує питомої відвідуваності.

Тепер з'ясуємо від чого залежить «відвідуваність на символ» у великих статтях. Побудувавши знову регресію за всіма змінними та покроково вилучивши зайве отримуємо регресію:

reg vps imag refs if size_c > 2000

та наступну закономірність (усі параметри значимі):

vps ~ .0393166*imag + .0001176*refs
Висновки
  • статті за популярністю досить чітко поділяються на дві групи — «малі» та «не малі», межа між якими лежить приблизно у 2000 символах тексту без інтервікі (3800 байт без інтервікі)
  • на відвідуваність «малих» статей в середньому мало впливає розмір. Додаткові 32 інтервікі підвищують популярність малої статті вдвічі, малі статті створені виключно ботами в 3,1 рази менше відвідувані за інші
  • для «не малих» статей збільшення об'єму тексту статті (без інтервікі) вдвічі підвищує відвідуваність в 1,7 рази, наявність трьох ілюстрацій чи 5,8 інтервікі підвищують відвідуваність «не малої» статті вдвічі (інакше кажучи — збільшення тексту статті вдвічі і додання однієї ілюстрації збільшує відвідуваність «не малої» статті вдвічі)
  • для «не малих» статей додання однієї ілюстрації підвищує питому відвідуваність та додає 39 відвідувань на кожні 1000 символів чистого тексту на рік. Додання 9 посилань на статтю в середньому додає 1 відвідування на кожні 1000 символів чистого тексту на рік.
Додаткові висновки
  • завищена питома відвідуваність (понад 0,1—0,17 відвідувань на символ на рік) у малих статтях може вказувати на «дефіцит інформації» у цих статтях — такі статті слід доводити до «критичного розміру» у 3800-4000 байт (без інтервікі) адже статті до цього розміру викликають враження неповноти та поганої якості укрВікі загалом. Відтак, пріоритетним напрямком можна вважати розширення статей про роки (середня питома відвідуваність таких статей у вибірці — 1,33)
  • «не малі» статті з завищеною питомою відвідуваністю можна використовувати для ефективного збільшення відвідувань та/чи ефективного покращення образу укрВікі серед читачів
  • для цілей популярності важливе підвищення кількості нових слів у статті при її розширенні, відтак бажаним є розкриття якомога різноманітніших аспектів у одній статті, вживання багатого лексикону.
Відкриті питання
  • поведінка питомої популярності у великих статтях (понад 20000 символів) — який максимальний обсяг статті є ефективним?
  • як оцінити майбутню питому популярність відсутньої статті?

--Α.Μακυχα 10:03, 14 лютого 2011 (UTC)