Закон Гіпса

Закон Гіпса (Шаблон:Lang-en) — емпірична закономірність у лінгвістиці, що описує розподіл числа різних слів у документі (або наборі документів) як функцію від його довжини. Описується формулою
- ,
де VR — число різних слів у тексті розміру n. K і β — вільні параметри, визначаються емпірично. Для англійського корпусу текстів, K зазвичай лежить між 10 і 100, а β між 0.4 і 0.6.
Закон часто приписують Гарольду Стенлі Гіпсу (Harold Stanley Heaps), але вперше його відкрив Густав Гердан (Gustav Herdan).[1] З деяким наближенням закон Гердана — Гіпса асимптотично еквівалентний закону Ципфа про частоту окремих слів у тексті.[2]
Див. також
Примітки
Посилання
- Шаблон:Citation.
- Шаблон:Citation.
- Шаблон:Citation. Heaps' law is proposed in Section 7.5 (pp. 206—208).
- Шаблон:Citation.
- Шаблон:Citation.
- Шаблон:Citation.
- Шаблон:Citation.
- ↑ Шаблон:Harvtxt: «Herdan's law in linguistics and Heaps' law in information retrieval are different formulations of the same phenomenon».
- ↑ Шаблон:Harvtxt; Шаблон:Harvtxt; Шаблон:Harvtxt.