Метод k-медіан

Матеріал з testwiki
Версія від 19:13, 28 жовтня 2022, створена imported>Vlasenko D (Див. також: доповнення)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Ме́тод k-медіа́н[1][2] — застосовувана в статистиці і машинному навчанні варіація методу k-середніх для задач кластеризації, де для визначення центроїда кластера замість середнього обчислюється медіана. Такий підхід відповідає мінімізації похибки за всіма кластерами в метриці з 1-нормою, замість метрики з 2-нормою, використовуваною в стандартному методі k-середніх.

Задача визначення k-медіан полягає в пошуку таких k центрів, що сформовані за ними кластери будуть «найкомпактнішими». Формально, для заданих точок даних xi, k центри cj слід вибрати так, щоб мінімізувати суму відстаней від кожної xi до найближчого cj.

Метод іноді працює краще, ніж метод k-середніх, де мінімізується сума квадратів відстаней. Критерій суми відстаней широко використовується для транспортної задачі[3].

Ще альтернатива — метод Шаблон:Нп, у якому шукають оптимальний медоїд, а не медіану кластера (медоїд є однією з точок даних, тоді як медіани такими бути не мусять).

Див. також

Посилання

Шаблон:Reflist Шаблон:Бібліоінформація

  1. A. K. Jain and R. C. Dubes, Algorithms for Clustering Data: Prentice-Hall, 1981.
  2. P. S. Bradley, O. L. Mangasarian, and W. N. Street, "Clustering via Concave Minimization, " in Advances in Neural Information Processing Systems, vol. 9, M. C. Mozer, M. I. Jordan, and T. Petsche, Eds. Cambridge, MA: MIT Press, 1997, pp. 368—374.
  3. Шаблон:Cite web