Учебник по промышленной статистике


Кластерный анализ


Кластерный анализ

  • Основная цель
  • Проверка статистической значимости
  • Области применения
  • Объединение (древовидная кластеризация)
    • Иерархическое дерево
    • Меры расстояния
    • Правила объединения или связи
  • Двувходовое объединение
    • Вводный обзор
    • Двувходовое объединение
  • Метод K средних
    • Пример
    • Вычисления
    • Интерпретация результатов


  • Основная цель
  • Проверка статистической значимости
  • Области применения
  • Объединение (древовидная кластеризация)
    • Иерархическое дерево
    • Меры расстояния
    • Правила объединения или связи
  • Двувходовое объединение
    • Вводный обзор
    • Двувходовое объединение
  • Метод K средних
    • Пример
    • Вычисления
    • Интерпретация результатов



Основная цель

Термин кластерный анализ (впервые ввел Tryon, 1939) в действительности включает в себя набор различных алгоритмов классификации. Общий вопрос, задаваемый исследователями во многих областях, состоит в том, как организовать наблюдаемые данные в наглядные структуры, т.е. развернуть таксономии. Например, биологи ставят цель разбить животных на различные виды, чтобы содержательно описать различия между ними. В соответствии с современной системой, принятой в биологии, человек принадлежит к приматам, млекопитающим, амниотам, позвоночным и животным. Заметьте, что в этой классификации, чем выше уровень агрегации, тем меньше сходства между членами в соответствующем классе. Человек имеет больше сходства с другими приматами (т.е. с обезьянами), чем с "отдаленными" членами семейства млекопитающих (например, собаками) и т.д. В последующих разделах будут рассмотрены общие методы кластерного анализа, см. Объединение (древовидная кластеризация), Двувходовое объединение и Метод K средних.

Проверка статистической значимости
Проверка статистической значимости

Заметим, что предыдущие рассуждения ссылаются на алгоритмы кластеризации, но ничего не упоминают о проверке статистической значимости. Фактически, кластерный анализ является не столько обычным статистическим методом, сколько "набором" различных алгоритмов "распределения объектов по кластерам".


Начало  Назад  Вперед



Книжный магазин