Учебник по промышленной статистике


Анализ соответствий - часть 2


Следующие данные представлены в работе Greenacre (1984, стр. 55).

Таблица 1
Таблица 1



Категории курящих   Группа
сотрудников (1)
Некурящие (2)
Слабо (3)
Средне (4)
Сильно Всего по строке (1) Старшие менеджеры
(2) Младшие менеджеры
(3) Старшие сотрудники
(4) Младшие сотрудники
(5) Секретари Всего по столбцу
  4
  4
25
18
10
  2
  3
10
24
  6
  3
  7
12
33
  7
  2
  4
  4
13
  2
  11
  18
  51
  88
  25
61 45 62 25 193


Это простая двувходовая таблица. Можно считать, что 4 числа в каждой строке данной таблицы являются координатами 4-х мерного пространства, и значит, можно вычислить (евклидовы) расстояния между 5-ю точками (строками) этого 4-х мерного пространства. Расстояния между данными точками в 4-х мерном пространстве объединяют (агрегируют) всю информацию о сходствах между строками в том смысле, что чем меньше расстояние, тем больше сходство между категориями курящих. Теперь, предположим, что возможно найти пространство меньшей размерности для представления точек-строк, которое сохраняет всю или почти всю информацию о различиях между строками. В рассматриваемом случае вы можете представить всю информацию о сходстве между строками (в данном случае о типе работника) в виде 1, 2 или 3-мерного графика. Хотя это может и не быть практически полезным для маленьких таблиц, аналогичных рассматриваемой, можно себе представить, как сильно выиграет представление и интерпретация очень больших таблиц (в которых, например, записаны предпочтения для 10 потребительских товаров 100 групп респондентов) в результате упрощения, полученного путем применения методов анализа соответствий (например, представить упомянутые 10 потребительских товаров в двумерном пространстве).

Масса.
Масса.

Продолжая предыдущий пример двухвходовой таблицы, рассмотрим вычислительный аспект работы программы.


Начало  Назад  Вперед



Книжный магазин