На статистических пиктографиках наблюдения или отдельные испытания представлены в виде символов со многими элементами.
Основная идея использования пиктографиков состоит в представлении отдельных наблюдений в виде некоторых графических объектов, где значения переменных соответствуют определенным свойствам или размерам этих объектов (как правило, одно наблюдение = один объект). Это соответствие таково, что внешний вид объекта изменяется в зависимости от набора значений.
Таким образом, появляется возможность однозначно «идентифицировать» объекты по набору значений. Изучение таких пиктограмм помогает обнаружить специфические наборы простых соотношений и взаимосвязей между переменными.
В идеальном случае анализ пиктографиков осуществляется в пять этапов.
1) Определяется порядок анализируемых переменных. Очень часто наилучшим решением является случайная последовательность. Можно также попробовать ввести переменные в порядке их расположения в уравнении множественной регрессии в зависимости от величины их факторных нагрузок на интерпретируемый коэффициент или использовать аналогичные многомерные методы. Это иногда позволяет упростить и сделать «однородным» общий вид пиктограмм, чтобы облегчить задачу распознавания не слишком
отличающихся друг от друга картинок. В то же время использование таких методов может усложнить задачу поиска некоторых взаимозависимостей. На этом этапе невозможно дать никаких универсальных рекомендаций, кроме совета попробовать самый быстрый метод (случайный выбор порядка) до того, как применять более сложные методы.
2) Проводится поиск любых возможных закономерностей, таких как сходство между группами пиктограмм, выбросы или специфические соотношения между элементами пиктограмм (например, «если на пиктограмме звезды первые два луча длинны, то один или два луча с другой стороны пиктограммы обычно коротки»). На этом этапе рекомендуется использовать пиктографики кругового типа.
3) Обнаруженные закономерности описываются в терминах используемых переменных.
4) Для проверки найденной структуры соотношений переменные сопоставляются с другими элементами пиктограмм. Например, можно попытаться переместить связанные элементы пиктограммы ближе друг к другу, чтобы упростить дальнейшее сравнение. В некоторых случаях в конце этого этапа рекомендуется исключить из рассмотрения переменные, не вносящие заметного вклада в исследуемую структуру.
5) Для проверки и количественной оценки обнаруженной зависимости или хотя бы некоторых ее параметров используется, например, регрессионный анализ, нелинейное оценивание, дискриминантный или кластерный анализ.
Большинство пиктографиков можно отнести к одному из двух типов: круговому или последовательному.
Круговые пиктограммы
Круговые пиктографики (звезды, лучи, многоугольники) имеют форму «велосипедного колеса», где значения переменных изображаются в виде расстояний между центром («втулкой») пиктограммы и ее углами.
Такие пиктограммы полезны при поиске взаимозависимостей между переменными, поскольку они хорошо отличаются и идентифицируются по внешнему виду, который в свою очередь определяется конфигурацией значений изучаемых переменных.
Чтобы перевести эти «приблизительные соответствия» на язык конкретной модели (в терминах соотношений между переменными) или чтобы проверить конкретные предположения, полезно переключиться на один из последовательных пиктографиков, использование которых может оказаться более эффективным в том случае, когда уже известно, что нужно искать.
Последовательные пиктограммы
На последовательных пиктографиках (столбцы, профили, линейные графики) отдельные пиктограммы представляют собой небольшие последовательные графики (разных типов).
Значения следующих друг за другом переменных отображаются на этих графиках расстоянием между основанием пиктограммы и последовательно идущими точками последовательности (например, высоты столбцов на показанном выше рисунке). Такие графики могут быть не столь эффективными на начальном этапе анализа, поскольку пиктограммы могут не слишком отличаться друг от друга. Тем не менее, как было указано выше, они могут пригодиться для проверки определенной гипотезы или для описания модели в терминах соотношений между конкретными переменными.
Круговые диаграммы
Пиктографики в виде круговых диаграмм занимают промежуточное место между пиктографиками двух упомянутых выше типов; все пиктограммы имеют одинаковую форму (круг) и разделены на последовательно идущие друг за другом части в соответствии со значениями переменных, следующих друг за другом.
Несмотря на их форму, с точки зрения функционального использования, такие пиктографики скорее можно отнести к разряду последовательных.
«Лица Чернова»
Этот тип пиктограмм образует отдельную категорию. Разные наблюдения здесь схематично представлены в виде лиц. При этом выбранные переменные соответствуют конкретным элементам (чертам) лица.
В силу уникальных свойств таких диаграмм некоторые исследователи рассматривают их в качестве основного многомерного метода исследований, способного выявить скрытые взаимосвязи между переменными, которые невозможно было бы отыскать, применяя любой другой метод. Это утверждение, однако, очень похоже на преувеличение.
Заметим, что метод «Лиц Чернова» довольно сложен, а его использование требует проведения большого числа экспериментов по сопоставлению черт лица с исходными данными.
Пиктографики применяются, как правило, в двух случаях: 1) когда нужно выявить характерные зависимости или группы наблюдений и 2) когда необходимо исследовать предположительно сложные взаимосвязи между несколькими переменными. В первом случае пиктографики используются для классификации наблюдений аналогично кластерному анализу.
Предположим, было проведено анкетирование артистов с целью изучения их личных качеств. Пиктографики помогут определить, существуют ли естественные группы артистов, отличающиеся определенными закономерностями полученных баллов за ответы на различные вопросы. Например, может оказаться, что некоторые артисты — чрезвычайно творческие личности, при этом они недисциплинированны и независимы, в то время как представители второй группы хорошо образованны, дисциплинированны и уделяют большое внимание успеху у публики.
Второй тип применений — исследование связей между несколькими переменными — больше напоминает факторный анализ, то есть его можно использовать при исследовании вопроса о зависимости переменных. Предположим, изучалось мнение группы людей о различных марках автомобилей. Несколько человек заполнили детальные анкеты, оценивая различные свойства различных автомобилей. В файле данных записаны средние оценки по каждому из свойств (рассматриваемых как переменные) для каждого из автомобилей (рассматриваемых как наблюдения).
При изучении «Лиц Чернова» (где каждое лицо представляет мнение об одном из автомобилей) может оказаться, что улыбающиеся лица обычно имеют большие уши, при этом если цене соответствует «величина» улыбки, а динамическим качествам — размер ушей, это «открытие» означает, что быстрые машины дороги. Разумеется, это очень простой пример, однако при анализе реальных данных применение этого метода может сделать более очевидными сложные взаимосвязи между переменными.
«Лица Чернова»
На данном типе диаграмм для каждого наблюдения рисуется отдельное «лицо». Значениям выбранных переменных ставятся в соответствие форма и размеры конкретных черт лица (например, длина носа, угол наклона бровей, ширина лица).
Звезды
График с пиктограммами в виде Звезд — это пиктографик кругового типа. На таких графиках для каждого наблюдения рисуется отдельная пиктограмма в виде звезды, при этом относительные значения выбранных переменных для каждого наблюдения представляются длинами соответствующих лучей (порядок следования которых зафиксирован: по часовой стрелке начиная от луча, направленного вертикально вверх). Концы лучей соединяются линиями.
Лучи
График с пиктограммами в виде Лучей — это пиктографик кругового типа. На нем для каждого наблюдения рисуется отдельная пиктограмма, напоминающая солнце, при этом все лучи имеют одинаковую длину и каждый из них представляет одну из выбранных переменных (порядок следования которых зафиксирован: по часовой стрелке, начиная от луча, направленного вертикально вверх). Точки на лучах, определяемые относительными значениями соответствующих переменных, соединяются ломаной линией.
Многоугольники
График с пиктограммами в виде многоугольников —-это пиктографик кругового типа. Здесь для каждого наблюдения рисуется пиктограмма в виде многоугольника. Относительные значения выбранных переменных для каждого наблюдения представлены расстояниями, отсчитываемыми от центра диаграммы до последовательно идущих вершин многоугольника (по часовой стрелке, начиная с направления вертикально вверх).
Круговые диаграммы
Графики с пиктограммами в виде круговых диаграмм — это пиктографики кругового типа (см. предыдущий раздел). Значения переменных для каждого наблюдения изображаются в виде секторов (по часовой стрелке, начиная с направления вертикально вверх). При этом относительные значения выбранных переменных определяют углы раствора соответствующих секторов.
Столбцы
График с пиктограммами в виде столбцов — это пиктографик последовательного типа. Для каждого наблюдения рисуется отдельный график; относительные значения выбранных переменных соответствуют высотам последовательных столбцов.
Линии
Графики с пиктограммами в виде линий являются пиктографиками последовательного типа.
Для каждого наблюдения рисуется отдельная ломаная линия; при этом относительные значения выбранных переменных для каждого наблюдения соответствуют высотам последовательных точек излома.
Профили
Графики с пиктограммами в виде профилей — это пиктографики последовательного типа (см. предыдущий раздел). Для каждого наблюдения рисуется отдельный график. Относительные значения выбранных переменных соответствуют высотам последовательных пиков сечения, ограниченного снизу базовой линией.