3 ВВЕДЕНИЕ
В отличие от представителей естественных наук (физиков, химиков, биологов, медиков), озабоченных измерением веса (молекулы, атома, планеты, живой клетки, человека), давления (газа, пара или крови), температуры (в атомном реакторе или у больного), использующих для этого приборы (линейку, тонометр, термометр) и получающих данные в соответствующих единицах (граммах, миллиметрах или градусах), психологи чаще всего должны осмысливать (понимать, описывать, измерять) какие-то более общие, абстрактные характеристики, часто ими самими придуманные, существующие гипотетически: интроверсия, альтруизм, интеллект. Как, например, можно измерить степень любви одного человека к другому? С помощью какого прибора? По какой шкале? В каких единицах?
С точки зрения психолога-психометрика любовь — это латентная (глубинная) характеристика, которую нельзя увидеть как таковую, но можно оценить на основе измерения явно выраженных (наблюдаемых) переменных. Например, можно выделить некоторые акты поведения и интерпретировать их как проявления любви. Если кто-то кому-то дарит цветы, интересуется его проблемами, читает его записки, смеется над его шутками, жертвует чем-то ради него и т. д., то можно допустить, что в данном случае переменную «любовь» следует «оценить со
4знаком плюс». Точно так же можно подобрать простые наблюдаемые характеристики для изучения альтруизма, понимания и т. д. Вообще идентификация глубинных измерений по наблюдаемым характеристикам (поступкам) происходит в психологических исследованиях любого уровня: индивида (например, выраженность нейротизма), личности (IQ), межличностного взаимодействия (лидерство), общества в целом (идеология, моральные нормы).
При этом исходят из гипотезы, что абстрактные понятия можно описать через более простые (наблюдаемые), поскольку эти абстрактные понятия объясняют наблюдаемые корреляции между простыми переменными. Например, постулат о существовании чего-то такого, называемого «любовью», определяет корреляции между поступками в различных ситуациях, связываемых с проявлениями любви. Стоит обратить внимание на выделенное слово «связываемых»: кем, где, когда, как? Задумав измерить какую-либо латентную переменную, исследователь (психолог-экспериментатор) составляет список характеристик (наблюдаемых переменных), свидетельствующих о проявлениях латентной переменной. Этот список чаще всего составляется на основании его гипотезы (например, о том, что чувство любви проявляется в каких-то очевидных и общепринятых поступках). Тут необходимо, конечно же, учитывать социокультурный контекст, ибо «узаконенные» (нормативные) способы проявления тех или иных чувств в разных обществах совершенно различны (достаточно вспомнить до сих пор бытующую русскую поговорку: «Бьет, значит любит»). Поскольку для оценки используются измерения по нескольким переменным-параметрам, то говорят о латентном конструкте — факторе.
Понятие «конструкт» ввел Дж. Келли (1955), рассматривавший персональные (личностные) конструкты не только как форму упорядочения опыта, но и как образование, опосредствующее восприятие и осознание действительности. Этот термин применяется и к общественному сознанию, впитавшему в себя личностные конструкты
5(например, на уровне идеологии, морали, общественных норм, определяющих функционирование и развитие всего общества в целом). Можно говорить о групповых конструктах, присущих представителям какой-то специальности и связанных с определенной профессиональной картиной мира.
Для обработки данных, полученных в ходе эксперимента, широко используются различные методы многомерной статистики. Наиболее распространенный из них — факторный анализ — статистическая процедура, используемая для выявления относительно небольшого количества глубинных (явно не наблюдаемых) конструктов, которые можно использовать для представления отношений между многочисленными наблюдаемыми переменными.
Точный момент возникновения метода факторного анализа определить достаточно трудно. Если отсчитывать его историю от изобретения Ф. Гальтоном коэффициента корреляции, то это середина 1880-х гг. Работая с антропометрическими данными, Пирсон в 1901 г. выдвинул идею «главных осей», но рождение факторного анализа как метода исследования связывают с публикацией в 1904 г. статьи Спирмэна «Объективное определение и измерение общего интеллекта». На основе статистического анализа тестов Спирмэн выдвинул двухфакторную теорию интеллекта, описываемого в терминах одного общего (генерального) фактора, присущего всем измерениям интеллекта, и целой серии специфических факторов, привносимых каждым из используемых тестов. Однако концепция одного генерального фактора оказалась несостоятельной, и дальнейшее развитие теории привело к появлению многофакторного анализа Тэрстоуна, т. е. к тому, что мы называем факторным анализом сегодня. Теперь общепринято рассматривать баллы в батареях тестов способностей (наблюдаемые переменные) как линейные комбинации факторов, выражающих вербальные навыки, математические способности и скорость восприятия.
Во время Второй мировой войны факторный анализ широко применялся различными военными службами
6США в связи с решением проблем квалификационных проверок, классификации и распределения личного состава. Довольно скоро появились работы, посвященные применению факторного анализа в исследовании темперамента (Guilford, Zimmerman, 1956), должностной морали (Roebuck, 1958), в разработке методик клинической терапии (Lorr, McNair, 1964; McNair, 1964), при выявлении психологических особенностей «public relations» (Schubert, 1962; Thurstone, Degan, 1951; Voiers, 1964; подробнее об этом см.: Харман, 1972).
Факторный анализ довольно быстро превратился в достаточно сложную математическую систему, сочетающую методы теории вероятности и математической статистики, линейной алгебры и функционального анализа, развиваемую американскими математиками и статистиками для американских психологов и этими американскими психологами главным образом используемую. Практически все книги по факторному анализу, доступные русскоязычному читателю, — это переводы. И ссылки в них, иллюстрирующие применение этого метода в психологии, относятся исключительно к англоязычной литературе.
В нашей стране обсуждение основ факторного анализа началось еще в 1930-х гг. Однако в основном это были критические выступления, соответствующие духу эпохи и приведшие к тезису о «крайнем упрощенчестве метафизического характера, возникающем при разложении свойства на сумму составляющих» (Мандрыка, 1931). Такая позиция существенно затормозила дальнейшее распространение и использование факторного анализа во всех областях советской науки.
Новый этап развития этого метода в СССР начался в 1950-х гг. в антропологии (Игнатьев, 1957). В работе В. П. Чтецова (1960) была изложена общая схема факторного анализа и рассмотрены некоторые работы зарубежных антропологов. Необходимость использования факторного анализа в физкультурной антропологии была показана в статье П. Н. Башкирова (1960), послужившей
7«мостиком» между антропологией и науками о спорте, тесно соприкасающимися с наукой о высшей нервной деятельности человека — областью интересов Б. М. Теплова и В. Д. Небылицина (подробнее об этом см.: Небылицын, 1960; Докторов, 1969).
Статья Небылицына (1960) по тем временам была достаточно смелой (не будем забывать про активную борьбу с буржуазными веяниями в советской биологии, генетике, математике и т. д.). Осторожно называя факторный анализ скорее искусством, предоставляющим немалый простор для субъективных интерпретаций и выводов, автор все же предлагает психологам познакомиться с теорией, основными предпосылками, логикой и техникой этого метода, а также выражает надежду на скорое превращение его в строгую логическую схему, дающую единственное решение.
Теплов (1967) обращает внимание на две различные, но не противоречащие друг другу задачи факторного анализа: формально-математическую (статистическую, связанную с экономным описанием полученных данных) и научно-содержательную (интерпретационную, позволяющую подтвердить или отбросить гипотезы, касающиеся природы изучаемых процессов). Эти две задачи тесно взаимосвязаны: для решения второй (научно-содержательной) задачи надо прежде всего решить первую — математическую. Описывая математическую модель факторного анализа и приводя примеры из исследований руководимой им лаборатории, Теплов говорит о том, что факторный анализ будет ценным орудием в любой области, где можно предположить наличие некоторых основных параметров, функций, свойств, образующих структуру. В настоящее время во всех монографиях по факторному анализу указываются области применения его в психологии. Стоит отметить, что свое окончательное название на русском языке метод факторного анализа получил именно в этой работе Теплова (ранее наряду с термином «факторный» использовался термин «факториальный»).
8Если попросить любого отечественного психолога назвать имена коллег, наиболее часто использующих факторный анализ сегодня, то бесспорными лидерами такого рейтинга станут «отцы-основатели» психосемантического направления — В. Ф. Петренко (1983, 1988, 1997) и А. Г. Шмелев (1983). Это действительно так. Факторный анализ (наряду с другими методами многомерной статистики — кластерным и дискриминантным анализом, многомерным шкалированием) входит в рабочий арсенал психосемантики. И если Е. Ю. Артемьева (1980, 1999), развивая психосемантический подход, пыталась избежать обработки данных, связанной с громоздкими вычислениями, из-за определенных трудностей использования больших ЭВМ и отсутствия персональных (отсюда ее семантические коды и пр.), то в настоящее время снятие этих барьеров позволяет «выжать» из полученных данных гораздо больше информации методами многомерной статистики. Конечно же, использование факторного анализа не ограничивается областью одной только психосемантики, хотя развитие последней в значительной степени способствует развитию общей математической культуры отечественных психологов. Достаточно просмотреть психологические журналы за последние два-три года, чтобы убедиться, что практически не осталось областей общей или прикладной психологии, где бы не проводились исследования с помощью метода факторного анализа.
Если на первых этапах факторно-аналитические процедуры выполнялись в основном «вручную», что требовало от исследователя владения теорией и методами расчета, то в настоящее время подавляющее большинство психологов, использующих факторный анализ для обработки своих данных, имеет очень туманное представление о сложных конструкциях, обосновывающих вычисления, а соответствующие компьютерные программы (как правило, созданные американскими программистами) воспринимает как «черный ящик», в который можно ввести свою матрицу данных, а на выходе получить матрицу факторов или какие-то графики. Конечно же, некоторые
9знания в области теории факторного анализа позволят исследователю более свободно чувствовать себя не только при обработке данных (выбор методов, статистических критериев, математического обоснования оптимального решения), но и на этапе планирования эксперимента (какие переменные включить, какого математического решения ожидать), а также при интерпретации полученного результата и осознании того, почему получилось именно это решение и можно ли его улучшить, выбрав другие методы факторного анализа. Все это повышает уровень исследований.
Однако все мы знаем, что ездить на автомобиле вполне можно и без знания его внутреннего устройства: выучил правила дорожного движения, познакомился с принципами движения машины, вспомнил школьные уроки физики — и в дорогу. Если что-то сломалось в пути, вовсе не обязательно лезть под капот, а можно обратиться за помощью к специалисту. Наверное, то же самое должно происходить, когда психолог садится за компьютер, включает программу факторного анализа и начинает обрабатывать свои данные. Здесь в качестве помощников выступают «Руководство пользователя» по применению программы факторного анализа и общая математическая культура, полученная в школе, а потом в институте (не случайно же курс математики считается необходимым для студента-психолога). Главная цель предлагаемого пособия — по возможности просто объяснить психологу (или студенту), как использовать мощь факторного анализа в своих целях. Однако, вспоминая аналогию с вождением автомобиля и учитывая то, что автосервис в настоящий момент развит гораздо лучше, чем обслуживание ученых-психологов специалистами по теории факторного анализа (последних просто очень мало), а также вероятность того, что психолог сам захочет (или будет вынужден) разбираться в формулах и теоремах этой теории, мы даем некоторые математические основы факторного анализа, а более продвинутому читателю рекомендуем дополнительную литературу.
10 Глава 1
МЕТОДЫ ГЛАВНЫХ КОМПОНЕНТ
И ФАКТОРНОГО АНАЛИЗА:
ТЕОРЕТИЧЕСКИЕ И ПРАКТИЧЕСКИЕ ВОПРОСЫ
1.1. Общие положения
Методы главных компонент и факторного анализа представляют собой совокупность статистических процедур, направленных на выделение из заданного множества переменных подмножеств переменных, тесно связанных (коррелирующих) между собой. Переменные, входящие в одно подмножество и коррелирующие между собой, но в значительной степени независимые от переменных из других подмножеств, образуют факторы. Цель факторного анализа — идентифицировать явно не наблюдаемые факторы с помощью множества наблюдаемых переменных.
В основе парадигмы использования факторного анализа лежит предположение о том, что выделяемые факторы отражают глубинные процессы (латентные, не наблюдаемые, не измеряемые), являющиеся причиной корреляций
11первичных (наблюдаемых, измеряемых) переменных. Другими словами, факторы (глубинные параметры) детерминируют (определяют) первичные наблюдаемые переменные и могут быть использованы для объяснения комплексных явлений. Наблюдаемые корреляции между первичными переменными возникают из-за того, что их детерминируют одни и те же факторы.
Например, мы исследуем влияние на академическую успеваемость студентов различных психологических и социально-демографических параметров: личностных характеристик, мотивации, умственных способностей, социального происхождения, семейного положения, здоровья, физических характеристик и т. д. Каждая из этих областей задается множеством переменных; все переменные подвергаются анализу одновременно и независимо друг от друга. Анализ выявляет «связки» (подмножества) коррелирующих между собой переменных. Изучение этих «связок» (интерпретация результатов) позволяет выявить скрытые процессы, влияющие на успеваемость студентов. В ходе анализа может получиться так, что несколько переменных, характеризующих независимость личности, имеют высокие коэффициенты корреляции с переменными, измеряющими мотивацию и успеваемость. Это можно проинтерпретировать как положительное мотивирующее влияние на успеваемость фактора независимости личности. Если же высокие коэффициенты корреляции будут обнаружены между переменными, измеряющими интеллектуальные способности и успеваемость, то это можно проинтерпретировать как положительное влияние на успеваемость фактора интеллекта. Корреляция между тестовыми баллами может быть объяснена такими определяющими факторами, как общий уровень интеллекта, абстрактная способность понимания, способность понять прочитанное. Корреляция между социальными переменными может возникнуть благодаря таким факторам, как социально-экономический уровень общества, уровни урбанизации, благотворительности, демографической стабильности.
12Математическая модель факторного анализа появилась как нечто подобное многомерному уравнению регрессии: каждая переменная выражается как линейная комбинация факторов, которые в действительности не наблюдаемы. Например, в классическом семантическом дифференциале Ч. Осгуда (со шкалами прилагательных-антонимов, с помощью которых достаточно легко оценивается любой объект) каждую из наблюдаемых шкал (большой/маленький, высокий/низкий, веселый/грустный и т. д.) можно выразить через три латентных фактора (Оценка, Сила и Активность):
| |
Большой/Маленький = a (Оценка) + b (Сила) + c (Активность) + UБМ | (1) |
Это уравнение отличается от обычного многомерного уравнения регрессии тем, что Оценка, Сила и Активность — это не единичные независимые переменные. Это латентные (ненаблюдаемые, гипотетические) конструкты, которые нельзя измерить, но которые, согласно модели исследователя, проявляются через целую группу переменных (в нашем случае шкал прилагательных-антонимов).
Факторы определяются наблюдаемыми переменными и могут быть оценены как их линейная комбинация.
Например:
| |
Оценка = C1 (приятный/неприятный) + C2 (веселый/грустный) + C3 (красивый/безобразный) + ... | (2) |
Теоретически возможна ситуация, что все переменные входят в фактор Оценки, но, как правило, переменными, характеризующими этот фактор, считаются те, у которых большие коэффициенты Ci. Говорят, что эта группа переменных составляет фактор. Так, например, в группу шкал фактора Оценка обычно входят красивый/некрасивый, хороший/плохой и т. п., в группу шкал фактора Сила — сильный/слабый, большой/маленький и т. п., а фактор Активность включает шкалы активный/
13пассивный, быстрый/медленный, подвижный/неподвижный и т. п. Обычно факторы, используемые для характеристики множества переменных, не известны заранее, а определяются в ходе факторного анализа.
Оценка, Сила, Активность — это общие факторы, так как через них все шкалы-переменные выражаются как функции. UБМ — это характерный фактор, включающий в себя специфический фактор (SБМ), выражающий ту часть переменной большой/маленький, которая не может быть объяснена общими факторами, а также связанный с ошибками измерения, присутствующими при любом исследовании.
Общее выражение для j-го фактора может быть записано так:
| |
Fj=Wj1X1+Wj2X2+Wj3X3…+WjpXp, | (3) |
где Wji — неизвестные коэффициенты факторных значений и p — количество переменных.
В общем случае для i-й переменной может быть записано следующее выражение:
| |
Xi=Ai1F1+Ai2F2+...+AikFk+Ui, | (4) |
где Fj (j изменяется от 1 до k) — это общие факторы, Ui — характерный, Aij — константы, используемые в линейной комбинации k факторов. Характерные факторы могут не коррелировать друг с другом и с общими факторами.
В психологии методы главных компонент и факторного анализа широко используются для разработки всевозможных диагностических методик — личностных, интеллектуальных и пр. Исследование начинается с выбора большого множества первичных переменных (которые можно измерить, т. е. определить их значение в результате опроса или какого-то физического измерения), отражающих первоначальную (экспериментально проверяемую) гипотезу о связи измеряемых и латентных переменных.
14Данные (значения переменных) набираются на репрезентативной (с точки зрения основной гипотезы исследования) выборке испытуемых. Выборка может быть составлена случайным образом или, наоборот, по какому-то внешнему критерию, которому испытуемые должны удовлетворять.
Процедуры факторно-аналитической обработки, применяемые к полученным данным, различны, но структура (алгоритм) анализа состоит из одних и тех же основных этапов: 1. Подготовка исходной матрицы данных. 2. Вычисление матрицы взаимосвязей признаков. 3. Факторизация (при этом необходимо указать количество факторов, выделяемых в ходе факторного решения, и метод вычисления). На этом этапе (как и на следующем) можно также оценить, насколько хорошо полученное факторное решение сближает исходные данные. 4. Вращение — преобразование факторов, облегчающее их интерпретацию. 5. Подсчет факторных значений по каждому фактору для каждого наблюдения. 6. Интерпретация данных.
В ходе выполнения факторного анализа какие-либо из указанных этапов можно опустить. Например, в качестве исходной матрицы данных можно использовать корреляционную матрицу или эквивалентную ей любую другую матрицу связей, подсчитанную в ходе какой-то другой вычислительной процедуры, и тогда работа начинается сразу со второго этапа. Также можно опустить вращение или (при отсутствии непосредственных наблюдений, когда мы имеем в качестве исходной матрицы корреляционную) не выполнять подсчет значений по каждому фактору для наблюдений.
Подготовка исходных данных. Практически во всех процедурах любой программы факторного анализа в качестве исходных данных используются матрицы. Матрица — это прямоугольная (в частном случае квадратная) таблица чисел, в которой, как правило, горизонтальные линии (строки, ряды) соответствуют наблюдениям (объектам), а вертикальные линии (столбцы) — переменным.
15При подготовке исходных данных для факторного анализа исследователь должен решить, как он будет записывать данные в строки и столбцы таблицы, т. е. выбрать, что будет рассматриваться в качестве наблюдений, а что в качестве переменных.
Наиболее распространен случай, когда факторно-аналитической обработке подвергается набор данных, полученных в результате опроса N испытуемых (респондентов) с помощью анкеты, содержащей n вопросов. Если целью исследования является анализ вопросов анкеты (точнее, ответов на эти вопросы и взаимосвязей между ними), то анкета, заполненная одним респондентом, соответствует одному наблюдению, а каждый из n вопросов рассматривается как переменная. Следовательно все данные записываются в таблицу, состоящую из N строк и n столбцов. Значения каждой переменной принадлежат заранее заданному множеству вариантов ответов на соответствующий вопрос и должны представлять собой интервальную (или по крайней мере ранговую) шкалу, если в дальнейшем предусмотрен факторный анализ матрицы данных. N испытуемых, ответивших на вопросы анкеты, называются выборкой.
Если исследователя интересует взаимосвязь не вопросов анкеты, а отдельных испытуемых из выборки, тогда матрицу данных можно транспонировать (т. е. столбцы записать как строки, а строки автоматически получатся записанными как столбцы) и говорить об n наблюдениях (каждый пункт анкеты — одно наблюдение) и N переменных (испытуемые рассматриваются как переменные).
Еще один способ формирования матрицы данных используется в психосемантике (Петренко, 1997), когда исследуется семантическое пространство (пространство значений) сознания (представлений, картины мира) индивида или группы индивидов, т. е. определяется, что представляет собой (означает) для исследуемого индивида или группы тот или иной объект. Но определить это можно только путем соотнесения между собой оценок,
16данных испытуемыми объектам по тем или иным шкалам. В данном случае шкалы представляют собой некий «алфавит» описания объекта, и чтобы понять, какое «слово» (оценка по большому набору шкал) сказано про какой-то объект, нужно соотнести это «слово» с другими «словами» этого «алфавита» (с оценкой других объектов по тем же шкалам). Таким образом, все данные шкалирования сводятся в матрицу, в которой каждая шкала соответствует переменной, а каждый объект — наблюдению. Наиболее типичный пример такого многомерного шкалирования (когда один испытуемый оценивает несколько объектов по нескольким шкалам) представляет уже упомянутый выше семантический дифференциал Ч. Осгуда.
Французский математик Ж. Балладур (1974) предложил свой способ составления матриц данных для факторного анализа. Этот метод предназначен для изучения взаимосвязей между качественными (номинативными) признаками, описывающими некоторую изучаемую совокупность. Например, лица, занятые в обрабатывающей промышленности, могут характеризоваться двумя качественными признаками: местом работы (отраслью производства) и местом проживания (городом). Можно составить матрицу, в которой на пересечении столбца, соответствующего отрасли, и строки, соответствующей городу, будет стоять число, означающее количество лиц, живущих в таком-то городе и занятых в такой-то отрасли производства. Факторный анализ этой матрицы поможет
17изучить сходства и различия промышленной структуры исследуемой группы городов (поскольку строки матрицы представляют структуру промышленности рассматриваемых городов). Он даст возможность представить города точками в многомерном пространстве, в котором оси переменных соответствуют отраслям. Тем самым исходная задача переформулируется в задачу факторного анализа: задан массив числовых данных, характеризующих изучаемую группу объектов (городов) по набору переменных (отраслей).
Вычисление матрицы взаимосвязей признаков. Процедура факторного анализа начинается с вычисления матрицы взаимосвязей переменных между собой (это квадратная матрица, размер которой равен количеству переменных).
Наиболее распространенная мера взаимосвязи (используемая в факторном анализе в 95% случаев) — это корреляционная связь. Вообще изобретение факторного анализа было связано именно с необходимостью одновременного анализа большого количества коэффициентов корреляции различных шкал между собой. Поэтому практически во всех книгах по факторному анализу речь идет именно о корреляционных матрицах, а не о матрицах взаимосвязей. Корреляционную матрицу можно вычислять различными способами. Чаще всего вычисляется коэффициент корреляции Пирсона, но может вычисляться и коэффициент ранговой корреляции (тогда говорят о непараметрическом факторном анализе). Коэффициент корреляции удобен тем, что это стандартизированная мера взаимосвязи, не зависящая ни от единиц измерения, ни от диапазона изменения переменных.
Английское слово «correlation» в русском языке оказалось жестко привязанным к «коэффициенту корреляции», вычисляемому по достаточно ограниченному набору формул из теории вероятностей и математической статистики. Однако его можно перевести не только как «корреляция», но и как «взаимосвязь», «соотношение»
18«взаимозависимость», «взаимоотношение», «отношение». Поэтому не следует ограничивать меры взаимосвязи признаков одними только коэффициентами корреляции, понимаемыми в узком теоретико-вероятностном смысле. Так, в качестве матрицы для факторизации во многих компьютерных программах предусмотрено использование также матрицы ковариаций. Еще один распространенный вариант построения матрицы взаимосвязей базируется на использовании различных метрик, задающих «расстояние» между переменными и нормированных таким образом, чтобы диапазон их изменений соответствовал диапазону изменения коэффициента корреляции (от —1 до 1).
Однако в случаях, когда дисперсии разных переменных существенно различаются и измеряются в разнородных единицах, разумно использовать именно корреляционную матрицу.
В случае, когда переменные измеряются в неодинаковых единицах, построение матрицы взаимосвязей заключается в нормировке переменных, т. е. в приведении их к стандартной форме с использованием средних и дисперсии по формуле:
где Xs — стандартизированное значение переменной X, Xср — среднее, σ — стандартное отклонение.
И далее можно вычислять показатели взаимосвязи каким-то иным способом, а не только как коэффициенты корреляции.
Интерпретируемость результатов — наиболее важный содержательный критерий достоверности и значимости анализа. Результат всех процедур можно назвать «хорошим», если выделенная факторная структура с содержательной точки зрения «имеет смысл» (факторы, полученные при «плохом» анализе, такого смысла не имеют). Факторы интерпретируются и получают названия в зависимости от конкретной комбинации