Открытие бизнеса

Пример приведения результатов факторного анализа. Факторный анализ раньше использовался в психологии для выявления ментальных и интеллектуальных способностей человека

Факторный анализ - статистический метод, который используется при обработке больших массивов экспериментальных данных. Задачами факторного анализа являются: сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е.

Классификация переменных, поэтому факторный анализ используется как метод сокращения данных или как метод структурной классификации.

Важное отличие факторного анализа от всех описанных выше методов заключается в том, что его нельзя применять для обработки первичных, или, как говорят, «сырых», экспериментальных данных, т.е. полученных непосредственно при обследовании испытуемых. Материалом для факторного анализа служат корреляционные связи, а точнее - коэффициенты корреляции Пирсона, которые вычисляются между переменными (т.е. психологическими признаками), включенными в обследование.

Факторный анализ имеет три основных применения в психологии. Во-первых, он может быть использован для конструирования тестов. Например, можно написать 50 заданий для измерения каких-либо способностей, личностной черты или аттитюда (такого, например, как консерватизм). Затем задания будут предъявлены репрезентативной выборке из нескольких сотен индивидуумов и обработаны (в случае тестов способностей) таким образом, что правильный ответ будет кодироваться «1», а неправильный - «О». Ответы, которые получают при использовании ранговых шкал (как в большинстве опросников личности и аттитюдов), просто вводятся в их сыром виде: один балл, если выбирается вариант ответа (а), два балла, если выбирается вариант ответа (б), и т.д. Ответы на эти 50 заданий затем коррелируют между собой и подвергают факторному анализу. Задания, которые имеют высокие нагрузки по каждому фактору, измеряют один и тот же лежащий в их основе психологический конструкт и таким образом формируют шкалу. Это позволяет определить, как обрабатывать опросники в будущем, просто взглянув на факторную матрицу: если задания 1, 2, 10 и 12 - единственные, которые имеют существенные нагрузки по одному фактору, тогда одна шкала теста будет состоять только из этих четырех заданий.

Кроме того, каждая из шкал нуждается в валидизации, например, путем подсчета баллов, полученных каждым человеком по каждому фактору, и оценки конструктной и(или) прогностической валидности этих шкал. Например, баллы, полученные по факторам, можно прокоррелировать с баллами, полученными из других опросников, используемых для прогноза успешности обучения, и т.д. Вторая задача, которую может решить факторный анализ, заключается в редукции данных, или в «концептуальной чистке». Было разработано огромное количество тестов для измерения личности, основывающихся на различных теоретических позициях, и далеко не всегда очевидно, в какой степени они перекрываются.

В-третьих, факторный анализ применяется при проверке психометрических свойств опросников, особенно когда они используются в новых культурах или популяциях. Например, предположим, что, в соответствии с руководством по использованию австралийского личностного теста, его следует обрабатывать путем сложения баллов, полученных по всем нечетным заданиям, которые формируют одну шкалу, в то время как сумма баллов, полученных по всем четным заданиям, образует другую шкалу.

Главное понятие факторного анализа - фактор. Это искусственный статистический показатель, возникающий в результате специальных преобразований таблицы коэффициентов корреляции между изучаемыми психологическими признаками, или матрицы интеркорреляций. Процедура извлечения факторов из матрицы интеркорреляцийназыв-ся факторизацией матрицы. В результате факторизации из корреляционной матрицы м.б. извлечено разное кол-во факторов вплоть до числа, равного кол-ву исходных переменных. Однако факторы, выделяемые в результате факторизации, как правило, неравноценны по своему значению. Формальным критерием качества проведения процедуры факторного анализа является процент объединенной дисперсии исходных признаков.

В настоящее время факторный анализ широко используется как для решения исследовательских задач, так и при конструировании психодиагностических методик.

Вы также можете найти интересующую информацию в научном поисковике Otvety.Online. Воспользуйтесь формой поиска:

Еще по теме 31. Применение факторного анализа в психологии.:

  1. 1. Способы факторного анализа, их виды, особенности применения.
  2. Факторный анализ, полный и дробный факторный эксперимент и математическая модель.
  3. 62. Планирования экспериментов. Факторный анализ, полный и дробный факторный эксперимент и математическая модель.
Глава 1. ФАКТОРНЫЙ АНАЛИЗ
Введение
Факторный анализ (ФА) принадлежит к числу таких методов, которые будучи разработанными в рамках запросов одной науки, впоследствии приобрели более широкое междисциплинарное значение. Заслугой можно считать разработку именно такого метода. Исторически возникший в лоне психометрики, ФА в настоящее время приобрел статус общенаучного метода и широко распространен не только в психологии, но и в нейрофизиологии, социологии, политологии, экономике и статистике. Поэтому не стоит удивляться, если на вопрос к математику, что такое ФА, вы получите ответ, что этот метод понижения размерности корреляционной матрицы, а экономист добавит, что ФА используется им как средство визуализации многопараметрического объекта экономического анализа.

ФА как общенаучный метод, получивший к настоящему времени солидное математико-статистическое обоснование, имеет непростую историю, начиная с полного отказа математиков признать ценность используемого психологами в известной степени нестрогого и зависящего от мастерства исследователя алгоритма до обязательного включения различных вариантов ФА в любую сколько-нибудь известную компьютерную статистическую программу. Основные идеи ФА (впрочем, как и других методов многомерного анализа данных) были заложены в трудах известного английского психолога и антрополога Ф. Гальтона (1822-1911), основателя евгеники, внесшего также большой вклад в исследование индивидуальных различий. В разработку ФА внесли вклад многие ученые и только на русском языке опубликовано более 10 монографий, посвященных непосредственно ФА, однако психологи должны быть особенно признательны трем своим коллегам, с именами которых связаны разработка и внедрение ФА в психологию - это Ч . Спирмен (1904, 1927, 1946), Л . Терстоун (1935, 1947, 1951) и Р . Кеттел (1946, 1947, 1951). Кроме того, нельзя не упомянуть еще трех ученых - английского математика и философа К. Пирсона , в значительной степени развившего идеи Ф. Гальтона, американского математика Г. Хоттелинга , разработавшего современный вариант метода главных компонент , и известного английского психолога Г. Айзенка , широко использовавшего ФА для разработки психологической теории личности.

Необходимо отметить, что в силу профессиональных установок авторов в литературе на русском языке (К. Иберла, 1980; Г. Харман, 1972) ФА чаще всего излагается как один из методов математической статистики, а ориентированное на психологов изложение - скорее исключение, чем правило (Дж. Ким, Ч. Мьюллер, 1989; Я. Окунь, 1972). В данной главе ФА будет излагаться как один из методов психологического шкалирования и многомерного анализа данных. Кроме того, в отличие от других авторов, в силу ряда причин описывавших преимущественно центроидный метод ФА, мы уделим особое внимание более современным и компьютеризованным процедурам применения ФА. По возможности мы будем исключать экскурсы в математические основы той или иной процедуры, а сосредоточимся на описании основных этапов работы с эмпирическими данными и их трансформацией в ходе ФА. В силу специфики курса “Психологические измерения” в Общем психологическом изложение материала будет сопровождаться иллюстрациями использования 2-х статистических программ - “Stadia” и SPSS.

§ 1. Область применения факторного анализа
Необходимость применения ФА в психологии как одного из методов многомерного количественного описания (измерения, анализа) наблюдаемых переменных в первую очередь следует из многомерности объектов, изучаемых нашей наукой. Сразу же определим, что под многомерным представлением объекта мы будем понимать результат его оценивания по нескольким различным и существенным для его описания характеристикам-измерениям, т.е. присвоение ему сразу нескольких числовых значений. Из этого вполне естественно следуют два очень важных вопроса: насколько существенны и различны эти используемые характеристики. Первый вопрос связан с всесторонностью и полнотой описания объекта психологического измерения, а второй (в большей степени) - с выбором некоторого минимально разумного количества этих характеристик. Поясним сказанное выше на примере. Чем отличается хороший, профессионально сделанный психологический опросник от многочисленных “полупродуктов-полушуток”, во множестве публикуемых в периодической печати для широкой публики или в книгах непрофессионалов-дилетантов? Прежде всего тем, что в первом случае объект психологического измерения (конструкт) описывается разносторонне и полно, и, кроме того, в нем не содержится лишних, не относящихся к делу (т.е. “не работающих” на ту или иную шкалу) вопросов. Таким образом, при использовании методов многомерных измерений психологических характеристик наиболее важны две проблемы - описать объект измерения всесторонне и, в тоже время, компактно . С известной долей обобщения можно сказать, что это одни из основных задач, решаемых ФА.

Понятно, что информативность многомерного описания объекта нашего изучения возрастает с увеличением количества используемых признаков или измерительных шкал. Однако очень трудно выбрать сразу и существенные, и независимые друг от друга характеристики. Этот выбор порой непрост и долог. Как правило, исследователь начинает с заведомо избыточного количества признаков, и в процессе работы (например, по созданию нового опросника или анализу экспериментальных данных) сталкивается с необходимостью адекватной интерпретации большого объема полученных данных и их компактной визуализации. Анализируя полученные данные, исследователь замечает тот факт, что оценки изучаемого объекта, полученные по некоторым шкалам, сходны между собой, а если оценить это сходство количественно и подсчитать коэффициент корреляции, то он может оказаться достаточно высоким. Другими словами, возникает вопрос о том, что многие характеристики (т.е. переменные, по которым производилось измерение нашего объекта), вероятно, в некоторой степени дублируют друг друга, а вся полученная информация в целом избыточна. Внимательный исследователь, даже незнакомый с основами ФА, сразу же может сообразить, что за связанными друг с другом (коррелирующими) переменными, по-видимому, стоит влияние некоторой скрытой, латентной переменной , с помощью которой можно объяснить наблюдаемое сходство полученных оценок. Очень часто эту гипотетическую латентную переменную называют фактором. Приблизительно такая логика заставила Чарлза Спирмена, психолога Оксфордского университета, в ходе анализа результатов тестирования способностей учеников английских школ предположить существование единого, генерального фактора интеллектуального развития человека, влияющего на многочисленные показатели разнообразных интеллектуальных тестов. Таким образом, давно известный метод научного познания - обобщение -приводит нас к возможности и необходимости выделения факторов как переменных более общего, более высокого порядка. Очень часто обобщение позволяет по-новому взглянуть на полученные данные, заметить те связи между исходными характеристиками (переменными), которые ранее были не очевидны, а после этого выйти на более высокий уровень понимания сущности измеряемого объекта.

Такого рода обобщение (т.е. сокращение размерности полученных данных) дает возможность использовать очень мощное средство научного анализа - графическое представление полученных данных. Понятно, что сокращение размерности результатов многомерного измерения какого-либо объекта до двух-трех позволит исследователю в очень наглядной и компактной форме представить весь объем полученных данных, выйдя за рамки логического анализа массы цифр, собранных в огромную таблицу. Имея в виду важное значение наглядно-образного мышления, трудно переоценить преимущества пространственного (графического) осмысления анализируемых данных. Таким образом, ФА может рассматриваться и как средство компактной визуализации данных.

Выделение в ходе анализа данных общего (для ряда переменных) фактора позволяет решать исследователю еще одну непростую задачу - оценивать некоторую скрытую от непосредственного наблюдения переменную (фактор) опосредованно, косвенно - через ее проявление (влияние) в ряде других, прямо измеряемых переменных. Подобным образом в психодиагностике личности были обнаружены, экстрагированы и измерены многие личностные конструкты, например: классический конструкт Айзенка импульсивность, оцениваемый в тесте EPI по ответам испытуемых на ряд вопросов, с разных сторон отражающих этот конструкт. Более того, ФА позволяет измерять не только прямо ненаблюдаемые (скрытые) переменные, но и оценивать определенные качества, которые могут намеренно скрываться и искажаться испытуемым при прямом их тестировании, однако проявляться (т.е. быть измеренными) косвенно через различные связанные с ними качества, оцениваемые прямо.

В ходе научного исследования ФА может выступать в двух ипостасях: как разведочный (эксплораторный) и как проверочный (конфирматорный) метод анализа данных. В первом случае ФА используется ex post factum, т.е. для анализа уже измеренных в эмпирическом исследовании переменных и, фактически, помогает исследователю их структурировать; на этом этапе совсем не обязательно делать априорные предположения о количестве факторов и их связях с наблюдавшимися переменными. Здесь главное значение ФА - структурировать связи между переменными, помочь сформулировать рабочие гипотезы (пусть иногда и очень умозрительные) о причинах обнаруженных связей. Как правило, такое использование ФА характерно для начальной, ориентировочной стадии работы, когда многое неявное кажется явным, непростое - простым, и наоборот. В отличие от разведочного, конфирматорный ФА используется на более поздних стадиях исследования, когда в рамках какой-либо теории или модели сформулированы четкие гипотезы, связи между переменными и факторами достаточно определены, и исследователь их может прямо указать. Тогда конфирматорный ФА выступает как средство проверки соответствия сформулированной гипотезы полученным эмпирическим данным.

Обобщая вышесказанное, выделим основные цели использования ФА:

1. Понижение размерности числа используемых переменных за счет их объяснения меньшим числом факторов. Обобщение полученных данных.

2. Группировка, структурирование и компактная визуализация полученных данных.

3. Опосредованное, косвенное оценивание изучаемых переменных в случае невозможности или неудобства их прямого измерения.

4. Генерирование новых идей на этапе разведочного анализа. Оценка соответствия эмпирических данных используемой теории на этапе ее подтверждения.
§ 2. Исходные принципы и предположения
Основные общенаучные идеи, лежащие в основе ФА, достаточно просты и могут быть, по мнению П. Благуша (1989), сформулированы так:

А) “сущность вещей заключена в их простых и вместе с тем многообразных проявлениях, которые могут быть объяснены с помощью комбинации нескольких основных факторов”, т.е. за наблюдаемой вариацией достаточно большого количества переменных стоит ограниченное число факторов;

Б) “общую сущность наблюдаемых вещей мы постигаем, совершая бесконечные приближения к ней”, т.е. поиск факторов - это длительный процесс познания посредством перехода к факторам все более высокого порядка.

Первым основным формально-математическим принципом, лежащим в основе классической модели ФА 1 , является постулат о линейной зависимости между психологическими характеристиками (наблюдаемыми переменными), с помощью которых оценивается какой-либо объект. Количественно степень этой зависимости (связи) может быть оценена с помощью коэффициента корреляции. Второе основное предположение состоит в том, что эти наблюдаемые переменные (предполагается, что их заведомо избыточное количество) могут быть представлены как линейная комбинация некоторых латентных переменных или факторов. Полагается, что ряд этих факторов являются общими для нескольких переменных, а другие, характерные факторы, специфическим образом связаны только с одной переменной. Поскольку последние ортогональны друг к другу, то, в отличие от общих факторов, они не вносят вклад в корреляцию (ковариацию) 2 между переменными. Таким образом, математическая модель ФА сходна с обычным уравнением множественной регрессии:
V i = A i,1 F 1 + A i,2 F 2 + ... + A i,k F k + U , (1)
где

V i - значение i-й переменной, которое выражено в виде линейной комбинации k общих факторов, A i,k - регрессионные коэффициенты, показывающие вклад каждого из k факторов в данную переменную; F 1...k - факторы, общие для всех переменных; U - фактор, характерный только для переменной V i .
Уравнение (1) выражает весьма простой смысл: каждая переменная может быть представлена в виде суммы вкладов каждого из общих факторов. С другой стороны, аналогичным образом, каждый из k факторов выражается в виде линейной комбинации наблюдаемых переменных:
F j = W j,1* V 1 + W j,2* V 2 + ... +W j,p* V p , (2)
где W j,i - нагрузки j-го фактора на i-ю переменную или факторные нагрузки; p - количество переменных.
На рис. 1 факторные нагрузки (w 1,1 ... w 2,6) обозначены различными стрелками, показывающими влияние фактора на конкретную переменную. Переменные v1, v2 и v3 преимущественно связаны с фактором F1, и только фактор F2 имеет небольшую нагрузку на первую переменную; для других трех переменных (v4, v5, v6) общим фактором является F2, и лишь на четвертую переменную F1 имеет незначительную нагрузку. Эмпирические оценки наблюдаемых переменных v1 ... v6 представлены в столбцах a, b, c, d, e, f, соответственно. Дугообразная стрелка, соединяющая факторы и коэффициент корреляции над ней, подчеркивают факт ортогональности (некоррелированности, линейной независимости) этих факторов, хотя в общем случае (об этом ниже) это предположение критично лишь на этапе выделения первоначальных факторов, а в дальнейшем, на этапе интерпретации факторного решения, при вращении факторной структуры допускается возможность корреляции между факторами. (Это один из многих парадоксов ФА, связанный с многозначностью получаемого факторного решения , которое не имеет строго однозначного математического обоснования.)

Рис.1. Гипотетическая модель с двумя общими факторами (F1 и F2) и шестью переменными (v1 ... v6)
Пользуясь схемой (рис. 1), еще раз обозначим основную задачу ФА: основываясь на эмпирических оценках (a, b, c, d,e, f) исследуемого объекта по каждой из шести переменных-характеристик (v1 ... v6), исследователь пытается объяснить взаимосвязь наблюдаемых переменных влиянием 2-х общих факторов, в которых находят свое отражение эти переменные.
§ 3. Основные этапы факторного анализа
В ходе исследования с использованием разведочного ФА можно выделить три различных этапа: 1) сбор эмпирических данных и подготовка корреляционной (ковариационной) матрицы; 2) выделение первоначальных (ортогональных) факторов; 3) вращение факторной структуры и содержательная интерпретация результатов ФА. Остановимся на них подробнее.
1. Сбор эмпирических данных в психологическом исследовании разведочного плана всегда опосредован использованием какой-либо измерительной процедуры, в ходе которой испытуемый оценивает измеряемый объект (стимул) по ряду предложенных исследователем характеристик. На этом этапе очень важно, чтобы исследователем был предложен достаточно большой набор характеристик, всесторонне описывающих измеряемый объект. Подбор важных и разнообразных характеристик и одновременно исключение лишних и несущественных - это достаточно трудное дело, требующее от исследователя опыта, знания литературы и, в известной степени, интуиции. Именно продуманный и удачный подбор оцениваемых характеристик определяет в конечном счете успех в выделении существенных и значимых факторов, стоящих за ними - это основное, о чем нельзя забывать на данном этапе. Иначе говоря, из случайного набора характеристик объекта невозможно выделить такие факторы, которые будут закономерно и содержательно определять его оценку испытуемыми. Понятно, что с первого раза, априорно бывает трудно подобрать нужные характеристики. Поэтому еще раз напомним, что разведочное исследование с помощью ФА - это длительный и интеративный процесс, когда результаты предыдущего анализа позволяют оценить допущенные ошибки и скорректировать процедуру последующего исследования.

Второе существенное замечание возникает в связи с постулатом линейности. В случае, когда связь между психологическими характеристиками оказывается существенно нелинейной, базисная размерность искомого факторного пространства возрастает, и это приводит к ложному решению. Преодоление этой трудности может идти двумя путями. Во-первых, можно использовать коэффициент криволинейной корреляции (по Пирсону, например), а во-вторых, следует избегать тех психологических переменных, которые имеют между собой явно нелинейные связи.

На данном этапе нельзя не коснуться вопроса о необходимом уровне измерения, поскольку он в первую очередь связан с использованием конкретного метода измерения. Вычислительные алгоритмы ФА требуют, чтобы измерения наблюдаемых переменных были проведены не ниже, чем по шкале интервалов . Это требование, к сожалению, выполняется далеко не всегда, что, впрочем, связано не столько с неосведомленностью исследователя, сколько с ограниченностью выбора измерительного метода и/или его адекватностью конкретной задаче или даже процедуре исследования. Реалии практики использования ФА в психологии таковы, что в подавляющем большинстве работ применяется один из вариантов метода балльной оценки, который, как известно, дает шкалу порядка . Налицо явное ограничение в использовании ФА. При решении данной проблемы следует иметь в виду следующее. Во-первых, стоит уделить максимальное внимание проработке процедурных моментов в использовании метода балльной оценки, чтобы выйти за установление только порядковых отношений и максимально “приблизиться” к шкале интервалов. Во-вторых, следует помнить, что математическая процедура ФА оказывается достаточно устойчивой к разного рода измерительным некорректностям при оценке коэффициентов корреляции между переменными. И наконец, в самой математической статистике существуют различные подходы к решению данной проблемы (Дж. Ким, Ч. Мьюллер,1989), и для более качественной (не строго метрической) трактовки результатов ФА указанное ограничение приобретает не слишком принципиальное значение.

Достаточно важен вопрос о количестве используемых переменных или, более операционально, о том, сколько переменных должно приходиться на один гипотетический фактор. Вслед за Терстоуном многие авторы считают, что в разведочном ФА на один фактор должно приходиться не менее трех переменных. Для конфирматорного ФА эта пропорция меньше и, как правило, исследователи ограничиваются двумя переменными. Если исследователя интересует оценка надежности получаемых факторных нагрузок, существуют и более строгие оценки количества необходимых переменных (Дж. Ким, Ч. Мьюллер, 1989).

Формальный итог первого этапа - получение матрицы смешения и на ее основе - корреляционной матрицы. Матрица смешения - это таблица, куда заносятся результаты измерения наблюдаемых переменных: в столбцах матрицы (по числу переменных) представлены оценки испытуемых (или одного испытуемого) каждой из переменной; строки матрицы - это различные наблюдения каждой переменной. Если задача исследователя - построить факторное пространство для одного испытуемого, то нужно обеспечить множественность таких наблюдений (например, повторить их несколько раз). В том случае, когда строится групповое факторное пространство, достаточно получить по одной оценке от каждого испытуемого. Для последующего расчета по этим данным корреляционной матрицы с достаточно достоверными коэффициентами корреляции следует обеспечить необходимое число наблюдений, т.е. количество строк в матрице смешения. Обычно не следует планировать менее 11-12 наблюдений.

Корреляционная матрица (матрица попарных корреляций между переменными) рассчитывается, как правило, с использованием коэффициента линейной корреляции Пирсона. Часто возникает вопрос о возможности и правомерности использовать другие меры сходства (сопряженнности) между переменными, основанные на ранговой (порядковой) статистике. Понятно, что данный вопрос возникает всегда, когда исследователь работает с номинальными или порядковыми данными. В строгом смысле ответ будет отрицательным. Однако следует принять во внимание два соображения. Во-первых, показано, что при достаточном числе наблюдений коэффициент линейной корреляции Пирсона достаточно устойчив к использованию при расчетах результатов порядковых измерений. Во-вторых, как было отмечено выше, если перед исследователем стоит задача не столько количественного, сколько качественного анализа данных, то такое эвристическое использование ФА считается вполне оправданным.

Еще один тонкий вопрос, связанный с построением матрицы попарных корреляций связан с тем, какую матрицу использовать в ФА - корреляционную или ковариационную? Для начала напомним соответствующие формулы.

Коэффициент ковариации

Между двумя переменными x и y , а коэффициент корреляции:

r xy = Cov/s x s y , (4)

Где n - количество наблюдений; x i и y i - значения переменных x и y ;X и Y - средние арифметические значения переменных x и y по ряду наблюдений;  x и  y - средние квадратические отклонения переменных x и y по ряду наблюдений.
Таким образом очевидно, что коэффициент корреляции - это тот же коэффициент ковариации, только нормированный по среднему квадратическому отклонению или, как еще говорят, выраженный в единицах среднего квадратического отклонения переменных. Из этого следуют и “рецепты” по применению в ФА корреляционной или ковариационной матриц:

1) если все переменные выражены в одних и тех же единицах измерения, то нет большого различия, какую из матриц факторизовать;

2) если метрики переменных заметно отличаются (единицы измерения значительно неоднородны и дисперсии переменных заметно отличаются), то целесообразно использовать анализ корреляционной матрицы;

3) ковариационные матрицы предпочтительнее, когда необходимо провести сравнение результатов ФА (факторных структур) в двух различных выборках, полученных в одном и том же исследовании, например, когда требуется оценить повторяемость какого-либо интересного результата.
2. Следующий важнейший этап ФА - собственно факторизация матрицы корреляций (ковариаций) или выделение первоначальных (ортогональных) факторов. В настоящее время - это полностью компьютеризованная процедура, которую можно найти во всех современных статистических программах. Одним из первых, кто предложил формально-математическое решение проблемы возможности факторизации корреляционной матрицы, был Л. Терстоун. В матричной форме его известное уравнение выглядит следующим образом (подробнее см.: Я. Окунь, 1974, c. 43-49):

(5)

Где - редуцированная корреляционная матрица;

Редуцированная матрица факторных нагрузок;

Транспонированная матрица факторных нагрузок.
Поясним, что редуцированная корреляционная матрица - это матрица попарных корреляций наблюдаемых переменных, где на главной диагонали лежат не единицы (как в полной матрице корреляций), а значения, соответствующие влиянию только общих для этих переменных факторов и называемые общностями. Аналогичным образом, редуцированная матрица факторных нагрузок или факторная матрица (формальная цель ФА) представляет собой факторные нагрузки только общих факторов.

Основная проблема, стоящая при решении уравнения (3), заключается в том, что значения общностей в редуцированной корреляционной матрице неизвестны, а для начала вычислений их необходимо иметь. На первый взгляд неразрешимая проблема решается таким образом: до начала вычислений задаются некоторые приблизительные значения общностей (например, максимальный коэффициент корреляции по столбцу), а затем на последующих стадиях вычислений, когда уже имеются предварительные величины вычисленных факторных нагрузок, они уточняются. Таким образом, очевидно, что вычислительные алгоритмы ФА представляют собой последовательность итеративных 1 вычислений, где результаты каждого последующего шага определяются результатами предыдущих. С известной долей упрощения можно считать, что различные алгоритмы факторизации корреляционной матрицы в основном и отличаются тем, как конкретно решается данная проблема.

Для людей, неискушенных в проблемах математической статистики, но решающих с помощью ФА свою задачу, более важен основной смысл процедуры факторизации, заключающийся в переходах от матрицы смешения к корреляционной матрице и далее к матрице факторных нагрузок и построению факторных диаграмм (рис. 2).


Рис. 2. Основные этапы трансформации данных в ходе факторного анализа.
Пользуясь данным рисунком, еще раз подчеркнем важную особенность ФА - это способ понижения размерности, сжатия объема данных. Обратите внимание, что исходная матрица смешения достаточно, велика, например, при условии 20-ти наблюдений каждой переменной она содержит 20Њ6=120 измерений. Конечный результат анализа - это всего лишь 26=12 чисел или построенная по матрице факторных нагрузок компактная факторная диаграмма. Таким образом, при адекватном использовании ФА как метода многомерного измерения мы можем получить 10-кратную компрессию исходной информации и наглядность результатов ее анализа.

Напомним, что главная цель выделения первичных факторов в разведочном ФА состоит в определении минимального числа общих факторов, которые удовлетворительно воспроизводят (объясняют) корреляции между наблюдаемыми переменными. Основная стратегия при выделении факторов незначительно отличается в разных методах. Она заключается в оценке гипотезы о минимальном числе общих факторов, которые оптимально воспроизводят имеющиеся корреляции. Если нет каких-либо предположений о числе факторов (в ряде программ оно может быть задано прямо), то начинают с однофакторной модели. Эта гипотеза о достаточности одного фактора оценивается с помощью используемого критерия оптимальности соответствия данной однофакторной модели исходной корреляционной матрице. Если расхождение статистически значимо, то на следующем шаге оценивается модель с двумя факторами и т. д. Такой процесс подгонки модели под данные осуществляется до тех пор, пока с точки зрения используемого критерия соответствия расхождение не станет минимальным и будет оцениваться как случайное. В современных компьютерных статистических программах используются различные методы факторизации корреляционной матрицы. Нам представляется, что, хотя для исследователя данная проблема не представляет прямого интереса, тем не менее она важна, поскольку от выбора метода факторизации в определенной мере зависят результаты расчета факторных нагрузок. В силу специфики нашего изложения основ ФА мы ограничимся лишь перечислением этих методов, снабдив его очень краткими комментариями и отошлем читателя для более глубокого знакомства к специальной литературе, требующей некоторых познаний в математике (Дж. Ким, Ч. Мьюллер, 1989):

Метод главных факторов (или главных осей) - наиболее старый и часто используемый в различных предметных областях.

^ Метод наименьших квадратов сводится к минимизации остаточной корреляции после выделения определенного числа факторов и к оценке качества соответствия вычисленных и наблюдаемых коэффициентов корреляции по критерию минимума суммы квадратов отклонений.
^ Метод максимального правдоподобия: специфика данного метода состоит в том, что в случае большой выборки (большого количества наблюдений каждой переменной) он позволяет получить статистический критерий значимости полученного факторного решения.

^ Альфа-факторный анализ был разработан специально для анализа психологических данных, и поэтому его выводы носят в основном психометрический, а не статистический характер. В альфа-факторном анализе минимальное количество общих факторов оценивается по величинам собственных значений факторов и коэффициентов обобщенности , которые должны быть больше 1 и 0, соответственно.

Факторизация образов (или анализ образов). В отличие от классического ФА в анализе образов предполагается, что общность каждой переменной определяется не как функция гипотетических факторов, а как линейная регрессия всех остальных переменных.

В табл. 1 представлены сравнительные результаты факторизации корреляционной матрицы (Дж. Ким, Ч. Мьюллер, 1989, с. 10), с использованием 4-х различных методов. Видно, что полученные результаты могут различаться, даже если не обращать внимание на знаки факторных нагрузок (об этом чуть ниже).
^ Таблица 1

Использование различных методов факторизации для получения двухфакторного решения

После компьютерного расчета матрицы факторных нагрузок наступает наиболее сложный, ответственный и творческий этап использования ФА - определение минимального числа факторов, адекватно воспроизводящих наблюдаемые корреляции, и содержательная интерпретация результатов ФА. Напомним, что максимальное количество факторов равно числу переменных. Кроме содержательных критериев решения вопроса о минимальном числе факторов существуют формально-статистические показатели достаточности числа выделенных факторов для объяснения корреляционной матрицы. Остановимся на двух основных показателях. После расчета факторных нагрузок для каждой переменной практически любая компьютерная программа распечатывает на экране следующую табл. 2.

Первый важный показатель в этой таблице (второй столбец) - это величина собственного значения каждого фактора; факторы расположены в таблице по убыванию этой величины. Не очень строго говоря, этот показатель характеризует вес , значимость каждого фактора в найденном факторном решении 2 . Из таблицы 2 видно, что от 1-го фактора к 10-му (всего было 10 переменных) величина собственного значения убывает более, чем в 100 раз. Естественно возникает вопрос о том, какая величина данного показателя свидетельствует о значимом, существенном вкладе соответствующего фактора, и каков критерий для отсечения незначимых, несущественных факторов. Достаточно часто в качестве такого критического значения используют величину собственного значения, равную 1.0. Таким образом, с определенной степенью уверенности предполагают, что те факторы, у которых этот показатель меньше 1.0, не вносят значительного вклада в объяснение корреляционной матрицы. Кроме анализа табличных величин бывает полезно визуально оценить динамику величины собственного значения по графику. Как правило, в большинстве статистических программ такая возможность пользователю предоставляется (см. рис. 3). Как предлагал в свое время Р. Кеттел (1965), выделение факторов заканчивается, когда после резкого падения величины собственного значения изменяются незначительно, и график фактически превращается в горизонтальную прямую линию. Несмотря на видимую простоту и ясность такого рецепта, следует отметить, что когда на графике имеется более чем один излом, то выделение горизонтального участка становится неоднозначным.

Таблица 2

Статистические показатели для определения минимального количества факторов


Рис. 3. Изменение величины собственного значения факторов: ось абсцисс - количество факторов; ось ординат - величина собственного значения
Другой не менее важный расчетный показатель значимости каждого фактора - процент объясняемой дисперсии переменных , содержащейся в корреляционной матрице (третий столбец в табл. 2). Естественно, что все 100% дисперсии будут объясняться только всеми десятью факторами. Однако не стоит забывать, что при любых измерениях (а особенно в разведочных, пилотажных исследованиях) имеют место разного рода случайные ошибки, и поэтому их вклад в общую дисперсию тоже может оказаться весьма значительным. Предполагается, что ряд выделенных факторов отражает влияние случайных процессов, никак не связанных с оценкой наблюдаемых переменных. Таким образом, формально задача заключается в том, чтобы, с одной стороны, выбрать некоторое минимальное количество факторов, которые бы, с другой стороны, объясняли достаточно большой процент всей дисперсии переменных. Ясно, что эти два требования в принципе взаимно противоречивы, и, следовательно, исследователь стоит перед выбором некоторой критической величины процента объясняемой дисперсии. К сожалению, никаких строго формальных рецептов по этому поводу не существует, но принято считать, что при хорошем факторном решении выбирают столько факторов, чтобы они в сумме (последний столбец таблицы) объясняли не менее 70-75%. В хорошо спланированных исследованиях с установленной факторной структурой этот суммарный процент может достигать 85-90 %.

Подводя итог, укажем, что в данном случае оба статистических критерия вполне однозначно свидетельствуют о достаточности не более 3-х факторов, что и отмечено пунктирной горизонтальной линией. Тем не менее, стоит подчеркнуть, что главным критерием для выделения минимального количества будет содержательная интерпретация выделенных факторов, а к использованию формально-статистических критериев следует относиться с осторожностью.
3. Вращение факторной структуры и содержательная интерпретация результатов ФА. Одним из основных кажущихся парадоксов ФА как метода, обеспеченного весьма солидным и современным математическим аппаратом, является неоднозначность расчета факторных нагрузок по исходной корреляционной матрице. Фактически это означает следующее: любой алгоритм факторизации корреляционной матрицы дает какой-то один вариант расчета факторных нагрузок из целого множества эквивалентных. Это означает, что расчет факторных нагрузок выполняется с точностью до любого линейного преобразования в правой части уравнения (2), что эквивалентно возможности произвольного поворота факторных осей вокруг векторов-переменных. Поясним сказанное, используя геометрическую интерпретацию результатов ФА. На рис. 4 представлены три переменные (v1, v2 и v3) в пространстве двух ортогональных факторов (F1 и F2). Переменные изображены в виде векторов, а факторные нагрузки переменных на факторы геометрически представляют собой проекции данного вектора (переменной) на соответствующую координатную ось (фактор). Если мы осуществим произвольный поворот осей координат на какой-то угол, например, на 45 градусов вправо (новые оси - штрих-пунктирные линии на рис. 4), то расположение переменных в новой системе координат (F1" - F2" ) с математической точки зрения полностью эквивалентно исходному. Изменились лишь величины факторных нагрузок (сравните проекции переменной v1 на оси F1 и F1" , соответственно, до и после поворота). Таким образом, исходное факторное решение справедливо с точностью до любого угла поворота ортогональных факторных осей вокруг пучка векторов, образованного переменными v1, v2 и v3.

Рис.4. Факторное пространство 3-х переменных (v1, v2 и v3) в пространстве 2-х факторов: сплошные линии (F1, F2) - до поворота; пунктирные линии (F1" , F2" ) - после поворота
Естественно, возникает вопрос об оптимальном расположении переменных в пространстве факторных осей. Как было отмечено выше, эта проблема в принципе не имеет строгого математического решения. Она относится уже к содержательной интерпретации расположения переменных в факторном пространстве. Фактически суть проблемы состоит в следующем: какой набор факторных нагрузок (или какая геометрическая модель результатов ФА) будет более подходящим для интерпретации исследователем. Поскольку при повороте осей координат факторные нагрузки по одному фактору могут расти, а по другому - уменьшаться, то, соответственно, будет расти или уменьшаться вклад этих факторов в разные переменные. Из этого следует, что нужно искать такой вариант расположения переменных в факторном пространстве, который наилучшим образом соответствует ожиданиям исследователя, его предположениям о взаимосвязи и взаимозависимости исследуемых переменных. Как правило, при использовании ФА полагают, что существует одно оптимальное положение осей координат, соответствующее существенным для данного исследования и хорошо интерпретируемым факторам.

Описанный выше процесс поиска оптимальной факторной структуры получил название процедуры вращения факторов . По образному выражению Л. Терстоуна, цель исследователя заключается в поиске “простой структуры” или попытке объяснить большее число переменных меньшим числом факторов. С формальной точки зрения при поиске простой структуры следует иметь в виду следующее: целесообразно стремиться к получению для каждой переменной максимального числа больших факторных нагрузок по одним факторам и одновременно наибольшего количества минимальных факторных нагрузок по другим факторам . Следуя этому правилу, мы стремимся сделать так, чтобы одну группу переменных можно было в большей степени объяснить влиянием одних факторов, а другую - других. Таким образом, “простота” хорошего факторного решения заключается в том, что каждая переменная имеет наиболее простое факторное объяснение, т.е. характеризуется преобладающим влиянием некоторого одного фактора, и в меньшей степени связана с другими факторами. И наоборот: один фактор должен быть специфическим образом связан с одной группой переменных и не связан с другими переменными. В предельном случае самая простая структура получается тогда, когда все переменные располагаются на соответствующих факторных осях, т. е. имеют ненулевые факторные нагрузки только по одному фактору, а по остальным - нулевые. Возвращаясь к рис. 4, укажем на результат вращения: после поворота факторных осей на 45 градусов вправо, нагрузка переменной v1 по первому фактору резко уменьшилась и одновременно немного возросла по второму. Кроме того заметно уменьшились факторные нагрузки переменных v2 и v3 по второму фактору. Таким образом “простота” новой факторной структуры выразилась в доминирующем влиянии первого фактора на переменную v1, а второго фактора - на две других переменных.

Видимая простота решения проблемы вращения системы координат в двухмерном случае (это можно сделать и вручную) становится неочевидной при 3-х и более факторах. Пересчет системы координат вручную и построение факторных диаграмм становятся очень сложными. Исходя из общего принципа построения простой структуры, изложенного выше, во многих компьютерных программах предлагаются несколько способов решения проблемы оптимальности вращения системы координат. Кратко остановимся на основных способах вращения. Выделяют два класса методов вращения - методы ортогонального вращения, когда при повороте осей координат угол между факторами остается прямым (и, следовательно, остается верным предположение о некоррелированности факторов), и более общие методы косоугольного вращения, когда первоначальное ограничение о некоррелированности факторов снимается.
Методы ортогонального вращения: варимакс, квартимакс, эквимакс и биквартимакс.

Варимакс - наиболее часто используемый на практике метод, цель которого - минимизировать количество переменных, имеющих высокие нагрузки на данный фактор, что способствует упрощению описания фактора за счет группировки вокруг него только тех переменных, которые с ним связаны в большей степени, чем остальные.

Квартимакс в определенном смысле противоположен варимаксу, поскольку минимизирует количество факторов, необходимых для объяснения данной переменной; поэтому он усиливает интерпретабельность переменных. Квартимакс-вращение приводит к выделению одного из общих факторов с достаточно высокими нагрузками на большинство переменных.

^ Эквимакс и биквартимакс - это два схожих метода, представляющих собой своеобразную комбинацию варимакса, упрощающего описание факторов, и квартимакса, упрощающего описание переменных. Отметим, что выбор более подходящего метода вращения конечно же требует известного опыта использования ФА, однако специальные исследования Х. Кайзера (1958) при прочих равных условиях свидетельствуют в пользу преимущественного применения варимакса.

Методы косоугольного вращения также позволяют упростить описание факторного решения за счет введения предположения о коррелированности факторов и, следовательно, о возможности существования факторов более высокого порядка , объясняющих наблюдаемую корреляцию. Основное преимущество косоугольного вращения состоит в возможности проверки ортогональности получаемых факторов: если в результате вращения получаются действительно ортогональные факторы, то можно быть уверенным в том, что ортогональность им действительно свойственна, а не является следствием использования метода ортогонального вращения.

В статистических программах наибольшую популярность получил метод облимин, по своей сути эквивалентный методу эквимакс при ортогональном вращении. В расчетах с помощью облимина используется специальный параметр (называемый в разных программах или ), задающий степень косоугольности факторов при вращении. Большие отрицательные значения этого параметра соответствуют наиболее косоугольным решениям, а меньшие отрицательные значения - наиболее ортогональному решению. Подробнее об использовании метода облимин можно прочитать в книге Г. Хармана (1972) и руководствах к соответствующим статистическим пакетам.
Стоит особо отметить, что перед выполнением процедуры вращения следует указать количество факторов, в пространстве которых и производится вращение. Поэтому вопрос о минимальном количестве факторов следует решить (в первом приближении!) до того. После осуществления вращения и анализа факторных диаграмм можно еще раз вернуться к проблеме минимального количества факторов, чтобы затем еще раз выполнить вращение с другим количеством (меньшим или большим) факторов. Например, на основании использования ряда статистических критериев, описанных выше, мы начинаем проводить вращение с учетом наличия 4-х факторов, но в ходе анализа факторных диаграмм убеждаемся в избыточности третьего и четвертого факторов и окончательное вращение выполняем в 2-х факторном пространстве. Таким образом, вращение и анализ факторных диаграмм следует проводить несколько раз с учетом разного количества факторов, начиная, как правило, с избыточного количества.

Вместе с тем не следует думать, что получение простой геометрической модели факторного решения является основным критерием “хорошести” результатов ФА и, следовательно, единственности и оптимальности расположения исследуемых переменных в системе факторных координат. Безусловно, решение вопроса о минимальном количестве факторов и сравнительная оценка различных вариантов вращения должны основываться на серьезном содержательном анализе полученных результатов. Укажем на основные моменты в ходе содержательного анализа:

1. По возможности следует четко сформулировать ожидаемые результаты и после этого задать себе следующие вопросы: а) согласуются ли ваши данные с вашими ожиданиями и результатами ранее выполненных исследований? б) что общего и какие есть различия между вашим и другими подобными исследованиями?

2. Стоит вспомнить, использовался ли ФА в сходных исследованиях и какие факторы выделялись в таких работах.

3. И наконец, при интерпретации факторов и объяснении их влияния на исследуемые переменные, следует подумать о согласованности найденного вами факторного решения с теоретическими основаниями данной предметной области психологии.
§ 4. Дополнительные статистические показатели для оценки результатов факторного анализа
В начале предыдущего параграфа мы отмечали, что вычислительные алгоритмы ФА основываются на ряде математических допущений о характере эмпирических данных, подвергаемых ФА. Остановимся на ряде статистических показателей, которые помогают исследователю оценить степень соответствия данных этим допущениям.

Как правило, в любой программе по ФА предусмотрен расчет показателей описательной статистики по матрице смешения. Например в статистических системах “Stadia” и SPSS для каждой переменной вычисляются общее количество наблюдений, среднее арифметическое значение и среднее квадратичное отклонение (см. табл. 3). Эти достаточно простые показатели позволяют быстро сравнить между собой все анализируемые переменные, и уже на уровне анализа исходных данных попытаться найти возможные ошибки, связанные либо с проведенными измерениями, либо с вводом данных в компьютер. Например, если при сборе данных использовалась 7-балльная шкала, то наверное вас насторожит среднее значение по какой-то переменной, равное 0.87, или резко отличающаяся от других величина среднего квадратичного отклонения.

Коэффициент сферичности Бартлета используется для оценки “хорошести” корреляционной матрицы. Если этот коэффициент достаточно большой, а соответствующий ему уровень значимости мал (например, меньше 0.05 или 0.01), то это свидетельствует о надежности вычисления корреляционной матрицы. При высоком уровне значимости исследователю стоит задуматься об адекватности использования ФА с полученными данными.

Кроме того, для оценки надежности вычислений элементов корреляционной матрицы и возможности ее описания с помощью ФА во многих статистических программах применяется так называемая мера адекватности выборки Кайзера-Мейера-Олкина(КМО) . По мнению Г. Кайзера (1974), значения КМО около 0.9 оцениваются как “изумительные”, 0.8 - “достойные похвалы”, 0.7 - “средние”, 0.6 - “посредственные”, 0.5 - “плохие”, а ниже 0.5 - “неприемлемые”. Для оценки надежности вклада в корреляционную матрицу каждой переменной в отдельности также используют меру выборочной адекватности (например, коэффициент MSA i в системе SPSS). Вышеприведенные характеристики Г. Кайзера вполне справедливы и для оценки этих величин тоже. Исследование надежности каждой переменной позволяет исключить из расчетов одну или несколько переменных, и тем самым повысить результативность ФА.
Таблица 3

Данные описательной статистики для 9 переменных

Работая с различными данными, Г. Кайзер установил, что величина данного коэффициента адекватности повышается при: а) увеличении количества переменных, б) возрастании числа наблюдений каждой переменной, в) уменьшении числа общих факторов и г) увеличении абсолютных значений коэффициентов корреляций. По сути дела данный автор выделил те условия, при которых повышается адекватность данных, а следовательно, и информативность ФА.
§ 5. Несколько замечаний по поводу конфирматорного ФА
Как было отмечено выше, конфирматорный ФА используется для проверки и подтверждения теоретической модели факторного типа эмпирическими данными. Предполагается, что у исследователя есть достаточно строго сформулированная модель изучаемой им реальности (например, какие психологические факторы в межкультурном исследовании мотивации достижения у школьников являются общими для всех культур, а какие специфическим образом влияют на мотивационные переменные только в одной стране).

При использовании конфирматорного ФА исследователь (в рамках своей модели) четко формулирует гипотезу о числе общих и специфических факторов. Естественно, эта гипотеза должна основываться на серьезном анализе природы исследуемых переменных и лежащих в их основе факторов. Более того, проверяя свою модель на реальных данных, исследователь может делать и количественные предположения о величине корреляции между переменными, величинах факторных нагрузок для ряда исследуемых переменных и зависимости между факторами (ортогональными или косоугольными). Имея данные эмпирических измерений, с одной стороны, и набор разнообразных теоретических гипотез - с другой, психолог с помощью ФА фактически занимается проверкой сформулированных им гипотез о свойствах изучаемой (моделируемой) реальности.

Подробное изложение исследовательских стратегий с помощью конфирматорного ФА не входит в задачу настоящего учебного пособия, поскольку представляет собой особую и достаточно специфическую задачу. Тем не менее, укажем, что в настоящее время существуют достаточно удобные компьютерные программы, где реализованы современные подходы к анализу моделей с латентными переменными, частным случаем которых и является ФА. В качестве примера мы можем привести достаточно известный статистический пакет Lisrel 8 , который дает возможность обрабатывать данные методом моделирования с помощью линейных структурных уравнений . Для подробного знакомства с принципами конфирматорного ФА могут быть рекомендовано (Благуш, 1989), а также прекрасное описание статистического пакета Lisrel 8 1 .

«Факторный анализ»
Основная трудность при выполнении настоящего учебного задания - это, как ни странно, выбрать подходящий предмет для исследования, т.е. определить тот набор переменных, которые необходимо или интересно изучить с помощью ФА. При решении этой проблемы можно пойти двумя путями: либо взять заведомо подходящую задачу, которая ранее уже решалась с помощью ФА, либо придумать ее самому (последнее, естественно труднее, но интереснее). В принципе и то, и другое подходит для выполнения учебного задания. Достаточно стандартный вариант выполнения работы - это провести ФА какого-либо известного опросника, в котором уже содержатся шкалы (факторы) и отражающие их вопросы (переменные). Еще лучше взять какой-либо новый (например, только что переведенный), но еще не стандартизированный опросник и провести исследование с ним. В этом случае будет интересно подумать над интерпретацией результатов ФА, и хотя бы немного побыть в роли разработчика новых психодиагностических методик. Неплохой вариант, если вы найдете в литературе данные, которые можно обработать ФА, и подумаете над их интерпретацией в контексте обсуждаемых автором работы проблем.

Для ориентировки студентов в том, что же можно сделать, мы приводим ниже список названий работ по ФА, которые были выполнены студентами 2-го курса факультета психологии Московского государственного университета им. М.В. Ломоносова в 1995-1996 гг.:

1. Оценка эмоционального состояния при прослушивании музыки разных жанров.

2. Личностные особенности деятелей тайных обществ первой трети XIX века.

3. Факторное пространство русских писателей XIX века.

4. Исследование факторов, определяющих положение человека в семье.

5. Изучение влияния различных типов стрессогенных ситуаций на интенсивность эмоционального переживания: определение специфики ситуаций для мужской и женской выборок.

6. Выделение скрытых факторов, обуславливающих привлекательность печатной рекламы.

7. Выявление факторов, оказывающих наибольшее влияние на выбор того или иного политического лидера при голосовании.

8. Факторы, способствующие заинтересованности человека той или иной пластинкой по виду ее конверта.

9. Характеристика человека, с которым мы хотим дружить.

10. Факторизация шкал опросника “16 PF”.

11. Оценка изучаемых предметов студентами 2-го курса.

12. Выявление факторной структуры шкал акцентуации характера по Леонгарду (тест Шмишека). Сравнение результатов факторизации на 2-х выборках испытуемых.

13. Исследование факторов, влияющих на выбор страны для зарубежной поездки.

14. Факторы, определяющие оценку идеального мужчины и идеальной женщины.

15. Исследование факторов, определяющих специфику национального характера.

После того, как уже выбрана адекватная исследовательская или практическая задача (предмет исследования), которая будет решаться с помощью ФА, и в основном определен набор оцениваемых переменных, стоит еще раз подумать о правильности их выбора. В первую очередь следует обратить внимание на то, чтобы переменные не повторяли друг друга, а разнообразно и всесторонне описывали предмет вашего исследования. В разведочном исследовании тщательный и вдумчивый подбор наблюдаемых переменных может обеспечить полноту описания изучаемой реальности. От этого и будет зависеть, сумеете ли вы выделить действительно важные факторы, влияющие на восприятие, оценку, понимание или действия человека в определенной ситуации, описываемой используемыми переменными. Например, если вы решили исследовать психологические факторы, которые определяют восприятие избирателями лидеров политических партий, то не следует ограничиваться оценкой только их личностных особенностей, безусловно стоит включить также и описательные характеристики их внешних данных, политических ориентаций и многое другое. Не следует забывать о том, что исследуемые вами факторы есть не более чем “экстракт” наблюдаемых переменных, и, следовательно, они не могут появиться из ничего.

Однако не стоит и чрезмерно увеличивать число используемых переменных путем включения нескольких однотипных. Если несколько выбранных вами переменных похожи друг на друга, то очевидно, что это приведет к появлению очень высоких коэффициентов корреляции между этими переменными и, таким образом, к избыточности и односторонности описания предмета вашего исследования.

В том случае, когда вы затрудняетесь или сомневаетесь в выборе необходимых переменных, полезно создать их заведомо избыточный список, а затем, воспользовавшись правилом “со стороны виднее”, попросить своих коллег поучаствовать в оценке этого списка в качестве экспертов.

^ Следующий важный этап в проведении исследования - сбор данных .

На этом этапе, как правило, сталкиваются с двумя вопросами: по какой группе испытуемых собирать данные и каким методом это делать? На первый вопрос ответить достаточно просто: чтобы получить статистически достоверные оценки коэффициентов корреляции, нужно по каждой переменной собрать не менее 12-15 наблюдений. Если задача состоит в построении факторного пространства для одного испытуемого, то нужно решить, каким образом лучше получить от него такое количество повторных данных.

При решении второго вопроса мы советуем обратиться к соответствующей главе настоящего пособия, посвященной методу балльной оценки. Какой процедурой сбора данных лучше воспользоваться, зависит от задачи вашего исследования, от условий, в которых проводится тестирование, от возраста и уровня образования испытуемых и т. д. При выборе конкретного варианта методики не стоит забывать и о простоте последующей обработки исходных данных, и об удобстве их считывания с бланка и ввода в компьютер.

^ Ввод данных и их обработка.

Остановимся кратко на некоторых важных этапах работы со статистической программой, с помощью которой собственно и реализуется процедура ФА. Для этой цели мы рекомендуем использовать либо русскоязычную статистическую систему “Stadia” или англоязычную систему обработки и анализа данных SPSS. Эти две программы достаточно широко используются, соответственно, российскими и зарубежными психологами и ориентированы на пользователя-гуманитария. Для облегчения использования этих двух программ, мы остановимся на основных моментах работы с каждой из них.

Работа в системе “Stadia”. После вызова программы (stadia.exe) вы сразу же попадаете в редактор данных и, следовательно, можете начинать ввод данных в электронную таблицу. Закончив ввод данных, не забудьте их сохранить на жестком диске - F4 ; практика показывает, что несоблюдение этого правила для неопытного пользователя часто заканчивается повторным вводом данных. Кроме того, обязательно проверьте правильность ввода данных (лучше эту малоприятную процедуру выполнять вдвоем: один читает - другой проверяет). В том случае, если данные уже набраны в каком-либо текстовом редакторе, вы можете загрузить их в окно редактора с дискеты, для чего используйте функцию “Чтение” - F3.

Войдя в меню статистических методов (F9 ), выберите в разделе “Многомерные методы” опцию “Факторный анализ”. Первый запрос программы касается типа введенных данных - что это: матрица смешения (переменные объекты) или корреляционная матрица; как правило, вы начинаете работать с матрицей смешения. После рассчета корреляционной матрицы появляется вопрос: “Записать ли рассчитанные корреляции в матрицу данных?”; чаще всего в этом нет особой необходимости. Далее на экране распечатывается таблица с показателями описательной статистики и матрица корреляций. Эта уже та информация, которую стоит записать в файл результатов - F2 ; в качестве имени файла (без расширения!) целесообразно ввести первые 6-8 букв своей фамилии латинскими буквами. Если выводимая на экран информация не уместилась на одной экранной странице, нажмите клавишу “Enter”. После этого на экране распечатается таблица с величинами собственных значений и процентом объясняемой дисперсии факторов (не забудьте сохранить и ее!) и появляется вопрос: “Выдать собственные векторы и новые координаты объектов?”; поскольку анализ собственных векторов используется редко, ответьте - “нет”. А вот график собственных значений посмотреть весьма полезно, поэтому на следующий вопрос программы ответьте “да” и посмотрите его на экране . Затем производится расчет первичных факторных нагрузок и соответствующая матрица распечатывается на экране. Можно ее сохранить в файле и посмотреть факторные диаграммы, а можно ответить “нет” (чаще всего так и поступают) и, нажав “Enter”, сразу перейти к вращению осей координат. Для проведения вращения нужно обязательно указать число факторов, а затем выбрать метод вращения и ответить на вопрос “Нужна ли нормализация Кайзера?”. Нормализация факторных нагрузок Кайзера выполняется для того, чтобы исключить влияние тех переменных, которые имеют по сравнению с другими переменными значительно большие значения нагрузок общих факторов. После расчета факторных нагрузок производится расчет и распечатка коэффициентов общности и специфичности для каждого фактора и, конечно, матрицы факторных нагрузок после вращения. На этом этапе имеется возможность посмотреть факторную диаграмму переменных в осях “фактор 1 - фактор 2”. После просмотра факторных диаграмм можно еще раз вернуться к выполнению процедуры вращения с новым (большим или меньшим) количеством факторов и опять проанализировать факторные диаграммы. После принятия решения о количестве факторов не забудьте сохранить в файле результатов соответствующую матрицу факторных нагрузок - F2 . При необходимости любую факторную диаграмму можно распечатать на принтере или сохранить рисунок в виде файла.

Работа в системе “SPSS”. После вызова программы из Windows так же, как и при работе в “Stadia”, вы попадаете в электронную таблицу (окно редактора данных) и сразу же можете вводить данные в первую переменную (var00001). Если данные уже набраны в виде ASCII-файла, то их можно импортировать в SPSS (меню: File , подменю: Read ASCII Data ). В случае импорта данных следует указать путь к файлу данных и его имя, а также выбрать тип формата данных - Freefield . Далее, нажав на кнопку Define, вы переходите в режим определения переменных , в котором необходимо каждой переменной (их столько, сколько столбцов в вашем файле данных) присвоить имя - в окошке Name , и определить ее тип - Numeric . Ввод каждой переменной в общий список анализируемых переменных (Defined Variables) осуществляется нажатием клавиши со стрелкой. После окончания определения всех переменных нажмите на клавишу OK . SPSS автоматически перейдет в окно редактора данных и осуществит ввод вашего ASCII-файла.

Переход к процедуре факторного анализа осуществляется следующим образом: меню - Statistics , подменю - Data Reduction , а в нем - Factor... После вызова процедуры ФА в правом окне выделите мышкой нужные переменные и перенесите их в окно Variables , нажав на кнопку со стрелкой.
Следующий важный этап работы - выбор параметров (опций) работы процедуры ФА. Первая группа параметров - расчет необходимых коэффициентов описательной статистики (Descriptives ). В данном разделе стоит заказать расчет следующих показателей: Univariate descriptives (средние и стандартные отклонения для каждой переменной), Significance level (оценки достоверности получаемых коэффициентов корреляции), а также KMO and Bartlett‘s test of sphericity (соответственно, мера адекватности выборки Кайзера-Мейера-Олкина и коэффициент Бартлета).

Далее выбирают конкретный метод факторизации корреляционной матрицы - Extraction . В данном разделе сделайте следующий выбор: 1) в качестве метода укажите - Principal components (метод главных компонент); 2) в подразделе Extract (сколько факторов выделять) можно либо отметить критическую величину собственного значения фактора (Eigenvalues over), например: не меньше 1, либо задать некоторое ожидаемое число факторов (Number of factors); 3) в подразделе Display (какие результаты показывать) выберите пункт Scree plot, чтобы увидеть график изменения собственных значений.

После этого следует выбрать метод вращения осей координат - раздел Rotation . Выберите Varimax, а также закажите для вывода результатов ФА:Rotated solution (распечатка матрицы факторных нагрузок после вращения) и Loading plots (построение факторных диаграмм).

В разделах Scores и Options все параметры установлены оптимальным образом, поэтому никаких изменений делать не стоит. После установки всех параметров (в каждом разделе не забудьте нажимать кнопку Continue ! ) для начала выполнения процедуры ФА следует нажать кнопку OK .

Все текстовые результаты заносятся в окно Output, и их можно просмотреть, используя кнопки скролинга по вертикали ( и ). Графические результаты ФА находятся в окне Chart Carusel , куда можно попасть из головного меню (Window) или непосредственно щелкнуть мышью на соответствующей пиктограмме внизу экрана.
Литература
1. Благуш П. Факторный анализ с обобщениями. М.: Финансы и статистика, 1989. 248 с.

2. Иберла К. Факторный анализ. . М.: Статистика, 1980. 398 с.

3. Ким Дж.-О., Мьюллер Ч.У. Факторный анализ: статистические методы и практические вопросы // Факторный, дискриминантный и кластерный анализ. М.: Финансы и статистика, 1989. С. 5 - 77.

4. Окунь Я. Факторный анализ. М.: Статистика, 1974. 200 с.

5. Харман Г. Современный факторный анализ. . М.: Статистика, 1972. 486 с.

6. SPSS. SPSS Professional Statistics 6.1. Chapter 2. Factor Analysis. Maria J. Norusis: SPSS Inc., 1994. P. 47-82.

Вторая многомерная процедура - это факторный анализ. В ходе факторного анализа определяются значения большого количества переменных, находится корреляция между ними, а затем выявляется группы переменных, образующие «факторы». Поясним эту идею на простом примере. Предположим, вы дали школьникам следующие задания:

словарный тест (СЛ);

тест на понимание прочитанного (ПП);

тест на аналогии (например, доктор связан с пациентом, как адвокат с_) (АН);

тест по геометрии (ГЕОМ);

тест на решение головоломок (РГ);

тест на вращение фигур (ВФ).

Для всех возможных пар тестов можно вычислигь пирсоново г, в результате получится так называемая матрица корреляции:

Обратите внимание на то, как некоторые значения корреляции образуют группы (я обвел две группы). Все корреляции между словарем, пониманием прочитанного и аналогиями довольно высоки. Это верно и для геометрии, головоломок и вращения фигур. Корреляции между тестами, принадлежащими к разным группам, практически равны нулю. Это говорит о том, что эти тесты направлены на исследование двух существенно различающихся умственных способностей, или «факторов». Мы можем обозначить их как «беглось речи» и «пространственные навыки».

Факторный анализ - это сложный статистический метод, с помощью которого из набора взаимных корреляций выделяются отдельные факторы. При анализе данной матрицы без сомнения будут выделены те же два фактора. В ходе анализа также определяются «факторные нагрузки», представляющие собой корреляции между каждым из тестов и каждым из выделенных факторов. В приведенном выше примере первые три теста будут иметь «высокую нагрузку» на фактор 1 (беглость речи), а вторые три - «высокую нагрузку» на фактор 2 (пространственные навыки). Конечно, в реальном исследовании корреляции никогда не группируются так четко, как в данном примере, и полученные результаты нередко приводят исследователей к бурным дискуссиям по поводу того, действительно ли обнаружены различные факторы. Также возникают расхождения в том, как правильно называть факторы, ведь факторный анализ сам по себе лишь выявляет факторы, а как их назвать - это решают сами исследователи.

Факторный анализ применялся в одном из самых долгих психологических споров - является ли интеллект единым свойством человека. Чарльз Спирмен - основоположник факторного анализа (начало XX в.), - считал, что все тесты интеллекта имеют одинаковую нагрузку на один фактор, который он назвал фактором общего интеллекта, или g (от англ. general). Более того, по его мнению, каждый тест должен давать высокую нагрузку на второй фактор, включающий навык, проверяемый данным тестом (например, математические способности). Эти факторы второго порядка, или «особые», он обозначил как s (от англ. special). Согласно его «двухфакторной» теории, выполнение тестов интеллекта напрямую зависит от общего интеллекта человека (g) и его особых навыков (л). Спирмен считал, что g наследуется, а различные 5-факторы приобретаются в процессе обучения (Fruchter, 1954).

Другие исследователи, и в том числе Льюис Терстоун, считали, что интеллект состоит из множества факторов, и отвергали существование общего фактора g. По результатам факторного анализа Терстоун сделал вывод, что существуют семь различных факторов, которые он назвал «первичными умственными способностями»: понимание речи, беглость речи, навыки счета, пространственные навыки, память, скорость восприятия и способность к рассуждениям.

Вопрос о том, является ли интеллект единым целым, продолжает ставить в тупик ученых, занимающихся его измерением, и его обсуждение не входит в задачи этой главы. Для нас важно, что факторный анализ может привести к различным результатам. Это связано с тем, что а) существует несколько разновидностей факторного анализа, по-разному оценивающих, насколько высокой должна быть корреляция для выявления отдельных факторов, и б) в различных исследованиях этой проблемы используются различные тесты интеллекта. Поэтому исследователи, использующие различные подходы и тесты, получают самые разные результаты. Говоря коротко, так же, как и остальные статистические методы, факторный анализ - это лишь инструмент, и он не может сам по себе решать такие теоретические вопросы, как природа интеллекта.

Как стало ясно из этого небольшого введения, корреляционные процедуры играют заметную роль в современных психологических исследованиях. Очень часто в них возникает необходимость, если экспериментальные процедуры использовать невозможно. Кроме того, разработка сложных многомерных процедур упростила решение вопроса о причинах и следствиях по сравнению с прошлым, когда большинство корреляционных процедур были двумерными по своей природе.

Многие корреляционные исследования проходят за пределами лабораторий. В следующей главе мы более подробно изучим во

Результаты: основной эффект и взаимодействие
Факторные исследования дают два вида результатов: основной эффект и взаимодействие. Основной эффект показывает общее влияние независимых переменных, а взаимодействие отражает совместное действие п...

Корреляция и регрессия: основы
Считается, что переменные коррелируют, если между ними существует какая-либо взаимосвязь. Это подразумевает сам термин «корреляция»: «ко» означает взаимное действие, а «реляция» (от англ. relation ...

Межличностная коммуникация
Межличностная коммуникация - это неформальное взаимодействие, которое происходит один на один или в малых группах. Беседуем ли мы с соседями по студенческому общежитию, болтаем ли по телефону с то...

Переменные

Фактор 1

Фактор 2

Фактор 3

Объяснимая

дисперсия

гументация содержания, фактически угадываемого в том или ином факторе - самая сложная и противоречивая задача. Например, если с большими положительными весами в один из выделившихся факто­ров вошли такие переменные, как высокий рост, грубый голос, боль­шая мышечная масса, склонность к риску, широкие плечи, агрессив­ное поведение, то вероятнее всего подобная комбинация антропологом будет трактоваться как фактор мужского пола, эндок­ринолог увидит влияние какого-то гормона, а психолог попытается найти некие аналоги в типологии личности. Особо широко в психоло­гии приемы факторного анализа представлены при попытках произ­вести упорядочение (объединение в шкалы) многочисленных пунк­тов в объемных личностных опросниках.

Большинство программ факторного анализа построено таким об­разом, что первый выделившийся фактор обладает самым большим влиянием на разброс показателей в группе (объяснимая дисперсия), а значение остальных факторов последовательно убывает.

Существует несколько основных форм факторного анализа, даю­щих в итоге различные результаты. Выбор необходимого варианта дик­туется конкретными задачами дипломного исследования.

❖ Кластерный анализ

Если вам необходимо разбить множество ваших переменных (объектов) на заданное или неизвестное число классов, то целесооб­разно использовать кластерный анализ (cluster - гроздь, пучок, скоп­ление, группа элементов, характеризуемых каким-либо общим свой­ством). Это не слишком часто используемая в дипломных работах форма математической обработки эмпирических материалов, пред­ставляющая интерес в тех случаях, когда переменных достаточно мно-

Рис. 3. Пример одного из вариантов графического представления результа­тов кластерного анализа шести переменных.

го и хочется наглядно увидеть их упорядоченность - в каких иерархи­ческих отношениях находятся переменные более высокого уровня обоб­щенности к более конкретным, частным (рис. 3).

Весьма любопытные результаты, тяготеющие к сфере психолингвис­тики, с помощью кластерного анализа можно получить при применении его к пунктам психологических тестов, вопросам опросников и анкет.

Существует точка зрения, что в отличие от многих других статисти­ческих процедур, методы кластерного анализа используются в боль­шинстве случаев тогда, когда еще не имеется каких-либо гипотез отно­сительно классов, т. е. когда вы все еще находитесь в описательной стадии исследования.

Пользоваться результатами кластерного анализа нужно осторож­но, поскольку он может навязывать экспериментатору гипотезу об отношениях переменных, построенную на внешних, формальных критериях и не учитывать их качественную специфику. Для того, чтобы избежать подобной ошибки, предпочтительно применять несколько разных алгоритмов расчета (их много, техники группи­ровки отличаются) и выбрать из результатов тот, который лучше всего объясняется с позиции здравого смысла. Следует понимать, что кластерный анализ определяет «наиболее возможно значимое решение».

❖ Дискримииантный анализ

Еще один из методов статистической обработки, который может оказаться полезным в дипломной работе, называется дискриминант- ним анализом. Суть его состоит в том, что он позволяет делить облада­ющие какими-то признаками объекты или состояния, относя их к како- му-либо классу или оценивать близость конкретного состояния к одному из классов. Сама исследовательская процедура дискриминан- тного анализа состоит из нескольких шагов:

    определяются группы, которые в дальнейшем нужно разли­чать (например, больных истерическим неврозом от больных не­врозом навязчивых состояний) - это так называемая обучающая выборка;

    эти группы, каждый член которых уже имеет точный (верифи­цированный) диагноз, исследуются по максимальному числу при­знаков (текущая симптоматика, личностная предрасположенность, специфика семейного воспитания, характер психотравмирующих ситуаций и т. п.);

    по каждому из исследованных признаков вся обучающая выбор­ка (и тех и других больных) дискриминируется и отслеживается - на­сколько точно данный признак разделил группу по диагнозам по срав­нению с фактическим положением дел;

    из всех просмотренных признаков отбираются наиболее инфор­мативные (те, которые наиболее точно делят обучающую выборку) и в дальнейшем они начинают использоваться для улучшения точности диагноза у тех, кому он еще не поставлен;

Попутно, при необходимости, можно отследить, насколько близ­ко или далеко находится каждый из обследованных индивидов к тому или другому состоянию.

В итоге дискриминантного анализа для каждой переменной вы получите стандартизованный коэффициент (Т - лямбда Уилк- са), интерпретируемый следующим образом: чем он больше, тем меньше вклад соответствующей переменной в различение сово­купностей.

Другими словами, основная идея дискриминантного анализа зак­лючается в том, чтобы определить, отличаются ли совокупности по среднему какой-либо переменной (или их комбинации), и затем ис­пользовать эту переменную, чтобы предсказать для новых членов их принадлежность к той или иной группе (это задача прогноза). Более простой пример: показатель роста может служить дискриминирую­щим признаком для отнесения неизвестного нам человека к мужскому или женскому полу, поскольку уже точно известно, что средний рост мужчины выше среднего роста женщины.

Один подобный признак, как можно догадаться из представленно­го примера, не гарантирует надежности прогноза, но совокупность характеристик может сделать его достаточно уверенным.

Ниже приводится иллюстрация графического представления диск­риминантного анализа (рис. 4).

Root 1 vs. Root2

Рис. 4. Графический пример разделения носителей признака на три группы, полученный в результате дискриминантного анализа.

❖ Непараметрические методы

Еще раз хотелось бы подчеркнуть, что все рассмотренные проце­дуры статистического анализа могут быть корректно использованы только в том случае, если ваши экспериментальные данные подчиня­ются т. н. нормальному закону распределения или хотя бы приближа­ются к нему. Это значит, что в имеющемся у вас распределении край­ние значения признака - и наименьшие и наибольшие - появляются редко, а чем ближе значение признака к средней арифметической, тем чаще оно встречается (см. рис. 1).

Если такого соответствия нет, что, как правило, объясняется либо малыми размерами выборки (менее 20-30), либо измерениями в по­рядковых шкалах (типа «высокий», «средний», «низкий»), либо тем, что переменные объективно распределены «ненормально», то для обработки эмпирических материалов диплома нужно использовать так называемые непараметрические критерии, хотя они и имеют мень­шую мощность и обладают меньшей гибкостью (для их расчета не рас­сматриваются и не учитываются значения среднего и стандартного отклонения). Но у них есть и ряд преимуществ. Они малочувствитель­ны к неточным измерениям и эти методы могут применяться для обра­ботки данных, имеющих полуколичественную природу (ранги, баллы и т. д.). Кроме того, с их помощью можно получить ответы на такие вопросы, которые неразрешимы с использованием методов, основан­ных на нормальном распределении. Следовательно, они иногда оказы­ваются уместны и для обработки нормально распределенных резуль­татов исследования.

Не вдаваясь в подробности, укажем лишь на названия непарамет­рических процедур, позволяющих получить показатели, аналогичные нормально распределенным.

Для выяснения достоверности различий между двумя независи­мыми выборками (например, при сравнении мальчиков и девочек) непараметрическими альтернативами t-критерия являются серийный критерий В альд а-Вольфович a, U критерий Манна-Уитни и двухвы- бор очный критерий типа Колмогорова-Смирнова.

Если в дипломе выясняются различия между зависимыми выбор­ками (например, показателями одной группы до коррекционной рабо­ты и после нее), то нужно использовать Т-критерий Уилкоксона для разностей пар, который может быть применен также и к ранжирован­ным данным. По сравнению сt-критерием Стъюдента, он требует зна­чительно меньшего объема вычислений и почти также строго прове­ряет нормально распределенные выборки. Его эффективность для больших и малых выборок составляет около 95%.

Если две рассматриваемые переменные имеют альтернативное распределение (включают только две градации, как например, показа­тели теста в группе ниже или выше некой избранной величины до и после тренировок, либо количество справившихся с контрольной по математике среди мальчиков и девочек), то подходящими непарамет­рическими критериями достоверности различий будут % 2 (хи-квадрат­ен не рекомендован к применению, если число опытов в каждом из сравниваемых распределений меньше 10) и точный критерий Фише­ра для четырехпольной таблицы. Внимание: не путайте алгоритм рас­чета упомянутого непараметрического критерия % 2 с имеющим много общего алгоритмом расчета критерия согласия х 2 Пирсона, полезного при сравнении эмпирического и теоретического распределений, как правило используемого для установления соответствия реально полу­ченного распределения нормальному закону.

Для выяснения связей между признаками (корреляции) можно рассчитать уже упоминавшийся тетрахорический показатель (г),ранговые коэффициенты корреляции Спирмена (R или р) и may (т)Кендалла. Последние два могут быть использованы для определения тесноты связей как между количественными, так и между качествен­ными признаками при условии, если их значения упорядочить или проранжировать по степени убывания или возрастания признака.

❖ Компьютерная обработка и графические иллюстрации

Пускай вас не смущает некоторая перегруженность статистичес­ких процедур, рекомендуемых для использования в дипломной работе. В большинстве случаев вам не обязательно (хотя и желательно) быть знакомыми с их математическим аппаратом. К сегодняшнему дню для нужд науки разработаны многочисленные компьютерные програм­мы, позволяющие даже не сведущему в математике человеку доволь­но легко рассчитывать большинство желаемых показателей. Самыми известными и популярными из них являются пакеты Statistica (таблич­ные и графические примеры с ее использованием приведены выше) иSPSS. Обе программы снабжены справочным материалом в формеHelp-ов и специальным информационным сопровождением с обзо­ром основных расчетных алгоритмов. При выведении показателей раз­личия, в корреляционных матрицах и в других таблицах автоматически выделяются цветом и жирностью числовые значения, представляющие для исследователя особый интерес (по достоверности, важности, при­оритетности и т. д.).

Эти же пакеты позволяют существенно улучшить внешний вид дипломной работы за счет внесения в нее большей наглядности. Это достигается заменой некоторых трудно читаемых таблиц и цифровых данных на графики, гистограммы, и другие формы иллюстраций, хо­рошо вписывающихся в смысловую канву предъявленных результатов (но ничего лишнего!).

Выбор формы графика не должен быть случаен. Например, изме­нения во времени лучше воспринимаются в линейном представлении, сопоставление показателей двух групп - в столбчатом, пропорции - в круговых гистограммах, а рассеяние - в точечном (рис. 5-8).


Федеральное агентство по образованию

«Новосибирский Государственный Педагогический Университет»

Факультет психологии

Кафедра общей психологии и истории психологии

Специальность: 030301

Курс: 3, 32гр.

Отделение: дневное

Факторный анализ

Выполнила: Китаева Р.С.

Проверила: Шамшикова Е.О.

Новосибирск, 2010 г.

Введение……………………………………………………………….…………..3

Глава 1. История развития и области применения факторного анализа………4

1.1. Области применения факторного анализа………...……………......7

Глава 2. Факторная матрица. Интерпретация факторов…. ………....……....11

2.1. Косоугольная система координат и факторы 2-го порядка……...17

Глава 3. Основные теории факторного анализа………...……………………18

Заключение……………………………………………………………………....21

Список литературы……………………………………………………………....23

Введение

“Факторный анализ – (от лат. faktor– действующий, производящий и греч. analysis - разложение, расчленение) – метод многомерной математической статистики, применяемый при исследовании статистически связанных признаков с целью выявления определенного числа скрытых от непосредственного наблюдения факторов” .

Созданный в начале века для нужд психологии (предпринимались попытки выделить основной фактор, определяющий интеллект), факторный анализ впоследствии получил большое распространение в экономике, медицине, социологии и других науках, располагающих огромным количеством переменных, из которых обычно необходимо выделить ведущие. С помощью факторного анализа не просто устанавливается связь изменения одной переменной с изменением другой переменной, а определяется мера этой связи, и обнаруживаются основные факторы, лежащие в основе указанных изменений. Факторный анализ особенно продуктивен на начальных этапах научных исследований, когда необходимо выделить какие-либо предварительные закономерности в исследуемой области. Это позволяет последующий эксперимент сделать более совершенным по сравнению с экспериментом на переменных, выбранных произвольно или случайно. Как метод факторный анализ имеет определенные слабые стороны, в частности отсутствует однозначное математическое решение проблемы факторных нагрузок, т.е. влияния отдельных факторов на изменения различных переменных.

Актуальность применения факторного анализа в психологических исследованиях на современном этапе связана с широким внедрением компьютеров, что делает возможным проведение сложных факторно-аналитических вычислений с обработкой больших массивов данных.

Глава 1. История развития и факторного анализа

Факторный анализ представляет собой ветвь математической статистики. Часто встречающееся ошибочное представление о факторном анализе как о психологической теории имеет свою причину: факторный анализ зародился и всегда интенсивно применялся в психологической науке. Первоначальная цель его состояла в построении математических моделей способностей и поведения человека. Наиболее известные из психологических теорий подобного рода принадлежат Ч.Спирмену, С.Барту, Т.Келли, Л.Терстоуну, К.Холзингеру и Г.Томсону .

Появление факторного анализа обычно связывают с именем Ч.Спирмена. Началом его монументального труда, развившего психологическую теорию единственного генерального и некоторого числа характерных факторов, следует считать статью “Общий интеллект, объективно определенный и измеренный”, опубликованную в 1904 г. в “Американском психологическом журнале”. Конечно, эта работа была лишь началом его двухфакторной теории и излагалась еще не в терминах “факторов”. Возможно, более важной работой, особенно в статистическом плане, была статья К.Пирсона “On lines and planes of closest fit to systems of points in space”, опубликованная в 1901 г., в которой выдвигалась идея “метода главных осей”. Тем не менее, отцом факторного анализа заслуженно считается Ч.Спирмен, посвятивший последние 40 лет жизни развитию этой дисциплины .

В последующие 20 лет были достигнуты значительные успехи в разработке как психологических теорий, так и математического обоснования факторного анализа. Основной вклад принадлежит здесь С.Спирмену, С.Барту, К.Пирсону, Г.Томсону, Д.Максвеллу, Д.Гарнету и К.Холзингеру. Основные усилия ученых в это время были направлены на доказательства существования (или, наоборот, отсутствия) общей (неспецифической) одаренности (general ability), изучение ошибок от непредставительности выборки при оценке тетрадных разностей и разработку вычислительных процедур для поиска генерального фактора .

Началом современного периода в развитии факторного анализа, характерного подъемом творческой активности и оживленной дискуссией на страницах научных публикаций можно считать 1925 г.; реальные результаты относятся к 1930 г. К этому времени становится ясным, что факторы, получаемые с помощью двухфакторной теории Спирмена, не всегда адекватно описывают набор психологических тестов; впрочем, первое время экспериментаторы упорно отрицали наличие отклонений от теории и максимально сокращали число рассматриваемых групповых факторов. Теория генерального и специфических факторов Спирмена постепенно вытеснялась теорией групповых факторов, но методы этой последней были еще слишком трудоемкими, что затрудняло их практическое применение. Именно поэтому ряд исследователей направили свои усилия на поиск методов непосредственного извлечения набора факторов из матрицы корреляций между тестами; результатом этого явилось создание многофакторного анализа, понятие о котором ввел впервые Гарнетт.

Хотя термин “многофакторный анализ” был впервые введен Л.Терстоуном и хотя Терстоун, несомненно, больше, чем кто-либо другой, сделал для популяризации многофакторного анализа, не он тем не менее был

первым, кто “сверг” двухфакторную теорию Спирмена, и не он открыл теорию многих факторов. И даже не центроидный метод позволил Терстоуну занять выдающееся место в истории факторного анализа. Терстоун ясно сознавал, что центроидный метод является лишь вычислительным компромиссом по отношению к методу главных компонент. Заслуга этого ученого состоит в том, что он обобщил критерий разности тетрад Спирмена и указал, что основой для определения числа общих факторов является ранг корреляционной матрицы. Проблема весьма упростилась в математическом аспекте, что способствовало дальнейшему развитию факторного анализа.

Приложения математических результатов, полученных в рамках факторного анализа, не ограничивались психологической наукой. Задача факторного анализа состоит в замене набора параметров меньшим числом некоторых категорий (“факторов”), являющихся линейной комбинацией исходных параметров. Удовлетворительным решением служит такая система факторов, которая достаточно адекватно передает информацию, имеющуюся в наборе параметров. Таким образом, главная цель факторного анализа– сжатие информации, экономное описание .

Одна и та же матрица корреляций может быть факторизована бесчисленным количеством способов. Возможно, именно неосведомленность об этом факте послужила причиной бурных дискуссий о “правильном”, “наилучшем” или “инвариантном” решении для данного набора параметров. Раз возможно бесконечное число одинаково “правильных” решений, то естественно возникает вопрос: как произвести выбор? Выбор типа нужного факторного решения производится на основании двух принципов: 1) статистической простоты; 2) содержательного психологического смысла (если речь идет о психологии). В свою очередь, каждый из этих принципов может быть по-разному интерпретирован; доказательством тому служит неоднозначное их применение различными школами факторного анализа.

Если иметь в виду чисто статистический поход, то естественно заменить исходный набор параметров несколькими факторами, определяемыми последовательно и таким образом, чтобы каждый из последующих факторов “отбирал на себя” максимум из оставшейся суммарной дисперсии параметров. Этот статистический оптимальный подход и соответствующий метод главных осей был впервые предложен Пирсоном в начале столетия и досконально разработан Хотеллингом в 1930-х годах. Алгоритмы метода главных компонент весьма эффективны с точки зрения результатов, но очень трудоемки: вычислить вручную главные компоненты для матрицы 10-го и более высокого порядка практически невозможно. В последние годы, однако, эта трудность была преодолена благодаря быстродействующим ЭВМ .

Другим методом, основанным на статистическом подходе, является центроидный метод. Этот метод был введен в употребление как вычислительный паллиатив (мера, не обеспечивающая полного, коренного решения задачи), после того как стала ясна практическая нереализуемость метода главных факторов. Это означает, что цетроидный метод позволяет достаточно легко из многих систем координат выбрать такую, которая в смысле распределения дисперсии приближается к оптимальной системе.

Вообще говоря, конечный результат обоих методов, центроидного и главных факторов, еще не может устроить психологов. В поисках содержательно значимых методов психологи создали различные теории, надеясь найти такой единственный метод, который был бы одинаково хорош при исследовании интеллекта, личности, физических экспериментов и любых параметров, с которыми приходится сталкиваться психологу.

1.1. Области применения факторного анализа.

Методы факторного анализа нашли применение главным образом в психологии. Причиной этому был тот факт, что факторный анализ зародился в психологии и формализм этой дисциплины тесно “… связан с психологической концепцией ментальных факторов; даже специалисту-статистику трудно заметить и установить связь между методами факторного анализа и методами обычной математической статистики” .

Решение, полученное методами факторного анализа, может послужить основой при формулировании некоторой научной гипотезы; возможно и обратное: методами факторного анализа ищется подтверждение существующей гипотезы. Теория Спирмена является иллюстрацией второго подхода. Спирмен показал, что если между парными корреляциями имеются определенные взаимосвязи, то может быть выписана система линейных уравнений, связывающих все рассматриваемые параметры, генеральный фактор и по одному дополнительному характерному фактору на каждый параметр. Эти взаимосвязи и позволяют дать статистическое обоснование двухфакторной теории. Если набор психологических параметров не удовлетворяет условиям существования указанных взаимосвязей, то может быть постулирована более сложная гипотеза, требующая уже несколько генеральных факторов для адекватного статистического описания системы параметров.

Одна из наиболее ранних работ, связанных с расширением сферы приложения факторного анализа, была проделана в 1950 г. Т.Келли; в ней предлагался метод достижения максимальной социальной полезности каждого индивидуума при сохранении индивидуальных свобод и прав. Во время второй мировой войны факторный анализ широко применялся различными военными службами США в связи с решением проблем классификационных проверок, классификации и распределения личного состава. Разумеется, психологи и по сей день продолжают развивать и применять методы факторного анализа .

Многие психологи предприняли интенсивные исследования, пытаясь методами факторного анализа выделить небольшое число тестов, возможно более полно описывающих умственную деятельность человека. Обычно работы такого рода включают факторизацию большого набора тестов, результатом которой являются несколько общих факторов. Далее от набора тестов отбираются те, которые наилучшим образом описывают факторы (возможен и синтез “наилучших” тестов из исходных); отобранные тесты считаются прямыми измерителями “факторов мозга”. Конечно, эти тесты лишь в той мере являются действительными измерителями факторов, в какой их считают “правильными” психологи. Факторные тесты должны быть “чистыми” тестами и сильно отличаться друг от друга, покрывая своей системой весь спектр умственной деятельности.

Извлечению факторов из большого набора тестов было посвящено несколько крупных работ. Из наиболее ранних исследований подобного рода следует отметить работу Спирмена и Холзингера о выявлении отдельных черт характера и работу Терстоуна, посвященную изучению умственных способностей. Из большого потока исследований последующих лет, касающихся выделения специфических психологических факторов, следует упомянуть отдельно работы Д.Гилфорда (исследование интеллекта) и Р.Кэттелла (теория личностных черт).

Столь же широкое применение, как и при исследовании интеллекта, факторный анализ получил и в других областях психологии, в частности при изучении темперамента, создании клинической терапии и т.д.

За последние годы факторный анализ все более широко начал применяться и в других областях знания: в социологии, метеорологии, медицине, географии, экономике и др.

В факторном анализе при исследовании конкретных массивов информации существует возможность использовать различные модели, или, иначе, различные виды факторных решений. На основании этой неопределенности факторного анализа некоторые ученые ставили под сомнение его полезность как орудия научного исследования. Очевидно, однако, что точно также подобного обвинения заслуживают и другие прикладные науки, поскольку и в них имеются теоретические альтернативы .

За всю историю развития факторного анализа психологи и статистики разработали несколько типов факторных решений. Сторонник очередной теории аргументировал обычно ее полезность возможностью интерпретации психологических экспериментов. Сильнейшие эмоции, характерные для одного периода развития факторного анализа, остроумно выразил Куртон: “Факторную теорию можно определить как математически разумную гипотезу. Специалист в области факторного анализа – это субъект, одержимый некой навязчивой идеей о природе умственных способностей или личности. Применяя высшую математику к исследуемому предмету, он доказывает, что его оригинальная точка зрения верна и неизбежна. Обычно он доказывает также, что все другие специалисты в факторном анализе – опасные сумасшедшие и единственное их спасение состоит в том, чтобы принять его теорию; только в этом случае выяснится истина об их болезни. Поскольку противники никогда не поддерживают такое обвинение, то он обзывает их безнадежными и устремляется в области математики, наверняка им не известные; тем самым доказывается не только необходимость, но и достаточность неизлечимости оппонентов” .

Глава 2. Факторная матрица. Интерпретация факторов.

Факторный анализ – это ветвь математической статистики. Его цели, как и цель других разделов математической статистики, заключается в разработке моделей, понятий и методов, позволяющих анализировать и интерпретировать массивы экспериментальных или наблюдаемых данных вне зависимости от их физической формы.

Одной из наиболее типичных форм представления экспериментальных данных является матрица, столбцы которой соответствуют различным параметрам, свойствам, тестам и т.п., а строки – отдельным объектам, явлениям, режимам, описываемым набором конкретных значений параметров. На практике размеры матрицы оказываются достаточно большими: так, число строк этой матрицы может колебаться от нескольких десятков до нескольких сотен тысяч (например, при социологических обследованиях), а число столбцов – от одного – двух до нескольких сотен. Непосредственный, “визуальный”, анализ матриц такого размера невозможен, поэтому в математической статистике возникло много подходов и методов, предназначенных для того, чтобы “сжать” исходную информацию, заключенную в матрице, до обозримых размеров, извлечь из исходной информации наиболее “существенное”, отбросив “второстепенное”, “случайное” .

При анализе данных, представленных в форме матрицы, возникают два типа задач. Задачи первого типа имеют целью получить “короткое описание” распределения объектов, а задачи второго – выявить взаимоотношения между параметрами.

Следует иметь в виду, что основной стимул для появления указанных задач заключается не только и не столько в желании коротко закодировать большой массив чисел, а в значительно более принципиальном обстоятельстве, имеющем методологический характер: коль скоро удалось коротко описать большой массив чисел, то можно верить, что вскрыта некая объективная закономерность, обусловившая возможность короткого описания; а ведь именно поиск объективных закономерностей и является основной целью, ради которой, как правило, и собираются данные.

Упомянутые подходы и методы обработки матрицы данных отличаются тем, какого типа задачи обработки данных они предназначены решать, и тем, к матрицам какого размера они применимы.

Что же касается проблемы короткого описания связей между параметрами при среднем числе этих параметров, то в данном случае соответствующая корреляционная матрица содержит несколько десятков или сотен чисел и сама по себе она еще не может служить “коротким описанием” существующих связей между параметрами, а должна с этой целью подвергнуться дальнейшей обработке.

Факторный анализ как раз и представляет собой набор моделей и методов, предназначенных для “сжатия” информации, содержащейся в корреляционной матрице. В основе различных моделей факторного анализа лежит следующая гипотеза: наблюдаемые или измеряемые параметры являются лишь косвенными характеристиками изучаемого объекта или явления, на самом же деле существуют внутренние (скрытые, не наблюдаемые непосредственно) параметры или свойства, число которых мало и которые определяют значения наблюдаемых параметров. Эти внутренние параметры принято называть факторами. Задача факторного анализа – представить наблюдаемые параметры в виде линейных комбинаций факторов и, может быть, некоторых дополнительных, “не существенных” величин – “помех”. Замечательным является тот факт, что, хотя сами факторы не известны, такое разложение может быть получено и, более того, такие факторы могут быть определены, т.е. для каждого объекта могут быть указаны значения каждого фактора .

Факторный анализ, независимо от используемых методов, начинается с обработки таблицы интеркорреляций, полученных на множестве тестов, известной как корреляционная матрица, а заканчивается получением факторной матрицы, т.е. таблицы, показывающей вес или нагрузку каждого из факторов по каждому тесту. Таблица 1 представляет собой гипотетическую факторную матрицу, включающую всего два фактора.

Факторы перечисляются в верхней строке таблицы от более значимого к менее значимому, а их веса в каждом из 10 тестов даны в соответствующих столбцах.

Таблица 1

Гипотетическая факторная матрица

Фактор II

1.Словарный

2.Аналогии

3.Завершение предложений

5.Понимание прочитанного

6.Сложение

7.Умножение

8.Арифметические задачи

9.Составление уравнений

10.Завершение числовых рядов

Оси координат. Принято представлять факторы геометрически в виде осей координат, относительно которых каждый тест может быть изображен в виде точки. Рис. 1 поясняет эту процедуру. На этом графике каждый из 10 тестов, приведенных в табл.1, отображен в виде точки относительно двух факторов, которые соответствуют осям I и II. Так, тест 1 представлен точкой с координатами 0,74 по оси I и 0,54 по оси II. Точки, представляющие остальные 9 тестов, построены аналогичным способом, с использованием значений весов из табл. 1.

Следует заметить, что положение осей координат не фиксировано данными. Исходная таблица корреляций определяет лишь положение тестов (т.е. точек на рис. 1) относительно друг друга. Те же точки можно нанести на плоскость с любым положением координатных осей. По этой причине при проведении факторного анализа обычно вращают оси до тех пор, пока не получают наиболее приемлемого и легко интерпретируемого отображения.

Рис. 1. Гипотетическое факторное отображение, показывающее веса двух групповых факторов по каждому из 10 тестов.

На рис. 1 полученные после вращения оси I’ и II’ показаны пунктирными линиями. Это вращение выполнено в соответствии с предложенными Терстоуном критериями положительного многообразия и простой структуры. Первый предполагает вращение осей до положения, при котором исключаются все значимые отрицательные веса. Большинство психологов считают отрицательные факторные нагрузки логически несоответствующими тестам способностей, так как такая нагрузка означает, что чем выше оценка индивидуума по специфическому фактору, тем ниже будет его результат по соответствующему тесту. Критерий простой структуры, в сущности, означает, что каждый тест должен иметь нагрузки по как можно меньшему числу факторов .

Выполнение обоих критериев дает факторы, которые можно наиболее легко и однозначно интерпретировать. Если тест имеет высокую нагрузку по одному фактору и не имеет значимых нагрузок по другим факторам, мы можем кое-что узнать о природе этого фактора, изучив содержание данного теста. Напротив, если тест имеет средние или низкие нагрузки по шести факторам, то он мало что скажет нам о природе любого из них.

На рис. 1 хорошо видно, что после вращения осей координат все вербальные тесты (1-5) располагаются вдоль или очень близко к оси I’, а числовые тесты (6-10) тесно группируются вокруг оси II’. Новые факторные нагрузки, измеренные относительно повернутых осей, приведены в табл. 2. Факторные нагрузки в табл. 2 не имеют отрицательных значений, за исключением пренебрежительно малых величин, явно относимых к ошибкам выборки. Все вербальные тесты имеют высокие нагрузки по фактору I’ и практически нулевые – по фактору II’. Числовые тесты, напротив, имеют высокие нагрузки по фактору II’ и пренебрежимо низкие – по фактору I’. Таким образом, вращение координатных осей существенно упростило идентификацию и называние обоих факторов, а также описание факторного состава каждого теста. На практике число факторов часто оказывается больше двух, что, разумеется, усложняет их геометрическое представление и статистический анализ, но не изменяет существа рассмотренной процедуры.

Таблица 2

Факторная матрица после вращения

Фактор I’

Фактор II’

1.Словарный

2.Аналогии

3.Завершение предложений

4.Восстановление порядка слов в предложении

5.Понимание прочитанного

6.Сложение

7.Умножение

8.Арифметические задачи

9.Составление уравнений

10.Завершение числовых рядов

Некоторые исследователи руководствуются теоретической моделью как принципом вращения осей. Кроме того, принимается в расчет неизменность, или подтверждение одних и тех же факторов в независимо выполненных, но сравнимых исследованиях.

Интерпретация факторов. Получив после процедуры вращения факторное решение (или, проще говоря, факторную матрицу), мы можем переходить к интерпретации и наименованию факторов. Этот этап работы скорее требует психологической интуиции, нежели статистической подготовки. Чтобы понять природу конкретного фактора, нам ничего не остается, как изучить тесты, имеющие высокие нагрузки по этому фактору, и попытаться обнаружить общие для них психологические процессы. Чем больше оказывается тестов с высокими нагрузками по данному фактору, тем легче раскрыть его природу. Из табл. 2, к примеру, сразу видно, что фактор I’ вербальный, а фактор II’ числовой. Приведенные в табл. 2 факторные нагрузки отображают к тому же корреляцию каждого теста с фактором .

2.1. Косоугольная система координат и факторы 2-го порядка.

Изображенные на рис. 1 оси называются ортогональными, так как они строго перпендикулярны друг другу. Иногда кластеры тестов располагаются таким образом, что лучшего соответствия используемым критериям удается достичь при использовании облических (косоугольных) осей. В таком случае уже сами факторы коррелируют друг с другом. Одни исследователи утверж-дали, что использование ортогональных (некоррелирующих) факторов всегда предпочтительнее, поскольку такие факторы дают более простую и четкую картину взаимосвязи черт. Другие настаивают на том, что косоугольную систему координат следует использовать всякий раз, когда она лучше соответствует изучаемым данным, поскольку большинство имеющих ясный физический смысл категорий и не должны быть независимыми. Очевидный пример – рост и вес. Несмотря на высокую корреляцию между собой, они оказались весьма полезными категориями при оценке телосложения.

Когда факторы коррелируют между собой, существующие между ними интеркорреляции можно подвергнуть тому же статистическому анализу, который мы применяем к интеркорреляциям между тестами. Иными словами, у нас есть возможность “факторизовать факторы” и получить факторы второго порядка. Этот способ обработки данных был использован в ряде исследований таких переменных, как способности и черты личности. В некоторых исследованиях с использованием тестов способностей был получен единственный общий фактор второго порядка. Как правило, американские исследователи, применяющие факторный анализ, начинают с объяснения как можно большей части общей дисперсии групповыми факторами и только затем выявляют общий фактор как фактор второго порядка, если данные подтверждают его наличие. У английских психологов, напротив, принято начинать с общего фактора, которому приписывается основная доля общей дисперсии, а затем возвращаться к групповым факторам для объяснения остаточной корреляции. Эта разница в методиках является следствием теоретических различий.

Глава 3. Основные теории факторного анализа.

На протяжении более полувека предпринимались многочисленные попытки с помощью статистических методов факторного анализа понять природу и организацию способностей, связанных с разнообразной человеческой деятельностью. Тем не менее эти методы до сих пор остаются наиболее тесно связанными с изучением когнитивных способностей, или “интеллекта”, направлением, в рамках которого и зародился факторный анализ. Рассмотрим лишь некоторые широко известные теории интеллекта, выбор которых обусловлен их воздействием на конструирование и использование тестов.

Двухфакторная теория. Первой теорией организации черт, основанной на статистическом анализе показателей тестов, была двухфакторная теория, развитая английским психологом Чарльзом Спирменом (Spearman, 1904; 1927). В своем первоначальном виде эта теория утверждала, что все виды интеллектуальной активности используют долю единого общего фактора, названного генеральным, или фактором g (от англ. general - общий). Кроме того, в теории Спирмена постулировалось наличие многочисленных специфических, или s-факторов (от англ. specific), каждый из которых сказывается на выполнении только одной из интеллектуальных функций. Положительная корреляция между любыми двумя функциями приписывалась, таким образом, действию фактора g. Чем больше эти две функции были “насыщены” (saturated) фактором g, тем выше должна бы быть корреляция между ними. Напротив, присутствие специфических факторов вело к снижению корреляции между функциями .

Несмотря на постулирование Спирменом двух типов факторов – генерального и специфических, фактор g рассматривается в его теории как единственная причина корреляции. Поэтому, в отличие от других теорий связи черт, эту теорию было бы точнее называть однофакторной, однако она сохранила свое первоначальное название. Рис. 2 иллюстрирует основополагающий принцип корреляций тестов согласно этой теории. Из этой схемы видно, что, в соответствии с теорией Спирмена, тесты 1 и 2 должны высоко коррелировать между собой, поскольку каждый сильно насыщен фактором g, о чем свидетельствуют заштрихованные участки. Незаштрихованным частям каждого теста соответствуют специфический фактор и дисперсия ошибок. Тест 3 должен слабо коррелировать с каждым из двух других тестов, поскольку включает очень малую долю фактора g.

Рис. 2. Принципиальная модель корреляции в двухфакторной теории

Согласно двухфакторной теории, целью психологического тестирования должно быть измерение величины фактора g у каждого индивидуума. Если этот фактор пронизывает все способности, тогда он дает нам единственную основу для предсказания результатов деятельности индивидуума в разных ситуациях. Специфические факторы измерять бесполезно, так как каждый из них, по определению, сказывается только на какой-то одной функции. Вот почему Ч.Спирмен предложил заменить разнородную совокупность заданий, встречаемых в тестах интеллекта, единственным, пусть односторонним, тестом, но при этом высоко насыщенным фактором g. Он полагал, что тесты на абстрактные отношения, по всей вероятности, лучше всех других измеряют g и поэтому могут быть использованы для этой цели. Примерами тестов, разработанных для измерения g, являются Прогрессивные матрицы Равена и Культурно-свободный тест интеллекта Кэттелла (Cattell’s Culture Fair Intelligence Test).

С самого начала Спирмен понимал, что двухфакторная теория нуждается в уточнении. Когда сравниваемые деятельности достаточно похожи, корреляция между ними может достигать величины, превышающей степень связи между переменными, объяснимую действием фактора g. Поэтому в добавление к генеральному и специфическим факторам, вероятно, существует промежуточный класс факторов, не столь универсальных, как g, но и не столь специфичных, как s-факторы. Такой фактор, общий только для группы (а не для всех вообще) интеллектуальных функций, был назван групповым фактором. В первых вариантах своей теории Спирмен допускал возможность весьма узких и пренебрежительно малых групповых факторов. Позднее, под давлением фактов, полученных в исследованиях некоторых его учеников, он стал использовать в своих теоретических построениях гораздо более широкие групповые факторы, такие как арифметические, технические и лингвистические способности .

Заключение

В настоящее время методы факторного анализа составляют сложную специальную область математической статистики. В психологической диагностике факторный анализ широко используется как для решения исследовательских задач, так и при конструировании психодиагностических методик.

Факторный анализ является эффективным средством получения короткого описания взаимоотношений между параметрами при среднем числе параметров и, кроме того, в несколько модифицированном виде служит одной из основных составляющих лингвистических методов обработки экспериментальных данных с большим числом параметров.

Многочисленные экспериментальные исследования, в частности по обработке психологических, социологических, экономических и других данных, показали, что определяемые факторы, как правило, хорошо интерпретируются как некоторые существенные внутренние характеристики изучаемых объектов. Таким образом, факторный анализ оказался эффективным формальным средством генерации новых понятий и гипотез в самых различных науках.

В настоящее время факторный анализ все чаще используется в роли подтверждающего, чем исследовательского метода. Нередко его сочетают с моделированием структурными уравнениями для оценивания теоретически сформулированной модели вклада различных переменных в выполнение задачи.

Слабое место традиционного факторного анализа – в недостаточном внимании к выбору анализируемых переменных.

Поскольку конечным результатом методов факторного анализа является, как правило, получение содержательно интерпретируемых факторов, то при решении практических задач факторный анализ в настоящее время является еще в большой мере искусством, овладение которым требует некоторого опыта.

Как указывалось выше, основная задача факторного анализа состоит в экономном описании экспериментальных данных. Это вовсе не означает, что всегда методами факторного анализа ищут “фундаментальные”, “базисные” категории (факторы) в данной области, например, в психологии. Иногда бывает необходимо по возможности наиболее полно проанализировать набор параметров, характеризующих умственные способности некоторой популяции. Но даже и в этом случае факторы не могут полностью описать ситуацию хотя бы потому, что некоторые важные параметры попросту еще не придуманы. Теоретически задача исчерпывающе полного описания неразрешима; однако в практическом исследовании с ограниченным кругом решаемых вопросов и небольшим числом рассматриваемых параметров она разрешима вполне. Нужно только помнить, что факторный анализ дает всегда интерпретацию лишь данного экспериментального материала и, следовательно, сокращенное описание лишь данного набора параметров.

Главную цель факторного анализа хорошо выразил Келли: “Факторный анализ не пытается искать истину в бесконечном времени, бесконечном пространстве или для бесконечной выборки; наоборот, он стремится дать простое описание конечной группы объектов, функционирующих конечным числом способов, в терминах некоторого пространства небольшого числа измерений. Разочарован будет тот, кто пожелает найти в факторном анализе более туманные цели и истины” .

Список использованной литературы

    Анастази, А. Психологическое тестирование / А. Анастази, С.Урбина. – СПб.: Питер, 2001. – 401 с.

    Бурлачук, Л.Ф.Словарь-справочник по психодиагностике / Л.Ф.Бурлачук, С.М. Морозов. – СПб.: Питер, 2000. –409 с.

    Горбатов, Д.С. Практикум по психологическому исследованию / Д.С. Горбатов. – Самара: Бахрах, 2000. – 212 с.

    Данилова, Н.Н. Психофизиология / Н.Н. Данилова. – М.: АспектПресс, 1998. – 351 с.

    Дюк, В.А. Компьютерная психодиагностика / В.А.Дюк. – СПб.: Братство, 1994. – 178 с.

    Забродин, Ю.М. Статистические и семантические проблемы конструирования и адаптации многофакторных личностных тест-опросников // Ю.М. Забродин, В.И. Похилько. - Психологический журнал. - т.8. - №6. - 1987. - С.79-89.

    Иберла, К. Факторный анализ / К. Иберла. – М.: Статистика, 1980. – 308 с.

    Кимбл, Г. Как правильно пользоваться статистикой / Г. Кимбл. – М.: Статистика, 1982. – 212 с.

    Краткий психологический словарь / под ред. А.В.Петровского, М.Г.Ярошевского. – Ростов-на-Дону: Феникс, 1999. – 412 с.

    Куликов, Л.В. Психологическое исследование: методические рекомендации по проведению / Л.В. Куликов. – СПб.: Речь, 2001. – 102 с.

    Левандовский, Н.Г. О корректированном применении факторного анализа и критериях факторизации // Н.Г. Левандовский. - Вопросы психологии. - 1980. - № 5. – С.138-142.

    Лоули, Д. Факторный анализ как статистический метод / Д.Лоули, А.Максвелл. – М.: Мир, 1967. – 144 с.

    Митина, О.В. Факторный анализ для психологов / О.В. Митина. – М.: УМК, 2001. – 169 с.

    Райгородский, Д.Я. Практическая психодиагностика / Д.Я.Райгородский. – Самара: Бахрах, 1998. – 260 с.

    Смирнов, Н.В., Курс теории вероятностей и математической статистики / Н.В.Смирнов. – М.: Наука, 1969.- 312 с.

    Современная психология: Справочное руководство. – М.: ИНФРА- М, 1999. – 599 с.

    Столяренко, Л.Д. Основы психологии / Л.Д.Столяренко. – Ростов-на-Дону: Феникс, 1999. – 309 с.

    Суходольский, Г.В. Основы математической статистики для психологов / Г.В. Суходольский. – М.: Академия, 1972. – 345 с.

    Теплов, Б.М. Простейшие способы факторного анализа // Б.М.Теплов. - Типологические особенности высшей нервной деятельности человека. – Т.5. – М.: Просвещение, 1967. – 435 с.

  1. Факторный анализ прибыли (2)Реферат >> Финансы

    Факторный анализ прибыли Факторный анализ общей, валовой (балансовой) ... абсолютную эффективность хозяйствования предприятия. Факторный анализ прибыли от реализации продукции (... хозяйственной дисциплины (Р7). Сумма факторных отклонений дает общее изменение...

  2. Факторный анализ себестоимости и прибыли предприятия

    Курсовая работа >> Экономика

    ФАКТОРНЫЙ АНАЛИЗ СЕБЕСТОИМОСТИ И ПРИБЫЛИ ПРЕДПРИЯТИЯ... Расчет себестоимости и прибыли Анализ варианта снижения цены Анализ взаимосвязи себестоимости, объема... выполнения курсовой работы на тему «Факторный анализ себестоимости и прибыли предприятия» является...

  3. Факторный анализ компании

    Реферат >> Менеджмент

    Математическому аппарату методы - компонентный анализ , канонический анализ и др.). Факторный анализ впервые возник в психометрике и в... на величину результативных показателей. Назначение факторного анализа Факторный анализ – определение влияния факторов на...