Поиск объектов указанием связей между шаблонами. Метод корреляций

Корреляционный метод

Модификацией метода сравнения с эталоном является корреляционный метод, основанный на вычислении взаимокорреляционной функции между эталоном и изображением.

Корреляция -- статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой корреляции двух случайных величин служит коэффициент корреляции.

Корреляционный анализ -- метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков для установления между ними статистических взаимосвязей.

Цель корреляционного анализа -- обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает что изменение значения переменной А, произойдет одновременно с пропорциональным изменением значения Б.

Классификация изображений проводится по результату: чем больше значение функции взаимной корреляции, тем с большей вероятностью эталон совпадает с изображением. Используя обозначения, принятые в выражении, формулу для вычисления взаимокорреляционной функции К можно представить в виде

Максимальное значение взаимокорреляционной функции равно,

и достигается при полном совпадении изображения с эталоном. Нормированная взаимокорреляционная функция

при совпадении эталона с изображением достигает максимального значения, равного единице.

Использование корреляционного метода и метода прямого сравнения с эталоном предъявляет к процессу предварительной обработки изображений общие требования. Они заключаются в том, что изображение и эталон должны быть одинаково ориентированы, иметь равный масштаб и не быть сдвинутыми друг относительно друга в поле изображения. Другим свойством этих методов, которое следует учитывать, является необходимость использования большого количества эталонов. Это особенно важно в тех случаях, когда решаются задачи распознавания объектов изменением их проекции.

Распознавание через связь шаблонов

Поиск объектов указанием связей между шаблонами

Часто наблюдаемый объект обладает внутренними степенями свободы, а это означает, что его внешний вид может сильно варьироваться (например, люди могут двигать руками и ногами, рыбы деформируются при плавании, змеи извиваются и т.д.). Данное явление может чрезвычайно затруднить сравнение с шаблоном, поскольку потребуется либо классификатор с гибкими границами (и множество образцов), либо много различных шаблонов.

Многие объекты названного типа содержат небольшое число компонентов, довольно строго упорядоченных. Можно попытаться согласовать данные компоненты как шаблоны, а затем определить, какие объекты присутствуют, изучив предложенные связи между найденными шаблонами. Например, вместо поиска лица по одному полному шаблону лица, можно искать глаза, нос и рот с приемлемым взаимным расположением.

Данный подход имеет несколько потенциальных преимуществ. Во-первых, узнать шаблон глаза может быть легче, чем узнать шаблон лица, поскольку первая структура очевидно проще. Во-вторых, можно получить и использовать относительно простые вероятностные модели, поскольку могут существовать некоторые свойства независимости, которые можно будет использовать. В-третьих, возможно, удастся согласовать большое число объектов с относительно небольшим числом шаблонов. Хороший пример этого явления -- морды животных; почти все животные с характерными мордами имеют глаза, нос и рот, отличается лишь пространственное расположение этих элементов. Наконец, из сказанного следует, что для построения сложных объектов можно использовать простые отдельные шаблоны. Например, люди могут двигать руками и ногами, и похоже, что обучить цельный явный шаблон обнаруживать людей целиком значительно сложнее, чем получить отдельные шаблоны для частей тела и вероятностную модель, описывающую их степени свободы.

Рассматриваемая тема не настолько хорошо изучена, чтобы к ней выработался какой-либо стандартный подход. В то же время основной вопрос достаточно очевиден -- как закодировать набор связей между шаблонами в форму, с которой легко работать. В данной главе изучается ряд различных подходов к данной задаче. Во-первых, каждый шаблон может указывать на объекты, которые он может представлять, а затем каким-то образом считается число указателей. Если построить некоторую явную вероятностную модель, для описания деталей пространственных отношений можно использовать больше весовых коэффициентов. Данную модель можно получить из функций правдоподобия; по сути, нужна функция распределения вероятностей, дающая большое значение, когда конфигурация компонентов подобна объекту, и малое -- в противном случае. Тогда поиск объектов превращается в поиск шаблонов, которые при подстановке в вероятностную модель дают большие значения. Нужно отметить, что следует внимательно относиться к сокращению поиска. Сложность этого подхода заключается в том, что даже при сокращении поиск может быть дорогим. Как утверждают Форсайт и Понс, в то же время при определенном классе вероятностных моделей можно провести эффективный поиск .

Простые модели объектов могут обеспечивать достаточно эффективное распознавание. Простейшая модель -- это рассматривать объект как набор фрагментов изображения (небольших окрестностей элементов характерного вида) нескольких различных типов, формирующих образ (pattern). Чтобы определить, какой образ наблюдается, находятся все фрагменты, каждый из которых указывает на все образы, в которые он входит. То изображение, на которое было указано наибольшее число, и считается присутствующим. Хотя данная стратегия проста, она довольно эффективна. Ниже описываются методы поиска фрагментов, а затем представляется ряд последовательно усложняющихся реализаций данной стратегии.

Не со всеми проблемами можно справиться экспериментальным методом. Существует множество ситуаций, когда исследователь не может контролировать, какие испытуемые попадают в те или иные условия. Например, если надо проверить гипотезу, что люди с анорексией более чувствительны к изменениям вкуса, чем люди с нормальным весом, то не можем же мы собрать группу испытуемых с нормальным весом и потребовать, чтобы у половины из них появилась анорексия! На самом деле нам придется отобрать людей, уже страдающих анорексией, и тех, у кого вес в норме, и проверить, различаются ли они также по вкусовой чувствительности. Вообще говоря, можно использовать метод корреляций, чтобы определить связана ли некоторая переменная, которую мы не можем контролировать, с другой интересующей нас переменной, или, иначе говоря, коррелируют ли они между собой.

В вышеприведенном примере у переменной веса есть только два значения -- нормальный и анорексичный. Чаще случается, что каждая из переменных может принимать много значений, и тогда надо определить, насколько величины одной и другой переменной коррелируют между собой. Определить это может статистический параметр, называемый коэффициентом корреляции и обозначаемый буквой r. Коэффициент корреляции позволяет оценить, насколько связаны две переменные, и выражается числом от -1 до +1. Ноль означает отсутствие связи; полная связь выражается единицей (+1, если отношение положительное, и -1, если оно отрицательное). По мере увеличения r от 0 до 1 сила связи возрастает.

Рис.6.

Эти гипотетические данные принадлежат 10 пациентам, каждый из которых имеет некоторое повреждение участков мозга, ответственных, насколько известно, за узнавание лиц. На рис. 6а пациенты располагаются вдоль горизонтали соответственно объему повреждения мозга, причем самая левая точка показывает пациента с наименьшим повреждением (10%), а самая правая точка показывает пациента с наибольшим повреждением (55%). Каждая точка на графике отражает показатель для отдельного пациента в тесте на узнавание лиц. Корреляция положительная и равна 0,90. На рис. 6б изображены те же самые данные, но теперь они показывают долю правильных ответов, а не ошибок. Здесь корреляция отрицательная, равная -0,90. На рис..6в успехи пациентов в тесте на распознавание отображены в зависимости от их роста. Здесь корреляция равна нулю.

Суть коэффициента корреляции можно пояснить на примере графического представления данных гипотетического исследования. Как показано на рис. 6а, в исследовании участвуют пациенты, о которых заранее известно, что у них поврежден мозг, и это вызвало разной степени трудности в узнавании лиц (прозопагнозия). Предстоит выяснить, возрастает ли трудность, или ошибка узнавания лиц, с увеличением процента поврежденной мозговой ткани. Каждая точка на графике 6а показывает результат для отдельного пациента при его тестировании на узнавание лиц. Например, пациент с 10%-ным повреждением ошибался в тесте на распознавание лиц в 15% случаев, а пациент с 55%-ным повреждением делал ошибки в 95% случаев. Если бы ошибка узнавания лиц постоянно возрастала с увеличением процента повреждения мозга, точки на графике располагались бы все время выше при движении слева направо; если бы они размещались на диагонали рисунка, коэффициент корреляции был бы r = 1,0. Однако несколько точек расположены по разные стороны этой линии, поэтому корреляция составляет около 90%. Корреляция 90% означает очень сильную связь между объемом поврежденного мозга и ошибками узнавания лиц. Корреляция на рис. 6а -- положительная, поскольку большее повреждение мозга вызывает больше ошибок.

Если бы вместо ошибок мы решили отобразить долю правильных ответов в тесте на распознавание, то получили бы график, изображенный на рис. 6б. Здесь корреляция отрицательная (равная примерно -0,90), поскольку с увеличением повреждения мозга доля правильных ответов уменьшается. Диагональ на рис. 6б -- это просто инверсный вариант той, что на предыдущем рисунке.

Наконец, обратимся к графику на рис. 6в. Здесь отображена доля ошибок пациентов в тесте на распознавание лиц в зависимости от их роста. Разумеется, нет оснований считать, что доля узнанных лиц связана с ростом пациента, и график подтверждает это. При движении слева направо точки не проявляют согласованного движения ни вниз, ни вверх, а разбросаны вокруг горизонтальной линии. Корреляция равна нулю.

Числовой метод вычисления коэффициента корреляции описан в Приложении II. Сейчас, однако, мы сформулируем несколько элементарных правил, которые помогут вам разобраться с коэффициентом корреляции, когда вы встретитесь с ним в последующих главах.

Корреляция бывает положительной (+) и отрицательной (-). Знак корреляции показывает, связаны ли две переменные положительной корреляцией (величина обеих переменных растет или уменьшается одновременно) или отрицательной корреляцией (одна переменная растет при уменьшении другой). Предположим, например, что количество пропусков занятий студентом имеет корреляцию -0,40 с баллами в конце семестра (чем больше пропусков, тем меньше баллов). С другой стороны, корреляция между полученными баллами и количеством посещенных занятий будет +0,40. Прочность связи одна и та же, но знак ее зависит от того, считаем ли мы пропущенные или посещенные занятия.

По мере усиления связи двух переменных r увеличивается от 0 до 1. Чтобы лучше это представить, рассмотрим несколько известных положительных коэффициентов корреляции:

Коэффициент корреляции между баллами, полученными в первый год обучения в колледже, и баллами, полученными на втором году, составляет около 0,75.

Корреляция между показателями геста на интеллект в возрасте 7 лет и при повторном тестировании в 18 лет составляет примерно 0,70.

Корреляция между ростом одного из родителей и ростом ребенка во взрослом возрасте, составляет около 0,50.

Корреляция между результатами теста на способность к обучению, полученными в школе и в колледже, равна примерно 0,40.

Корреляция между баллами, полученными индивидуумами в бланковых тестах, и суждением психолога-эксперта об их личностных качествах составляет около 0,25.

В психологических исследованиях коэффициент корреляции 0,60 и выше считается достаточно высоким. Корреляция в диапазоне от 0,20 до 0,60 имеет практическую и теоретическую ценность и полезна при выдвижении предсказаний. К корреляции от 0 до 0,20 следует относиться осторожно, при выдвижении предсказаний ее польза минимальна.

Тесты. Знакомый пример использования корреляционного метода -- тесты по измерению некоторых способностей, достижений и других психологических качеств. При тестировании группе людей, различающихся по какому-нибудь качеству (например, математическим способностям, ловкости рук или агрессивности), предъявляют некоторую стандартную ситуацию. Затем можно вычислить корреляцию между изменениями показателей данного теста и изменением другой переменной. Например, можно установить корреляцию между показателями группы студентов в тесте на математические способности и их оценками по математике при дальнейшем обучении в колледже; если корреляция значительная, то на основе результатов этого теста можно решить, кого из нового набора студентов можно перевести в группу с повышенными требованиями.

Тестирование -- важный инструмент психологических исследований. Оно позволяет психологам получать большое количество данных о людях с минимальным отрывом их от повседневных дел и без применения сложного лабораторного оборудования. Построение тестов включает множество этапов, которые мы подробно рассмотрим в последующих главах.

Корреляция и причинно-следственные связи. Между экспериментальными и корреляционными исследованиями есть важное различие. Как правило, в экспериментальном исследовании систематически манипулируют одной переменной (независимой) с целью определить ее причинное воздействие на некоторые другие переменные (зависимые). Такие причинно-следственные связи нельзя вывести из корреляционных исследований. Ошибочное понимание корреляции как причинно-следственного отношения можно проиллюстрировать на следующих примерах. Может существовать корреляция между мягкостью асфальта на улицах города и количеством солнечных ударов, случившихся за день, но отсюда не следует, что размягченный асфальт выделяет какой-то яд, приводящий людей на больничную койку. На самом деле изменение обеих этих переменных -- мягкости асфальта и числа солнечных ударов -- вызывается третьим фактором -- солнечным теплом. Еще один простой пример -- высокая положительная корреляция между большим количеством аистов, гнездящихся во французских деревнях, и высокой рождаемостью, зарегистрированной там же. Предоставим изобретательным читателям самим догадываться о возможных причинах такой корреляции, не прибегая к постулированию причинно-следственной связи между аистами и младенцами. Эти примеры служат достаточным предостережением от понимания корреляции как причинно-следственного отношения. Если между двумя переменными есть корреляция, изменение одной может вызывать изменения другой, но без специальных экспериментов такой вывод будет неоправданным.

Методы корреляции

Все явления общественной жизни взаимосвязаны и взаимообусловлены. Задача статистики состоит в том, чтобы выявить и измерить связи и зависимости между изучаемыми явлениями.

Взаимосвязанные признаки подразделяются на факторные (под их воздействием изменяются другие, зависящие от них признаки) и результативные.

Связи по степени тесноты могут быть функциональными (при которых определенному значению факторного признака соответствует строго определенное значение результативного признака; для выявления такой связи достаточно одного наблюдения), статистическими (когда одному и тому же значению факторного признака могут соответствовать несколько значений результативного признака; эти связи проявляются в массе случаев и при этом в среднем). Функциональные связи иначе называются полными, а статистические - неполными или корреляционными.

Корреляционная зависимость проявляется только в средних величинах и выражает числовое отношение между ними в виде тенденции к возрастанию или убыванию одной переменной величины при возрастании или убывании другой.

Корреляционная связь является свободной, неполной и неточной связью.

Поскольку корреляционная связь является статистической, первым условием возможности ее изучения является общее условие всякого статистического исследования: наличие данных по достаточно большой совокупности явлений. По отдельным явлениям можно получить совершенно превратное представление о связи признаков, ибо в каждом отдельном явлении значения признаков кроме закономерной составляющей имеют случайное отклонение (вариацию).

Вторым условием закономерного проявления корреляционной связи служит условие, обеспечивающее надежное выражение закономерности в средней величине. Кроме уже указанного большого числа единиц совокупности для этого необходима достаточная качественная однородность совокупности. Нарушение этого условия может извратить параметры корреляции.

Прямые и обратные связи. В зависимости от направления действия, функциональные и стахостические связи могут быть прямые и обратные. При прямой связи направление изменения результативного признака совпадает с направлением изменения признака-фактора, то есть с увеличением факторного признака увеличивается и результативный, и, наоборот, с уменьшением факторного признака уменьшается и результативный признак. В противном случае между рассматриваемыми величинами существуют обратные связи. Например, чем выше квалификация рабочего (разряд), тем выше уровень производительности труда - прямая связь. А чем выше производительность труда, тем ниже себестоимость единицы продукции - обратная связь.

Прямолинейные и криволинейные связи. По аналитическому выражению (форме) связи могут быть прямолинейными и криволинейными. При прямолинейной связи с возрастанием значения факторного признака происходит непрерывное возрастание (или убывание) значений результативного признака. Математически такая связь представляется уравнением прямой, а графически - прямой линией. Отсюда ее более короткое название - линейная связь. При криволинейных связях с возрастанием значения факторного признака возрастание (или убывание) результативного признака происходит неравномерно, или же направление его изменения меняется на обратное. Геометрически такие связи представляются кривыми линиями (гиперболой, параболой и т.д.).

Однофакторные и многофакторные связи. По количеству факторов, действующих на результативный признак, связи различаются: однофакторные (один фактор) и многофакторные (два и более факторов). Однофакторные (простые) связи обычно называются парными (т.к. рассматривается пара признаков). Например, корреляционная связь между прибылью и производительностью труда. В случае многофакторной (множественной) связи имеют в виду, что все факторы действуют комплексно, то есть одновременно и во взаимосвязи. Например, корреляционная связь между производительностью труда и уровнем организации труда, автоматизации производства, квалификации рабочих, производственным стажем, простоями и другими факторными признаками. С помощью множественной корреляции можно охватить весь комплекс факторных признаков и объективно отразить существующие множественные связи.

Для изучения, измерения и количественного выражения взаимосвязей между явлениями статистикой применяются различные методы, такие как: метод сопоставления параллельных рядов, балансовый, графический, методы аналитических группировок, дисперсионного и корреляционного анализа

Метод параллельных рядов заключается в том, что полученные в результате сводки и обработки материалы располагают в виде параллельных рядов и сопоставляют их между собой для установления характера и тесноты связи.

Балансовый метод состоит в том, что данные взаимосвязанных показателей изображаются в виде таблицы и располагаются таким образом, чтобы итоги между отдельными ее частями были равны, т.е. чтобы баланс. Балансовый метод используется для характеристики взаимосвязи между производством и распределением продуктов, денежными доходами и расходами населения и т.д. почти все внутренние и внешние хозяйственные связи выражаются в виде балансов.

Метод аналитических группировок. Сущность метода аналитических группировок состоит в том, что единицы статистической совокупности группируются, как правило, по факторному признаку и для каждой группы рассчитывается средняя или относительная величина по результативному признаку. Затем изменения средних или относительных значений результативного признака сопоставления с изменениями факторного признака для выявления характера связи между ними.

Корреляционно-регрессионный анализ. Корреляционная связь - связь, проявляющаяся при достаточно большом числе наблюдений в виде определенной зависимости между средним значением результативного признака и признаками-факторами.

Изучение корреляционных связей сводится в основном к решению следующих задач:

  • - выявление наличия (или отсутствия) корреляционной связи между изучаемыми признаками. Эта задача может быть решена на основе параллельного сопоставления (сравнения) значенийх иу уn единиц совокупности; с помощью группировок; построения и анализа специальных корреляционных таблиц; а также построения диаграмм рассеяния;
  • - измерение тесноты связи между двумя (и более) признаками с помощью специальных коэффициентов. Эта часть исследования называется корреляционный анализ;
  • - определение уравнения регрессии - математической модели, в которой среднее значение результативного признакау рассматривается как функция одной или нескольких переменных - факторных признаков. Эта часть исследования называется регрессионный анализ.

Задача корреляционного анализа - измерение тесноты связи между варьируемыми признаками и оценка факторов, оказывающих наибольшее влияние.

Задача регрессионного анализа - выбор типа модели (формы связи), устанавливающих степени влияния независимых переменных.

Связь признаков проявляется в их согласованной вариации, при этом одни признаки выступают как факторные, а другие - как результативные. Причинно-следственная связь факторных и результативных признаков характеризуется по степени:

  • - тесноты;
  • - направлению;
  • - аналитическому выражению.

Регрессионный анализ. Для оценки параметров уравнений регрессии наиболее часто используется метод наименьших квадратов (МНК), суть которого заключается в следующем требовании: искомые теоретические значения результативного признака должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических (фактических) значений, т.е.

При изучении связей показателей применяются различного вида уравнения прямолинейной и криволинейной связи. Так, при анализе прямолинейной зависимости применяется уравнение:

При криволинейной зависимости применяется ряд математических функций:

полулогарифмическая

показательная

степенная

параболическая

гиперболическая

Наиболее часто используемая форма связи между коррелируемыми признаками - линейная, при парной корреляции выражается уравнением,где а 0 - среднее значение в точкеx =0, поэтому экономической интерпретации коэффициента нет; а 1 - коэффициент регрессии, показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Система нормальных уравнений МНК для линейной парной регрессии имеет следующий вид:

Отсюда можно выразить коэффициенты регрессии:

Для практического использования регрессионных моделей необходима проверка их адекватности. При численности объектов анализа до 30 единиц возникает необходимость проверить, насколько вычисленные параметры характерны для отображаемого комплекса условий, не являются ли полученные значения параметров результатом действия случайных причин. Значимость коэффициентов регрессии применительно к совокупностиn <30определяется с помощью t-критерия Стьюдента. При этом вычисляются фактические значения t-критерия:

для параметра а0: ,

для параметра а 1: .

среднее квадратическое отклонение результативного признака от выровненных значений.

среднее квадратическое отклонение факторного признака от общей средней.

Полученные по формуламфактические значения и сравниваются с критическим, который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы н =n-k- 1, где n - число наблюдений, k - число факторов, включенных в уравнение регрессии). Рассчитанные параметры а 0 и а 1 уравнения регрессии признаются типичными, если t фактическое больше t критического.

Корреляционный анализ позволяет установить тесноту связи между факторами и решить следующие задачи:

  • - ответить на вопрос: существует ли связь?
  • - выявить изменение связи в различных ситуациях реальных данных;
  • - определить наиболее значимые факторы в результативном признаке;

Различают:

  • - парную корреляцию - это зависимость между результативным и факторным признаком;
  • - частную корреляцию - это зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков;

Множественную - многофакторное влияние в статической модели.

К простейшим показателям тесной связи относятся:

  • - линейный коэффициент корреляции К.Пирсона;
  • - коэффициент детерминации;
  • - коэффициенты корреляции знаков - для оценки тесноты связи качественных признаков (непараметрические методы), Г. Фехнера, К. Спирмэна, М. Кэндэла.

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который рассчитывается по одной из формул:

Корреляционный анализ выполняет оценку адекватности регрессионной модели, но путем установления тесноты связи.

Оценка линейного коэффициента корреляции

Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого определяется фактическое значение критерия:

Вычисленное по формулезначение сравнивается с критическим, который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы н.

Коэффициент корреляции считается статистически значимым, если t расч превышает (t расч >).

Универсальным показателем тесноты связи является теоретическое корреляционное отношение:

где - общая дисперсия эмпирических значений y , характеризует вариацию результативного признака за счет всех факторов, включая х ;

Факторная дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у ;

Остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов кроме х .

По правилу сложения дисперсий:

Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)

Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. з = |r| .

Множественный коэффициент корреляции в случае зависимости результативного признака от двух факторов вычисляется по формуле:

где - парные коэффициенты корреляции между признаками.

Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: .

Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера:

где R 2 - коэффициент множественной детерминации (R 2);

k - число факторных признаков, включенных в уравнение регрессии.

Связь считается существенной, еслиF расч > F табл - табличного значения F- критерия для заданного уровня значимостиби числе степеней свободы

н 1 = k , н 2 = n - k - 1.

Частные коэффициенты корреляции характеризуют степень тесноты связи результативного признака и фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. В случае зависимости у от двух факторных признаков частные коэффициенты корреляции рассчитываются:

где r - парные коэффициенты корреляции между указанными в индексе переменными.

В первом случае исключено влияние факторного признака х 2 , во втором - х 1.

Для оценки сравнительной силы влияния факторов, по каждому фактору рассчитывают частные коэффициенты эластичности:

где - среднее значение соответствующего факторного признака;

Среднее значение результативного признака;

Коэффициент регрессии приi -м факторном признаке.

Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов.

Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией i -го признака, входящего в множественное уравнение регрессии, рассчитывается по формуле:

где - парный коэффициент корреляции между результативным и i -м факторным признаком;

Соответствующий стандартизованный коэффициент уравнения множественной регрессии:

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

«Теория статистики», учебник под ред. Р.А. Шмойловой,

М.: Финансы и статистика, 2007. - 510 с.

«Практикум по теории статистики»., под ред. Р.А. Шмойловой,

М.: Финансы и статистика, 2004. - 456 с.

«Общая теория статистики» И.И. Елисеева, М.М. Юзбашев,

М.: Финансы и статистика, 2002. - 480 с.

«Теория статистики» В.М. Гусаров, М.: ЮНИТИ, 2001. - 247 с.

Корреляция - Это степень, в которой события или личные характеристики человека зависят друг от друга. Корреляционный метод - процедура в исследовании, использующаяся, чтобы определить взаимосвязь между переменными. Данный метод может, например, ответить на вопрос: «существует ли корреляция между количеством стресса, с которым сталкиваются люди и степенью испытываемой ими депрессии?» То есть, по мере того, как люди продолжают переживать стресс, насколько увеличивается вероятность того, что они впадут в депрессию?

Корреляция - Степень зависимости друг от друга событий или характеристик.

Корреляционный метод - Процедура исследований, которая используется для определения того, насколько события или характеристики зависят друг от друга.

Чтобы ответить на этот вопрос, исследователи подсчитывают баллы жизненного стресса (например, количество угрожающих событий, переживаемых человеком в определенный период времени) и баллы депрессии (например, баллы в опросниках по депрессии). Как правило, исследователи обнаруживают, что эти переменные увеличиваются или уменьшаются вместе (Stader & Hokanson, 1998; Paykel & Cooper, 1992). To есть чем больше количество баллов стресса в жизни определенного человека, тем выше его или ее сумма баллов по депрессии. Корреляции такого рода имеют позитивную направленность и их называют позитивной корреляцией.

Корреляция может иметь и негативную, а не позитивную направленность. При негативной корреляции, когда значение одной переменной возрастает, значение другой уменьшается. Исследователи обнаружили, например, негативную корреляцию между депрессией и уровнем активности. Чем больше депрессия человека, тем меньше его занятость.

Существует еще и третья взаимосвязь в корреляционном исследовании. Две переменные могут быть не взаимосвязаны, то есть между ними не существует последовательной взаимосвязи. Когда число одной переменной возрастает, показатели другой переменной иногда возрастают, иногда уменьшаются. Исследования обнаружили, например, что депрессия и интеллект не зависят друг от друга.

Кроме знания направленности корреляции исследователям нужно знать ее величину или силу. То есть насколько близко эти две переменные соотносятся между собой. Действительно ли одна переменная всегда зависит от другой или их взаимосвязь менее определенна? Когда обнаруживается тесная взаимосвязь двух переменных у многих испытуемых, то говорят, что корреляция - высокая или устойчивая.

Направленность и величина корреляции часто имеет численное значение и выражается в статистическом понятии - Коэффициенте корреляции ( R ). Коэффициент корреляции может варьироваться от +1.00, показывающего полную позитивную корреляцию между двумя переменными, и до -1.00 - этот коэффициент указывает на полную негативную корреляцию. Знак коэффициента (+ или -) обозначает направленность корреляции; число представляет ее величину. Чем ближе коэффициент к 0, тем слабее корреляция и меньше ее величина. Так корреляции +0.75 и -0.75 имеют одинаковые величины, а корреляция +.25 слабее и той и другой корреляции.

Коэффициент корреляции ( R ) - Статистический термин, указывающий направленность и величину корреляции, колеблющийся от -1.00 до +1.00.

Поведение людей меняется, и многие человеческие реакции можно оценивать лишь приблизительно. Поэтому в психологических исследованиях корреляции не достигают величины полной позитивной или полной негативной корреляции. В одном исследовании стресса и депрессии, проводившемся с 68 взрослыми, корреляция между двумя переменными составила +0.53 (Miller et al., 1976). Несмотря на то, что эту корреляцию едва ли можно назвать абсолютной, ее величина в психологическом исследовании считается большой.

Чтобы преодолеть ограничения метода клинических случаев, исследователи личности часто используют альтернативную стратегию, известную как корреляционный метод . Этот метод стремится установить взаимосвязи между событиями (переменными) и внутри них. Переменная - любая величина, которая может быть измерена и чье количественное выражение может варьировать в переделах того или иного континуума. Например, тревожность - переменная, потому что ее можно измерить (с помощью шкалы самооценки тревоги) и потому что люди различаются по степени выраженности у них тревожности. Сходным образом точность выполнения задания, требующего определенного навыка, тоже является переменной, которую можно измерить. Корреляционное исследование можно провести, просто измерив уровень тревожности у некоторого числа людей, а также уровень точности действий каждого из них при выполнении группой сложного задания. Если опубликованные результаты подтвердятся в другом исследовании, то можно будет считать, что субъекты с более низкими показателями тревожности имеют более высокие показатели точности выполнения задания. Поскольку на точность выполнения задания, вероятно, влияют и другие факторы (например, прежний опыт его выполнения, мотивация, интеллект), связь между точностью действий и тревожностью не будет безупречной, но она будет заслуживать внимания.

Переменными в корреляционном исследовании могут быть данные тестирования, демографические характеристики (такие как возраст, порядок рождения и социально - экономический статус), результаты измерения черт характера по методу самооценки, мотивы, ценности и установки, физиологические реакции (такие как частота сердечных сокращений, артериальное давление и кожно - гальваническая реакция), а также стили поведения. При использовании корреляционного метода психологи хотят получить ответы на такие специфические вопросы, как: влияет ли высшее образование на профессиональный успех в будущем? имеет ли отношение стресс к коронарной болезни сердца? есть ли взаимосвязь между самооценкой и одиночеством? есть ли связь между порядковым номером рождения и мотивацией достижения? Корреляционный метод не только позволяет ответить «да» или «нет» на эти вопросы, но также дать количественную оценку соответствия значений одной переменной значениям другой переменной. Для решения этой задачи психологи вычисляют статистический индекс, называемый коэффициентом корреляции (известен также как коэффициент линейной корреляции по Пирсону). Коэффициент корреляции (обозначается маленькой буквой r ) показывает нам две вещи: 1) степень зависимости двух переменных и 2) направление этой зависимости (прямая или обратная зависимость).

Численное значение коэффициента корреляции варьирует от–1 (полностью отрицательная, или обратная зависимость) через 0 (отсутствие связи) до +1 (полностью положительная, или прямая зависимость). Коэффициент, близкий по значению к нулю, означает, что две измеряемые переменные не связаны сколько - нибудь заметным образом. То есть большие или малые значения переменной X не имеют значимой связи с большими или малыми значениями переменной Y . В качестве примера приведем связь между двумя переменными: массой тела и интеллектом. В целом, полные люди не являются значимо более интеллектуальными или значимо менее интеллектуальными, чем более худощавые люди. И, наоборот, коэффициент корреляции +1 или–1 говорит о полном, однозначном соответствии между двумя переменными. Корреляции, близкие к полным, почти никогда не встречаются в исследовании личности, и это заставляет предположить, что хотя многие психологические переменные и связаны друг с другом, степень связи между ними не является столь уж сильной. Значение коэффициента корреляции в пределах между ±0,30 и ±0,60 является общераспространенным в исследовании личности и представляет практическую и теоретическую ценность для научного прогнозирования. К значениям коэффициента корреляции между 0 и ±0,30 следует относиться с осторожностью - их ценность для научных предсказаний минимальна. На рис. 2–2 представлены графики распределения значений двух переменных при двух различных значениях коэффициента корреляции. По горизонтали расположены значения одной переменной, а по вертикали - другой. Каждая точка означает баллы, полученные одним испытуемым по двум переменным.

Рис. 2–2. Каждая из диаграмм иллюстрирует различную степень зависимости значений двух переменных. Каждая точка па диаграмме представляет собой показатели испытуемого по двум переменным: a - полная положительная корреляция (r = +1); b - полная отрицательная корреляция (r = -1); с - умеренная положительная корреляция (r = +0,71); d - корреляция отсутствует (r = 0).

Положительная корреляция означает, что большие значения одной переменной имеют тенденцию быть связанными с большими значениями другой переменной или малые значения одной переменной - с малыми значениями другой переменной. Другими словами, две переменные увеличиваются или уменьшаются вместе. Например, существует положительная корреляция между ростом и массой тела людей. В целом, у более высоких людей есть тенденция иметь большую массу тела, чем у более низких. Другой пример положительной корреляции - связь между количеством сцен насилия, которые видят дети в телевизионных передачах и их тенденцией вести себя агрессивно. В среднем, чем чаще дети наблюдают насилие по телевизору, тем чаще они демонстрируют агрессивное поведение. Отрицательная корреляция означает, что высокие значения одной переменной связаны с низкими значениями другой переменной и наоборот.

Примером отрицательной корреляции может служить связь между частотой отсутствия студентов в аудитории и успешностью сдачи ими экзаменов. В целом, студенты, имевшие большее количество пропущенных занятий, проявляют тенденцию к получению более низких оценок на экзаменах. Студенты, имевшие меньшее количество пропусков, получали более высокие экзаменационные баллы. Другой пример - отрицательная корреляция между робостью и напористым поведением. Лица, получившие высокие баллы по показателю робости, имели склонность к нерешительному поведению, в то время как лица с низкими показателями робости проявляли себя решительными и напористыми. Чем ближе значение коэффициента корреляции к +1 или к–1, тем сильнее связь между двумя изучаемыми переменными. Так, коэффициент корреляции +0,80 отражает наличие более сильной зависимости между двумя переменными, чем коэффициент корреляции +0,30. Сходным образом, коэффициент корреляции–0,65 отражает более сильную взаимосвязь переменных, чем коэффициент корреляции–0,25. Надо иметь в виду, что величина корреляции зависит только от числового значения коэффициента, в то время как знак «+» или «-», стоящий перед коэффициентом, просто обозначает положительная это корреляция или отрицательная. Так, значение r = +0,70 отражает наличие такой же сильной зависимости, как и значение r = -0,70. Но первый пример указывает на положительную зависимость, а второй - на отрицательную. Далее, коэффициент корреляции–0,55 указывает на более сильную зависимость, чем коэффициент корреляции +0,35. Понимание этих аспектов корреляционной статистики поможет вам оценивать результаты исследований такого рода.

Оценка корреляционного метода

Корреляционный метод обладает некоторыми уникальными преимуществами. Наиболее важным является то, что он позволяет исследователям изучать большой набор переменных, которые недоступны проверке с помощью экспериментальных исследований. Например, когда речь идет об установлении связи между сексуальным насилием, перенесенным в детстве, и эмоциональными проблемами в более поздние годы жизни, корреляционный анализ может стать единственным этически приемлемым способом исследования. Аналогично, чтобы изучить, как демократический и авторитарный стили родительского воспитания соотносятся с ценностными ориентациями человека, стоит выбрать этот метод, поскольку этические соображения не дают возможности экспериментально контролировать стиль родительского воспитания.

Второе преимущество корреляционного метода состоит в том, что он дает возможность изучать многие аспекты личности в естественных условиях реальной жизни. Например, если мы хотим оценить влияние развода родителей на адаптацию и поведение детей в школе, мы должны систематически отслеживать социальные и академические успехи детей из распавшихся семей в течение определенного периода времени. Проведение подобного естественного наблюдения потребует времени и усилий, но позволит дать вполне реалистичную оценку сложного поведения. По этой причине корреляционный метод является предпочтительной исследовательской стратегией для персонологов, заинтересованных в изучении индивидуальных различий и феноменов, поддающихся экспериментальному контролю. Третье преимущество корреляционного метода заключается в том, что иногда с его помощью становится возможным предсказать некое событие, зная другое. Например, в исследовании получена умеренно высокая положительная корреляция между оценками по SAT у старшеклассников и их же оценками, полученными позднее в колледже (Hargadon, 1981). Поэтому, зная баллы студентов по SAT, приемная комиссия в колледже может достаточно точно предсказать их последующую успеваемость. Подобные предсказания никогда не бывают совершенными, но часто оказываются полезными для решения вопроса о приеме в учебное заведение. Тем не менее, все исследователи личности признают два серьезных недостатка этой стратегии. Во - первых, применение корреляционного метода не позволяет исследователям выделять причинно - следственные отношения. Суть проблемы состоит в том, что корреляционное исследование не может дать окончательное заключение о том, что две переменные причинно связаны . Например, во многих корреляционных исследованиях подтверждается связь между просмотром телевизионных программ с эпизодами насилия и агрессивным поведением у части детей и взрослых зрителей (Freedman, 1988; Huston, Wright, 1982). Какой вывод можно сделать из этих работ? Одно из возможных заключений таково: просмотр в течение длительного времени сцен насилия по телевидению ведет к возрастанию у зрителя агрессивных побуждений. Но возможен и противоположный вывод: агрессивные по складу своего характера субъекты или те, кто совершали агрессивные действия, предпочитают смотреть телевизионные программы со сценами насилия. К сожалению, корреляционный метод не позволяет установить, какое из этих двух объяснений верно. В то же время, корреляционные исследования, в которых устанавливается сильная корреляционная зависимость между значениями двух переменных, поднимает вопрос о возможности наличия причинно обусловленной связи между этими переменными. Что касается, например, связи между просмотром сцен насилия по телевидению и агрессией, то экспериментальное исследование, проведенное вслед за полученными результатами корреляционного анализа, привело ученых к заключению, что экспозиция программ, содержащих сцены насилия, может быть причиной агрессивного поведения (Eron, 1987).

Второй недостаток корреляционного метода - возможная путаница, вызванная действием третьей переменной. Для иллюстрации рассмотрим зависимость между употреблением наркотиков подростками и их родителями. Означает ли наличие корреляционной зависимости, что подростки, видя, как родители принимают наркотики, сами начинают употреблять их в еще большем количестве? Или это значит, что беспокойство при виде того, как их дети - подростки принимают наркотики, заставляет самих родителей прибегать к наркотикам, чтобы тем самым уменьшить свою тревогу? Или какой - то третий фактор сходным образом толкает подростков и взрослых к употреблению наркотиков? Может быть, подростки и их родители принимают наркотики, чтобы смириться с угнетающей нищетой, в которой они живут? То есть истинной причиной, обусловливающей наркоманию, может быть социально - экономический статус семей (например, бедность). Вероятность того, что третья переменная, которая не измеряется и о которой, может быть, даже и не подозревают, в действительности оказывает причинное влияние на обе измеряемые переменные, нельзя исключать при интерпретации результатов, полученных с помощью корреляционного метода.

Хотя корреляционный метод не предполагает установления причинно - следственной связи, из этого не следует, что причинно - следственные отношения в определенных случаях не могут быть четко установлены. Последнее особенно верно в отношении лонгитюдных корреляционных исследований - где, например, интересующие нас переменные, измеренные в одно время, коррелируют с другими переменными, о которых известно, что они появляются вслед за первыми. Рассмотрим, например, хорошо известную положительную корреляцию между курением сигарет и раком легких. Несмотря на возможность того, что какая - то третья неизвестная переменная (например, генетическая предрасположенность) может служить причиной и курения, и рака легких, мало кто сомневается, что весьма вероятная причина рака - курение, так как по времени курение предшествует заболеванию раком легких. Подобная стратегия (измерение двух переменных, разделенное определенным промежутком времени) дает возможность исследователям устанавливать причинно - следственные отношения в случаях, когда невозможно провести эксперимент. Например, на основе клинических наблюдений исследователи в течение долгого времени подозревали, что хронический стресс способствует развитию многих физиологических и психологических проблем. Недавние работы по измерению силы стресса (с использованием шкал самооценки) позволили проверить эти предположения с применением корреляционного метода. В области физиологических расстройств, например, накопленные данные свидетельствуют о следующем: стресс значимо связан с возникновением и развитием сердечно - сосудистых заболеваний, диабета, рака и различных типов инфекционных заболеваний (Elliott, Eisdorfer, 1982; Friedman, Booth - Kelley, 1987; Jemmott, Locke, 1984; Smith, Anderson, 1986; Williams, Deffenbacher, 1983). Корреляционный анализ также показал, что стресс может способствовать формированию зависимости от наркотиков (Newcomb, Harlow, 1986), сексуальных расстройств (Malatesta, Adams, 1984), а также возникновению многочисленных психических нарушений (Neufeld, Mothersill, 1980). Тем не менее, критики корреляционного подхода справедливо замечают, что могут существовать и другие факторы, искусственно усиливающие предположительную связь между стрессом и болезнью (Schroeder, Costa, 1984). Таким образом, одно предостережение остается: хотя иногда при наличии сильной корреляционной зависимости между двумя переменными напрашивается вывод о наличии причинной связи между ними, в действительности установить причинно - следственные отношения можно только экспериментальными методами.



В продолжение темы:
Штукатурка

Что такое злаки, знает каждый. Ведь человек начал выращивать эти растения более 10 тысяч лет назад. Поэтому и сейчас такие названия злаков, как пшеница, рожь, ячмень, рис,...

Новые статьи
/
Популярные