.RU
Карта сайта

5. МЕРЫ СВЯЗИ: ОСНОВАННЫЕ НА МОДЕЛИ ПРОГНОЗА И РАНГОВЫЕ - Программа «Высшее образование»


^ 5. МЕРЫ СВЯЗИ: ОСНОВАННЫЕ НА МОДЕЛИ ПРОГНОЗА И РАНГОВЫЕ


Модальныге мерыг Гуттмана. Сравнение распределений посредством мерыг Л. Гудмена и Е. Краскала. Когда социолог имеет дело с ранжированными рядами? Принцип сравнения ранжированных рядов. Связанныге ранги. Коэффициенты ранговой корреляции Д. Гудмена и Е. Краскала, Р. Сомерса, М. Дж. Кендалла.
Вначале мы приведем примеры коэффициентов связи для признаков, имеющих по-прежнему номинальный уровень измерения. Особое внимание к такого рода мерам вполне оправданно. Специфика социологически данны такова, что социолог в основном работает с номинальным уровнем измерения. Исключение составляют первый (государственная статистика) и третий (бюджеты времени) типы социологической информации. Как и раньше, в качестве примера рассматриваем связь между будущей профессией студента и удовлетворенностью учебой. Это несмотря на то, что второй из них измерен по порядковой шкале. Пока эту упорядоченность никак не используем. Социологу приходится часто так поступать, ибо он всегда работает с эмпирией в ситуации разнотипности шкал. Мер, учитывающих эту разнотипность, мало, и они не всегда удовлетворяют потребностям социолога. В силу этого при одится намеренно идти на «огрубление» данны и работать в ситуации номинального уровня измерения даже тогда, когда речь идет о порядковы и «метрически » шкалах. Следует вас предостеречь. Во многих работах, упомянутыгх в списке литературыг, содержатся разного рода неточности и некоторыге ошибки в написании формул. Поэтому при самостоятельном изучении следует перепроверять формулыг, сравнивая их с аналогичными из других источников.
Прежде всего рассмотрим меры, основанные на так называемой модели прогноза. Это уже как бы другой «язык» анализа таблиц со­пряженности. Для социолога понятие «прогноз» носит не только мно­гозначный арактер, но к этому понятию отношение очень осторожное и трепетное. Если на основе эмпирически данны и можно что-то прогнозировать, предсказывать, то в достаточно узком смысле понимания прогноза. При этом ход рассуждений примерно такой. Если ничего не изменится, то может быть то-то и то-то. Социологи-математики (такие тоже есть) термин «прогноз, предсказание» употребляют в еще более узком смысле, но очень часто [4, 5]. Мы также будем пользоваться понятием «прогноз» в очень узком смысле. Попробуем коротко и грубо прояснить, в каком смысле.
У нас с вами есть одномерное распределение какого-то признака. Напоминаем, что под признаком понимаем как отдельно взятый эмпирический индикатор (наблюдаемый признак), так и производный от эмпирических индикаторов показатель. Пусть таковым признаком будет удовлетворенность учебой (У). Распределение этого признака можем интерпретировать следующим образом. Есть значения признака (различные степени удовлетворенности учебой), и есть вероятности этих значений (относительные частоты в долях или частости). А, точнее, оценки вероятности, полученные по выборке. Все, что рассчитывается по выборочной совокупности, называется

оценками истинныгх

(существующих для изучаемой генеральной совокупности)

значений.

Разумеется, социолог может опускать термин «оценка», если понимает, о чем идет речь. Для простоты мы будем поступать так же.
Итак, наши вероятности P0j равны маргинальным частотам по столбцам (именно они соответствуют признаку (У) — удовлетворенность учебой), деленным на общее число опрошенны студентов-гуманитариев
no-
(n00). В виде формулы это выглядит так: P0;. = —-. Тогда, по приведенной
ниже таблице 3.5.1 (это та же таблица сопряженности, с которой мы постоянно работаем), вероятности пяти степеней удовлетворенности учебой равны:

р} = 200 /1000 = 0.2; /^ = 300/1000 = 0.3; Ρ =200/1000 = 0.2; р =250/1000 = 0.25; Ό =50/1000 = 0.05


Эти вероятности можно интерпретировать как вероятности

статистического предсказания (У).

Мы же их получили по «хорошей» выборке. Поэтому если из нашей изучаемой генеральной совокупности студентов-гуманитариев случайно выберем некоторого студента, то вероятность того, что у этого случайного студента окажется максимальная удовлетворенность учебой, очень мала. Это потому, что по выборке она была равна всего лишь 0,05. Вероятность «отгадать» все остальные варианты удовлетворенности учебой тоже невелика ибо они, как видите, не больше, чем 0,3. При этом само понятие «вероятность» можно трактовать на уровне обыденного сознания. Только в повседневной жизни вам обычно говорят, например, «вероятность того, что у меня завтра будет плохое настроение для прогулки, равна 90%» или «вероятность того, что я завтра приду к тебе в гости, меньше 50%» или «вероятность нашей возможной встречи «фифти - фифти» (50 на 50)». И вы всегда понимаете, что сие озна­чает. При этом такие суждения вы интерпретируете не столько ко­личественно, сколько качественно. А в математических формулах пользуются не процентами для оценки вероятности, а долями — частостями — и, соответственно, вероятность принимает вполне конкретное значение из интервала от 0 до 1.
Теперь вполне правомерно поставить вопрос:

^ Как изменятся рассчитанные нами вероятности иметь ту или иную степень удовлетворенности учебой, если привлечь к анализу второй признак


(будущую профессию студента)? Можно вопрос поставить и по-другому:

Насколько знание будущей профессии прибавит знания об удовлетворенности учебой? Или: Насколько информация о будущей профессии изменит информацию об удовлетворенности учебой?

Поиск ответа на последний вопрос порождает меры связи, основанные на понятии

энтропии

(мы касались этого понятия при введении качественных коэффициентов вариации). Такого рода меры мы не будем рассматривать. Вы можете с ними познакомиться в работах [3, 8, 11].
Первый наш вопрос можно поставить и так:

Как и насколько изменятся вероятности предсказания удовлетворенности учебой, если учесть будущую профессию?

Как вы уже догадываетесь, по сути речь идет о знании условны распределений нашего признака (У) или условны частот, или условны вероятностей, т. е. вероятностей, которые логично обозначить как Р.... Индекс первый (j) относится к столбцам, т. е. к удовлетворенности учебой (признак У), второй (i) относится к строкам, т. е. к будущей профессии (признак X), а косая черта подчеркивает, что признак (X) является условием.
Существуют всевозможные коэффициенты, помогающие найти ответ на подобные вопросы. Как видно из наших рассуждений, они должны быть

направленными

и носить, так же как и меры, основанные на хи-квадрат, арактер

«глобал ный»,

т. е. давать оценку связи в целом для всей таблицы сопряженности в отличие от локальны мер (связь отдельны свойств).
Если для кого-то термин «предсказание» остался пока непонятым, то при описании предлагаемых ниже мер как можно реже будем пользоваться этим термином.

Меры λ (лямбда) Л. Гуттмана (L. Guttmann)


Таки мер три, две из ни направленные, а одна представляет собой усреднение первых двух. Мы приведем только одну λ^. Эта мера, этот коэффициент характеризует в случае нашей задачи влияние будущей профессии (X) на удовлетворенность учебой (У). Отвечает на вопрос, насколько изменяется предсказание (У) при знании (X). Ниже приводится формула, в которой используются известные вам обозначения, за исключением:
Пщгах — максимальная частота в i-й строке:
потах — максимальная частота среди маргинальных частот по столбцам.

Π

ni max - n0max
λ/ χ
П00 n0
Эта формула была бы понятнее, если вместо частот использовать частости (доли), интерпретируемые как вероятности [11, с. 126]. Такую формулу мы не будем приводить, чтобы не пугать излишними формулами. Отметим лишь, что в литературе приводится как формула, записанная через абсолютные частоты, так и через частости. Кроме того, фамилия Гуттмана тоже приводится по-разному. Например, Гудман в работе 8, с. 131. Это не так уж важно.
Для того чтобы пояснить содержательный смысл этой меры, этого коэффициента, ниже приводится та же таблица сопряженности, с которой мы постоянно работаем для изучения взаимосвязи между «будущей профессией студента» (признак X) и «удовлетворенностью учебой» (признак У). Таблица 3.5.1 содержит те же частоты, что и таблица 3.3.1, за исключением обозначений самих частот. В нее добавлен новый столбец — последний с максимальными частотами по всем строкам, включая строку с маргинальными частотами по столбцам. Они нам необходимы для вычисления коэффициента Ху/х Гуттмана.
^

Таблица 3.5.1 Таблица сопряженности двух признаков (У) и (X),



: Будущая профессия


студента (X)



^ Степени удовлетворенности учебой (У)



Марги­нальные частоты по строкам

Но

Максималь­ные чистоты но строкам


VI) ьш

1



2



3



4



5



1 .Политолог



14



20



31



30



5



100



0|

шач

=31



2.Соииолог



30



40



60



60



10



200





3.Культуролог



90



90



60



45



15



300



П1тл1

=90



4.Филолог



31



30



19



15



5



100



mix

=31



5.Психолог



а

10



15



15



2



50



П5льи

=15



б.Историк



27



110



15



85



13



150





Маргиналь­ные частоты по столбцам

Hi,

200



300



200



250



50



Ни,

=1000




2014-07-19 18:44
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • © sanaalar.ru
    Образовательные документы для студентов.