.RU
Карта сайта

Типологическая группировка - 1. Предмет и метод статистической науки


^ Типологическая группировка

– это разделение исследуемой качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки. Примером является группировка промышленных предприятий по формам собственности.
При проведении типологической группировки основное внимание должно быть уделено идентификации типов социально-экономических явлений.

Структурной

называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку.

Аналитическая

группировка выявляет взаимосвязи между изучаемыми явлениями и их признаками.

Важным моментом при выборе группировочного признака является необходимость учета изменившихся обстоятельств, в которых действует то или иное явление. Принцип соблюдения условия места и времени здесь должен выполняться.
Процесс построения группировок состоит из следующих этапов.

^ Группировочным признаком

называется признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки.
В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, возраст человека и т.д.), а вторые отражают состояние единицы совокупности (пол человека, национальность, и т.д.)
Всю совокупность признаков можно разделить на две группы: факторные и результативные.

Факторными

называются признаки, под воздействием которых изменяются другие признаки и образуют группу

результативных

признаков.

Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности. Степени вариации признака.
При построении группировки по качественному признаку групп будет столько, сколько имеется градаций, видов, состояний у этого признака (пол – 2, регионов России – 89 и т.д.).
Если группировка проводится по количественному признаку, то необходимо обратить внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.
Чем больше колеблемость группировочного признака, тем больше следует образовать групп.
Если распределение признака условно равномерно, то для определения количества групп используется формула Стерджесса:

Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.

Интервал

– значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей называется наименьшее значение признака в интервале, а верхней – наибольшее значение признака в нем.

Величина интервала

– разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с

равными интервалами

.
Величина равного интервала определяется по следующей формуле:

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения (крайние точки).
Полученная величина является шагом интервала.

^ Открытые интервалы

– те, у которых указана только одна граница.

Закрытые интервалы

– те, у которых обозначены обе границы.
Ширина открытого интервала принимается равной ширине соседнего с ним закрытого интервала.

Статистический ряд распределения

– это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.
В зависимости от признака, положенного в основу группировки различают атрибутивные и вариационные ряды распределения.

Атрибутивными

называют ряды, построенные по качественным признакам.

Вариационными

рядами называют ряды распределения, построенные по количественному признаку. Каждый вариационный ряд состоит из двух элементов: вариантов и частот.

Вариантами

считаются отдельные значения признака, которые он принимает в вариационном ряду, т.е. конкретное значение варьирующего признака.

Частоты

– это численности отдельных вариантов или каждой группы вариационного ряда, показывающие, как часто встречается та или иная варианта в ряду.

Частостями

называют частоты, выраженные в процентах или долях единицы.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды. В случае дискретной вариации величина количественного признака принимает только целые значения. В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения.

Статистической

называется таблица, которая содержит числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа.
По логическому содержанию таблица представляет собой статистическое предложение. Подлежащим статистической таблицы называется объект, характеризующийся цифрами. Обычно подлежащее располагается в левой части таблицы, в наименовании строк. Сказуемое статистической таблицы образует система показателей, которыми характеризуется подлежащее (объект изучения). Сказуемое формирует верхние заголовки и составляет содержание граф.

По разработке сказуемого различают таблицы с простой и сложной разработкой сказуемого. При простой разработке сказуемого показатель, определяющий его, не подразделяется на подгруппы, и итоговые значения получаются путем простого суммирования значений по каждому признаку отдельно, независимо друг от друга.
Сложная разработка сказуемого предполагает деление признака на формирующие его подгруппы.
Исследователь при построении статистических таблиц должен руководствоваться оптимальным соотношением показателей сказуемого и учитывать как положительные, так и отрицательные моменты сложной разработки показателей сказуемого.

Приемы, определяющие технику формирования статистических таблиц.



  1. Таблица должна быть компактной и содержать только те исходные данные, которые непосредственно отражают исследуемое социально-экономическое явление в статике и динамике и необходимы для познания его сущности. Цифровой материал необходимо представлять таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева направо и сверху вниз.

  2. Заголовки таблицы, граф и строк пишутся полностью, без сокращений.

  3. Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой.

  4. Для того чтобы легче читать и анализировать достаточно большие таблицы (по количеству приведенных строк), целесообразно оставлять двойной промежуток после каждых пяти (и далее кратных пяти)строк.

  5. Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то

    им

    необходимо присвоить общий объединяющий заголовок.Данный прием используется и для подлежащего, и для сказуемого таблиц.

  6. Графы и строки полезно нумеровать.

  7. Взаимосвязанные и взаимозависимые данные, характеризующие одну из сторон анализируемого явления, целесообразно располагать в соседних друг с другом графах.

  8. Графы и строки должны содержать единицы измерения

  9. Лучше всего располагать в таблицах сопоставляемую в ходе анализа цифровую информацию в одной и той же графе, одну под другой, что значительно облегчает процесс их сравнения.

  10. Для удобства работы числа в таблицах следует представлять в середине граф, одно под другим: единицы под единицами, запятая под запятой, четко соблюдая при этом

    их

    разрядность.

  11. По возможности числа целесообразно округлять.

  12. Отсутствие данных об анализируемом социально-экономическом явлении может быть обусловлено различными причинами, что по-разному отмечается в таблице

  13. В случае необходимости дополнительной информации - разъяснений к таблице могут даваться примечания.

4.Графический метод в изучении экономической деятельности.



Графический метод есть метод условных изображений статистических данных при помощи геометрических фигур, линий, точек и разнообразных символических образов. Главное достоинство статистических графиков - наглядность. Графики являются незаменимым средством обобщения статистических данных, подведения итогов сложных исследований и выявления связи между явлениями. Для построения графика необходимо определить, для каких целей он составляется, и тщательно изучить исходный материал. Но самое главное условие - это овладение методологией графических изображений.

Графический образ

- это символические знаки, с помощью которых изображаются статистические данные: линии, точки, плоские геометрические фигуры (прямоугольники, квадраты, круги и т.д.).В качестве графического образа выступают и объемные фигуры. Иногда в графиках используются и негеометрические фигуры в виде силуэтов или рисунков предметов.

Полем графика

является место, на котором он выполняется. Это листы бумаги, географические карты, план местности и т.п. Принято считать, что наиболее оптимальным для зрительного восприятия является график, выполненный на поле прямоугольной формы с соотношением сторон 1:1,3 до 1:1,5; этот вариант именуется правилом «золотого сечения».

Пространственные ориентиры

графика задаются в виде системы координатных сеток. Система координат необходима для размещения геометрических знаков в поле графика. Наиболее распространенной является система прямоугольных координат.

Масштабные ориентиры

статистического графика определяются масштабом и системой масштабных шкал. Масштаб статистического графика - это мера перевода числовой величины в графическую. Масштабной шкалой называется линия, отдельные точки которой могут быть прочитаны как определенные числа. Шкала имеет большое значение в графике и включает три элемента: линию (или носитель шкалы); определенное число помеченных черточками точек; цифровое обозначение чисел, соответствующих отдельным помеченным точкам. Различают шкалы прямолинейные (например, миллиметровая линейка) и криволинейные - дуговые и круговые (циферблат часов). Масштабом равномерной шкалы называется

длина отрезка.
Последний элемент графика -

экспликация

. Каждый график должен иметь словесное описание его содержания. Описание включает, название графика, которое в краткой форме передает его содержание; надписи вдоль масштабных шкал и пояснения к отдельным частям графика.

Статистический график

– это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблиц в виде графика производит более сильное впечатление, чем цифры, значительно облегчает понимание статистического материала, делает его наглядным и доступным.
С появлением ПЭВМ построение графических изображений стало технически достаточно просто. Однако для проведения графического анализа необходимо правильно сконструировать графические изображения, хорошо знать изучаемые явления и учитывать:
^ Назначение графиков. Они могут быть использованы для различных целей, и, в зависимости от этого подбирают, его величину, характер линий, цвет, вид штрихования, которые должны гармонически сочетаться между собой.
^ Цель графиков. Очень часто цель их – наглядно представить результаты исследования, в других случаях – подчеркнуть известные закономерности, иллюстрировать новые открытые факты, обосновать новые гипотезы. 

Существует множество видов графических изображений

.

Их классификация основана на ряде признаков, в основе которых;

Классификация статистических графиков по форме графического образа:

По способу построения статистические графики делятся на диаграммы и статистические карты.

Диаграммы - наиболее распространенный способ графических изображений.

  1. Диаграмма сравнения. Наиболее распространенными диаграммами сравнения являются столбиковые диаграммы. Это графическое изображение статистических показателей в виде столбиков-прямоугольников. Данные диаграммы широко используются для наглядного сравнения объектов изучаемых явлений во времени и пространстве, а также для изображения структуры явлений. Разновидность столбиковых диаграмм составляют так называемые

    ленточные, или полосовые, диаграммы.

    Их отличие состоит в том, что масштабная шкала расположена по горизонтали сверху

    или

    снизу и она определяет величину полос по длине. Разновидностью столбиковых (ленточных) диаграмм являются направленные диаграммы. Они отличаются от обычных двусторонним расположением столбиков или полос и имеют начало отсчета по масштабу в середине. К группе двусторонних относятся диаграммы числовых отклонений. В них полосы направлены в обе стороны от вертикальной нулевой линии; вправо - для прироста; влево – для уменьшения. Прямоугольные диаграммы (не квадраты!) находят себе применение при графическом изображении, главным образом для двумасштабных сравнений: один масштаб для основания, другой - для высоты. Эти диаграммы называются знаками Варзара.

  2. Структурные диаграммы. Основное назначение структурных диаграмм заключается в наглядной иллюстрации структуры какого-либо явления, характеристике удельных весов отдельных частей целого, выявлении структурных сдвигов. В качестве графического образа для изображения структуры совокупностей применяются прямоугольники - для построения столбиковых и полосовых диаграмм и круги - для построения секторных диаграмм.

  3. Диаграммы динамики. Для построения линейных графиков применяют систему прямоугольных координат. Обычно по оси абсцисс откладывают время (годы, месяцы и т.д. ), а по оси ординат - размеры изображаемых явлений или процессов. На оси ординат наносят масштабы. Полулогарифмической сеткой называется сетка, в которой на одной оси нанесен линейный масштаб, а на другой – логарифмический. Замкнутые диаграммы отражают внутригодичный цикл динамики какого-либо одного года. Спиральные диаграммы показывают внутригодичный цикл динамики за ряд лет. Среди различных видов графиков особое место занимает кривая, именуемая моделью Лоренца, или кривой Лоренца. Данная кривая дает , возможность графически изобразить уровень концентрации явления.

Статистические карты представляют собой вид графических изображений статистических данных на схематической географической карте и характеризуют уровень или степень распространения того или иного явления на определенной территории.
Картограмма - это схематическая географическая карта, на которой штриховкой различной густоты, точками или окраской определенной степени насыщенности показывается сравнительная интенсивность какого-либо показателя в пределах каждой единицы нанесенного на карту территориального деления (например, плотность населения по областям или республикам, распределение районов по урожайности зерновых культур и т.п.). Картограммы делятся на фоновые и точечные.
^ Картограмма фоновая - вид картограммы, на которой штриховкой различной густоты или окраской определенной степени насыщенности показывают интенсивность какого-либо показателя в пределах территориальной единицы.
^ Картограмма точечная - вид картограммы, где уровень выбранного явления изображается с помощью точек. Точка изображает одну единицу совокупности или некоторое их количество, показывая на географической карте плотность или частоту проявления определенного признака.

^ 5. Обобщающие статистические показатели.



Статистический показатель

– количественная характеристика социально-экономических явлений и процессов в условиях качественной определенности.

^ Система статистических показателей

– это совокупность взаимосвязанных показателей, имеющая одноуровневую или многоуровневую структуру и нацеленная на решение конкретной статистической задачи.
Различают конкретный статистический показатель и показатель категорию.

Конкретный статистический показатель

характеризует размер, величину изучаемого явления или процесса в определенном месте и определенном времени.

Показатель-категория

отражает сущность, общие отличительные свойства конкретных статистических показателей одного и того же вида без указания места и времени.
По охвату единиц совокупности все показатели делят на индивидуальные и сводные.

Индивидуальные показатели

характеризуют один объект или одну единицу совокупности.

Сводные показатели

характеризуют группу совокупности или всю совокупность в целом. Сводные показатели делятся на объемные и расчетные. Объемные показатели получают путем сложения значение признака отдельных единиц совокупности. Расчетные показатели определяются по различным формулам.
По форме выражения статистические показатели подразделяются на абсолютные, относительные и средние.

Моментные показатели

– показатели на определенную дату.

^ Интервальные показатели

– показатели за определенный период времени.
В зависимости от принадлежности к одному или двум объектам изучения различают однообъектные и межобъектные. С точки зрения пространственной определенности статистические показатели подразделяют на общетерриториальные (характеризует изучаемый объект или явление в целом по стране), региональные и местные (локальные).

Абсолютные показатели

отражают физические размеры изучаемых статистикой процессов и явлений, а именно их массу, площадь, объем, протяженность, временные характеристики. Всегда являются именованными числами. Выражаются в натуральных, стоимостных или трудовых единицах измерения.
Натуральные единицы – тонны, километры, литры, баррели, штуки.
Условно-натуральные единицы используются когда какой-либо продукт имеет несколько разновидностей и общий объем можно определить только исходя из общего для всех разновидностей потребительского свойства. Перевод в условные единицы осуществляется на основе специальных коэффициентов, рассчитываемых как отношение потребительских свойств отдельных разновидностей продукта к эталонному значению.
Стоимостные единицы измерения дают денежную оценку социально-экономическим явлениям (стоимость ВВП). Трудовые единицы измерения позволяют учитывать общие затраты труда на предприятии и трудоемкость отдельных операций технологического процесса (чел-дни, чел-часы).

^ Индивидуальные абсолютные показатели

получают непосредственно в процессе статистического наблюдения как результат интересующего количественного признака.

^ Сводные объемные абсолютные показатели

получают в результате сводки и группировки индивидуальных значений.

Относительный показатель – результат деления одного абсолютного показателя на другой и выражает соотношение между количественными характеристиками социально-экономических явлений.
Без относительных показателей невозможно измерить интенсивность развития изучаемого явления во времени, оценить уровень развития одного явления на фоне других, взаимосвязанных с ним явлений, осуществить пространственно-территориальные сравнения.
При расчете относительного показателя абсолютный показатель, находящийся в числителе получаемого отношения, называется текущим или сравниваемым, а показатель, находящийся в знаменателе, называется базой сравнения или основой.
Относительные показатели могут выражаться в коэффициентах, процентах, промилле, продецимилле, а могут быть именованными значениями. Проценты используются в тех случаях, когда сравниваемый абсолютный показатель превосходит базисный не более, чем в 2-3 раза. Если же превосходство больше, то используется коэффициент.
Выделяют следующие виды относительных показателей.
1. Относительный показатель динамики (ОПД) – отношение уровня исследуемого процесса или явления за данный период времени и уровня этого же явления в прошлом. ОПД измеряется в процентах, либо выражается в виде коэффициента.
Данная величина показывает во сколько раз текущий уровень больше базисного или какую долю от базисного составляет. Если ОПД выражен кратным отношением, то он представляет собой коэффициент роста. При умножении этого коэффициента на 100 получают темп роста.
2. Относительный показатель плана (ОПП) – отношение планируемого уровня показателя к уже достигнутому показателю в прошлом. ОПП, также как и ОПД, выражается в процентах или в виде коэффициента.
3. Относительный показатель реализации плана (ОПРП) – отношение фактически достигнутого уровня к запланированному уровню показателя. ОПРП также выражается в процентах или в виде коэффициента.
4. Относительный показатель структуры (ОПС) – соотношение структурных частей изучаемого объекта и определяется отношением показателя, характеризующего часть совокупности к показателю, характеризующему всю совокупность. ОПС выражается в долях единицах или в процентах.
5. Относительный показатель координации (ОПК) – соотношение разных частей, принадлежащих одному объекту.
6. Относительный показатель сравнения (ОПСр) – соотношение одноименных абсолютных показателей, характеризующих разные объекты.
7. Относительный показатель интенсивности (ОПИИ) характеризует степень распространения изучаемого процесса или явления в присущей ему среде и определяется отношением показателя, характеризующего явление к показателю, характеризующему среду распространения этого явления. ОПИ измеряются в процентах, промилле, продецимилле. Данный показатель исчисляется, когда абсолютная величина оказывается недостаточной для формулировки обоснованных выводов о масштабах явления. Разновидностью ОПИИ являются показатели уровня экономического развития, характеризующие производство ВВП на душу населения, товарооборот на душу населения и т.д. Показатели уровня экономического развития являются именованными величинами и измеряются в рублях на душу и т.д.

^ 6. Средние величины.



Средняя величина

представляет собой обобщенную количественную характеристику признака статистической совокупности в конкретных условиях места и времени.
Показатель в форме средней величины отражает типичные черты и дает обобщающую характеристику однотипных явлений по одному из варьирующих признаков.

^ Сущность средней

заключается в том, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием основных.
Средняя величина только тогда будет отражать типичный уровень признака, когда она рассчитана по качественно однородной совокупности.

На практике определить среднюю во многих случаях можно через исходное соотношение средней (ИСС) или ее логическую формулу:

Данная формула является основополагающей. В зависимости от того, в каком виде представлены исходные данные для расчета средней, зависит, каким именно образом будет реализовано ее исходное соотношение.
Различают следующие виды средней, каждая из которых может быть простой и взвешенной:

^ 1)Средняя арифметическая простая (не взвешенная)

. Эта форма средней используется в тех случаях, когда расчет осуществляется по не сгруппированным данным.

^ Средняя арифметическая взвешенная

. При расчете средних величин отдельные значения признака могут повторяться, встречаться по нескольку раз. В данном случае расчет проводится по сгруппированным данным или вариационным рядам, которые могут быть дискретными или интервальными.

^ 2)Средняя гармоническая

– это величина, обратная средней арифметической из обратных значений признака. Различают среднюю гармоническую простую и взвешенную.

^ Средняя гармоническая простая

.

Средняя гармоническая взвешенная

применяется тогда, когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение.
Средняя арифметическая и средняя гармоническая величины могут применятся в одних и тех же ситуациях, но по разным данным. Если в ИСС неизвестен числитель, то в расчетах применяется средняя арифметическая величина. Если в ИСС неизвестен знаменатель, то в расчетах используется средняя гармоническая величина.

^ 3)Средняя квадратическая величина

применяется тогда, когда вместо индивидуальных значений признака представлены квадраты исходных величин.

4)Средняя геометрическая

применяется в случаях определения средней по значениям, имеющим большой разброс, либо в случаях определения средней величины по относительным показателям.

^ 5)Средняя степенная.

В математической статистике различные средние выводятся из формул степенной средней:

При z = 1 – средняя арифметическая;
z = 0 – средняя геометрическая;
z = –1 – средняя гармоническая;
z = 2 – средняя квадратическая.
Чем выше z, тем больше значения средней величины.

Характеристиками структуры совокупности являются следующие структурные средние:

1. Мода (Mo)

– величина признака, наиболее часто встречающаяся в совокупности, т.е. имеющая наибольшую численность в ряду распределения.
а) В дискретном ряду распределения мода определяется визуально.
б) В интервальном ряду распределения визуально можно определить только интервал, в котором заключена мода, который называется модальным интервалом. Мода будет равна:

^ 2. Медиана (Me)

– значение признака, приходящееся на середину ранжированного ряда, т.е. делящее ряд распределения на две равные части.
а) В дискретном ряду распределения определяется номер медианы по формуле:

Номер медианы показывает то значение показателя, которое и является медианой.
б) В интервальном ряду распределения медиана рассчитывается по следующей формуле:

^ 7. Показатели вариации.



Вариации

– колеблемость, многообразие, изменяемость величины признака у единиц совокупности.
Измерение вариации позволяет определить степень воздействия на данный признак других варьирующих признаков.
Показатели вариации делятся на абвсолютные и относительные. К абсолютным показателям относятся размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение. К относительным – коэффициенты осцилляции, коэффициенты вариации и относительное линейное отклонение.

Размах вариации

– простейший показатель, разность между максимальным и минимальным значениями признака.

Недостатком является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

^ Среднее линейное отклонение

отражает все колебания варьирующего признака и представляет собой среднюю арифметическую из абсолютных значений отклонений вариант от средней величины, т.к. сумма отклонений значений признака от средней равно 0, то все отклонения берутся по модулю.
Простая
Взвешенная

Дисперсия

– средний квадрат отклонений значений признака от их средней величины.
Невзвешенная формула:
Взвешенная формула:
Наиболее удобным и широко распространенным на практике показателем является С

реднее квадратическое отклонение

. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность, что и изучаемый признак.
Невзвешенная формула:
Взвешенная формула:
Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемой совокупности. В отличие от них,

коэффициент вариации

измеряет колеблемость в относительном выражении, относительно среднего уровня, что во многих случаях является предпочтительнее:

Если коэффициент вариации не превышает 33%, то совокупность по рассматриваемому признаку можно считать однородной.

Относительные показатели.


1) Коэффициент осцилляции


2) Линейный коэффициент вариации



3) Коэффициент вариации


Они определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 %

Дисперсия

– средний квадрат отклонений значений признака от их средней величины.
Невзвешенная формула:
Взвешенная формула:

1

0

Дисперсия постоянной величины равна 0

2

0

Уменьшение всех значений признака на одну и ту же величину А не изменяет величину дисперсии

3

0

Уменьшение всех значений признака в В раз уменьшает дисперсию в В2 раз, а среднее квадратическое отклонение в В раз

Таким образом все значения признака можно разделить на какую-то постоянную величину, затем определить среднее квабратическое отклонение и умножить его на эту постоянную величину
40 Средний квадрат отклонений от любой величины А в той или иной степени отличающейся от средней арифметической всегда будет больше среднего квадрата отклонений, исчисленного от средней арифметической
При этом средний квадрат отклонений будет больше на определенную величину (на квадрат разности средней и условно взятой величины)

50 Дисперсия имеет свойство минимальности; если А=0, то дисперсия вычисляется по формуле:
Между средним линейным отклонением и средним квадратическим отклонением существует примерное соотношение. в том случае, если фактическое распределение близко к нормальному распределению. Как правило
В условиях нормального распределения существует зависимость между величиной среднего квадратического отклонения и количеством наблюдений.
Правило трех
1) В пределах располагается 68,3% количества наблюдений
2) В пределах находится 95,4% количества наблюдений
3) В пределах находится 99,7% количества наблюдений
Отклонения считается максимально возможными

Показатели вариации могут быть использованы не только в анализе изменчивости изучаемого признака, но и для оценки степени воздействия одного признака на вариацию другого признака, т.е. в анализе взаимосвязей между показателями.
При проведении такого анализа совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным и результативным.
Для выявления взаимосвязи исходная совокупность делится на две или более групп по факторному признаку. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. При этом применяется

правило сложения дисперсий

:

- общая дисперсия;
- средняя из внутригрупповых дисперсий;
- межгрупповая дисперсия.

^ Общая дисперсия

измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию.

Межгрупповая дисперсия

отражает ту часть вариации результативного признака, которая обусловлена воздействием факторного признака. Это воздействие проявляется в отклонении групповых средних от общей средней:

где - среднее значение результативного признака по i-ой группе;
- общая средняя по совокупности в целом;
- объем (численность) i-ой группы.
Если факторный признак, по которому производится группировка, не оказывает никакого влияния на результативный признак, то групповые средние будут равны между собой и совпадут с общей средней. В этом случае межгрупповая средняя будет равна нулю.

^ Внутригрупповая дисперсия

отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и независящую от признака фактора, положенного в основание группировки.

^ Средняя из внутригрупповых дисперсий

отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка:

где - дисперсия результативного признака в i-ой группе;
- объем (численность) i-ой группы;

Эмпирический коэффициент детерминации

представляет собой долю межгрупповой дисперсии в общей дисперсии.

Теснота связи между факторным и результативным признаком оценивается на основе

эмпирического корреляционного отношения

:

Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.

Для подробного описания особенностей распределения используются дополнительные характеристики, в частности, определяются моменты распределения.
^ Моментом k-го порядка

называется средняя из k-x степеней отклонений

вариантов х от

некоторой постоянной величины А:


При использовании в качестве весов частот или частостей моменты называются эмпирическими, а при использовании вероятностей — теоретическими.
Эмпирический момент k-го порядка:
1. Начальные моменты (М^) получаются, если постоянная величина А равна нулю (Л = О):
2. Условные и начальные относительно Х0 моменты (тк) получаются при А равном не нулю, а некоторой производной величине Х0

(начало

отсчета):
С помощью условных моментов упрощается расчет основных характеристик ряда распределения. При подстановке различных значений k получаем начальные моменты относительно Хо. Так, например, если k = 1, то:
Из этой формулы вытекает, что х = х0+т1 т.е. средняя арифметическая равна началу отсчета плюс начальный момент первого порядка. Если отклонения i- х0) имеют общий множитель С, то на него можно разделить отклонения, а по окончании вычислить полученный момент, умножив на этот множитель в соответствующей степени, т.е.:
Отсюда следует, что при k = 1 x=x0+m1*C.
3. Центральные моменты (µ k) получаются, если за постоянную величину А

взять среднюю арифметическую (А=х):

Выяснение общего характера распределения предполагает оценку его однородности, а также расчет показателей асимметрии и эксцесса.
При сравнительном изучении асимметрии нескольких распределений с разными единицами измерения вычисляется

относительный показатель асимметрии

:

Его величина может быть положительной (для правосторонней асимметрии) и отрицательной (для левосторонней асимметрии).
Применение данного показателя дает возможность определить не только величину асимметрии, но и проверить ее наличие в генеральной совокупности. Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной. Если асимметрия меньше 0,25, она считается незначительной.
Наличие асимметрии в генеральной совокупности проверяется с помощью определения оценки существенности на основе средней квадратической ошибки:

В случае, если , асимметрия считается существенной и распределение признака в генеральной совокупности несимметрично и неслучайно, а закономерно.
Для симметричных распределений может быть рассчитан показатель эксцесса, который показывает, насколько резкий скачок имеет изучаемое явление. Показатель эксцесса определяется на основе центрального момента четвертого порядка по формуле:

Если показатель эксцесса больше нуля, то распределение островершинное и скачок считается значительным, если коэффициент эксцесса меньше нуля, то распределение считается плосковершинным и скачок считается незначительным. Среднеквадратическая ошибка эксцесса показывает, насколько существенен скачок в явлении и рассчитывается по формуле:


Закономерностями распределения

называются закономерности изменения частот в вариационных рядах.
Основная задача анализа вариационных рядов заключается в выявлении подлинной закономерности распределения путем исключения влияния второстепенных, случайных для данного распределения факторов.
Если увеличить объем совокупности и уменьшить интервал в группах, то графическое изображение приближается к некоторой плавной кривой, которая называется кривой распределения.

^ Кривая распределения

– графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариант.

^ Теоретическая кривая распределения

– кривая, выражающая общую закономерность данного типа распределения в чистом виде, исключающего влияние случайных для него факторов.

^ Закон нормального распределения



-

ордината прямой нормального распределения
- стандартизированная (нормированная) величина

Свойства кривой нормального распределения


1

0

-

функция нормального распределения четная


20 При функция имеет бесконечно малые значения
30 Функция имеет мах при модальное значение функция достигает также при или при . При этом мах значение функции будет составлять
40 При функция дает точку перегиба
50 Если случайная величина представляет сумму двух независимых случайных величин, каждая из которых следует нормальному закону, то она тоже следует нормальному закону.
При нормальном распределении коэффициент ассиметрии ; ;
Суть закона нормального распределения: значение исследуемой непрерывной случайной величины формируется под воздействием очень большого числа независимых случайных факторов, причем сила воздействия каждого отдельного фактора мала и не может иметь превосходство.

^ 8. Выборочный метод в статистических исследованиях.



Под

выборочным наблюдением

понимается такое несплошное наблюдение, при котором статистическому обследованию подвергаются единицы изучаемой совокупности, отобранные случайным способом.
Совокупность отобранных для обследования единиц называют

выборочной

, а совокупность единиц, из которых производится отбор –

генеральной

.
Достоверность рассчитанных по выборочным данным характеристик определяется репрезентативностью выборочной совокупности, которая зависит от способа отбора единиц.
По виду различают индивидуальный, групповой и комбинированный отбор. При

индивидуальном

отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при

групповом

– группы единиц, а при

комбинированном

отборе производится сочетание группового и индивидуального отбора.
Метод отбора определяет возможность продолжения участия отобранной единицы в процедуре отбора.

Бесповторным

называется отбор, при котором попавшая в выборку единица не возвращается в генеральную совокупность. При

повторном

отборе – попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в исходную совокупность и может снова участвовать в процедуре отбора.

Ошибки регистрации являются следствием неправильного установления значения наблюдаемого признака или неправильной записи.
^ Ошибки репрезентативности обусловлены тем, что выборочная совокупность не может по всем параметрам в точности воспроизвести генеральную совокупность. Они отражают, в какой степени попавшие в выборку единицы могут представлять всю генеральную совокупность.
^ Систематические ошибки репрезентативности связаны с нарушением принципов формирования выборочной совокупности.
Случайные ошибки репрезентативности обусловлены действием случайных факторов, не содержащих каких-либо элементов системности в направлении воздействия на рассчитываемые выборочные характеристики. Оценка ошибок выборочного наблюдения основана на теоремах теории вероятностей.

Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30.
При оценке результатов малой выборки величина генеральной дисперсии в расчетах не используется. Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента:
где . – мера случайных колебаний выборочной средней в малой выборке.
Величина σ вычисляется на основе данных выборочного наблюдения:

Предельная ошибка малой выборки рассчитывается аналогичным образом:

Но, в данном случае, вероятная оценка зависит не только от величины t, но и от объема выборки. Величина коэффициента доверия t при различных объемах малой выборки представлена в таблице 9.3.
Независимо от вида выборки, на заключительном этапе определяются

доверительные интервалы

, в которых может находиться генеральная средняя (для количественных признаков) или генеральная доля (для качественных признаков). Доверительные интервалы – это область тех значений генеральной средней, выход за пределы которой имеет весьма малую вероятность. Доверительные интервалы определяются по формулам:


Распределение вероятности в малых выборках в зависимости


от коэффициента доверия t и объема выборки n



n



4



5



6



7



8



9



10



15



20




2014-07-19 18:44
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • © sanaalar.ru
    Образовательные документы для студентов.