Что такое fi в статистике
Перейти к содержимому

Что такое fi в статистике

  • автор:

Виды средних величин

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины – средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй – 7, третий – 4, четвертый – 10, пятый– 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для определения средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную.Например, рассчитаем средний возраст студентов в группе из 20 человек, возраст которых варьируется от 18 до 22 лет, где xi – варианты осредняемого признака, fi – частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:

Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины – средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/xi). Если отрезки пути обозначить через fi, то весь путь выразиться как Σfi, а время, затраченное на весь путь, – как Σ fi/xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi – отдельные варианты; n – число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называетсяопределяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Виды степенных средних

Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая – при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где – средняя величина; – индивидуальное значение; n – число единиц изучаемой совокупности; k – показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, илиописательные, средние – мода (Мо) и медиана (Ме).

Мода – величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 – нижняя граница интервала; h – величина интервала; fm – частота интервала; fm_1 – частота предшествующего интервала; fm+1 – частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой – больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 – нижняя граница интервала; h – величина интервала; fm – частота интервала; f– число членов ряда;

∫m-1 – сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили – на 10 равных частей. Квартилей насчитывается три, а децилей – девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Средние величины в юридической статистике

Средние величины и показатели вариации. (Занятие 7)

Средняя величина
это обобщающий показатель, который
характеризует типичный уровень явления в
конкретных условиях места и времени.
Средняя величина отражает размер
варьирующего признака в расчете на единицу
качественно однородной совокупности.

3.

Виды средней величины
• Выбор вида средней определяется содержанием
показателя и исходных данных.
• В каждом конкретном случае применяется одна из
средних величин:
средняя арифметическая простая,
средняя арифметическая взвешенная,
средняя гармоническая простая,
средняя гармоническая взвешенная,
средняя геометрическая и др.
структурные средние (мода, медиана)
и др.

4.

Средняя арифметическая простая
i
где х1 , х2, х3 , … xn— индивидуальные значения варьирующего признака
(варианты);
n — число единиц совокупности

5.

Средняя арифметическая
взвешенная
• применяется в тех случаях, когда данные представлены в виде
рядов распределения или группировок. Она определяется по
формуле:
• где хi — величина осредняемого признака у каждой единицы
совокупности (варианта)
• fi — повторяемость индивидуальных значений признака
(частота).
• Умножение варианты на частоту в статистике называется
взвешиванием, а частоты — весами

6.

Средняя геометрическая простая
i

7.

Средняя геометрическая
взвешенная

8.

Средняя гармоническая простая
i

9.

Средняя гармоническая взвешенная
Где zi (wi) — веса

10.

Средняя квадратическая простая
• где хi — варианты;
• n — число единиц совокупности

11.

Средняя квадратическая
взвешенная
где хi — варианта;
fi — повторяемость индивидуальных
значений признака (частота).

12.

Средние величины
• Важнейшими условиями (принципами) для
правильного вычисления и использования
средних величин является следующие:
1. В каждом конкретном случае необходимо
исходить
из
качественного
содержания
осредняемого признака, учитывать взаимосвязь
изучаемых признаков и имеющиеся для расчета
данные.
2. Индивидуальные
значения,
из
которых
вычисляются средние, должны относиться к
однородной совокупности, а число их должно
быть значительным.

13.

Средние величины
При расчете различных средних по одним и
тем же данным значения средних будут
неодинаковыми, т.е. действует правило
мажорантности средних:

14.

15.

Средняя структурная. Мода
Модой (Мо) называется наиболее часто
встречающееся или типичное значение
признака,
или модой называется то значение варианты,
которое соответствует максимальной точке
кривой распределения .
В дискретном ряду мода – это варианта с
наибольшей частотой.

16.

Мода (для интервального ряда)
где: xMo – нижняя граница модального интервала;
iMo – величина модального интервала;
fMo – частота, соответствующая модальному
интервалу;
fMo−1 – частота, предшествующая модальной;
fMo+1 – частота интервала, следующего за
модальным.

17.

Средняя структурная. Медиана
Медиана (Ме) – это величина, которая делит
численность упорядоченного вариационного
ряда на две равные части.
Для дискретного ряда с нечетным числом
членов медианой является варианта,
расположенная в центре ряда.
Для дискретного ряда с четным числом членов
ряда медианой будет среднее арифметическое
из двух смежных вариант
для четного ряда —

18.

Средняя структурная.
Медиана (для интервального ряда)
где: x Me – нижняя граница медианного интервала;
iMe – величина медианного интервала;
– полусумма частот ряда;
sMe−1 – сумма накопленных частот, предшествующих медианному
интервалу;
fMe – частота медианного интервала.

19.

Средние величины
ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ

20.

Пример 3
Имеется информация о стаже работников
банка (см. табл.)
Стаж (лет)
до 3
3-6
6-9
9-12
12-15
15 и более
Число
работников
6
25
28
17
16
6
Определите:
1. Средний стаж работников банка.
2. Модальный и медианный стаж работников.

21.

Пример 3
• Алгоритм решения:
1.
2.
3.
Закрыть интервалы (первый и последний интервалы ряда открытые).
Найти срединные значения ряда.
Сведем полученные данные в таблицу:
Стаж (лет)
4.
Число работников
(частота fi)
Серединное значение
интервала (варианта — xi)
f ix i
0-3
6
1,5
9
3-6
25
4,5
112,5
6-9
28
7,5
210
9-12
17
10,5
178,5
12-15
16
13,5
216
15-18
Д
8
16,5
132
Итого:
100

858

22.

Статистические показатели
ПОКАЗАТЕЛИ ВАРИАЦИИ

23.

Показатели вариации
• Используются для установления типичности
или показательности средней величины,
т.е. насколько точно характеризует средняя
данную совокупность по определенному
признаку

24.

Показатели вариации
1. Размах вариации (R).
2. Среднее линейное отклонение (
).
3. Дисперсия ( 2).
4. Среднее квадратичное отклонение ( ).
5. Коэффициент вариации ( )

25.

Размах вариации
• Это разность между максимальным и
минимальным значениями признака:

26.

Среднее линейное отклонение
i
i
i
i
Для
несгруппированных
данных
Для сгруппированных
данных
(вариационного ряда)

27.

Дисперсия
Для
несгруппированных
данных (простая)
Для сгруппированных
данных (взвешенная)

28.

Среднее квадратическое
отклонение
• Среднее
квадратическое
отклонение
является мерилом надежности средней.
• Чем меньше среднее квадратическое
отклонение, тем однороднее совокупность
и тем лучше средняя арифметическая
отражает собой всю совокупность

29.

Коэффициент вариации
• Это выраженное в % отношение среднего
квадратического отклонения к средней
арифметической:
Статистическая
совокупность
считается
количественно
однородной,
если
коэффициент вариации не превышает 33%

30.

Пример 2. Решение задач
(был рассмотрен ранее)
При проведении плановых мероприятий по выявлению нарушений
скоростного режима на автомобильных дорогах района
зарегистрирована следующая скорость движения автотранспорта (в
км/ч):
168
115
137
124
145
105
135
125
122
146
170
135
100
132
150
110
105
127
118
112
130
155
138
128
142
100
130
150
135
180
120
145
125
140
175
140
148
138
105
140
Для анализа информации требуется:
1.
2.
Построить интервальный ряд распределения, образовав 4 группы с
равными интервалами.
Полученный ряд распределения изобразить на графике.

31.

Пример 4
На основании приведенных в примере 2 данных
и построенного вариационного ряда
определите:
1. Среднюю скорость автомобилей,
превысивших скорость:
a) на основе индивидуальных данных;
b) на основе построенного вариационного ряда;
2. Среднее квадратическое отклонение.
3. Коэффициент вариации

32.

Пример 4
1 b)
Скорость
движения
автотранспорта
(км/ч)
Число
зарегистрирован
ных случаев
(частоты fi )
Срединные
значения
интервалов
(варианты xi)
Веса
fi *xi
100-120
9
110
110*9
120-140
16
130
130*16
140-160
11
150
150*11
160-180
4
170
170*4
40

5400
Итого

Средние величины

В статистике большое значение имеют средние величины.

Совокупность, изучаемая по количественному признаку, состоит из индивидуальных значений; на них оказывают влияние как общие причины, так и индивидуальные условия. Простейшее обобщение любого набора данных представляет собой единственное число, которое наилучшим образом представляет все значения набора данных. Такое число можно было бы назвать типическим значением для данного набора данных. В нем отклонения, характерные для индивидуальных значений, погашаются; являясь функцией множества индивидуальных значений, это число представляет всю совокупность и отражает то общее, что присуще всем ее единицам.

Средняя величина — это обобщающий показатель, характеризующий типический уровень явления в конкретных условиях места и времени.

Практическое значение средних величин как обобщающих характеристик явлений и процессов чрезвычайно широко. В средних величинах отражаются важнейшие показатели товарооборота, товарных запасов, цен. Средними величинами характеризуются качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.

Например, фирма интересуется, сколько в целом тратят на медицинские товары жители города. Анализ случайной выборки из 500 человек, живущих в городе, показал, что в прошлом квартале каждый из них потратил в среднем 350 руб. Естественно, кто-то потратил больше, кто-то меньше этого среднего значения. Вместо того чтобы работать со всеми индивидуальными значениями (со всеми 500 числами), мы используем среднее для определения типического значения индивидуальных расходов каждого потребителя. Оценка затрат на медицинские товары жителей города может быть определена как произведение среднего значения расходов одного человека из выборки на численность населения города. Таким образом получают прогноз суммарных продаж, который является приемлемым и, вероятно, полезным. Понятно, что этот прогноз не является точным. В гл. 7 будет рассмотрено, как учитывать статистическую ошибку, возникающую при распространении результата, полученного для выборки, на все население.

Типичность средней непосредственным образом связана с однородностью статистической совокупности. Средняя величина только тогда будет отражать типичный уровень признака, когда она рассчитана по качественно однородной совокупности. Так, если мы рассчитаем средний курс по акциям всех предприятий, реализуемых в данный день на данной бирже, то получим фиктивную среднюю. Это будет объясняться тем, что используемая для расчета совокупность является крайне неоднородной. В этом и подобных случаях метод средних используется в сочетании с методом группировок: если совокупность неоднородна — общие средние должны быть заменены или дополнены групповыми средними, т.е. средними, рассчитанными по качественно однородным группам.

Общая средняя — средняя, рассчитанная по совокупности в целом.

Групповая средняя — средняя, исчисленная для каждой группы. Она характеризует размер явления, наблюдаемого в конкретных условиях.

Среднее значение можно назвать типическим значением для данного набора данных. Если не все значения в наборе данных одинаковы, то мнения о «наиболее типическом» могут быть разными. Существуют следующие виды такой обобщающей меры:

  • • степенные средние;
  • • структурные средние.

Первая категория степенных средних включает следующие виды средних:

  • • средняя арифметическая;
  • • средняя гармоническая;
  • • средняя геометрическая;
  • • средняя квадратическая, кубическая и т.д.

Перечисленные средние величины можно рассчитать по общей формуле средней степенной (при различной величине &):

где х — средняя степенная; к — показатель степени, позволяющий определить вид средней; xt — вариант (значение, которое принимает признак); fi — частота, или статистический вес варианта.

При подстановке в формулу (4.2) значения k — 1 получается средняя арифметическая, значения k = -1 — средняя гармоническая, значения k = 0 — средняя геометрическая, значения k — 2 — средняя квадратическая и т.д.

Средние арифметическая, гармоническая и квадратическая будут подробно рассмотрены в гл. 5.

Получ им формулу средней геометрической простой, подставив в фор-

мулу х= —-, значение k = О 1 :

Для того чтобы раскрыть неопределенность этого вида, прологарифмируем обе части формулы степенной средней (4.2):

Если подставить в это равенство значение k = 0, получим неопределенность вида —. Используем правило Лопиталя (при некоторых условиях

предел отношения функций равен пределу отношения их производных) и продифференцируем отдельно числитель и знаменатель по переменной к. Получим:

Следовательно, при к — О Потенцируя, находим:

Полученная формула и является средней геометрической простой. Расчет средней геометрической взвешенной осуществляется по формуле:

Наиболее широкое применение этот вид средней получил в анализе динамики для определения среднего темпа роста, что будет рассмотрено в соответствующей главе.

Правило мажорантное™ средних величин следующее:

Теория статистики : учебник / под редакцией проф. Г. Л. Громыко. М. : ИНФРА-М, 2000. С. 65.

Вторая категория — структурные средние. Среди них наиболее распространены мода и медиана. Если же возникает необходимость изучить структуру ряда более подробно, вычисляют квантили, или градиенты. Квартили, квинтили, децили — частные случаи квантилей.

При осреднении уровней динамических рядов применяются различные виды средней хронологической.

Более подробно средние величины будут рассмотрены в последующих главах (степенные и структурные средние — в гл. 5, средние хронологические — в гл. 6).

Решение задач по статистике и выводы к ним

Задача по статистике №1. Найти параметры интервального ряда распределения по данным таблицы, а именно: моду, медиану, среднюю арифметическую величину, среднюю взвешенную величину, коэффициент вариации, среднее квадратическое отклонение.

Группы компаний по основным производственным фондам, млн. руб. (х)

Число компаний (fi)

Середина интервала (Xi) = (начало интервала+конец интервала)/2

Мы сразу добавили столбец «середина интервала». Для первой группы компаний рассчитали следующим образом: (10+25)/2=17,5 млн. руб. Для 2-5 групп расчеты произведены аналогично.

Теперь рассчитаем среднюю арифметическую величину.

средняя арифметическая = = (17,5+29+37,5+45,5+55,5)/5=37 млн. руб.

Далее рассчитаем среднюю взвешенную величину.

средняя взвешенная = = (17,5*2+29*8+37,5*14+45,5*9+55,5*3)/36=38 млн. руб.

Значение средневзвешенной величины можно считать более корректным, чем значение средней арифметической величины, поэтому далее в расчетах будем использовать среднюю взвешенную.

Теперь добавим в таблицу столбцы, данные которых нам понадобятся для расчета дисперсии.

Число компаний (f)

Середина интервала (Xi) = (начало интервала+конец интервала)/2

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *