• Медиана набора чисел это. Формула моды и медианы в статистике График медианы в статистике

    12.07.2023

    Мода и медиана – особого рода средние, которые используются для изучения структуры вариационного ряда. Их иногда называют структурными средними, в отличие от рассмотренных ранее степенных средних.

    Мода – это величина признака (варианта), которая чаще всего встречается в данной совокупности, т.е. имеет наибольшую частоту.

    Мода имеет большое практическое применение и в ряде случаев только мода может дать характеристику общественных явлений.

    Медиана – это варианта, которая находится в середине упорядоченного вариационного ряда.

    Медиана показывает количественную границу значения варьирующего признака, которой достигла половина единиц совокупности. Применение медианы наряду со средней или вместо нее целесообразно при наличии в вариационном ряду открытых интервалов, т.к. для вычисления медианы не требуется условное установление границ отрытых интервалов, и поэтому отсутствие сведений о них не влияет на точность вычисления медианы.

    Медиану применяют также тогда, когда показатели, которые нужно использовать в качестве весов, неизвестны. Медиану применяют вместо средней арифметической при статистических методах контроля качества продукции. Сумма абсолютных отклонений варианты от медианы меньше, чем от любого другого числа.

    Рассмотрим расчет моды и медианы в дискретном вариационном ряду:

    Определить моду и медиану.

    Мода Мо = 4 года, так как этому значению соответствует наибольшая частота f = 5.

    Т.е. наибольшее число рабочих имеют стаж 4 года.

    Для того, чтобы вычислить медиану, найдем предварительно половину суммы частот. Если сумма частот является числом нечетным, то мы сначала прибавляем к этой сумме единицу, а затем делим пополам:

    Медианой будет восьмая по счету варианта.

    Для того, чтобы найти, какая варианта будет восьмой по номеру, будем накапливать частоты до тех пор, пока не получим сумму частот, равную или превышающую половину суммы всех частот. Соответствующая варианта и будет медианой.

    Ме = 4 года.

    Т.е. половина рабочих имеет стаж меньше четырех лет, половина больше.

    Если сумма накопленных частот против одной варианты равна половине сумме частот, то медиана определяется как средняя арифметическая этой варианты и последующей.

    Вычисление моды и медианы в интервальном вариационном ряду

    Мода в интервальном вариационном ряду вычисляется по формуле

    где Х М0 - начальная граница модального интервала,

    h м 0 – величина модального интервала,

    f м 0 , f м 0-1 , f м 0+1 – частота соответственно модального интервала, предшествующего модальному и последующего.

    Модальным называется такой интервал, которому соответствует наибольшая частота.

    Пример 1

    Группы по стажу

    Число рабочих, чел

    Накопленные частоты

    Определить моду и медиану.

    Модальный интервал , т.к. ему соответствует наибольшая частота f = 35. Тогда:

    Хм 0 =6, 0 =35

    h м 0 =2, 0-1 =20

    0+1 =11

    Вывод: Наибольшее число рабочих имеет стаж примерно 6,7 лет.

    Для интервального ряда Ме вычисляется по следующей формуле:

    где Хм е – нижняя граница медиального интервала,

    е – величина медиального интервала,

    – половина суммы частот,

    е – частота медианного интервала,

    е-1 –сумма накопленных частот интервала, предшествующего медианному.

    Медианный интервал – такой интервал, которому соответствует кумулятивная частота, равная или превышающая половину суммы частот.

    Определим медиану для нашего примера.

    т.к 82>50, то медианный интервал .

    Хм е =6, е =35,

    е =2, е-1 =47,

    Вывод: Половина рабочих имеет стаж меньше 6,16 лет, а половина имеет стаж больше, чем 6,16 лет.

    Центральную тенденцию данных можно рассматривать не только, как значение с нулевым суммарным отклонением (среднее арифметическое) или максимальную частоту (мода), но и как некоторую отметку (значение в совокупности), делящую ранжированные данные (отсортированные по возрастанию или убыванию) на две равные части. Половина исходных данных меньше этой отметки, а половина – больше. Это и есть медиана .

    Итак, медиана в статистике – это уровень показателя, который делит набор данных на две равные половины. Значения в одной половине меньше, а в другой больше медианы. В качестве примера обратимся к набору случайных чисел.

    Очевидно, что при симметричном распределении середина, делящая совокупность пополам, будет находиться в самом центре – там же, где средняя арифметическая (и мода). Это, так сказать, идеальная ситуация, когда мода, медиана и средняя арифметическая совпадают и все их свойства приходятся на одну точку – максимальная частота, деление пополам, нулевая сумма отклонений – все в одном месте. Однако, жизнь не так симметрична, как нормальное распределение.

    Допустим, мы имеем дело с техническими замерами отклонений от ожидаемой величины чего-нибудь (содержания элементов, расстояния, уровня, массы и т.д. и т.п.). Если все ОК, то отклонения, скорее всего, будут распределены по закону, близкому к нормальному, примерно, как на рисунке выше. Но если в процессе присутствует важный и неконтролируемый фактор, то могут появиться аномальные значения, которые в значительной мере повлияют на среднюю арифметическую, но при этом почти не затронут медиану.

    Медиана выборки – это альтернатива средней арифметической, т.к. она устойчива к аномальным отклонениям (выбросам).

    Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение, если сравнивать с отклонениями от любой другой величины. Даже меньше, чем от средней арифметической, о как! Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объектов около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.).

    Формула медианы в статистике для дискретных данных чем-то напоминает формулу моды. А именно тем, что формулы как таковой нет. Медианное значение выбирают из имеющихся данных и только, если это невозможно, проводят несложный расчет.

    Первым делом данные ранжируют (сортируют по убыванию). Далее есть два варианта. Если количество значений нечетно, то медиана будет соответствовать центральному значению ряда, номер которого можно определить по формуле:

    № Me – номер значения, соответствующего медиане,

    N – количество значений в совокупности данных.

    Тогда медиана обозначается, как

    Это первый вариант, когда в данных есть одно центральное значение. Второй вариант наступает тогда, когда количество данных четно, то есть вместо одного есть два центральных значения. Выход прост: берется средняя арифметическая из двух центральных значений:

    В интервальных данных выбрать конкретное значение не представляется возможным. Медиану рассчитывают по определенному правилу.

    Для начала (после ранжирования данных) находят медианный интервал . Это такой интервал, через который проходит искомое медианное значение. Определяется с помощью накопленной доли ранжированных интервалов. Где накопленная доля впервые перевалила через 50% всех значений, там и медианный интервал.

    Не знаю, кто придумал формулу медианы, но исходили явно из того предположения, что распределение данных внутри медианного интервала равномерное (т.е. 30% ширины интервала – это 30% значений, 80% ширины – 80% значений и т.д.). Отсюда, зная количество значений от начала медианного интервала до 50% всех значений совокупности (разница между половиной количества всех значений и накопленной частотой предмедианного интервала), можно найти, какую долю они занимают во всем медианном интервале. Вот эта доля аккурат переносится на ширину медианного интервала, указывая на конкретное значение, именуемое впоследствии медианой.

    Обратимся к наглядной схеме.

    Немного громоздко получилось, но теперь, надеюсь, все наглядно и понятно. Чтобы при расчете каждый раз не рисовать такой график, можно воспользоваться готовой формулой. Формула медианы имеет следующий вид:

    где x Me - нижняя граница медианного интервала;

    i Me - ширина медианного интервала;

    ∑f/2 - количество всех значений, деленное на 2 (два);

    S (Me-1) - суммарное количество наблюдений, которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;

    f Me - число наблюдений в медианном интервале.

    Как нетрудно заметить, формула медианы состоит из двух слагаемых: 1 – значение начала медианного интервала и 2 – та самая часть, которая пропорциональна недостающей накопленной доли до 50%.

    Для примера рассчитаем медиану по следующим данным.

    Требуется найти медианную цену, то есть ту цену, дешевле и дороже которой по половине количества товаров. Для начала произведем вспомогательные расчеты накопленной частоты, накопленной доли, общего количества товаров.

    По последней колонке «Накопленная доля» определяем медианный интервал – 300-400 руб (накопленная доля впервые более 50%). Ширина интервала – 100 руб. Теперь остается подставить данные в приведенную выше формулу и рассчитать медиану.

    То есть у одной половины товаров цена ниже, чем 350 руб., у другой половины – выше. Все просто. Средняя арифметическая, рассчитанная по этим же данным, равна 355 руб. Отличие не значительное, но оно есть.

    Расчет медианы в Excel

    Медиану для числовых данных легко найти, используя функцию Excel, которая так и называется — МЕДИАНА . Другое дело интервальные данные. Соответствующей функции в Excel нет. Поэтому нужно задействовать приведенную выше формулу. Что поделаешь? Но это не очень трагично, так как расчет медианы по интервальным данным – редкий случай. Можно и на калькуляторе разок посчитать.

    Напоследок предлагаю задачку. Имеется набор данных. 15, 5, 20, 5, 10. Каково среднее значение? Четыре варианта:

    Мода, медиана и среднее значение выборки – это разный способ определить центральную тенденцию в выборке.

    • 4. Мода. Медиана. Генеральная и выборочная средняя

      Мода на экране, медиана в треугольнике, а средние – это температура по больнице и в палате. Продолжаем наш практический курс занимательной статистики (Занятие 1) изучением центральных характеристик статистической совокупности , названия которых вы видите в заголовке. И начнём мы с его конца, поскольку о средних величинах речь зашла практически с первых же абзацев темы. Для подготовленных читателей оглавление :

      ну а «чайникам» лучше ознакомиться с материалом по порядку:

      Итак, пусть исследуется некоторая генеральная совокупность объёма , а именно её числовая характеристика , не важно, дискретная или непрерывная (Занятия 2, 3 ).

      Генеральной средней называется среднее арифметическое всех значений этой совокупности:

      Если среди чисел есть одинаковые (что характерно для дискретного ряда ) , то формулу можно записать в более компактном виде:
      , где
      варианта повторяется раз;
      варианта – раз;
      варианта – раз;

      варианта – раз.

      Живой пример вычисления генеральной средней встретился в Примере 2 , но чтобы не занудничать, я даже не буду напоминать его содержание.

      Далее. Как мы помним, обработка всей генеральной совокупности часто затруднена либо невозможна, и поэтому из неё организуют представительную выборку объема , и на основании исследования этой выборки делают вывод обо всей совокупности.

      Выборочной средней называется среднее арифметическое всех значений выборки:

      и при наличии одинаковых вариант формула запишется компактнее:
      – как сумма произведений вариант на соответствующие частоты .

      Выборочная средняя позволяет достаточно точно оценить истинное значение , чего вполне достаточно для многих исследований. При этом, чем больше выборка, тем точнее будет эта оценка.

      Практику начнём, а точнее продолжим, с дискретного вариационного ряда и знакомого условия:

      Пример 8

      По результатам выборочного исследования рабочих цеха были установлены их квалификационные разряды: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3.

      Как решать задачу? Если нам даны первичные данные (исходные необработанные значения), то их можно тупо просуммировать и разделить результат на объём выборки:
      – среднестатистический квалификационный разряд рабочих цеха.

      Но во многих задачах требуется составить вариационный ряд (см. Пример 4 ) :

      – или же этот ряд предложен изначально (что бывает чаще). И тогда, мы, конечно, используем «цивилизованную» формулу:

      Мода . Мода дискретного вариационного ряда – это варианта с максимальной частотой. В данном случае . Моду легко отыскать по таблице, и ещё легче на полигоне частот – это абсцисса самой высокой точки:


      Иногда таковых значений несколько (с одинаковой максимальной частотой), и тогда модой считают каждое из них.

      Если все или почти все варианты различны (что характерно для интервального ряда ), то модальное значение определяется несколько другим способом, о котором во 2-й части урока.

      Медиана . Медиана вариационного ряда* – это значение, которая делит его на две равные части (по количеству вариант).

      Но теперь нам нужно найти среднюю, моду и медиану.

      Решение : чтобы найти среднюю по первичным данным, лучше всего просуммировать все варианты и разделить полученный результат на объём совокупности:
      ден. ед.

      Эти подсчёты, кстати, займут не так много времени и при использовании оффлайн калькулятора. Но если есть Эксель, то, конечно, забиваем в любую свободную ячейку =СУММ(, выделяем мышкой все числа, закрываем скобку ) , ставим знак деления / , вводим число 30 и жмём Enter . Готово.

      Что касается моды, то её оценка по исходным данным, становится непригодна. Хоть мы и видим среди чисел одинаковые, но среди них запросто может найтись пять так шесть-семь вариант с одинаковой максимальной частотой, например, частотой 2. Кроме того, цены могут быть округлёнными. Поэтому модальное значение рассчитывается по сформированному интервальному ряду (о чём чуть позже) .

      Чего не скажешь о медиане: забиваем в Эксель =МЕДИАНА(, выделяем мышью все числа, закрываем скобку ) и жмём Enter : . Причём, здесь даже ничего не нужно сортировать.

      Но в Примере 6 была проведена сортировка по возрастанию (вспоминаем и сортируем – ссылка выше) , и это хорошая возможность повторить формальный алгоритм отыскания медианы. Делим объём выборки пополам:

      И поскольку она состоит из чётного количества вариант, то медиана равна среднему арифметическому 15-й и 16-й варианты упорядоченного (!) вариационного ряда:

      ден. ед.

      Ситуация вторая . Когда дан готовый интервальный ряд (типичная учебная задача).

      Продолжаем анализировать тот же пример с ботинками, где по исходным данным был составлен ИВР . Для вычисления средней потребуются середины интервалов:

      – чтобы воспользоваться знакомой формулой дискретного случая:

      – отличный результат! Расхождение с более точным значением (), вычисленным по первичным данным, составляет всего 0,04.

      По сути дела, здесь мы приблизили интервальный ряд дискретным, и это приближение оказалось весьма эффективным. Впрочем, особой выгоды тут нет, т.к. при современном программном обеспечении не составляет труда вычислить точное значение даже по очень большому массиву первичных данных. Но это при условии, что они нам известны:)

      С другими центральными показателями всё занятнее.

      Чтобы найти моду, нужно найти модальный интервал (с максимальной частотой) – в данной задаче это интервал с частотой 11, и воспользоваться следующей страшненькой формулой:
      , где:

      – нижняя граница модального интервала;
      – длина модального интервала;
      – частота модального интервала;
      – частота предыдущего интервала;
      – частота следующего интервала.

      Таким образом:
      ден. ед. – как видите, «модная» цена на ботинки заметно отличается от средней арифметической .

      Не вдаваясь в геометрию формулы, просто приведу гистограмму относительных частот и отмечу :


      откуда хорошо видно, что мода смещена относительно центра модального интервала в сторону левого интервала с бОльшей частотой. Логично.

      Справочно разберу редкие случаи:

      – если модальный интервал крайний, то либо ;

      – если обнаружатся 2 модальных интервала, которые находятся рядом, например, и , то рассматриваем модальный интервал , при этом близлежащие интервалы (слева и справа) по возможности тоже укрупняем в 2 раза.

      – если между модальными интервалами есть расстояние, то применяем формулу к каждому интервалу, получая тем самым 2 или бОльшее количество мод.

      Вот такой вот депеш мод:)

      И медиана. Если дан готовый интервальный ряд, то медиана рассчитывается чуть по менее страшной формуле, но сначала нудно (описка по Фрейду:)) найти медианный интервал – это интервал, содержащий варианту (либо 2 варианты), которая делит вариационный ряд на две равные части.

      Выше я рассказал, как определить медиану, ориентируясь на относительные накопленные частоты , здесь же сподручнее рассчитать «обычные» накопленные частоты . Вычислительный алгоритм точно такой же – первое значение сносим слева (красная стрелка) , и каждое следующее получается как сумма предыдущего с текущей частотой из левого столбца (зелёные обозначения в качестве примера) :

      Всем понятен смысл чисел в правом столбце? – это количество вариант, которые успели «накопиться» на всех «пройденных» интервалах, включая текущий.

      Поскольку у нас чётное количество вариант (30 штук), то медианным будет тот интервал, который содержит 30/2 = 15-ю и 16-ю варианту. И ориентируясь по накопленным частотам, легко прийти к выводу, что эти варианты содержатся в интервале .

      Формула медианы:
      , где:
      – объём статистической совокупности;
      – нижняя граница медианного интервала;
      – длина медианного интервала;
      частота медианного интервала;
      накопленная частота предыдущего интервала.

      Таким образом:
      ден. ед. – заметим, что медианное значение, наоборот, оказалось смещено правее, т.к. по правую руку находится значительное количество вариант:


      И справочно особые случаи.

      что такое медиана набора чисел? и как найти медиану 13, 19, 24, 17, 15, 11 ??? и получил лучший ответ

      Ответ от Ўлия Деркач[гуру]
      Медианой набора чисел называется такое число, которое разделяет набор на две равные по численности части. Вместо “медиана” можно было бы сказать “середина”.
      1. Нужно написать числа в порядке возрастания (составить ранжированный ряд)
      11,13,15,17,19,24
      2. Одновременно зачеркиваем “самое большое” и “самое маленькое” числа данного набора чисел до тех пор пока не останется одно число или два числа.
      3. Если осталось одно число, то оно и есть медиана.
      4. Если осталось два числа, то медианой будет среднее арифметическое двух оставшихся чисел.
      Ме= 15+17/2=16

      Ответ от A.R.E. R.U. [активный]
      Расположи их в порядке возрастания. То, что посередине и будет медианой.
      Если их четное количество (как в твоем случае) , то медианой будет среднее арифметическое 2-х серединных чисел.
      11, 13, 15, 17, 19, 24
      (15+17)/2=16.


      Ответ от Пользователь удален [эксперт]
      расположи числа по порядку и в середине ряда будет твоя "медиана" обычно дают нечетное число чисел...а у тебя их 6?


      Ответ от 3 ответа [гуру]

      Привет! Вот подборка тем с ответами на Ваш вопрос: что такое медиана набора чисел? и как найти медиану 13, 19, 24, 17, 15, 11 ???



    Похожие статьи