• О степенях свободы в статистике. Святослав федоров: небо — это высшая степень свободы

    03.05.2019

    НЕБО - ЭТО ВЫСШАЯ СТЕПЕНЬ СВОБОДЫ

    К онечно же, гены жизни попали на нашу планету из космоса. Иначе трудно объяснить, почему, едва встав на ноги, люди начали конструировать крылья и попытались взлететь.
    Шестнадцатилетним мальчишкой я поступил в 1943 году в Ереванскую артиллерийскую спецшколу. Целый год изучал орудия, тренировался в стрельбе из 72-го калибра, но... Все это не волновало душу. Мечтал только о судьбе летчика-истребителя. И мне повезло. Мой дядя вернулся с фронта и стал начальником Управления военных учебных заведений Северо-Кавказского округа в Ростове-на-Дону. Я написал рапорт, и через пару месяцев меня действительно перевели в Ростовскую 10-ю спецшколу ВВС.
    Мои новые товарищи оказались совершенно не такими людьми, как курсанты-артиллеристы. Начальник летной школы Ганишек, замечательный человек, по-моему, и отбирал только романтиков. Мечты о будущих полетах, новых самолетах создавали необычную атмосферу товарищества и всеобщей дружбы.
    Несчастный случай с потерей стопы поставил точку в моей летной подготовке. Правда, когда лежал в госпитале, прочитал «Повесть о настоящем человеке» и тоже мечтал, что пустят в полеты с протезом: ведь у Маресьева не было двух стоп, а у меня - всего одной...
    Но моей профессией стала медицина. Она тоже оказалась для меня вполне романтичной. Изобретательство ведь - захватывающая душу вещь. Искусственные хрусталики, исправление любой близорукости и дальнозоркости, новые методы лечения глаукомы, лазеры для лечения многих заболеваний - все это напоминало мне то полетное настроение. Хирургу, как и летчику, надо принимать быстрые решения. И, как и летчику, хотелось избавиться от старого и часто ненужного контроля «с земли».
    В 1986 году удалось уйти от обстрелов командной системы. Свобода в труде напоминала свободный полет летчика, а штурвал наконец оказался в наших руках.
    Конечно же, как только появилась возможность, мы вложили большие средства, заработанные нами, не только в медицинскую технику, но и в малую авиацию. Купили вертолет, ангар, радиостанцию, бензозаправщик, построили взлетную полосу.
    Какое счастье - через 52 года снова сесть за штурвал! Это была «Авиатика 890У». Шестьдесят-семьдесят метров пробега - и взлет. Как все красиво с высоты, как прекрасно человеку с крыльями! Он побеждает гравитацию, которая всех и всегда тянет вниз. Какое счастье - пронзить кучевое облако и зависнуть над зелеными полями и серебряными реками! После этого я утверждаю, что экология зрения важнее даже наших бесконечных социальных бед. Может быть, именно глаза так тянут нас вверх.
    Мне исполнилось 70 лет, и мои друзья подарили мне моноплан ЯК-18Т. Почти новый, нужно лишь поправить шасси.
    Теперь не проблема летать в наш филиал даже за 600-800 км.

    Свобода человека - это, конечно, и экономическое его благополучие, и безопасность его жизни. Но еще и свобода передвижения. Недаром, наказывая человека, его лишают возможности передвигаться в пространстве. Поэтому авиация - и большая с ее скоростями, и малая с ее возможностью сесть где угодно - дает те ощущения, без которых человеку жить трудно.
    Сегодня малая авиация, включая парапланы, мотодельтапланы, планеры, завоевала себе пространство в зоне трехсот метров от поверхности земли. Но мы, как всегда, отстаем. Авиабюрократы хотят управлять и этим пространством, объясняя свое вмешательство заботой о наших жизнях. Так хочется попросить их: дайте нам возможность самим думать о своей безопасности. В том числе в небе.
    Февраль 1999 года

    В одном из предыдущих постов мы обсудили, пожалуй, центральное понятие в анализе данных и проверке гипотез - p-уровень значимости. Если мы не применяем байесовский подход, то именно значение p-value мы используем для принятия решения о том, достаточно ли у нас оснований отклонить нулевую гипотезу нашего исследования, т.е. гордо заявить миру, что у нас были получены статистически значимые различия.

    Однако в большинстве статистических тестов, используемых для проверки гипотез, (например, t-тест, регрессионный анализ, дисперсионный анализ) рядом с p-value всегда соседствует такой показатель как число степеней свободы, он же degrees of freedom или просто сокращенно df, о нем мы сегодня и поговорим.

    Степени свободы, о чем речь?

    По моему мнению, понятие степеней свободы в статистике примечательно тем, что оно одновременно является и одним из самым важных в прикладной статистике (нам необходимо знать df для расчета p-value в озвученных тестах), но вместе с тем и одним из самых сложных для понимания определений для студентов-нематематиков, изучающих статистику.

    Давайте рассмотрим пример небольшого статистического исследования, чтобы понять, зачем нам нужен показатель df, и в чем же с ним такая проблема. Допустим, мы решили проверить гипотезу о том, что средний рост жителей Санкт-Петербурга равняется 170 сантиметрам. Для этих целей мы набрали выборку из 16 человек и получили следующие результаты: средний рост по выборке оказался равен 173 при стандартном отклонении равном 4. Для проверки нашей гипотезы можно использовать одновыборочный t-критерий Стьюдента, позволяющий оценить, как сильно выборочное среднее отклонилось от предполагаемого среднего в генеральной совокупности в единицах стандартной ошибки:

    Проведем необходимые расчеты и получим, что значение t-критерия равняется 3, отлично, осталось рассчитать p-value и задача решена. Однако, ознакомившись с особенностями t-распределения мы выясним, что его форма различается в зависимости от числа степеней свобод, рассчитываемых по формуле n-1, где n - это число наблюдений в выборке:


    Сама по себе формула для расчета df выглядит весьма дружелюбной, подставили число наблюдений, вычли единичку и ответ готов: осталось рассчитать значение p-value, которое в нашем случае равняется 0.004.

    Но почему n минус один?

    Когда я впервые в жизни на лекции по статистике столкнулся с этой процедурой, у меня как и у многих студентов возник законный вопрос: а почему мы вычитаем единицу? Почему мы не вычитаем двойку, например? И почему мы вообще должны что-то вычитать из числа наблюдений в нашей выборке?

    В учебнике я прочитал следующее объяснение, которое еще не раз в дальнейшем встречал в качестве ответа на данный вопрос:

    “Допустим мы знаем, чему равняется выборочное среднее, тогда нам необходимо знать только n-1 элементов выборки, чтобы безошибочно определить чему равняется оставшейся n элемент”. Звучит разумно, однако такое объяснение скорее описывает некоторый математический прием, чем объясняет зачем нам понадобилось его применять при расчете t-критерия. Следующее распространенное объяснение звучит следующим образом: число степеней свободы - это разность числа наблюдений и числа оцененных параметров. При использовании одновыборочного t-критерия мы оценили один параметр - среднее значение в генеральной совокупности, используя n элементов выборки, значит df = n-1.

    Однако ни первое, ни второе объяснение так и не помогает понять, зачем же именно нам потребовалось вычитать число оцененных параметров из числа наблюдений?

    Причем тут распределение Хи-квадрат Пирсона?

    Давайте двинемся чуть дальше в поисках ответа. Сначала обратимся к определению t-распределения, очевидно, что все ответы скрыты именно в нем. Итак случайная величина:

    Имеет t-распределение с df = ν, при условии, что Z – случайная величина со стандартным нормальным распределением N(0; 1), V – случайная величина с распределением Хи-квадрат, с ν числом степеней свобод, случайные величины Z и V независимы. Это уже серьезный шаг вперед, оказывается, за число степеней свободы ответственна случайная величина с распределением Хи-квадрат в знаменателе нашей формулы.

    Давайте тогда изучим определение распределения Хи-квадрат. Распределение Хи-квадрат с k степенями свободы - это распределение суммы квадратов k независимых стандартных нормальных случайных величин.

    Кажется, мы уже совсем у цели, по крайней мере, теперь мы точно знаем, что такое число степеней свободы у распределения Хи-квадрат - это просто число независимых случайных величин с нормальным стандартным распределением, которые мы суммируем. Но все еще остается неясным, на каком этапе и зачем нам потребовалось вычитать единицу из этого значения?

    Давайте рассмотрим небольшой пример, который наглядно иллюстрирует данную необходимость. Допустим, мы очень любим принимать важные жизненные решения, основываясь на результате подбрасывания монетки. Однако, последнее время, мы заподозрили нашу монетку в том, что у нее слишком часто выпадает орел. Чтобы попытаться отклонить гипотезу о том, что наша монетка на самом деле является честной, мы зафиксировали результаты 100 бросков и получили следующий результат: 60 раз выпал орел и только 40 раз выпала решка. Достаточно ли у нас оснований отклонить гипотезу о том, что монетка честная? В этом нам и поможет распределение Хи-квадрат Пирсона. Ведь если бы монетка была по настоящему честной, то ожидаемые, теоретические частоты выпадания орла и решки были бы одинаковыми, то есть 50 и 50. Легко рассчитать насколько сильно наблюдаемые частоты отклоняются от ожидаемых. Для этого рассчитаем расстояние Хи-квадрат Пирсона по, я думаю, знакомой большинству читателей формуле:

    Где O - наблюдаемые, E - ожидаемые частоты.

    Дело в том, что если верна нулевая гипотеза, то при многократном повторении нашего эксперимента распределение разности наблюдаемых и ожидаемых частот, деленная на корень из наблюдаемой частоты, может быть описано при помощи нормального стандартного распределения, а сумма квадратов k таких случайных нормальных величин это и будет по определению случайная величина, имеющая распределение Хи-квадрат.

    Давайте проиллюстрируем этот тезис графически, допустим у нас есть две случайные, независимые величины, имеющих стандартное нормальное распределение. Тогда их совместное распределение будет выглядеть следующим образом:

    При этом квадрат расстояния от нуля до каждой точки это и будет случайная величина, имеющая распределение Хи-квадрат с двумя степенями свободы. Вспомнив теорему Пифагора, легко убедиться, что данное расстояние и есть сумма квадратов значений обеих величин.

    Пришло время вычесть единичку!

    Ну а теперь кульминация нашего повествования. Возвращаемся к нашей формуле расчета расстояния Хи-квадрат для проверки честности монетки, подставим имеющиеся данные в формулу и получим, что расстояние Хи-квадрат Пирсона равняется 4. Однако для определения p-value нам необходимо знать число степеней свободы, ведь форма распределения Хи-квадрат зависит от этого параметра, соответственно и критическое значение также будет различаться в зависимости от этого параметра.

    Теперь самое интересное. Предположим, что мы решили многократно повторять 100 бросков, и каждый раз мы записывали наблюдаемые частоты орлов и решек, рассчитывали требуемые показатели (разность наблюдаемых и ожидаемых частот, деленная на корень из ожидаемой частоты) и как и в предыдущем примере наносили их на график.


    Легко заметить, что теперь все точки выстраиваются в одну линию. Все дело в том, что в случае с монеткой наши слагаемые не являются независимыми, зная общее число бросков и число решек, мы всегда можем точно определить выпавшее число орлов и наоборот, поэтому мы не можем сказать, что два наших слагаемых - это две независимые случайные величины. Также вы можете убедиться, что все точки действительно всегда будут лежать на одной прямой: если у нас выпало 30 орлов, значит решек было 70, если орлов 70, то решек 30 и т.д. Таким образом, несмотря на то, что в нашей формуле было два слагаемых, для расчета p-value мы будем использовать распределение Хи-квадрат с одной степенью свободы! Вот мы наконец-то добрались до момента, когда нам потребовалось вычесть единицу. Если бы мы проверяли гипотезу о том, что наша игральная кость с шестью гранями является честной, то мы бы использовали распределение Хи-квадрат с 5 степенями свободы. Ведь зная общее число бросков и наблюдаемые частоты выпадения любых пяти граней, мы всегда можем точно определить, чему равняется число выпадений шестой грани.

    Все становится на свои места

    Теперь, вооружившись этими знаниями, вернемся к t-тесту:

    В знаменателе у нас находится стандартная ошибка, которая представляет собой выборочное стандартное отклонение, делённое на корень из объёма выборки. В расчет стандартного отклонения входит сумма квадратов отклонений наблюдаемых значений от их среднего значения - то есть сумма нескольких случайных положительных величин. А мы уже знаем, что сумма квадратов n случайных величин может быть описана при помощи распределения хи-квадрат. Однако, несмотря на то, что у нас n слагаемых, у данного распределения будет n-1 степень свободы, так как зная выборочное среднее и n-1 элементов выборки, мы всегда можем точно задать последний элемент (отсюда и берется это объяснение про среднее и n-1 элементов необходимых для однозначного определения n элемента)! Получается, в знаменателе t-статистики у нас спрятано распределение хи-квадрат c n-1 степенями свободы, которое используется для описания распределения выборочного стандартного отклонения! Таким образом, степени свободы в t-распределении на самом деле берутся из распределения хи-квадрат, которое спрятано в формуле t-статистики. Кстати, важно отметить, что все приведенные выше рассуждения справедливы, если исследуемый признак имеет нормальное распределение в генеральной совокупности (или размер выборки достаточно велик), и если бы у нас действительно стояла цель проверить гипотезу о среднем значении роста в популяции, возможно, было бы разумнее использовать непараметрический критерий.

    Схожая логика расчета числа степеней свободы сохраняется и при работе с другими тестами, например, в регрессионном или дисперсионном анализе, все дело в случайных величинах с распределением Хи-квадрат, которые присутствуют в формулах для расчета соответствующих критериев.

    Таким образом, чтобы правильно интерпретировать результаты статистических исследований и разбираться, откуда возникают все показатели, которые мы получаем при использовании даже такого простого критерия как одновыборочный t-тест, любому исследователю необходимо хорошо понимать, какие математические идеи лежат в основании статистических методов.

    Онлайн курсы по статистике: объясняем сложные темы простым языком

    Основываясь на опыте преподавания статистики в , у нас возникла идея создать серию онлайн курсов, посвященных анализу данных, в которых в доступной для каждого форме будут объясняться наиболее важные темы, понимание которых необходимо для уверенного использования методов статистики при решении различного рода задача. В 2015 году мы запустили курс Основы статистики , на который к сегодняшнему дню записалось около 17 тысяч человек, три тысячи слушателей уже получили сертификат о его успешном завершении, а сам курс был награждён премией EdCrunch Awards и признан лучшим техническим курсом. В этом году на платформе stepik.org стартовало продолжение курса Основы статистики. Часть два , в котором мы продолжаем знакомство с основными методами статистики и разбираем наиболее сложные теоретические вопросы. Кстати, одной из главных тем курса является роль распределения Хи-квадрат Пирсона при проверке статистических гипотез. Так что если у вас все еще остались вопросы о том, зачем мы вычитаем единицу из общего числа наблюдений, ждем вас на курсе!

    Стоит также отметить, что теоретические знания в области статистики будут определенно полезны не только тем, кто применяет статистику в академических целях, но и для тех, кто использует анализ данных в прикладных областях. Базовые знания в области статистики просто необходимы для освоения более сложных методов и подходов, которые используются в области машинного обучения и Data Mining. Таким образом, успешное прохождение наших курсов по введению в статистику - хороший старт в области анализа данных. Ну а если вы всерьез задумались о приобретении навыков работы с данными, думаем, вас может заинтересовать наша онлайн - программа по анализу данных, о которой мы подробнее писали . Упомянутые курсы по статистике являются частью этой программы и позволят вам плавно погрузиться в мир статистики и машинного обучения. Однако пройти эти курсы без дедлайнов могут все желающие и вне контекста программы по анализу данных.

    Теги: Добавить метки

    Определение. Числом степеней свободы механической системы называется количество независимых величин , с помощью которых может быть задано положение системы в пространстве.

    а) Так, положение в пространстве материальной точки полностью определяется заданием трёх её координат (например, декартовых x, y, z или сферических , т.е. число степеней свободыi=3 ).

    б) Система из 2-х жёстко связанных материальных точек (отрезок, их соединяющий, фиксирован
    ). Координаты этих 2-х точек связаны соотношением, при этом достаточно задать 5 координат, а шестую можно найти из приведённого соотношения, т.е.i =5 . Если точки не связаны между собой жёстко, то число степеней свободы i=6 . Изменение даёт ещё одну степень свободы, которая называетсяколебательной .

    Положение системы, состоящей из 2-х жёстко связанных материальных точек (или, например, стержня) можно задать следующим образом: задать 3 координаты центра инерции системы С и 2 угла и , которыми определяется направление в пространстве оси системы (Рис. 7.1).

    Закон равнораспределения энергии

    В классической статической физике выводится закон Больцмана о равномерном распределении энергии по степеням свободы молекул: на каждую степень свободы молекулы приходится в среднем одинаковая кинетическая энергия, равная кТ . Необходимо отметить, что поступательное и вращательное движения связаны только с кинетической энергией, в то время как колебательное движение связано с наличием и кинетической и потенциальной энергий , причём среднее значение потенциальной и кинетической энергии оказывается одинаковым. Поэтому на каждую колебательную степень свободы приходится в среднем две половинки кТ. Средняя энергия молекулы должна равняться:

    Для молекул с жёсткой связью между атомами i совпадает с числом степеней свободы молекулы.

    Внутренняя энергия идеального газа

    Определение. Внутренней энергией какого-либо тела называется энергия этого тела за вычетом кинетической энергии тела как целого и потенциальной энергии тела во внешнем поле сил. Она является функцией внутреннего состояния системы. Для идеального газа внутренняя энергия состоит из суммы энергий поступательного, вращательного и колебательного движений молекул . (Заметим, что в общем случае во внутреннюю энергию входят энергия взаимодействия атомов, энергия электронных оболочек, внутриядерная энергия и др.). Внутреннюю энергию одного моля идеального газа найдём, умножив число Авогадро на среднюю энергию одной молекулы:

    Учитывая, что
    , получим:

    т.е. внутренняя энергия идеального газа является функцией температуры и пропорциональна ей, а также зависит от числа степеней свободы молекул . То, что внутренняя энергия является функцией состояния системы, означает, что всякий раз, когда система оказывается в данном состоянии, ее внутренняя энергия принимает присущее этому состоянию значение, независимо от предыстории системы. Следовательно, изменение внутренней энергии при переходе системы из одного состояния в другое будет всегда равно разности значений внутренней энергии в этих состояниях, независимо от пути, по которому совершался переход .

    Свяжем внутреннюю энергию с теплоёмкостью. По определению теплоёмкость в процессе при постоянном объёме
    , для идеального газа

    Соответственно

    3 . Основное уравнение молекулярно-кинетической теории.

    Постановка задачи . Требуется получить связь между макропараметрами – давлением P, температурой T, с микропараметрами – массой молекулы m , её скоростью и концентрацией молекулn .

    Пусть имеется некоторый сосуд с газом. Будем считать, что молекулы могут двигаться вдоль осей x, y, z. Выберем на стенке сосуда участок поверхности
    (Рис. 7.2). Если в сосудеN молекул, то вследствие равновероятности этих направлений вдоль каждой оси будет двигаться

    молекул. Половина из них движется вдоль данного направления, т.е.

    (ось имеет два направления).

    Предположим, что все молекулы движутся с одинаковой скоростью, равной . Тогда за время
    до элемента стенки
    долетят молекулы, заключённые в объёме параллелепипеда с основанием
    и высотой
    . Число этих молекул равно

    произведению плотности молекул
    (где
    объём сосуда) на объём
    , т.е. число молекул, летящих к площади

    (1)

    По закону сохранения импульса каждая молекула при ударе о стенку передаёт ей импульс (удар считается упругим), равный изменению импульса молекулы (Рис. 7.3, а, б ).

    . (2)

    По 2-му закону Ньютона:

    , (3)

    где
    сила, действующая со стороны молекулы на стенку;
    длительность взаимодействия молекулы со стенкой.

    Степени свободы в жизни живых систем

    У каждой живой системы имеется семь степеней свободы. Шесть из них являются алгоритмическими факторами развития Вселенной и одна - степень свободы духа . Все степени свободы равноправны в том смысле, что они либо отсутствуют на определённом этапе её развития («заморожены»), либо присутствуют в максимально возможной для данной Вселенной степени. При этом каждая живая система во Вселенной, будучи её подсистемой, обладает теми же степенями свободы того же вида и качества , но в различное время (на различной стадии развития) неодинаковыми по количеству реализации данного свойства (степени свободы).

    Чем выше уровень системы по своему развитию (плану и сфере Бытия), тем бо льшее количество степеней свободы и/или в большей мере проявляется та или иная степень свободы в её жизнедеятельности и используется для саморазвития. При этом толчок к саморазвитию может осуществляться как изнутри, так и извне.

    Высшая степень свободы духа выражается в полном самоосознании системой своей цели и роли в жизни Вселенной и (или) может быть даже всего Космоса, которое, будучи основой целенаправленного волевого устремления, даёт возможность активного участия системы в Восходящей Эволюции Мироздания. Полная свобода духа является наградой системе за преображение её в более совершенную на протяжении всех ступеней развития, но в то же время она определяет высочайший спрос (Закон Космической Морали) за всё содеянное с момента открытия данной степени свободы. Таким образом, нарастание каждой степени свободы от шага к шагу делает её не только более совершенной материально (структурно), но и духовно (энергетически).

    Все степени свободы, кроме свободы духа, в основном, способствуют становлению вида жизни, а последняя (свобода духа) делает его более совершенным среди аналогичных видов. Однако и эта степень свободы для каждого вида жизни своя и она становится причиной самосовершенствования независимо от того, откуда поступает сигнал на это преобразование.

    «Вклиниваясь в разговор», многие системы высших порядков хотят воздействовать на системы более низких уровней. Однако рассуждения о том «быть или не быть» и «каковой быть» системе данного уровня на данной ступени развития Вселенной решается не просто мыслящими системами, а системами разумными и высокоразвитыми. Для каждого уровня системы есть свой Иерарх, решение которого имеет силу и никто более не смеет вмешиваться и рассуждать на данную тему («Всяк сверчок знай свой шесток» - прекрасная поговорка о смысле Иерархий в Космосе).

    В жизни человеческой цивилизации Верховным Иерархом является Бог-Отец (религиозно-теистический термин), Руководящей Силой - креационные потоки Психической Энергии высшего качества, идущие из созвездий Ориона, Лебедя, Большого Пса, иногда из Веги (по запросу Высшего Совета Иерархов Вселенной). Когда данные энергии достигают высокоразвитых существ (систем жизни), происходит демографический3 взрыв и начинаются процессы трансмутационных преобразований видов жизни и форм их существования и сосуществования (т.е., в том числе, и социальный или социально-политический кризис, разрешаемый путём эволюции или революции).



    Похожие статьи