Владимир Савельев

  • b3258458124has quoted2 years ago
    усеченным (или урезанным) средним.

    Определение

  • b3258458124has quoted2 years ago
    мерами центральной тенденции

    Определение

  • b3258458124has quoted2 years ago
    две формулы дисперсии: одна для генеральной совокупности, другая — для выборки

    Структура

  • Читательhas quoted2 years ago
    Предположим, что вы вычислили t-критерий Стьюдента. Или U-критерий Манна-Уитни. Или какой-нибудь другой. Как же по нему понять, действительно ли песики и котики различаются по размеру? Чтобы это выяснить, статистики используют весьма нетривиальный подход.
    Во-первых, они делают предположение, что котики и песики как биологические виды абсолютно не отличаются друг от друга. Это предположение называется нулевой гипотезой.

    Следующим шагом они вычисляют вероятность того, что две случайно выбранные группы котиков и песиков дадут значение критерия большее или равное тому, которое мы получили (чаще всего без учета его знака). Эта вероятность называется p-уровнем значимости.
    Если p-уровень значимости меньше 5% (чаще записывается как 0,05), то нулевая гипотеза отвергается и принимается гипотеза о том, что котики и песики все-таки различаются. Такая гипотеза называется альтернативной.

    Если же p-уровень значимости больше 0,05, то нулевая гипотеза не отвергается.

    Однако, то, что она не отвергается, еще не значит, что она верна. Это означает только то, что в данном опыте мы не обнаружили значимых различий.
  • Читательhas quoted2 years ago
    Доверительные интервалы. Как уже было сказано ранее, ученые чаще всего проводят свои исследования не на всех котиках, а на какой-то выборке. Соответственно, они не знают истинного среднего размера по всем котикам. Однако они могут прикинуть, в каком диапазоне он находится. Такой диапазон называется доверительным интервалом.

    Рядом с доверительным интервалом всегда указывается вероятность. 95%-ый доверительный интервал означает, что мы с точностью в 95% можем утверждать, что истинный средний размер котиков находится в этом диапазоне.
    Чем шире такой интервал, тем менее точной считается статистическая оценка. Что касается различий между песиками и котиками, то они имеют место быть, когда их доверительные интервалы не пересекаются.
  • Читательhas quoted2 years ago
    Байесовская статистика. Все вышеприведенные способы определения значимости не учитывают наши предыдущие (априорные) знания о том, каких размеров бывают котики и песики. Каждый раз, когда мы определяем p-уровень значимости или доверительный интервал, мы ведем себя так, как будто никогда не видели ни тех, ни других.
    Но ведь это не так! Мы ведь достаточно четко представляем себе, как они выглядят! Нельзя просто так брать и отбрасывать предыдущий опыт!
    Проблему сопоставления наших предыдущих знаний и новых данных пытается решить группа методов, основанных на теореме английского священника Томаса Байеса.
    Не вдаваясь в математические подробности, опишем общую логику. Предположим, что из предыдущих опытов мы выяснили, что в 60% случаев случайно выбранный песик больше случайно выбранного котика. Проведя собственный эксперимент, мы обнаружили, что это число гораздо выше – 80%. Следует ли из этого, что нам нужно забыть наш предыдущий опыт и заменить старые данные новыми? Разумеется нет. Новый опыт только подправит предыдущую вероятность, и в следующий раз мы будем считать, что она несколько выше.
  • Читательhas quoted2 years ago
    Все математические модели делятся на функциональные и структурные. Функциональные модели – к которым, к слову, относится регрессионное уравнение, – описывают влияние внешних факторов на котиковое состояние. Например известная нам модель котикового счастья.
  • Читательhas quoted2 years ago
    Из предыдущих разделов мы узнали, как определить, различаются ли между собой песики и котики по размеру. И если мы отвечаем на этот вопрос положительно, то мы по сути устанавливаем связь между двумя признаками: размером и биологическим видом, к которому принадлежат эти животные.
    Однако, согласитесь, что мир не ограничивается только лишь котиками или песиками. Ведь существует еще и множество других животных. Например слоники.

    И если мы добавим их к нашему небольшому зоопарку, мы не сможем применить обычное попарное сравнение (например по t-критерию Стьюдента или U-критерию Манна-Уитни) для определения того, связан ли размер с биологическим видом. В этих случаях необходимо использовать другие методы. Например дисперсионный анализ.
  • Читательhas quoted2 years ago
    Важно отметить следующее: поскольку для проверки эффективности лекарства мы вычисляли три критерия, то здесь возникает проблема множественных сравнений. Чтобы ее преодолеть, необходимо применить поправку Бонферрони и сравнивать p-уровень значимости не с 0,05, а с 0,017. В противном случае вы рискуете очень сильно ошибиться в своих выводах.

    Альтернатива этому – использование дисперсионного анализа для повторных измерений, о котором будет рассказано в следующей главе.
  • Читательhas quoted2 years ago
    Когда таких сдач много (а точнее, больше двух), возникает проблема множественных сравнений, о которой мы не раз говорили выше. Если кратко, то она заключается в том, что если вы будете попарно сравнивать первый анализ со вторым, второй с третьим и т. д., вероятность того, что вы ошибетесь в своих выводах, будет возрастать.
    Разрешить эту проблему, как и в предыдущем случае, может дисперсионный анализ, а точнее, его особая разновидность – дисперсионный анализ с повторными измерениями. Нулевая гипотеза такого анализа состоит в том, что состояние котиков от пробы к пробе не меняется.

    В самом простом варианте мы действуем практически так же, как и при обычном дисперсионном анализе – делим дисперсию на части. В тот раз таких частей было две: первая была обусловлена влиянием лечения (межгрупповая дисперсия), а вторая – остальными факторами (внутригрупповая дисперсия).
    Однако, важным отличием является то, что мы проводим все измерения на одних и тех же котиках. Иными словами, каждый котик измеряется по несколько раз и, соответственно, вносит свой вклад в общую дисперсию. Таким образом, наша дисперсия делится уже на три части: межгрупповую, внутригрупповую и межиндивидуальную.

    Критерий Фишера сравнивает между собой только первые два вклада. Соответственно, чем он больше, тем больше причин отклонить нулевую гипотезу. И опять же – если вы отклонили ее, то попарное сравнение нужно будет проводить с помощью специальных post-hoc-критериев.
fb2epub
Drag & drop your files (not more than 5 at once)