Академия: Критическое мышление в информационный век - Неделя 1
Всем привет!
Сейчас хотел бы представить конспект 1 недели курса Mindware: Critical Thinking for the Information Age (Критическое мышление в информационный век) на Coursera.
Ведет курс профессор Richard E. Nisbett - университет Мичигана.
Язык курса: English.
Конспект модуля №1
Статистика - незаменимый инструмент, если у вас есть большой объём данных и вам нужно принять какое-то решения основываясь на полученных данных. Изучение что влияет или не влияет на результат, соотношения между данными и многое другое. Но о всем по порядку.
Переменная- значение которое меняется, противоположность константе. Например, температура меняется в течении дня. В то время как температура замерзания воды будет постоянной или константой. Все что изменяется с течением времени может быть переменной: давление, рост, возраст, количеств яиц, которые несет курица на ферме и т д.
Обычно для анализа переменных используют нормальное распределение, когда график имеет форму колокола. Чем ближе значение к середине, тем ближе оно к уровню нормы.
Пример:
Ваш сосед готовит плохо, затем вы вспомните много людей которые готовят хорошо, но лишь пару человек (ваша бабушка) готовят отлично. В итоге мы получаем нормальное распределение. Говоря о нормальном распределении часто пользуются понятием стандартное отклонение.
Стандартное отклонение показывает насколько показатель смещается в + или – сторону от середины.
Середина всегда на 50%
Первое стандартное отклонение всегда на 84% .
Соответсвенно в отрицательную сторону будет равно 16%.
84-16 =68% получается, что 68 % случаев попадает в этот диапазон со стандартным отклонением.
Пример:
вы хотите вложится в акции с 4% -ным средним годовым доходом за год. Представьте, что вы рассматриваете акции несколько лет и среднее стандартное отклонением 3%. Среднее значение составляет 4%, а стандартное отклонение равно 3. Таким образом, одно стандартное отклонение выше среднего составит 7, а одно стандартное отклонение ниже среднего составит 1. И мы знаем, что 68% всех случаев собираются от 1 до 7% прибыли. Мы также знаем, что примерно в 16% случаев прирост составит более 7%, а примерно в 16% случаев прирост составит менее 1%.
Эти инвестиции можно назвать безопасными.
Но если стандартное отклонение составляет 10, мы получаем такой шаблон. Мы находим, что в 68% случаев прибыль будет составлять от -6% до +14%. И мы знаем, что 16% случаев будут составлять более 14% и в 16% случаев будет меньше чем -6%.
Это довольно рисковые инвестиции.
Корреляция – мера зависимости между переменными.
Например, как возраст влияет на умение готовить.
Закон больших чисел
Представьте задачу:
Есть город с двумя больницами.
В одной - около 15 рождений в день и в другой - около 45 рождений в день.
Соотношение рожденных детей составляет 50%/50% - мальчики/ девочки.
Но какая из этих больниц, как вы думаете, имеет больше дней, когда 60% или более родившихся младенцев составляют мальчики? Больница с 15 родами в день или в больнице с 45 родами в день?
Я скажу вам, что большинство людей думает, что не будет никакой разницы.
Проведем моделирование
Итак в Больнице 1 (15 рождений). Там 9 мальчиков и 6 девочек, так что это 60% мальчиков. Кажется ли это вообще необычным? нет, не совсем, на самом деле, если бы один из этих мальчиков был девочкой, это было бы восемь мальчиков и семь девочек, что близко к 50/50. Ничего не обычного.
Что касается больницы 2 то тут 27 мальчиков и 18 девочек, это 60% мальчиков. Вам это кажется необычным? Правда, немного странно почему так много мальчиков?
Учитывая, что мы знаем, что соотношение мальчиков и девочек составляет 50/50. Вы можете спросить, насколько вероятно, что в один день родится 27 мальчиков и 18 девочек. Ответ только в 3 из 100 случаев.
Так был сформулирован Закон больших чисел - значения выборки зависит от их размера. Чем больше выборка, тем меньше вероятность того, что вы получите случайность, не действительное значение. Таким образом, 60% - это очень нерепрезентативное значение по сравнению с 50%, что близко к истинному значению.
Конспект 1 недели можно представить в виде карты:
Мнение:
Первая неделя понравилась, много примеров, методами из статистики пользуюсь часто по работе. Интересно применение стандартного отклонения для риск менеджмента при торговле криптовалютой. Посмотрим, что будет дальше.
Конспект подготовлен для Академии Голоса @academy.