воскресенье, 13 августа 2017 г.

Голая статистика. Чарльз Уилан


Ссылка на OZON

Книга для тех, кто ничего не понимает в ститистике, но хочет хоть что-то узнать ツ 

Статистика может быть очень мощным инструментом в правильных руках. Она помогает:

  • подсказывать покупателю правильные товары в разделе «вас наверняка заинтересует...»;
  • опросить небольшое количество жителей, а сделать выводы о всей стране (проверка, за кого будут голосовать, опросить всех будет дороговато).
Яркий пример правильной статистики — это Netflix. Автор рассказывает, как точно система подсказывает, какой фильм ему может понравиться. А основываются такие заявления... на сатистике! Так, я посмотрела кино такое-то, оценила позитивно. Также его позитивно оценили пользователи А, Б, В. Смотрим, что еще они оценивали хорошо и что подходит по жанру. 

Вообще самое главное в статистике — правильная выборка. Чем больше выборка, тем точнее результаты. Но «если мусор на входе — мусор на выходе». Если сделать неправильную выборку, то и результаты будут ни о чем. Например, если опросить о выборах или состоянии в стране только тех, кто ходит в дорогущий гольф-клуб, нельзя сказать, что вы узнали общую картину по стране. Только мнения богатеев. И пусть их будет хоть 100, хоть 1000.
Другая проблема — когда статистику используют во вред. Например, как определеить лучших врачей или лучшие школы? Если тупо идти по KPI, то мы знаем, чем это заканчивается. Если смотреть на то, какой процент смертности у врача, он не будет пытаться спасти больше жизней, он начнет отказываться от тяжелых случаев. И люди, которые могли бы выжить хоть с каким-то шансом, погибнут. Зато статистика операций лучше!

Или если смотреть, сколько школьников сдает экзамены. Почему бы не начать выгонять отстающих, записывая их как "ушел по собственому желанию" (переезд или что-то такое)? Статистика у школы крутая, но пошло ли это на пользу детям?

А еще на самом деле нельзя точно доказать теории из серии «мега-овощ сокращает риск развития сердечно-сосудистых заболеваний». На самом деле обычно мы просто отвергаем нулевую гипотезу (о том, что он не оказывает влияния) с некой долей погрешности.

Большинство теорий можно проверить только путем регрессионного анализа. Ну, потому что нельзя заставлять людей есть вредную пищу, сильно нервничать итд, чтобы проверить, как это отразится на их здоровье и уровне смертности. Поэтому мы изучаем людей постфактум, сравнивая, кто что делал и как это могло повлиять на их состояние здоровья. Ищем закономерности и делаем выводы.

В общем, не все так просто со статистикой!

Могу сказать, что читается книга довольно легко, автор пишет интересно. Но она все равно «тяжелая». Я читала две таких умных книги в параллель, к концу очень устала. Иногда не хочется тратить мыслетопливо, хочется за книжкой отдохнуть 

Ну а еще я поняла, что если это — самая интересная книга о статистике, то другие я читать не хочу =)))

Однако для знакомства с наукой очень рекомендую. Автор старается сделать книгу интересной и рассматривает вопросы типа «Кто лучший бейсболист? Как определить самую крутую школу?» и так далее. Мне понравилось)

Комментариев нет:

Отправить комментарий