bookmate game
ru
Books
Роман Зыков

Роман с Data Science. Как монетизировать большие данные

  • jbmeerkathas quoted4 years ago
    Считается, что нужно потратить 10 000 часов для того, чтобы стать очень хорошим специалистом в своей области.

    Популярное заблуждение. Можно и сто тысяч часов потратить и не стать высококвалифицированным профессионалом. Важно как именно время потрачено, а количество вторично.

    Интересно то, что Малкольм Гладуэлл, который популяризовал это утверждения, основывался на исследовании психолога Андерса Эрикссона, который, в свою очередь, раскритиковал Гладуэлла за неверную трактовку его исследования. Согласно исследованию это среднее количество времени, которое высококлассные профессионалы потратили на достижение своего уровня, но много и тех, кто потратил меньше, и огромное количество тех, кто потратил больше и немногого добился. Подробнее про то, какой должна быть практика для достижения результата Эрикссон написал в книге «Peak».

  • Serhii Mazurokhas quoted4 years ago
    А для статистического усреднения человек как таковой совершенно не важен. Это — абстракция, а не конкретная личность.
  • Oleg Kopylovhas quoted2 years ago
    существует единственного алгоритма, который будет самым точным для любых задач
  • Oleg Kopylovhas quoted2 years ago
    Теорема No Free Lunch (или по-нашему — халявы не бывает) гласит, что не
  • Oleg Kopylovhas quoted2 years ago
    Как я уже писал, основное отличие машинного обучения от обычного программирования заключается в том, что программа обучается на примерах, а не на прямых инструкциях. Поэтому неотъемлемой частью какого-либо решения является обученная на данных (примерах) модель
  • Oleg Kopylovhas quoted2 years ago
    Как вы помните из предыдущих глав, классическая аналитика данных делится на два этапа — поиск гипотез и их статистическая проверка. Для формирования гипотез нам понадобятся описательная статистика, визуализация данных и доменные знания, например, какие события в компании произошли
  • b1178325954has quoted2 years ago
    В аналитический паралич легко впасть, если пытаться принять решение чисто рационально, руководствуясь только логикой.
  • Oleg Kopylovhas quoted2 years ago
    Я всегда стараюсь использовать этот подход во всех компаниях, где бы ни работал. Вы даже не представляете, насколько будут вам благодарны пользователи ваших аналитических систем, когда смогут получать данные самостоятельно. Самые умные и деятельные сотрудники являются самыми активными потребителями информации для принятия решений, и создавать им препятствия — это преступление
  • Oleg Kopylovhas quoted2 years ago
    что в эпоху облачных вычислений, дешевого хранения данных и хороших алгоритмов их сжатия нужно сохранять максимально много и подробно. Поверьте, когда понадобится найти ответ на какой-то вопрос и вы будете понимать, что данных нет, а могли бы быть, будет очень обидно. Рано или поздно собирать их все равно придется, почему бы не начать прямо сейчас
  • Oleg Kopylovhas quoted2 years ago
    Много данных не бывает
    Эту фразу я повторял, когда работал в Ostrovok.ru.
fb2epub
Drag & drop your files (not more than 5 at once)