Что такое наука о данных? Подобно любой новой области, она еще не определена полностью, но вы уже знаете о ней достаточно, чтобы заинтересоваться, иначе вы не читали бы эту книгу. Я считаю науку о данных местом на пересечении информатики, статистики и независимых областей применения. От информатики исходит машинное обучение и технологии высокопроизводительных вычислений, чтобы справляться с масштабом. От статистики исходит давняя традиция исследовательского анализа данных, проверка достоверности и визуализация. От областей применения в бизнесе и науках исходят задачи, стоящие сломанных копий, а также стандарты вычислений, позволяющие оценить, когда победа будет окончательно достигнута.
Но все эти области уже хорошо известны. Почему наука о данных, и почему теперь? Я вижу три причины для этого внезапного пика активности:
- Новая технология позволяет уловить, аннотировать и сохранить обширные объемы данных из социальных сетей, регистрируя также данные сенсоров. После того как вы накопили все эти данные, вы начинаете задаваться вопросом, что с ними можно сделать.
- Компьютерные достижения позволяют анализировать данные новыми способами и в невиданных ранее масштабах. Архитектуры сетевой вычислительной среды предоставляют некоторый доступ к своей огромной мощи даже простым парням, когда они нуждаются в ней. Новые подходы к машинному обучению приводят к удивительным достижениям в решении давнишних проблем, подобных компьютерному зрению и обработке текстов на естественном языке.
- Ведущие технологические компании (такие как Google и Facebook) и многомиллиардные фонды (такие как Renaissance Technologies и TwoSigma) уже доказали мощь современной аналитики данных.
Разместите ссылку на эту страницу в социальных сетях. Так о ней узнают тысячи человек:
Facebook
Twitter
Мой мир
Вконтакте
Одноклассники
Нашли ошибку? Сообщите администрации сайта: Выберите один из разделов меню и, если необходимо, напишите комментарий
За ложную информацию бан на месяц
Разместите, пожалуйста, ссылку на эту страницу на своём веб-сайте:
Код для вставки на сайт или в блог: Код для вставки в форум (BBCode): Прямая ссылка на эту публикацию:
Анализ поведенческих данных на R и Python — Задействуйте всю мощь поведенческих данных в своей компании, используя инструменты, специально разработанные для их анализа. Общепринятые алгоритмы науки о данных и инструменты предсказательной аналитики трактуют данные о поведении клиентов, такие как клики на веб-сайте или покупки в супермаркете, ...
Наука о данных — это вовсе не страшно! Изучите программирование на языке Python для анализа данных и статистики. Пишите код в облаке, используя Google Colab. Обменивайтесь данными и визуализируйте информацию. Интересуетесь наукой о данных, но немного побаиваетесь? Не нужно! Эта книга покажет, как использовать язык Python для создания интересных вещ ...
R в действии. Анализ и визуализация данных с использованием R и Tidyverse — R – золотой стандарт, ежедневно используемый исследователями по всему миру для самых разных вычислений и статистического анализа данных.
Данный материал НЕ НАРУШАЕТ авторские права никаких физических или юридических лиц. Если это не так - свяжитесь с администрацией сайта. Материал будет немедленно удален. Электронная версия этой публикации предоставляется только в ознакомительных целях. Для дальнейшего её использования Вам необходимо будет приобрести бумажный (электронный, аудио) вариант у правообладателей.