Что такое большие данные и зачем они нужны?Иногда файл Excel — это просто файл. Структурированные данные, которые легко анализировать и которые созданы по определенным алгоритмам — это не Big data. Даже если это очень большие таблицы.
В то же время и объемная и неструктурированная информация — это тоже не Big data.
Что же относится к Big data? Когда поток содержит в себе структурированные и неструктурированные данные, информация представлена в различных видах и форме, массив настолько велик и настолько быстро растет, что нужны специальные инструменты обработки — тогда можно говорить о Big data.
У больших данных есть три характеристики (3V):
- Объем (Volume)
- Скорость (Velocity)
- Разнообразие (Variety)
Но как именно обращаться с большими данными? Как получить от них практическую пользу? Откуда они берутся, как их собирать, где хранить, как анализировать?
Без обработки ценность больших данных крайне низка.
В этом курсе на доступных, понятных и практических примерах вы узнаете, как использовать большие данные в компаниях.
После прохождения курса сотрудники научатся:- Применять большие данные в своей профессии
- Собирать данные, знать разные методы сбора
- Классифицировать данные
- Преобразовывать данные в единую систему
- Организовывать хранилища данных, использовать для этого разные решения: “у себя” / в публичном облаке / в корпоративном облаке
- Использовать разные методы анализа
- краудсорсинг
- смешение и интеграция данных
- машинное обучение
- предиктивный анализ
- имитационная модель
- статистический анализ
- data mining
- Взаимодействовать с экспертами по Big data в одном информационном поле
Для кого подходит курсКурс подходит для руководителей команд, рабочих групп, для сотрудников, которые хотят начать управлять большими данными и внедрить этот процесс в свою работу. Курс позволяет познакомиться с основами и решить, какие действия нужно предпринять, чтобы начать собирать и анализировать большие данные.