Введение в аналитику больших данных Онлайн-курс. Цель и содержание курса Цель: ориентирование в области технологий и методологий анализа больших данных.

Презентация:



Advertisements
Похожие презентации
Архитектура, возможности и методы использования платформы облачных вычислений Microsoft Windows Azure Лекция 2 Понятие об облачных вычислениях. Обзор платформ.
Advertisements

ВВЕДЕНИЕ В BIG DATA Воробьев Даниил. ПЛАН ПРЕЗЕНТАЦИИ 1. Что такое Big Data 2. Принципы Big Data 3. Задачи решаемые в Big Data 4.Big Data со стороны IT.
Москва 2006 Роль консультационных услуг в процессе оптимизации работы с документами в организации Антошечкина Елена начальник отдела анализа и методологии.
Ключевой тренд мировой образовательной политики – регулярный мониторинг качества знаний.
Анализ данных и интеграция информационных систем Станислав Чистяков Старший Консультант 5 апреля 2011 года, гостиница «Золотое кольцо»
Информационно-аналитическая система информационной безопасности в системах массовых услуг (электронное правительство) И.А.Трифаленков Директор по технологиям.
Лекция 1 Введение. Программирование.. Введение. Информатика – предмет и задачи. Существует много определений информатики: Информатика это наука и сфера.
Лекция «Основные понятия баз данных» 4 семестр. Определения База данных - это электронное хранилище, предназначенное для структурированного хранения информации,
Hadoop & Wikimart Роман Зыков Moscow, BI trends, 11 th October 2012.
НЕОБХОДИМЫЙ НАБОР ИНСТРУМЕНТОВ ДЛЯ ЭФФЕКТИВНОЙ ДЕЯТЕЛЬНОСТИ В СЕТЕВОЙ ОРГАНИЗАЦИИ.
Информационные технологии Дисциплина информационных технологий Охватывает все области передачи, хранения и восприятия информации и не только компьютерные.
Hadoop Лекция 1. Введение в Hadoop и MapReduce. Что такое Hadoop Инфраструктура (framework) для параллельной обработки больших объемов данных (терабайты)
BIG DATA Революция в области хранения и обработки данных Выполнили студенты Кибец Юлия Усатов Константин.
Российская академия наук Институт проблем информатики (ИПИ РАН) Приоритетные направления исследований в информационных технологиях академик РАН Игорь Анатольевич.
ВЛИЯНИЕ ВРЕМЕННЫХ ЗАДЕРЖЕК ПЕРЕДАЧИ ИНФОРМАЦИИ НА ФИНАНСОВЫЙ РЕЗУЛЬТАТ ДЕЯТЕЛЬНОСТИ СЕТЕВОГО ПРЕДПРИЯТИЯ МГТУ им. Н.Э. Баумана Кафедра Инженерный Бизнес.
ИВЭСЭП Информационные Технологии Управления Распределенная обработка данных.
Системы управления содержимым сайта Content Management Systems (CMS) Лекция 9.
ЭФФЕКТИВНЫЙ МУНИЦИПАЛИТЕТ облачные технологии управления.
Deductor – принципы работы. BaseGroup Labs Назначение системы Deductor является платформой, ориентированной на решение задач анализа самого широкого спектра:
Топчий Андрей, Южно-Уральский государственный университет IT Security for the Next Generation Тур Россия с СНГ, МГТУ им. Н.Э. Баумана 5-7 марта, 2012 Топчий.
Транксрипт:

Введение в аналитику больших данных Онлайн-курс

Цель и содержание курса Цель: ориентирование в области технологий и методологий анализа больших данных Модули: 1.Введение в большие данные 2.Введение в Data Mining 3.Основы языка R 4.Инструменты Data Mining 5.Обзор технологий хранения больших данных 2

Введение в аналитику больших данных Лекция 1 к.ф.-м.н. Павловский Евгений Николаевич

В лекции будут Предпосылки формирования тренда больших данных Основные вызовы больших данных (4V) Определение термина "большие данные" Базовое представление о Map Reduce и Hadoop Представление о работе аналитика В результате изучения лекции Вы получите: понимание вызовов 4V больших данных, их взаимосвязь понимание условий возникновения Map Reduce и о его реализации Hadoop представление о факторах возникновения тренда больших данных. 4

Что такое «Большие данные»? Взгляды: Первый Инженерный Маркетинговый Научный 5

Первый взгляд на большие данные 6 * полностью карту можно посмотреть здесь:

Инженерный взгляд хранилища системы хранения данных облака EMC оборот Oracle IBM Amazon один админ на виртуальных Cloudera хранить уже дорого зачем столько собираем? кибербезопасность передача данных, политики, контроль как обрабатывать? контуры данных контроль за копированием права доступа утечки шифрование/дешифрование потоки данных коммуникации человек-человек человек-компьютер-человек человек-компьютер компьютер-человек (напоминалки, автодозвон ) компьютер-компьютер пропускная способность ограничивающий фактор жизненный цикл данных создание (в т.ч. автоматическое) обработка анализ систематизация озарения визуализация отчёты уничтожение захоронения, как ядерные отходы хранить дорого а что хранить, что удалять? вычисления на узлах, где данные собраны готовые технологии обработки Google FS Hadoop MapReduce

8

Предпосылки формирования тренда Распространение сенсоров Увеличение пропускной способности сетей Развитие беспроводных сетей Развитие технологий хранения данных (удешевление) 9

Предпосылки формирования тренда 10 * startups.htmlhttp://strata.oreilly.com/2011/08/building-data- startups.html

Предпосылки формирования тренда: публикации 2008, Nature: «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объёмами данных?», Клиффорд Линч. Аналогия с «большой нефтью», «большой рудой». 2011, McKinsey: «Big data: The next frontier for innovation, competition, and productivity». Аналитический отчёт. 11