Я – аналитик Big Data. Я изучаю гигантские массивы данных и систематизирую их в зависимости от конкретных целей и задач. Представьте, какие объемы цифровой информации появляются всего за сутки? А за год? Количество новых пользователей в социальных сетях – это большие данные (только за прошедший год их стало почти на 300 миллионов больше!). Сколько пачек молока сегодня купили в твоём регионе – тоже большие данные. А сколько из них были оплачены бесконтактным способом? Моя задача – во всех этих цифрах разобраться, увидеть скрытые закономерности и дать правильные рекомендации клиентам.
Как настоящий маг и провидец, я предсказываю поведение людей в магазине, чтобы поднять продажи, знаю, какой стартап обречен на успех, и помогаю корпорациям защититься от мошенников. Только помогают мне в этом не заклинания и заговоры, а магия чисел. Как правило, к категории Big Data относятся потоки данных свыше 100 Гб в день (а «Война и мир» Л.Н. Толстого «весит» всего 5 Мб!), поэтому я должен уметь анализировать не только точно, но и быстро. В этом мне помогают новейшие компьютерные технологии. Так что без идеального английского – никуда, на нем написана большая часть технической документации.
Чаще всего ко мне обращаются компании из сферы финансовых услуг, транспорта, медицины, промышленности и телекоммуникаций -- им особенно важно знать все о поведении своих клиентов. Например, если я определил, что в городе появилось 100 тысяч людей с последней моделью телефона — мой клиент, сотовый оператор, понимает: здесь срочно нужно стоить новую LTE-станцию. А вот в соседнем населенном пункте можно обойтись и 3G. Без моих навыков предприниматели играют вслепую. Именно данные, которые я проанализировал, помогают им не просто двигаться в правильном направлении, но ещё и самым легким и коротким путём. Поэтому профессионалы в сфере Big Data сегодня буквально на вес золота.
Анализирую информацию из самых разных источников и нахожу иголку в стогу сена
Провожу в обнимку с компьютером и координирую работу специалистов по базам данных
Строю математические модели – без них никуда
Осваиваю новые отрасли, ведь в ритейле, нефтегазовой промышленности или медицине - свои тонкости
Генерирую новые идеи и подходы к решению бизнес-задач
Действительно очень много думаю. Компьютер, конечно, помогает, но большая часть работы происходит у меня в голове
Знаешь ли ты, что
Впервые термин Big Data – (дословно «большие данные») предложил в 2008 году редактор журнала Nature — Клиффорд Линч. Спецвыпуск был посвящен взрывному росту мировых объемов информации.
Анализ данных интересовал ученых уже в XX веке. В 1944 году библиотекарь Фремонт Райдер посчитал, что библиотеки должны удваивать вместительность каждые 16 лет. А Йельская библиотека к 2040 году должна будет состоять из 6000 миль (около 10000 км) полок.
С каждым годом объем генерируемой человеком информации растёт. К 2020 году объем хранимых данных увеличится до 40-44 зеттабайт (1 ЗБ ~ 1 миллиард ГБ). К 2025 году — до примерно 400 зеттабайт.
По оценкам крупнейшей консалтинговой компании в 2021 году общий объем мирового рынка аналитики больших данных увеличится до показателя в $67,2 млрд. Ежегодный рост составит около 35,9 %.
Главные характеристики Big Data – три V: volume (большие объемы), velocity (необходимость быстрой обработки), variety (разнообразие).