Хотя эта работа — офисная, далеко не всякий сможет ею заниматься. Ибо без математики там ни туды и ни сюды.
Сколько мест для парковки необходимо выделить для строящегося офиса фирмы, или сколько будет потребителей электроэнергии? Сколько нужно курьеров, где должны быть расположены офисы обслуживания, каково должно быть количество операторов службы поддержки? Ответ на подобные вопросы можно найти, обработав терабайты, а иногда — и петабайты данных.
В ближайшие годы в разных секторах экономики — торговле, производстве, здравоохранении, образовании — будет возникать все большая потребность в оперировании данными огромного размера, и все больший дефицит специалистов, которые могут это делать.
Проанализированные данные дают простые ответы. Однако исходным материалом для такого анализа являются миллионы записей о движении RFID меток, о щелчках мыши в компьютерах сотрудников и клиентов, о движении товарных чеков. Для работы с подобными данными такие компании как IBM разрабатывают специализированное программное обеспечение, но кто будет с ним работать?
«Вы должны взять огромное количество неструктурированных данных, очистить их, и понять, как их правильно использовать», — цитирует Spectrum Майкла Хаслера, руководителя нового курса по большим данным в Техасском университете, Остин, США. Профессор поясняет, что такая работа требует таланта и похожа на труд старателей, промываюших огромное количество породы, чтобы найти крупицы золота. Для такой работы у эксперта должны быть знания и навыки в различных областях, среди которых информатика, экономика, инженерия, статистика.
«Наша задача — готовить квалифицированных рассказчиков, — говорит Хаслер. — После недели работы такой человек должен за 10 минут объяснить слушающим его людям суть проблемы и предложить оптимальное решение». По словам профессора, к 2018 году в США нехватка специалистов по большим данным будет насчитывать 190 тысяч человек. Во всем мире ситуацию можно назвать катастрофической: компьютерные сети и средства автоматизации во всех сферах экономики развиваются, но бизнес просто будет засыпан количеством данных, среди которых будет некому навести порядок.
Однако, в университетской среде уже наметились положительные сдвиги. В США специалистов по большим данным начали готовить университеты Северной Каролины и Северо-Западный университет в Эванстоне (Иллинойс), а также Нью-Йоркский университет. Подобные курсы открылись также в университете Мельбурна (Австралия) а также Дублина (Ирлания), а в Индии «цифровых старателей» готовят в университетах Мумбая и Бангалора.
Примером успешной карьеры в области больших данных, которую можно построить в неожиданных секторах экономики, Хаслер назвал деятельность Скотта Альбрехта. Проработав четыре года в консалтинговой фирме, этот человек решил пройти курс работы с большими данными в Техасском университете. Окончив обучение, специалист получил приглашение стать аналитиком в профессиональном баскетбольном клубе NBA в Кливленде. Теперь Альбрехт занимается анализом эффективности игроков.