На схожем принципе выстроена вся работа по обработке и анализу «больших данных» – тех самых big data, о которых наслышан каждый из нас. Большим данным, как и фантастической психоистории, приписывают самые невероятные возможности. Буквально недавно мы читали о якобы влиянии технологии персонализированной рекламы, основанной на анализе big data, на победу Дональда Трампа. Google на основании пользовательских запросов создали Google Flu Trends – систему отслеживания распространения гриппа по США, которая опережала по оперативности даже американский Центр контроля и профилактики заболеваний. Приложение Street Bump должно было максимально быстро улучшать транспортную инфраструктуру Бостона, сообщая в реальном времени о каждой выбоине на дорогах.
Однако с большими данными все совсем не так просто. Cambridge Analytica, которой предписывали столь могущественное влияние на выборы в США, работала не только над успешной кампанией Трампа или того же Теда Круза, но и над очевидно провальной кампанией Бена Карсона. Google Flu Trends вскорости не смогли верно предсказать вспышку гриппа, просто потому, что на частоту поисковых запросов в какой-то момент повлияла не сама болезнь, а новостной фон о гриппе в СМИ. Street Bump исправно сообщала о выбоинах – но только в кварталах состоятельных людей, которые в состоянии купить личный автомобиль и смартфон, и лучше информированы о возможности помочь городским властям.
Значит ли это, что важность «больших данных» – миф? Нет, конечно. Просто нужно понимать, что big data – не панацея от всего, и не готовые ответы на любые вопросы, а эффективный современный инструмент для создания рабочих моделей. И профессиональные аналитики понимают, что этот инструмент требует системного изучения, понимания, и совершенствования.
К сожалению, у нас в Казахстане специалисты по big data – штучный и очень редкий «товар». С этой проблемой сталкиваются многие казахстанские компании, аккумулирующие значительные массивы данных. Особенно актуальным вопрос дефицита таких специалистов является для розничного бизнеса, развивающего проекты с долгосрочной перспективой. В век информации важно не отстать от мировых трендов, поэтому компании по-разному пытаются решать эту проблему. Отправляют своих сотрудников на обучение за рубеж, приглашают на работу заграничных специалистов. В Kaspi нашли для себя еще одно решение проблемы - воспитать новое поколение аналитиков самостоятельно, запустив в работу масштабный системный образовательный проект – «Лаборатория Kaspi». В этом году Лаборатория выпускает аналитиков нового поколения уже третий раз.
Лаборатория Kaspi – это не просто курс лекций, это настоящая творческая мастерская, пройдя которую студенты получают сертификаты от Kaspi, совместно с компаниями SAS (мировым лидером в области бизнес-аналитики), и Glowbyte (одним из лидеров на территории СНГ в области IT консалтинга). На занятиях в Лаборатории производится разбор реальных бизнес-кейсов из таких сфер деятельности, как телекоммуникации, сегмент FMCG, банковская деятельность, интернет-продвижение.
Директор Департамента анализа и применения данных Kaspi Bank Думан Уватаев говорит, что Лаборатория – скорее социальный проект. «Мы не относимся ревностно к тому, что наши студенты могут работать где-то еще. Прикладные задачи, которые мы приводим в качестве примеров, касаются не только банковской деятельности – и это не случайно. В течение курса анализа больших данных, мы охватываем такие направления деятельности как таргетированный маркетинг, бизнес-аналитика, продажи, телекоммуникации и т.д. Пройдя обучение у нас, человек может стать продвинутым специалистом-аналитиком в самых разных областях», – уверяет он. Прогнозы Думана полностью оправданы: 100% выпускников первого выпуска трудоустроены в крупнейших казахстанских и зарубежных компаниях, в том числе – в банковском секторе. Самые выдающиеся в каждом из трех выпусков остаются работать в самом Kaspi Bank.
Не обошлось на проекте и без курьезов. Изначально, еще в 2014 году, Лаборатория приглашала к обучению только студентов вузов-партнеров – а это ведущие университеты страны: КазНУ, КазНТУ, КИМЭП, АУЭС, КБТУ, МУИТ, SDU и AMU. Однако уже во втором выпуске 2015 года среди учащихся под видом студентов партнерских университетов оказывались как ребята совершенно других вузов, так и, например, молодые инициативные вузовские преподаватели. Был среди учащихся второго набора даже руководитель крупной финансовой компании, записавшийся под видом студента. Так организаторы в Kaspi поняли, что получаемые в Лаборатории знания очень ценны – и решили расширить доступ к ним для всех желающих. В 2016 году конкурс составлял 11 человек на место: Из 530 зарегистрировавшихся студентов успешно прошли тестирование и приступили к обучению 47 человек (в предыдущих выпусках на курс набирали не более 30 студентов). 26 декабря состоится торжественное вручение сертификатов выпускникам-2016.
Один из учащихся третьего набора, программист Константин Попов, поделился своим видением пользы Лаборатории: «Во время занятий у нас была задача – разработать алгоритм по вычислению банковских мошенников. Эти люди вредят честным пользователям, получают обманом доступ к интернет-банкингу, например, или берут кредиты на чужое имя. Их можно вычислить. Регулярно собираются данные о поведении таких злоумышленников. Согласно собранным данным выстраивается математическая модель. Получается некий сводный “портрет мошенника”, и, если человек попадает под вычисленные характеристики, то есть повышенная вероятность того, что он нечист на руку. Так, благодаря своевременной аналитике, можно защитить пользователей – причем не только в банковской сфере, это универсальная модель».
Еще один интересный бизнес-кейс, показывающий важность грамотной работы с большими данными – совместный продукт Kaspi с крупнейшим проектом для автолюбителей – «Колеса». В основе совместной разработки, названной «Проверено Колесами», лежит клиентская аналитика – data mining. Суть проста: клиенты, которые хотят быстро продать свой автомобиль, могут обратиться в специализированные сервисы, где их железного коня оценят. При этом оценка производится в автоматическом режиме. Параметры автомобиля, все его технические характеристики вносятся в систему. Далее автоматический комплекс, исходя из этих параметров, в течение нескольких секунд выдает справедливую рыночную стоимость. Если бы оценку проводил человек, она заняла бы несколько часов. Кроме того, уровень объективности был бы значительно ниже – ведь оценщик просматривает всего порядка десятка объявлений о продаже аналогичных автомобилей. А аналитический комплекс проводит сравнительный анализ одновременно по нескольким тысячам объявлений. В итоге продавец предлагает, а покупатель приобретает автомобиль по гарантировано справедливой стоимости. По результатам исследований, скорость продажи автомобилей, которые были проверены таким образом, возрастает вдвое.
Объем обучающего материала в 2016 году увеличился в полтора раза, и достиг 137 академических часов: 105 академических часов – наука о данных; 32 часа – геосервисы. Кстати, именно отдельный курс «Геосервисы» – принципиальное новшество третьего набора. В рамках курса участники получили возможность самостоятельно создать приложение с использованием современных подходов геотаргетинга.
Геосервисы – часть современной неогеографии, новый подход к работе с локализованной в географическом пространстве и во времени информацией. Звучит для большинства из нас непонятно, но на самом деле все просто. Представьте, что вы ищите какой-то продукт. Вам важны его характеристики и цена – но немаловажно и место, где его можно приобрести. Геосервисы позволяют сделать такой поиск максимально удобным для потребителя. «Зачастую компании ограничиваются тем, что вывешивают на сайте список магазинов, где можно купить их продукт – но ведь таких торговых точек может быть великое множество. И пользователь по адресам должен предположить, как далеко они от него находятся. Мы решили упростить жизнь своим клиентам и в рамках клуба Kaspi Red сделали очень удобную карту, где обозначены более 500 магазинов – партнеров клуба, с разбивкой по категориям», – рассказывает Думан Уватаев.
Можно привести очень много примеров необходимости и востребованности современных аналитических технологий. Специалисты новой эры приносят очевидную пользу как потребителям, обеспечивая наиболее полную реализацию их потребностей, так и рыночным игрокам, облегчая им работу, и заставляя новые технологии функционировать на пользу обществу. И где бы ни использовались big data, неогеография, или иные новейшие инструменты анализа – для развития финансовых структур, производства, или науки – биологии, медицины, генетики, астрономии, физики, инжиниринга, бионики и так далее – главной целью всех исследований остается Человек и его интересы.
Фото Владимира Третьякова