Эпоха «больших данных»: к расширению практического использования

Можно ли эффективно использовать «большие данные» без свободы действий на местах?

Экономика

По мере развития технологий искусственного интеллекта (ИИ) и интернета вещей (IoT) всё большее внимание привлекает к себе «менеджмент на основе анализа данных» – моментальный анализ большого массива данных, отражающих поведение клиентов в целях постоянного выявления новых деловых возможностей. Каким образом находят практическое применение «большим данным» наиболее передовые предприятия? Мы расспросили об этом исследователя информационных технологий, заместителя руководителя Национального НИИ информации Сато Итиро.

Моментальный анализ и реакция на поведение потребителя

—— Принятие решений на основе данных в маркетинге и других областях привлекает большое внимание.

—— Сейчас потребители приобретают товары, обращая внимание не на рекламу, которую дают предприятия, а на отзывы других людей в социальных сетях и на информационных вебсайтах. Поэтому для того, чтобы заниматься маркетингом, обязательно необходимо анализировать действия каждого индивидуального потребителя. Объём анализируемых данных резко увеличился. Но возросшие возможности обработки данных с использованием искусственного интеллекта (ИИ), а также другими методами, позволили осуществлять моментальный анализ больших массивов данных.

Вниманию покупателя на портале электронной торговли «Амазон» предлагается раздел «Те, кто приобрели данный товар, также купили и это». Для того, чтобы давать рекомендации таким образом, «Амазон» осуществляет по каждому пользователю индексацию всех товаров: если покупатель ознакомился с описанием товара – присваивается код «1», если он приобрёл товар – «5», если не предпринял никаких действий – «0» и т. п. Таким образом даже при минимальном количестве покупок и просмотров данным конкретным покупателем, имея покупателей со схожим шаблоном поведения, появляется возможность рекомендовать товары, приобретённые другими людьми со сходными интересами.

«Амазон» исключительно искусно использует эту систему рекомендации товаров для того, чтобы не делать покупателю предложения, которые он воспримет как «совсем не то». В маркетинге массив данных под названием «покупательское поведение» умело используется после анализа с применением ИИ.

Кстати, что касается других предпринимателей в нашей стране, точность выбора рекомендуемых товаров у них не так уж высока, поскольку они либо располагают слишком малым числом пользователей для сопоставления, либо используют смежную информацию, которая отражает не только намерения пользователей. Если потребителю рекомендуют товары, которые ему не нравятся, то он может больше никогда не заходить на этот торговый вебсайт. Вместе с тем, у потребителя портится настроение, если рекомендации создают у него ощущение, что за ним следят. Поэтому нельзя рекомендовать лишь то, что безусловно понравится покупателю. Так что же ему порекомендовать? Это очень важный вопрос, при ответе на который следует учитывать и не самые популярные товары, и товары, которые имеются в наличии с избытком. «Амазон» искусно решает эту задачу на основе комплексного подхода.

«Информация в момент использования» как повод к смене бизнес-модели

—— Какие примеры вы можете привести помимо рекомендации товаров покупателю?

—— Уже получили повсеместное распространение системы POS – терминалы розничной торговли, которые позволяют считывать штрих-код товара и передавать полученную информацию о продаже в центральный компьютер для контроля продаж и управления запасами.

Прежде считалось более чем достаточным просто учесть факт продажи непосредственно в момент её совершения. Но в наши дни благодаря использованию ИИ и повышению возможности обрабатывать большие массивы данных появилась другая возможность: сбор и учёт данных о месте и времени использования товара (POI). Следует предположить, что этот подход получит дальнейшее распространение.

Возьмём, к примеру, продаваемые в Японии автомобили Leaf компании «Ниссан». Информация о количестве используемой электроэнергии литий-ионного аккумулятора, которым снабжается этот автомобиль, ежеминутно поступает на терминалы для зарядки и передаётся через них в центр обработки данных. Наблюдение за использованием заряда аккумуляторов позволяет при необходимости подсказывать, где находится ближайший терминал для зарядки. Это относится не только к автомобилям. Данные о месте и времени использования товара не просто позволяют избегать нехватки товаров в магазинах, но создают возможность предлагать товар как услугу, что, вероятно, в значительной мере изменит бизнес-модель предприятий.

Заместитель директора Национального НИИ информации Сато Итиро

Примеры сокращения потерь клиента благодаря IoT

—— Вероятно, можно привести такие же примеры и в отношении интернета вещей (IoT)?

—— Интернет вещей нераздельно связан с большими данными. Если мы говорим о сборе данных – это IoT, а если об анализе и использовании этого материала – это уже большие данные. Более того, обучение искусственного интеллекта – так называемое глубокое обучение – опирается именно на большие данные. Примерно пять лет назад, когда заговорили о больших данных, единственной возможностью был анализ сведений, полученных из Всемирной паутины, а благодаря IoT мы получили возможность собирать данные о реальном мире.

Некоторые производители офисного оборудования ведут мониторинг эксплуатации своей продукции, связав в сеть копировальные машины и принтеры своих клиентов. Они следят за такими факторами как заедание бумаги, износ деталей, полнота тонеров, запас бумаги, и это позволяет связываться с клиентами и направлять соответствующий технический персонал прежде, чем сам клиент обратится, чтобы сообщить о возникшей проблеме.

К примеру, если известно, что в тонере заканчивается порошок, мониторинг позволит центру оперативного реагирования распорядиться о высылке замены на соответствующий склад. Со склада новый тонер перешлют в ближайший к клиенту сервис-центр, чтобы в конечном итоге тонер оказался у клиента прежде, чем предыдущий будет израсходован полностью. Такой подход позволит клиенту эксплуатировать оборудование без простоев из-за отсутствия расходных материалов. К тому же, благодаря такому мониторингу становится понятно, когда у того или иного клиента происходит наплыв посетителей и оборудование используется чаще – скажем, это может происходить по вечерам или в выходные дни. Установка в офисы таких клиентов более устойчивого к поломкам оборудования позволит минимизировать влияние внезапных неполадок на их бизнес.

Это примеры искусного использования сочетания IoT и больших данных. Но по большей части при обсуждении вопросов анализа больших данных интерес сводится к увеличению за счёт их использования выручки и прибыльности своей компании.

Большие данные – эффективный инструмент минимизации потерь

—— Насколько сложно увеличивать объём продаж с помощью больших данных?

—— Очень сложно. Поэтому фактически среди примеров удачного использования больших данных крупными пользователями гораздо больше примеров сокращения потерь. Для этого собирают, аккумулируют и анализируют деловые неудачи и промахи.

К примеру, бизнес, предлагающий сетевые игры, проанализировал шаблоны поведения пользователей, отказавшихся от их услуг в прошлом. В то время пользователи заключали контракты на условиях ежемесячной оплаты для участия в играх, и самым неприятным событием для компании был уход игроков. Поведение уходящих пользователей в определённой степени было типичным. Перед уходом сокращалась частота доступа, а также обмена сообщениями с другими пользователями. Заблаговременно выявляя по этому поведенческому шаблону тех, кто может уйти, предоставляя этим людям льготы и предлагая новые игры, их удаётся удерживать.

Если особенность данных, ведущих к извлечению прибыли, состоит в том, что мы чего-то «не знаем», то особенность данных, связанных с потерями, заключается в том, что мы имеем дело с чем-то «уже известным». Поэтому фактически большие данные оказывается эффективнее использовать для сокращения потерь, чем для краткосрочного увеличения объёма продаж.

Для того, чтобы выявлять злоупотребления с кредитными картами, компании, которые их выпускают, на основании истории предыдущего использования составляют для каждого пользователя шаблон типичного покупательского поведения. Это даёт возможность замечать подозрительные события, когда имеет место даже незначительное отклонение от этого шаблона. Это тоже пример использования больших данных для сокращения потерь.

Полезное применение данным находят непосредственно на месте событий

—— Что нужно для того, чтобы выявлять на основании уже известных данных особенности, которые ранее оставались незамеченными?

—— Что касается самых любопытных особенностей, полезных с точки зрения бизнеса, то их наиболее дотошно подмечают те, кто ведёт работу непосредственно на местах. Но на практике учёные специалисты, которые выступают в роли аналитиков, чаще всего занимаются своей работой, не интересуясь мнением людей, которые находятся там, где непосредственно происходят события. Между тем, аналитикам следовало бы подкреплять данные тем, что подмечают люди непосредственно на месте.

Анализ больших данных сводится к постоянному повторению процесса построения гипотезы по поводу того или иного свойства определённых данных и последующего сбора информации для проверки гипотезы. Это работа, в которой успехом можно считать, если подтверждается хотя бы одна гипотеза из сотни. Но, прежде всего, такие гипотезы невозможно выдвигать, не имея представления о том, что происходит непосредственно на месте событий. Поэтому нужно обеспечивать надлежащий сбор информации о том, что замечают непосредственно на месте событий, наряду с быстрой реализацией цикла выдвижения и проверки гипотез.

Кроме того, результаты анализа больших данных содержат множество мелких деталей – к примеру, об изменении объёма продаж в зависимости от размещения товаров на прилавках каждого магазина. Следовательно, эти результаты касаются скорее тех, кто находится непосредственно на месте событий, нежели корпоративных менеджеров. А значит, поскольку практическое применение результатам анализа больших данных находят непосредственно на местах, организации, лишенные свободы действий на местах, не смогут извлекать пользу из больших данных.

Стимулировать использование информации, охраняя личные данные

—— Сбор данных ведётся в отношении самых разных аспектов нашей жизни, не правда ли?

—— В связи с этим возникает возможность вторжения в частную жизнь и личные данные. Чем мощнее технология, тем сильнее побочные эффекты, которыми сопровождается её использование. Знать эти побочные эффекты необходимо как разработчикам, так и тем, кто технологией пользуется.

В случае больших данных, как я рассказывал на примере «Амазона», зачастую суждение об отдельных пользователях составляется путём догадок на основании данных о других пользователях. Это очень удобно, если догадка верна, и вместе с тем создаёт проблемы, если она ошибочна. И, пусть даже из благих побуждений, зачастую это сродни подглядыванию за частной жизнью. Для того, чтобы данные использовались должным образом, личные данные и приватность должны защищаться как законом, так и технологически.

Что касается законодательного аспекта, в закон о защите личных данных были внесены поправки с учётом предполагаемого использования больших данных. Эти поправки вступили в силу в мае 2017 года. Если законодательная защита слаба, это, может быть, и приведёт к более широкому использованию данных предприятиями, но вместе с тем частные лица перестанут предоставлять данные о себе. Поэтому при внесении поправок поставили целью позаботиться о защите личных данных и приватности, а уж затем стимулировать использование и циркуляцию сведений о человеке.

Япония уступает в сборе данных

—— Каково нынешнее положение Японии в области больших данных?

—— Такие компании как «Амазон», «Гугл», «Фейсбук» и многие другие создают платформы – вебсайты электронной коммерции, поисковые сайты и социальные сети, искусно собирая данные пользователей, и, ограничивая использование этих сведений рамками своей компании, получают всё новые данные, расширяя свой бизнес.

С другой стороны, Япония, лидируя в мире в деле создания и распространения платформ, позволяющих собирать данные, отстаёт в том, что касается непосредственно сбора данных. Правительство заявляет: «Данные – это общественное достояние, которое должно быть общим». И больше не желает ничего слышать. Но делятся ли собранными данными те, кто более всех остальных преуспел в их сборе – «Гугл», «Фейсбук» и другие компании? Ответ отрицательный. Такова реальность – если не позволить в какой-то определённой степени монопольно использовать в рамках компании данные, которые были собраны благодаря услугам, которые предлагает данная компания – у предприятий не будет стимулов заниматься сбором данных.

У японских предприятий имеется хороший персонал на местах, но вместе с тем огромный вред наносит то, что как на местах, так и на уровне корпоративного менеджмента сильна склонность неукоснительно следовать опыту прошлого. В мире, где не происходит никаких изменений, следовать опыту прошлого вполне достаточно, но в нынешнюю эпоху перемен, если не отыскивать мельчайшие изменения в данных, отражающих реальную ситуацию, и не реагировать на эти изменения тщательнейшим образом – мы проиграем.

Подготовка материала: текст Кувахара Рика (Power News)

Иллюстрация к заголовку: chesky/PIXTA

(Статья на японском языке опубликована 9 ноября 2017 г.)

Интернет Менеджмент большие данные