В последнее время мы всё чаще слышим слова «искусственный интеллект», «машинное обучение», «Big Data» (чтобы лучше понимать, как устроены эти технологии, читайте наш словарь «Big Data, блокчейн, машинное обучение — объясняем термины на ёжиках»). В своих выступлениях на конференциях их упоминает президент и председатель Сбербанка России Герман Греф, издание Meduza частенько публикует материалы с громкими заголовками.
Если раньше казалось, что все эти термины не имеют отношения к реальной жизни, то сегодня нет никаких сомнений — мы сталкиваемся с ними повсюду. Поэтому, в какой бы сфере вы ни работали, скорее всего, там тоже можно применить машинное обучение.
Посмотрите, как выглядит обычный день обычного человека.
Утро. Опять проспал. Закажу такси до работы. Что?! Откуда такие цены? О, можно пройти до соседнего дома, там будет дешевле на 50 рублей.
На работе. Как же сложно подниматься по лестнице, пора худеть, надо заняться спортом. В конце концов, скоро лето! Google исправляет моё очередное «rfr gj[eltnm» на «как похудеть», выдаёт несколько адресов спортзалов, статьи о правильном питании, которые я уже больше не могу видеть. И контекстная реклама клиники пластики и медикаментозного похудения, смешно! Скидка 50 %. Но вообще… заманчиво, не придётся потеть в зале, есть невкусную пищу, ждать. Сайт выглядит прилично… Консультация, цены — всё есть. Может, узнать о кредите?
Обед. Суши за репост! Класс, репостну! Вдруг повезёт.
На работе. Снова какие-то документы на немецком, почему нельзя писать такие вещи хотя бы по-английски?! Открываю приложение Google Translate, навожу на документ. Текст автоматически распознается, и я получаю перевод (спасибо современным технологиям!). Интересно, как приложение вообще понимает текст, если я даже этот шрифт с трудом разбираю? Впрочем, пустые размышления. Отправляю перевод редактору на доработку. Хорошо, что Gmail не завален спамом. Не приходится искать последнее письмо от редактора часами.
Теперь пора дойти до банка.
— Привет, Siri, где ближайший банк?
— Ближе всего к вам находится Сбербанк России, улица Ленина.
В банке.
— Здравствуйте, мне нужен кредит на 300 тысяч рублей.
— Для каких целей?
— Здоровьем заняться планирую…
— Давайте документы, мы проверим вашу кредитную историю.
Кредит на машину >> выплачено
Кредитная история родственников >> в порядке
Зарплата >> выше средней по стране
Проверка социальных сетей клиента >> найдена угроза: «суши за репост»
— Извините, наша система отказала вам в выдаче кредита.
Вечер. Какой длинный и ужасный день. Ничего, сейчас посмотрю какой-нибудь сериал, отвлекусь. Интересно, что там вышло нового на Netflix? Ого, на обложке написано, что сериал сняли Вачовски. Хоть кто-то понимает, что мне нужно этим вечером…
Признаём, ситуация немного утрирована. Но разберите её на детали и увидите, что вся наша жизнь пронизана результатами машинного обучения.
Где мы каждый день сталкиваемся с машинным обучением
Такси. Представляете, сколько людей пользуются Яндекс.Такси? Каждая поездка — это огромное количество данных: точка отправления, маршрут, время в пути, точка назначения, спрос. Анализ всего массива данных теперь позволяет советовать пользователю такую точку отправления, до которой он сможет дойти пешком за несколько минут, водителю будет удобно подъехать, а сама поездка окажется намного дешевле.
Поисковые системы. Каждый раз, когда мы обращаемся к поиску, мы сталкиваемся с работой множества алгоритмов. Одни исправляют в запросе ошибки или автоматически меняют язык раскладки, другие — ранжируют результаты поиска, третьи — анализируют, что мы обычно ищем, чтобы предложить во время ремонта дверные замки в Туле, а не показать замок Нойшванштайн в Германии.
Распознавание текста. Кажется, причём тут машинное обучение? А вы задумывались, сколько разных шрифтов может быть, а уж тем более почерков? Существуют даже специальные программы, позволяющие распознавать почерк врача. Это нужно, чтобы все его записи автоматически попадали в систему, а не требовали кропотливого ручного ввода. Да и если вам нужно оцифровать какой-то бумажный документ, машина должна понимать шрифты, какими бы замысловатыми они ни были.
Онлайн-переводчики. C переводчиками вообще интересная ситуация. Об алгоритмах для переводов говорили много лет, но то возникали сложности с омонимией (как в случае с замками: слова одинаковые, а значения разные), то они плохо работали на предложениях разной длины. Впрочем, последние результаты переводов на основе нейронных сетей уже достаточно неплохие. Они понятны человеку и требуют лишь небольшой редактуры.
Обнаружение спама. Замечали, что в последнее время в почте меньше спама, чем раньше? В Gmail много лет собирали информацию, какие письма пользователи отмечают как спам. В результате алгоритм, обученный на этих данных, стал распознавать спам и фишинговые атаки в 99,9 % случаев. Социальные сети тоже начинают перенимать опыт: Instagram, например, разработал алгоритмы для «отлова» спама на русском, английском, испанском, португальском, арабском, французском, немецком, японском и китайском языках.
Голосовые помощники. Давно пользовались Siri, Google Assistant, Alexa или Алисой? Не важно, ставили вы таймер, когда были заняты руки, или просто развлекались, задавая вопросы голосовому помощнику. Всё это тоже результат работы машинного обучения!
Банки и платежные системы. Тут всё просто: для банковских алгоритмов мы являемся набором характеристик, после анализа которых нам либо дадут кредит, либо нет. Сравнивая миллионы транзакций между собой, алгоритмы PayPal ищут подозрительные и блокируют их. Даже Сбербанк в тестовом режиме оценивает потенциальных заёмщиков по лайкам и репостам в соцсетях (замечали, что приложение просит доступ к ВКонтакте?).
Рекомендательные системы. Самые впечатляющие алгоритмы разрабатываются в Netflix. Только представьте: на основе анализа всего, что вы уже посмотрели в сервисе, алгоритмы предложат фильм или сериал, который должен вам понравиться. Так ещё и подберут именно такую обложку, чтобы вы захотели прочитать описание.
И всё это — примеры практического использования машинного обучения. Как оно работает и зачем используется в маркетинге, читайте дальше.
Как устроено машинное обучение
Представьте, вы с детства знаете, что есть велосипеды, а есть собаки, которые за ними бегают. Очень сложно вообразить, что вы увидите собаку невероятно редкой породы, непривычных размеров или странного окраса и скажете, что это велосипед. Но как научить машину, для которой любая картинка — набор нулей и единиц, не путать собак с другими предметами?
Если вы покажете машине только одну фотографию собаки, она будет считать, что все они имеют только такую форму, цвет, размеры и прочие характеристики. Грубо говоря, собаками будут только предметы, идеально совпадающие с исходной фотографией. А значит, надо показать, что существует множество совершенно разных собак.
Как это сделать? Есть два способа:
- Взять много картинок с собаками и столько же — с велосипедами. Загрузить их в алгоритм и затем самостоятельно выбрать на каждой паре картинок собак. Так алгоритм научится не путать их с велосипедами.
- Собрать миллионы картинок. Сказать, что на всех есть собака. Затем отдать их алгоритму и ждать магию — компьютер определит только ему известные характеристики, присущие всем собакам. В результате с некоторым процентом погрешности он сможет узнавать это животное на новых картинках.
*Теперь распознавание пород собак от Microsoft работает и на людях
Наши иллюстрации с собаками отражают два основных подхода:
- Обучение с учителем (supervised learning) — это когда мы сначала сами выбираем картинки с собаками среди пар «собака-велосипед». То есть у нас есть множество объектов и меток, а дальше алгоритм создаёт некоторую функцию, которую не знает человек.
- Обучение без учителя (unsupervised learning) — это тот пример, когда мы загружаем много фотографий с собаками, а алгоритм сам ищет присущие им признаки. То есть у нас есть много объектов без меток, а алгоритм должен создать и присвоить метки самостоятельно.
Это небольшое введение в процесс, чтобы вы понимали магию! На практике вместо собак и велосипедов обычно исследуются десятки или сотни тысяч характеристик множества клиентов, миллионы картинок, не связанных сюжетом и цветовой гаммой, миллиарды слов.
Как машинное обучение используется в маркетинге
Существует много вариантов использования машинного обучения в маркетинге: от ценообразования до подбора кликабельных картинок. Рассмотрим несколько примеров.
Тщательный анализ аудитории стал трудоёмким процессом, ведь теперь нельзя ограничиваться только географическими данными, возрастом и полом клиентов. Нужно смотреть шире, обращать внимание на поведенческие характеристики, время активности, хобби, даже на то, что лайкают пользователи.
Представьте, вам нужно подготовить рассылку для всех клиентов агрегатора билетов на самолёты. Вы можете отправить одно общее письмо на всех, рассказать и про дешёвые билеты, и про класс повыше. А можете проанализировать, когда, какими рейсами и куда летают ваши пользователи, узнать их интересы, примерное финансовое положение. И в результате одним отправить подборку самых дешёвых направлений с советами о выборе хостела, рекомендациями баров, вторым — наиболее комфортные рейсы в страны для шопинга, а третьим — статьи о путешествиях всей семьей.
Можно много размышлять, какие картинки привлекают пользователей, пытаться самостоятельно найти зависимости: яркость, преобладающие цвета, расположение объектов, фазу Луны. А можно создать алгоритм, позволяющий искать глубокие зависимости между картинками, на которые кликают чаще. В дальнейшем вы сможете использовать его в качестве помощника при создании контента. Наши аналитики создали модель, которая прогнозирует, какая картинка соберёт больше кликов в контекстной рекламе. Это очень полезный инструмент, если вы работаете в агентстве интернет-рекламы.
Анализ текстов — сложная, но хорошо изученная область применения машинного обучения. Например, мы попробовали научить алгоритм определять наиболее конверсионные запросы. Смотрите, как падает относительная конверсионность, если в запросах есть слова «фото» или «отзывы».
Про большие компании отзывы пишут везде: на сайтах отзовиков, в социальных сетях. Размечать положительные, отрицательные и нейтральные комментарии вручную становится всё сложнее из-за их количества. Но и тут поможет автоматизация. Теперь алгоритмы не только распознают сарказм, но и практически не ошибаются в определении тональности отзывов. Например, наша модель определения класса текста автоматически сортирует комментарии на положительные, отрицательные и нейтральные. Да, название у неё странное, но она здорово экономит время специалистов по SERM.
Подводим итоги
Как видите, машинное обучение не только существенно облегчает работу маркетологов, выполняя рутинные операции. Оно помогает систематизировать, обрабатывать и анализировать большие объёмы данных. Машинное обучение позволяет моделировать различные ситуации, делать прогнозы для эффективных маркетинговых решений, с его помощью можно скорректировать стратегию развития бизнеса.
В следующей статье как раз поговорим о предсказательной аналитике, в основе которой — технологии машинного обучения и искусственного интеллекта. Приведём примеры успешного использования предиктивных моделей на практике.