Машинное обучение в SAP Leonardo*

05 августа 2020

Эразмус Пьер

Винаяк Рао Вивек

Синха Амит

Вадавадиги Ганеш

Машинное обучение — это компонент искусственного интеллекта (artificial intelligence, AI), посредством которого системы могут автоматически обучаться в непрерывном режиме для углубления понимания бизнес-процессов с целью повышения качества результатов.

*Оригинал (англ.): SAP Leonardo. Введение в интеллектуальное предприятие. Пьер Эразмус, Вивек Винаяк Рао, Амит Синха, Ганеш Вадавадиги. Издательство SAP PRESS. Глава 5. 2019.

Машинное обучение позволяет компьютерам выполнять оперативные задачи, обучаясь на материале больших наборов операционных данных, результатов и исторических данных, а не просто выполнять повторяющиеся задачи в соответствии с явно запрограммированными параметрами. Часто в машинном обучении используется библиотека комплексных алгоритмов для обучения на базе огромных наборов больших данных, поступающих из различных источников. Общее правило заключается в том, что чем более всесторонние данные используются в обучении (например, наборы исторических данных большего объёма за более ранние периоды и большее число сезонов), тем более интеллектуальными становятся алгоритмы (которые дают более точные результаты и более эффективно выявляют аномалии).

Начнём эту главу с общего обзора концепции машинного обучения, чтобы понять, что представляет собой данная технология и как она работает. Далее рассмотрим возможности использования машинного обучения в контексте корпоративных приложений. После этого обратим пристальное внимание на решение SAP Leonardo Machine Learning Foundation и перейдём к описанию возможностей применения машинного обучения в существующих инструментах и продуктах SAP. В этом разделе мы не будем подробно описывать каждый продукт, в который можно встроить машинное обучение, а сфокусируемся на том, как использование машинного обучения может расширить каждое из решений. Наконец, завершим главу обзором нового предложения SAP: SAP Intelligent Robotic Process Automation.

Что такое машинное обучение? (раздел 5.1)

Специалисты по обработке данных используют машинное обучение, чтобы изучать, определять и обучать алгоритмы для выявления тенденций по большим данным. Целью является применение машинного обучения для получения новых ценных сведений и улучшенных результатов. Для этого используются алгоритмы двух категорий: контролируемые и неконтролируемые.

Контролируемое машинное обучение часто является отправной точкой для начинающих и используется, как правило, если контекст, процессы или результат являются более описательными или лучше известны людям. Примерами алгоритмов контролируемого обучения являются линейная и логистическая регрессия, многоклассовая классификация и метод опорных векторов. При контролируемом машинном обучении специалист по обработке данных определяет входные данные и желательные результаты для программирования алгоритма с учётом окончательного дизайна и ожидаемого описательного результата. Таким образом, в контролируемом обучении вывод алгоритма известен заранее, а входные данные для обучения алгоритма уже имеют маркировку. В данном случае контролируемое обучение позволяет оптимизировать существующие процессы, повысив их производительность или улучшив экономические параметры с упором на автоматизацию.

Неконтролируемое машинное обучение ближе к тому, что мы называем искусственным интеллектом, и ориентировано на исследование данных в ходе непрерывного обучения. В этом случае алгоритмы обучаются распознавать аномалии и модели в данных без вмешательства человека, самообучаясь посредством непрерывного исследования данных. Сегодня мы только начинаем осваивать возможности неконтролируемого обучения. Часто такие алгоритмы применяются для более простых сценариев. Однако это весьма многообещающая и перспективная сфера. Возможно, вскоре неконтролируемое машинное обучение позволит решать намного более сложные задачи, неподвластные обычному человеку.

При неконтролируемом обучении определяются новые входные данные с повторной маркировкой по новым категориям. Например, все данные с датчиков, подключённых к Интернету вещей (например, датчики трения, вибрации и температуры), можно определить как триггеры/симптомы некорректного функционирования или установки деталей оборудования. Часто входные и выходные данные оказываются неожиданными и изменяются со временем, поскольку алгоритм усваивает или обнаруживает более релевантные входные данные и поставляет более ценные результаты. На основе результатов неконтролируемого обучения можно создавать новые бизнес-процессы и/или инициировать изменения в процессах. В реальности применяется сочетание контролируемого и неконтролируемого обучения.

На более общем уровне результат работы алгоритма машинного обучения зависит от алгоритма, который используется с учебными данными. Рассмотрим стандартные категории моделирования.

Регрессия

В основе регрессионного анализа лежит статистическое моделирование. Такой анализ используется, чтобы сделать выводы о причинной зависимости. Регрессии выполняются с использованием зависимых и независимых переменных. Регрессионный анализ определяет корреляцию между результатами, прогнозируя значение зависимой переменной по значениям независимых переменных. Для учебных данных предоставляются значения для переменных обоих видов. Модель вписывается в регрессионную кривую, которую можно использовать для прогнозирования значения на тестовых данных. На Рис. 5.1 представлен пример регрессионного анализа, в котором регрессионная кривая подходит для зависимой переменной выручки от продаж на основе значений независимых переменных бюджета на стимулирование продаж и бюджета на изучение новых продуктов. По регрессионной кривой можно прогнозировать будущие показатели выручки от продаж в зависимости от бюджета на стимулирование продаж и изучение новых продуктов. В SAP Leonardo Machine Learning Foundation и решениях для определения потребностей при выполнении прогнозной аналитики используются различные сложные регрессионные модели.

Рис. 5.1 Пример регрессии в машинном обучении

Перевод картинки:

Классификация

Целью классификационной модели является категоризация объекта в группе предварительно определённых категорий на основе его атрибутов. Сегодня с помощью классификационных моделей машинного обучения выявляются тысячи мошеннических операций по кредитным картам. На основе атрибутов транзакции мошеннические операции выделяются из тысяч операций в реальном времени. Другой пример показан на Рис. 5.2. Здесь применяется распознавание изображений для идентификации продукта. В данном примере группа по ТОРО фотографирует изношенную деталь и отправляет изображение в систему SAP Leonardo.

С помощью алгоритма классификации машинное обучение позволяет идентифицировать важную деталь и отслеживает текущий запас этих деталей на заводе, выделяя их из тысяч других. Далее с помощью интегрированной корпоративной системы машинное обучение предлагает опцию для заказа дополнительного количества из запаса на складе или для создания заказа на поставку для закупки деталей у поставщика, чтобы избежать ситуаций дефицита или отсутствия важных деталей в нужный момент. Этот пример наглядно показывает гигантский прогрессивный потенциал машинного обучения для управления запасами деталей и получения связанных преимуществ в результате повышения эффективности процесса.

Рис. 5.2 Пример классификации в машинном обучении

Перевод картинки:

Кластеризация

Кластеризация — это пример неконтролируемого машинного обучения с целью группирования совокупности по значащим кластерам, релевантным для выбора бизнес-действий или принятия решений. Ожидается, что члены одного кластера или группы будут более похожи друг на друга, чем члены разных кластеров. Число кластеров на размер совокупности указывается для алгоритма или вычисляется алгоритмом моделирования кластеров для машинного обучения. На Рис. 5.3 показан пример вывода алгоритма кластеризации в SAP Leonardo: клиенты компании розничной онлайн-торговли были сгруппированы на основе годового дохода и стоимости покупок за год. Как показано на Рис. 5.3, клиентов можно сгруппировать по трём отдельным идентифицируемым кластерам. Эти кластеры можно использовать при составлении специализированных программ стимулирования продаж, для направленной рекламы или при создании возможностей апселлинга. Такая аналитика повышает эффективность расходования бюджетов на сбыт и маркетинг, позволяет увеличить выручку, генерирует возможности, снижает отношение выручки и затрат для каждого клиента и обеспечивает лояльность клиентов в долгосрочной перспективе.

Рис. 5.3 Пример кластеров в машинном обучении

Перевод картинки:

Существует два подхода к машинному обучению.

Встроенное машинное обучение

Этот подход применяется в простых случаях, например, при выявлении тенденций, прогнозировании или использовании алгоритмов с низкими потребностями по ресурсам ЦП/ОЗУ/данным. Данных в S/4HANA достаточно для обучения модели, больших массивов внешних данных для обучения не требуется. Все необходимые алгоритмы предоставляются в SAP HANA (например, Predictive Analysis Library, Automated Predictive Library (APL), анализ текста) и обрабатываются интегратором SAP Predictive Analytics в рамках управления жизненным циклом модели машинного обучения.

Параллельное машинное обучение

Этот подход применяется для глубокого обучения, например, для обработки изображений или языков, а также нейронных сетей. В таких случаях требуется большой объём ресурсов ЦП/ОЗУ/данных. Логика машинного обучения реализована в SAP Cloud Platform, а бизнес-логика может находиться в SAP S/4HANA или SAP Cloud Platform. Для обучения модели требуются огромные объёмы внешних данных с ориентацией на обработку неструктурированных данных.

На Рис. 5.4 представлена архитектура машинного обучения. Слева по центру показан пример средств машинного обучения, встроенных в SAP S/4HANA или приложения с параллельным выполнением машинного обучения, как в примере в правом верхнем углу, где представлены приложения SAP S/4HANA для машинного обучения, использующие технические и бизнес-сервисы SAP Leonardo Machine Learning Foundation.

Рис. 5.4 Архитектура машинного обучения

Перевод картинки:

Machine Learning Foundation (раздел 5.2)

Решение SAP Leonardo Machine Learning Foundation предназначено для разработки, создания и тестирования алгоритмов машинного обучения для приложений и предоставляет пользователям и компаниям функции для создания, тестирования, выполнения, изменения и ведения алгоритмов.

SAP Leonardo Machine Learning Foundation позволяет создавать настроенные приложения для машинного обучения. Пользователи всех уровней, в том числе начинающие и не имеющие навыков анализа данных, могут работать с инструментарием и библиотекой готовых шаблонов и алгоритмов для изучения, редактирования, изменения и тестирования, а опытные пользователи с помощью этой платформы могут создавать сложные алгоритмы. SAP Leonardo Machine Learning Foundation может объединять нескольких стейкхолдеров, включая разработчиков, партнёров и клиентов для совместного использования технологий машинного обучения на базе SAP Cloud Platform.

SAP Leonardo Machine Learning Foundation — это облачный продукт с библиотекой готовых сервисов и встроенными алгоритмами для обучения, тестирования и выполнения алгоритмов с применением пользовательских источников данных или их разнообразных наборов. Также поддерживается интеграция со сторонними решениями и источниками данных для потоковой передачи, например, с моделями Google TensorFlow. С помощью этого решения вы сможете разрабатывать и оптимизировать настраиваемые процессы приложений с применением правил машинного обучения и возможностью использования разных типов данных со специализированными алгоритмами для работы с текстом, речью, изображениями и временными рядами.

Как показано на Рис. 5.5, SAP Leonardo Machine Learning Foundation предоставляет конечным пользователям мощные возможности для выполнения процессов машинного обучения, встроенные в приложения. Перечислим некоторые из этих возможностей.

Разработчики могут встраивать в приложения многократно используемые сервисы машинного обучения.
Специалисты по анализу данных могут обучать модели как сервис путём внедрения собственных моделей.

Рис. 5.5 SAP Leonardo Machine Learning Foundation

Перевод картинки:

Функцию сохранения в виде сервиса можно использовать при настройке или изменении существующих моделей машинного обучения.
Вы можете применить собственную модель и развернуть существующие результаты как сервис.
Сервисы можно встраивать в бизнес-приложения.

Корпоративные системы могут выступать в качестве источников данных через облачный коннектор SAP Cloud Platform Connectivity. Либо с помощью SAP Data Hub можно подключаться к SAP S/4HANA или системе базы данных SAP HANA.

К основным функциональным сервисам в SAP Leonardo Machine Learning Foundation относятся алгоритмы для обработки изображений, текста и речи. Настроенные сервисы машинного обучения можно использовать с собственными данными в API обучения и пользовательских моделях. Кроме того, эти сервисы можно использовать через API REST посредством API потребления.

В SAP Leonardo Machine Learning Foundation реализованы следующие функции для обработки изображений.

Классификация изображений

Эта функция классифицирует изображения по общим категориям, например, с атрибутами вида, цвета, размера, темы изображения и т.д.

Настраиваемая классификация изображений

Создайте пользовательский сервис классификации изображений с собственными данными, который будет распознавать типы по вашей классификации.

Настраиваемое выявление объектов на изображении

Создайте сервис для обнаружения и распознавания пользовательских объектов на изображениях.

Экстракция особенностей изображений

Эта функция представляет контент изображения в виде вектора для поиска изображений с похожим контентом.

Оптическое распознавание символов и распознавание текста на фоне

Эта функция обрабатывает сканы документов или содержащих текст изображений и извлекает текст и числа.

Обнаружение людей и обнаружение лиц

Эта функция позволяет выявлять фотографии с изображениями людей или человеческих лиц.

Экстракция особенностей лиц

Эта функция используется для представления лица в виде вектора для поиска изображений с такими же лицами.

Устройство сегментации изображений с несколькими экземплярами

Эта функция разделяет изображение на сегменты, которые, как правило, используются для определения границ или поиска объектов.

На Рис. 5.6 представлены функции SAP Leonardo Machine Learning Foundation для обработки изображений и примеры микросервисов обработки изображений.

Рис. 5.6 Классификация изображений в машинном обучении

Перевод картинки:

На платформе SAP Conversational AI реализованы возможности обработки на естественном языке. С помощью функций этой платформы можно создавать пользовательские боты, которые будут понимать клиентов и осуществлять коммуникацию с ними. Кроме того, здесь автоматизировано эффективное выполнение периодических задач. Отраслевые готовые боты для поддержки клиентов позволяют быстро и эффективно внедрить решение. В решении доступны следующие функции обработки речи.

Оформите подписку sappro и получите полный доступ к материалам SAPPRO

У вас уже есть подписка?

Войти

Обсуждения 2

Комментарий от

Nikolay Grabarov

| 01 сентября 2020, 09:30

я сталкивался с подобной проблемой на HP-UX, решение по оптимизации размеров реду-логов у меня было точно такое же, однако радикальный прирост производительности дало разбиение процессов экспорта/импорта больших таблиц на части (технология split tables). Только в "старых" SAP системах процесс экспорта/импорта должен запускаться в ручную в терминальном режиме с помощью скриптов на исходной платформе export_monitor.sh и на целевой платформе import_monitor.sh

Комментарий от

Вячеслав Шиболов

| 01 сентября 2020, 11:57

Nikolay Grabarov 01 сентября 2020, 09:30

Николай, на сколько я понял, для "установщика" 4.6C технология split tables недоступна даже через скрипты. Или я недостаточно тщательно искал решение. В текущем проекте я уложился во временные рамки даже без разбиения таблиц. А так можно было дальше оптимизировать процесс.