Меню

Интеллектуальный анализ данных в HANA

HANA - платформа современного предприятия. А раз так, значит возникает вопрос: как обстоят дела с интеллектуальной обработкой данных? Как из сырых данных получить действительно важную и интересную бизнесу информацию? Быстро обработать данные, проводить стихийных анализ и т.п. на текущий момент достаточно большинству, но что делать тем, кто хочет больше?

Предлагаю рассмотреть возможности, которые есть в HANA:

1) AFL-PAL

2) Возможность вызова процедур написанных на R

Введение.

HANA - платформа современного предприятия. А раз так, значит возникает вопрос: как обстоят дела с интеллектуальной обработкой данных?  Как из сырых данных получить действительно важную и интересную бизнесу информацию? Быстро обработать данные, проводить стихийных анализ и т.п. на текущий момент достаточно большинству, но что делать тем, кто хочет больше?
Предлагаю рассмотреть возможности, которые есть в HANA:

  1. AFL-PAL
  2. Возможность вызова процедур написанных на R

Первая возможность

Устанавливается библиотека AFL  (Application Function Library) которая включает библиотеку PAL (Predictive Analysis Library)
Библиотека AFL представляет из себя частично набор хранимых процедур в базе данных HANA, а частично наблор шаблонов, а процедуры ещё необходимо сгенерировать[1]. Для этого сначала создаются две процедуры afl_wrapper_generator и afl_wrapper_eraser , а уже потом с их помощью создаются PAL – процедуры. Более подробную информацию можно найти в мануалах на help.sap.com

У человека, который первый раз видит такой механизм, возникает закономерный вопрос, - «Зачем это сделано так?». Ответ на него крайне прост. Потому что, когда генерируется процедура – её имя указывается имя как новое. То есть разные версии могут использовать разные процедуры на основе единого шаблона. Также, данные процедуры обслуживает отдельный сервис HANA – scripserver.Это сделано для обеспечения большей стабильности.

Библиотека PAL включает в себя целый список различных алгоритмов по кластеризации, классификации, ассоциации, анализу отклонений и т.д.
Список дополняется и расширяется с каждым следующим Service Pack-ом.

Тот же Predictive Analysis умеет использовать  эти процедуры, тем самым перенося всю логику вычислений на уровень БД.

Вторая возможность

Использовать язык R (язык программирования для статистической обработки данных). В HANA можно писать процедуры на языке R и вызывать их.

Стоит поподробнее описать возможности этого языка, потому что R – это язык, распространяемый бесплатно. Он очень активно используется для статистического анализа. На хабре есть куча статей по нему, вплоть до статей о том, как проанализировать те же статьи на хабре.

Использование BO Predictive Analysis

В Predictive Analysis визуализация возможна «своя», а возможна с использованием языка R (Рис 1).

Рис. 1.

В случае использования BO Predictive

Если хотите прочитать статью полностью и оставить свои комментарии присоединяйтесь к sapland

У вас уже есть учетная запись?

Войти