Интеллектуальный анализ данных в HANA
HANA - платформа современного предприятия. А раз так, значит возникает вопрос: как обстоят дела с интеллектуальной обработкой данных? Как из сырых данных получить действительно важную и интересную бизнесу информацию? Быстро обработать данные, проводить стихийных анализ и т.п. на текущий момент достаточно большинству, но что делать тем, кто хочет больше?
Предлагаю рассмотреть возможности, которые есть в HANA:
1) AFL-PAL
2) Возможность вызова процедур написанных на R
Введение.
HANA - платформа современного предприятия. А раз так, значит возникает вопрос: как обстоят дела с интеллектуальной обработкой данных? Как из сырых данных получить действительно важную и интересную бизнесу информацию? Быстро обработать данные, проводить стихийных анализ и т.п. на текущий момент достаточно большинству, но что делать тем, кто хочет больше?
Предлагаю рассмотреть возможности, которые есть в HANA:
- AFL-PAL
- Возможность вызова процедур написанных на R
Первая возможность
Устанавливается библиотека AFL (Application Function Library) которая включает библиотеку PAL (Predictive Analysis Library)
Библиотека AFL представляет из себя частично набор хранимых процедур в базе данных HANA, а частично наблор шаблонов, а процедуры ещё необходимо сгенерировать[1]. Для этого сначала создаются две процедуры afl_wrapper_generator и afl_wrapper_eraser , а уже потом с их помощью создаются PAL – процедуры. Более подробную информацию можно найти в мануалах на help.sap.com
У человека, который первый раз видит такой механизм, возникает закономерный вопрос, - «Зачем это сделано так?». Ответ на него крайне прост. Потому что, когда генерируется процедура – её имя указывается имя как новое. То есть разные версии могут использовать разные процедуры на основе единого шаблона. Также, данные процедуры обслуживает отдельный сервис HANA – scripserver.Это сделано для обеспечения большей стабильности.
Библиотека PAL включает в себя целый список различных алгоритмов по кластеризации, классификации, ассоциации, анализу отклонений и т.д.
Список дополняется и расширяется с каждым следующим Service Pack-ом.
Тот же Predictive Analysis умеет использовать эти процедуры, тем самым перенося всю логику вычислений на уровень БД.
Вторая возможность
Использовать язык R (язык программирования для статистической обработки данных). В HANA можно писать процедуры на языке R и вызывать их.
Стоит поподробнее описать возможности этого языка, потому что R – это язык, распространяемый бесплатно. Он очень активно используется для статистического анализа. На хабре есть куча статей по нему, вплоть до статей о том, как проанализировать те же статьи на хабре.
Использование BO Predictive Analysis
В Predictive Analysis визуализация возможна «своя», а возможна с использованием языка R (Рис 1).
Рис. 1.
В случае использования BO Predictive
Если хотите прочитать статью полностью и оставить свои комментарии присоединяйтесь к sapland
ЗарегистрироватьсяУ вас уже есть учетная запись?
Войти