Меню

Дхарма Теджа Атлури

Рейтинг: 3100

Результат: 31 материала(ов)
Теджа Атлури Дхарма

Сортировать:

Новое Популярное

Определение правил по качеству данных и работа со сводами правил

В предыдущих разделах мы рассказали, как публиковать наборы данных и организовывать их по тегам, как выполнять профилирование наборов данных для сбора признаков атрибутов данных, а также как делать эту информацию доступной для анализа и использования. С самого начала работы вам необходимо непрерывно контролировать уровень качества данных, чтобы обеспечить их пригодность для анализа и извлекать из них действительно ценные сведения. Для этого вам потребуются правила, созданные по атрибутам и элементам данных. По этим правилам вы будете оценивать свои данные. Результат такой оценки в количественном представлении будет отображаться на информационных панелях. Рассмотрим выполнение всех этих задач подробнее.

Управление публикациями и каталогами данных

В этом разделе представлены различные шаги для создания метаданных, связанных с разными исходными и целевыми наборами данных и доступными для организации посредством публикации, а также для управления этими метаданными. Вы узнаете, как организовать данные, а также связанные атрибуты и поля путём присвоения и организации тегов.

Профилирование данных для их изучения

Профилирование данных представляет собой процесс анализа с подробным статистическим отчётом по набору данных. Встроенные функции проводника метаданных позволяют выполнять профилирование данных для получения дополнительной информации о данных, хранящихся в объекте, в том числе минимальных и максимальных значениях, средней длине, нулевых, пустых и различающихся значениях.

Управление данными посредством метаданных

Переходим к теме управления данными и качеством данных. Из этой главы вы узнаете, как с помощью функций управления метаданными в SAP Data Intelligence, можно управлять данными и генерировать на их основе ценную информацию. Мы рассмотрим каждый шаг этого процесса с практическими примерами.

Приложения для системных администраторов

В SAP Data Intelligence реализованы продуманные средства контроля для управления системами, управления лицензиями и создания пользователей. Благодаря реализации предварительно определённых политик и опций для пользовательской настройки этих политик данное решение обладает гибкими возможностями для создания продуманной матрицы разделения полномочий. В этом разделе рассмотрим каждую из этих областей и операции, обычно выполняемых системными администраторами с помощью SAP Data Intelligence.

Приложения для специалистов по моделированию и аудиторов

Итак, мы рассмотрели уже многие приложения в SAP Data Intelligence, в том числе «Управление подключениями» (Connection Management), «Проводник метаданных» (Metadata Explorer), «Средство моделирования» (Modeler), «Менеджер сценариев машинного перевода» (ML Scenario Manager) и «Инструменты Vora» (Vora Tools). Чтобы обеспечить согласованную работу этих инструментов, требуется приложение «Мониторинг» (Monitoring).

Приложения для специалистов по анализу и обработке данных

Операции, выполняемые специалистом по анализу и обработке данных, в некоторой степени пересекаются с задачами инженера по данным, особенно в плане анализа, предварительной обработки данных (т. е. подготовки данных к использованию в модели искусственного интеллекта/машинного обучения) и проверки будущих выводов. Рассмотрим задачи специалиста по анализу и обработке данных подробнее.

Приложения для инженеров по данным

В проекте обработки и анализа данных представлены разные этапы и операции, которые можно организовать по ролям (инженер по данным, специалист по обработке и анализу данных и разработчик приложений, а также специалисты по поддержке. Данный раздел посвящён приложениям для инженеров по данным.

Приложения на панели запуска SAP Data Intelligence

Как мы уже говорили в главе 2 (раздел 2.5), панель запуска SAP Data Intelligence представляет собой приложение на основе браузера, которое функционирует как единая точка доступа к приложениям, в которых можно выполнять самые разные задачи: от первичного сбора данных, обнаружения и предварительной обработки до конечного потребления данных посредством сервисов RESTful после применения к ним моделей искусственного интеллекта и машинного обучения в соответствии с индивидуальными бизнес-требованиями.

Работа с приложениями SAP Data Intelligence

В этой главе мы продолжим подробнее говорить о темах, начатых в главе 2. Вы узнаете, как панель запуска SAP Data Intelligence упрощает выполнение различных задач для инженеров по данным, специалистов по обработке и анализу данных, специалистов по моделированию, аудиторов и системных администраторов.

Установка SAP Data Intell с использованием плановика ТОРО и SLC Bridge

Теперь подробнее рассмотрим общую последовательность шагов. В следующих разделах представлены релевантные задачи и понятия. Если вы планируете выполнять установку сейчас, рекомендуем изучить дополнительные справочные материалы и выполнить практические упражнения для освоения новых для вас понятий. Этих шагов будет достаточно для получения общего представления о сквозной процедуре установки.

Планирование и предпосылки для установки SAP Data Intelligence 3.0 в локальной среде

C точки зрения планирования определения размера и установки для SAP Data Intelligence реализован модульный подход. Доступны различные варианты развёртывания: от базовой платформы до расширенного и полного стека.

Установка SAP Data Intelligence 3.0 в локальной среде

В этом разделе рассматриваются основные задачи и понятия для выполнения начальной установки и конфигурирования SAP Data Intelligence. Этот раздел не претендует на звание главного руководства или руководства по установке, ориентированного на задачи. Нет, мы просто представим здесь обзор наиболее важных предпосылок и шагов в плановике ТОРО, чтобы показать вам размах общего процесса развёртывания.

Получение доступа к Jump Box для мониторинга и устранения неисправностей

Для выполнения входа в Jump Box с помощью SSH на компьютере с ОС Microsoft Windows можно использовать утилиту PuTTY (https://www.putty.org/). Это бесплатный SSH- и Telnet-клиент для Windows. В следующих разделах рассмотрим шаги настройки и получения доступа к Jump Box, копирования файлов журнала и мониторинга через провайдера облачных услуг AWS.

Подключение к SAP Cloud Appliance Library

После завершения подготовительных операций можно переходить к работе с SAP Cloud Appliance Library и продолжить настройку SAP Data Intelligence. Сначала следует определить учётную запись провайдера облачных услуг и использовать её при создании экземпляра.

Настройка SAP Data Intelligence в SAP Cloud Appliance Library

После изучения особенностей определения требований к аппаратным характеристикам ландшафта, обзора и условий предоставления SAP Cloud Appliance Library переходим к шагам настройки SAP Data Intelligence. Начнём с подробного рассмотрения обязательных предварительных настроек для трёх основных провайдеров облачных услуг. В качестве примера возьмём настройку для провайдера AWS.

Предоставление облачных ресурсов по запросу и определение требований к характеристикам оборудования для SAP Data Intelligence

Как мы уже говорили в разделе 3.1.2, в SAP Data Intelligence используется технология контейнерных приложений (т. е. Kubernetes и реестры контейнеров). Поскольку система SAP Data Intelligence является предварительно сконфигурированным программно-аппаратным комплексом на платформе SAP Cloud Appliance Library, здесь применяется минимальный размер ландшафта кластеров Kubernetes с тремя рабочими узлами. В этом разделе рассматриваются опции SAP Cloud Appliance Library, которые упрощают определение размера системы, а также приводятся поддерживаемые провайдеры облачных услуг и связанные затраты. Кроме того, вы узнаете, как выполнять резервное копирование, восстановление и завершение работы экземпляра.

Портал решений SAP Cloud Appliance Library

SAP Cloud Appliance Library представляет собой портал решений SAP по запросу с простым пользовательским интерфейсом (UI) и каталогом новейших продуктов SAP. Являясь порталом по запросу, SAP Cloud Appliance Library позволяет быстро и эффективно развернуть все новейшие решения SAP в облаке, в том числе SAP S/4HANA, SAP HANA, экспресс-выпуск, SAP Model Company, отраслевые решения, SAP Data Intelligence, SAP BW/4HANA и другие. Поговорим о некоторых ключевых понятиях. Начнём с термина «программно-аппаратный комплекс» (appliance).

1 2