В рамках сотрудничества в области управления большими данными и аналитики компании DIS Group и «Ростелеком» завершили тестирование и подписали протокол о совместимости продуктов RT.DataLake и «Плюс7 ФормИТ на Hadoop». Об этом CNews сообщили представители DIS Group.
«Платформа управления данными» от «Ростелекома» предназначена для бизнес-задач, связанных с большим объемом данных в различных отраслях, включая промышленность, медицину, страхование, логистику и государственный сектор: от построения корпоративных хранилищ и озер до сложной аналитики на базе искусственного интеллекта.
ETL-платформа «Плюс7 ФормИТ» позволяет интегрировать данные из различных корпоративных информационных систем, а также других источников, включая файлы, веб-формы, электронную почту и другие сервисы. Визуальные интерфейсы ускоряют разработку процессов интеграции и управления качеством данных в несколько раз по сравнению с другими решениями.
Совместное использование RT.DataLake и «Плюс7 ФормИТ» позволит расширить возможности платформы управления данными «Ростелекома», в том числе профилировать данные и приводить их к требуемому уровню качества – что особенно актуально при создании цифровых двойников и сложной предиктивной аналитике, требующих высочайшего уровня качества данных.
«Крупным корпоративным заказчикам могут потребоваться дополнительные мощные инструменты интеграции данных при создании озер данных на базе RT.DataLake. Мы считаем, что в таких случаях хорошим решением будет «Плюс7 ФормИТ на Hadoop» и успешно проверили его совместимость с RT.DataLake», – сказал директор по развитию платформы управления данными ПАО «Ростелеком» Станислав Лазуков.
В рамках протокола были обозначены следующие задачи тестирования: автоматизированная установка дистрибутива RT. DataLake при помощи RT.ClusterManager; интеграция платформ RT.DataLake и компонент «Плюс7 ФормИТ на Hadoop»; чтение, запись и обработка данных на кластере Hadoop через подключение «Плюс7 ФормИТ на Наdоор» в режимах Native, Spark; работоспособность утилиты Sqoop: в качестве источника и приемника применялись таблицы Oracle DB и PostgreSQL.
В ходе тестирования проверены все основные режимы совместной работы, включая ключевые возможности по интеграции данных и обработке данных на платформе «Плюс7 ФормИТ на Hadoop» в режиме Pushdown на платформу RT.DataLake.
«Подтверждение совместимости «Плюс7 ФормИТ на Hadoop» и RT.DataLake даст возможность создавать проекты по построению и наполнению озер данных с большими объемами неструктурированной информации, которые можно будет использовать для решения самых разных бизнес-задач», – сказал технический директор DIS Group Олег Гиацинтов.
***
DIS Group – ИТ-компания, которая предлагает решения в области управления данными, бизнес-аналитики, защиты информации, а также осуществляет консалтинг и внедрение проектов по данным направлениям. Компания работает с поставщиками продуктов и решений, включенных в реестр российского ПО.
ПАО «Ростелеком» — интегрированный провайдер цифровых услуг и решений, который присутствует во всех сегментах рынка и охватывает миллионы домохозяйств, государственных и частных организаций. Количество клиентов услуг доступа в интернет с использованием оптических технологий превышает 11,3 млн, платного ТВ — 11,2 млн пользователей.