Выбирай : Покупай : Используй
0

Modus ETL 1.6.11: оптимизация получения данных из источников «1С», экспорт описания и структуры таблиц хранилища и новые шаблоны в сценариях обработки данных

Вышло обновление Modus ETL. Об этом CNews сообщили представители Modus. Получение данных из источников Добавлена быстрая...

Вышло обновление Modus ETL. Об этом CNews сообщили представители Modus.

Получение данных из источников

Добавлена быстрая загрузка больших файлов форматов XLSX и CSV. Теперь один млн записей XLSX грузится за 53 сек, а четыре млн записей CSV грузятся за 32 сек.

Доработан механизм получения структуры метаданных хранилища из баз «1С»: повторное получение списка доступных таблиц и состава их полей (обновление метаданных) из баз данных «1С» теперь происходит в ~5 раз быстрее.

Улучшен механизм проверки корректности пользовательских настроек, отвечающих за взаимодействие между Агентом ETL и Modus ETL. Теперь при проверке корректности пользовательских настроек нажатии на кнопку «Проверить доступность» происходит не только проверка доступности Агента ETL, но и проверка настроек Modus ETL. Так пользователи могут выявить некорректные настройки сразу, не дожидаясь возникновения ошибок в процессе получения данных.

Оптимизировано получение данных из источников «». Теперь данные передаются пачками фиксированного размера и сразу помещаются в хранилище. Это помогает обойти ограничения «1С»-источников по передаче больших файлов и снижает потребление ОЗУ в базе-источнике.

Доработан Агент ETL: теперь заполнение параметров «Адрес», «Логин», «Пароль» контролируется автоматически. Также добавлен вывод ошибок, выявленных при проверке, в лог работы.

В тестовой Альфа-версии добавлена возможность использования Агентом ETL модулей получения данных, написанных на языке Python. Теперь для загрузки данных, имеющих сложную и нестандартную структуру, можно будет подготовить специальный код на Python, встроить этот код в модуль получения данных в Modus ETL и настроить автоматическое получение данных.

Трансформация данных

Теперь при копировании и переносе сценариев обработки данных схема (верстка) отображения шагов будет воспроизводиться в модели WorkFlow.

В шаблон шага «Разделение строки» добавлена возможность использования «пробела» в качестве разделителя строк.

В шаблон шага «Произвольный код 1С» добавлена возможность в коде «1С» использовать «Параметры сценария».

В шаблоне шага «Перенос данных» механизм создания таблицы-приемника оптимизирован и адаптирован под современные версии ClickHouse.

Добавлена возможность при помощи изменения SQL-запроса выполнять тонкую настройку параметров создания временных таблиц хранилища.

Добавлена кнопка «Расширенные настройки» для управления выбранным объектом WorkFlow. Теперь пользователь может заходить в свойства шагов сценария и изменять типы связей между шагами, выбирая тип «Временная таблица» или «Вложенный запрос».

В сценариях обработки данных были добавлены новые шаблоны: «Очистка таблицы», «Обновление таблицы», «Обновление таблицы из таблицы-источника».

Доработан Агент ETL: теперь работа шаблонов шагов сценария в части Machine Learning не требует установки отдельного специального сервиса.

Управление хранилищем

Доработана форма создания и редактирования таблицы хранилища: реализовано интерактивное управление параметрами полей (столбцов) без необходимости «проваливаться» в форму настройки каждого поля. Это повышает удобство пользователя при работе и экономит время настройки таблицы на ~30%.

Доработана форма редактирования таблицы хранилища: добавлена возможность на основании таблицы хранилища создать и обновить простой набор данных на аналитическом портале Modus BI без необходимости создавать таблицу хранилища заново.

Доработана форма создания и редактирования таблицы хранилища: добавлен столбец «Алиас», с помощью которого можно для каждого поля таблицы указать псевдоним для описательной документации, а также использовать его при создании простых наборов данных для аналитического портала Modus BI.

Добавлена возможность экспорта описания и структуры таблиц хранилища в виде файлов с описательной документацией в форматы PDF, XLSX, DOCX, TXT и не только. Теперь пользователь может использовать их для подготовки отчётной документации по проектам, пояснительных записок, инструкций и так далее. Это сокращает трудозатраты на подготовку документации по используемым таблицам и наборам данных минимум в два раза.

Команда Modus также поработала над информационной безопасностью Modus ETL. Теперь пароль строки подключения к ETL при выводе информации в файл лога скрыт.

Прочие доработки

В очередной раз получен сертификат «1С:Совместимо» для Modus ETL. Выполнено обновление «1С:Библиотеки стандартных подсистем» до версии 3.1.9.

Доработан раздел «Основные настройки»: на вкладке «Прочее» в группу «Очистка журналов событий сбора данных» добавлены дополнительные опции управления (очистка журналов событий сбора данных, настройка расписания и события очистки).

Актуализирована служебная форма для тестирования взаимодействия между Modus ETL и Агентом ETL.

На главной странице Modus ETL добавлена возможность скачивать дистрибутивы Агента ETL и Адаптера ETL для «». Если раньше нужно было получать дистрибутивы на сайте «1С» или искать их в каталоге с шаблонами конфигураций «1С», то теперь этого делать не нужно.

Комментарии