«Яндекс» разработал сервис Dev Cluster, который помогает ускорять проведение ИИ-экспериментов и сокращает время разработки моделей
Команда Yandex Infrastructure разработала инструмент для динамического распределения GPU-ресурсов. Сервис Dev Cluster позволяет ML-разработчикам за несколько кликов получать нужную конфигурацию (контейнер с GPU) для обучения моделей и тестирования гипотез без сложной настройки и обслуживания инфраструктуры. Решение ускоряет проведение ИИ-экспериментов и сокращает время разработки моделей. Об этом CNews сообщил представитель Yandex Cloud.
Dev Cluster позволяет избежать неоптимального использованию ресурсов, их простоя и необходимости вручную управлять загруженностью GPU. За секунды ML-разработчики могут получить нужные GPU-ресурсы без забот об инфраструктуре.
«Ключевая задача ML-инфраструктуры – ускорить time-to-market и предоставить бизнес-командам инструменты для удобного проведения ML-экспериментов и быстрого обучения моделей. Удовлетворенность ML-инженеров инфраструктурой – одна из наших основных метрик, за последний год показатель улучшился в 2 раза», — отметил Андрей Ривкин, руководитель ML-платформы в Yandex Infrastructure.
Dev Cluster – один из инструментов единой ML-платформы «Яндекса». Она включает в себя комплекс решений и процессов для всех этапов жизненного цикла машинного обучения: подготовка данных, создание, обучение и применение моделей. Цель платформы – позволить ML-инженерам быстро и удобно решать свои задачи. Её развивает Yandex Infrastructure – команда, которая создаёт и предоставляет внутреннюю инфраструктуру Яндекса, необходимую абсолютно любому сервису компании. Это собственные дата-центры, сеть, распределённые хранилища на эксабайты данных, платформы разработки и деплоя, инфраструктура для ML.



