Senior MLOps Engineer ( Dubai)
Neoflex

️️️Вакансия: Senior MLOps Engineer ( Dubai)
ONSITE позиция в Дубае (4 дня в неделю — работа из офиса)
Английский — B2 или выше
Компания Neoflex создает ИТ-платформы для цифровой трансформации бизнеса
Вилка зп: Обсуждается индивидуально
Работа в офисе в Дубае (4 дня в неделю в офисе)
Требования к языку: Свободное владение английским языком (устным и письменным).
Задачи:
• Проектировать и оптимизировать пайплайны инференса AI, обеспечивая низкую задержку и высокую пропускную способность сервинга моделей для корпоративных приложений.
• Создавать и поддерживать масштабируемую AI инфраструктуру для эффективной поддержки сложных, крупномасштабных нагрузок.
• Обеспечивать надежное развертывание и эксплуатацию высокопроизводительных фреймворков сервинга моделей AI в разных средах.
• Обеспечивать эффективное использование GPU и экономичное выполнение AI нагрузок.
• Выстроить комплексный мониторинг и наблюдаемость для стабильной производительности инференса моделей.
• Соблюдать требования корпоративной безопасности, принципы governance и лучшие практики MLOps на всем протяжении жизненного цикла поставки AI решений.
Основные требования:
• Степень бакалавра или эквивалент.
• 7+ лет совокупного инженерного или операционного опыта.
• Не менее 5 лет релевантного опыта в аналогичной роли.
• Опыт работы в крупных и сложных глобальных предприятиях с высокой доступностью, высокими транзакционными нагрузками и географической распределеностью.
Ключевые знания и требования :
• Инференс глубинного обучения: экспертиза в TensorRT, vLLM, Triton, FasterTransformer
• Оптимизация моделей: опыт с ONNX, GGUF, квантованием (FP16, INT8, FP8).
• Распределенные системы: опыт с NCCL, MPI, InfiniBand, RDMA и мультиузловыми GPU нагрузками
• Масштабируемый AI serving: практический опыт с Triton Inference Server, vLLM, TensorFlow Serving
• Профилирование и отладка: знакомство с nvidia-smi, Nsight, nvprof, TensorRT Profiler
• Управление GPU в Cloud и On Prem: опыт с Kubernetes (K8s), OpenShift, планированием GPU (Kubeflow, Ray, KServe).
• Понимание векторных баз данных и их применения в аналитике и AI нагрузках
• Уверенное владение Python, Scala и SQL
• Опыт совместной работы над программными проектами и управления архитектурой таких проектов
• Продвинутые навыки работы в среде Linux
Будет преимуществом :
• GPU программирование: знание CUDA, cuDNN, NCCL, Tensor Cores для оптимизации инференса
• Speculative Decoding и FlashAttention для инференса LLM
• Опыт оптимизации потоковой передачи токенов для чат приложений
• Опыт работы с векторными базами данных (Qdrant, Milvus) для RAG нагрузок
Мы предлагаем:
• Работа на проектах в области передовых технологий и инноваций;
• Международная команда;
• Помощь с релокацией ;
• Современный офис ;
• Медицинская страховка.
________________________________________
Готовы присоединиться к команде в Дубае? Откликайтесь на вакансию!
Ждем резюме в личные сообщения :
Telegram https://t.me/Anastasya_Samoilova (Анастасия)
How to apply
To apply for this job you need to authorize on our website. If you don't have an account yet, please register.
Post a resumeSimilar jobs
Senior Solutions Architect, Generative AI, Startups, AWS

Site Superintendent (Civil, Irrigation, Architect, Agriculture & MEP)

onboarding and Inventory Administrator
