۳ هفته پیش
استخدام MLOps Engineer برای شرکت خودرو ۴۵ در تهران
حضوری
مقطع تحصیلی اعلام نشده
سابقه ندارد
حقوق توافقی
آقا و خانم
تمام وقت
مشاهده اطلاعات تماس
استخدام شرکت خودرو 45
شرکت خودرو 45 در تهران جهت تکمیل کادر خود از واجدین شرایط زیر دعوت به همکاری می نماید:
| MLOps Engineer | |
| We are seeking an MLOps Engineer who can deploy, optimize, and maintain AI models particularly LLMs and Voice AI in real-world environments. The main focus of this role is on deploying language models (such as DeepSeek, OpenAI API), working with local GPUs or dedicated servers, and managing real-time communication with language and voice-to-text services. |
About the Role |
| Work with APIs of large language models (OpenAI, DeepSeek, and similar), including managing API keys, rate limits, and stable connections. Install, configure, and deploy LLMs on GPUs (e.g., DeepSeek, Mistral, Llama, etc.). Implement and integrate Voice-to-Text solutions (such as Whisper or Google Speech API). Create and maintain streaming connections to LLMs for live and real-time responses. Monitor GPU usage, RAM consumption, and task loads, and optimize system performance. Write scripts for simple automation of deployment or monitoring (using Python or Bash). Collaborate closely with the backend and model teams to ensure smooth and stable system performance. |
Responsibilities
|
| Proficiency in Python and basic ML libraries (PyTorch or TensorFlow, at least for execution and configuration). Hands-on experience deploying LLMs on GPUs. Familiarity with APIs such as OpenAI, DeepSeek, and similar services. Good understanding of GPU operations (nvidia-smi, memory usage, batching, etc.). Experience with lightweight monitoring tools such as Prometheus or Grafana (basic level). Ability to work in Linux environments and familiarity with Docker for simple deployments. Knowledge of Voice-to-Text frameworks such as Whisper, Vosk, or SpeechRecognition. |
Required Skills and Experience |
| Experience with streaming or WebSocket connections to models. Familiarity with LLM quantization or optimization techniques. Interest in inference optimization and latency reduction. |
Nice to Have
|
متقاضیان واجد شرایط می توانند با کلیک روی لینک تکمیل فرم استخدام، رزومه خود را ارسال نمایند.
اطلاعات تماس
گزارش مشکل آگهی
- ثبتنام برای تکمیل فرم استخدام اینجا کلیک نمایید
- مهلت ۱۴۰۴/۱۰/۱۲
آگهیهای مشابه
جستجوهای مشابه
- استخدام مدیر سرور در شهر تهران
- استخدام برنامه نویس در شهر تهران
- استخدام مهندس کامپیوتر در شهر تهران
- استخدام رشته کامپیوتر در شهر تهران
- استخدام مهندس نرم افزار در شهر تهران
- استخدام مهندس نرم افزار در استان تهران
- استخدام متخصص هوش مصنوعی در شهر تهران
- استخدام برنامه نویس وب (web) در استان تهران
- استخدام برنامه نویس پایتون (Python) در شهر تهران
- استخدام رشته فناوری اطلاعات (IT) در استان تهران
دستهبندی آگهیهای استخدام