۱ ماه پیش

استخدام Senior Observability در شرکت همراه کسب و کارهای هوشمند
همراه کسب و کارهای هوشمند

استخدام Senior Observability در شرکت همراه کسب و کارهای هوشمند

همراه کسب و کارهای هوشمند
تهران
اطلاعات تماس

حضوری
مقطع تحصیلی اعلام نشده
سابقه ندارد
حقوق توافقی
آقا و خانم
تمام وقت

مشاهده اطلاعات تماس
اطلاعات بیشتر

استخدام شرکت همراه کسب و کارهای هوشمند

 

شرکت همراه کسب و کارهای هوشمند در تهران جهت تکمیل کادر خود به افراد واجد شرایط ذیل نیازمند است:

Description job title
Design and enhance observability architecture (Metrics, Logs, Traces)
Implement centralized monitoring and telemetry collection strategies
Build advanced dashboards and visualization layers for service health
Define effective alerting models with proper thresholds and noise reduction
 Improve system visibility across distributed services and APIs
Reliability Engineering
Apply reliability principles to reduce incidents and service degradation
 Define and track SLOs, SLAs, SLIs, and error budgets
Conduct reliability and availability analysis across services
Identify systemic weaknesses and recurring failure patterns
Contribute to resilience improvements and operational hardening
Incident Intelligence & Analysis
Lead advanced alert triage and event correlation
Support incident response with deep telemetry insights
Participate in root cause analysis (RCA) and post-incident reviews
Develop monitoring improvements based on incident learnings
Performance & Capacity Insight
Analyze performance trends and anomaly detection
Support capacity planning using monitoring data
Deliver service reliability and performance reports
Required Technical Skills
Strong hands-on experience with monitoring & visualization tools:
Prometheus, Zabbix, Grafana, Splunk, Kibana
Experience with log aggregation and analysis platforms: ELK Stack or Splunk
Solid understanding of Observability concepts (Metrics, Logs, Tracing, Telemetry)
Familiarity with distributed systems monitoring
Linux system knowledge and performance troubleshooting
Understanding of network and infrastructure monitoring fundamentals
Experience with API/service monitoring
Experience with event management and ticketing systems
Reliability & Engineering Knowledge
Deep understanding of MTTR, MTBF, availability, resilience engineering
Experience defining and measuring SLO/SLI frameworks
Knowledge of alert optimization and signal-to-noise improvement
Strong analytical skills for failure pattern recognition
Experience contributing to operational readiness and service reliability
Nice to Have
Experience with APM tools
Knowledge of automation or scripting (Python, Bash)
Exposure to cloud-native monitoring
Familiarity with ITIL processes
Soft Skills
Strong analytical and systems-thinking mindset
Calm and effective under incident pressure
Cross-team collaboration skills
Clear reporting and documentation
Work Conditions
Participation in incident scenarios and reliability reviews
Close collaboration with Service Operations teams
Senior Observability & Reliability Engineer

متقاضیان واجد شرایط می توانند با کلیک روی لینک تکمیل فرم استخدام، رزومه خود را ارسال نمایند.

اطلاعات تماس
گزارش مشکل آگهی
https://iranestekhdam.ir/?p=3076303
ابتدای صفحه
مختصری درباره ایران استخدام

سایت ایران استخدام در تاریخ ۱۳۹۱/۱/۱۰ راه اندازی شد و با تلاش گروهی و روزانه مدیران و نویسندگان خود در جهت تبدیل شدن به مرجع بروز آگهی های استخدامی گام برداشت. سعی همیشگی همکاران ما ارائه مطلوب و با کیفیت آگهی های استخدامی خدمت بازدیدکنندگان محترم این سایت بوده است. ایران استخدام به صورت مستقل و خصوصی اداره می شود و وابسته به هیچ نهاد و یا سازمان دولتی نمی باشد، این سایت تنها منتشر کننده ی آگهی های استخدامی بوده و بنابراین لازم است که بازدید کنندگان محترم سایت خود نسبت به صحت و سقم اخبار منتشر شده در آن هوشیار باشند.

نماد اعتماد الکترونیکی
ارسال رزومه