Ζητείται υπεύθυνο άτομο για απομακρυσμένη παρακολούθηση server infrastructure (Ubuntu, PostgreSQL clusters, Dockerized apps, video streaming services) με ευθύνη για άμεση επέμβαση σε περιπτώσεις προβλημάτων (downtime, latency spikes, service failures κ.α.). Η θέση αφορά υποστήριξη σε 24/7 basis μέσω rotation ή on-call βαρδιών.
Αρμοδιότητες:
- Παρακολούθηση real-time dashboards (Prometheus, Grafana, custom alerts)
- Άμεσος έλεγχος και επέμβαση σε alerts (service restart, failover, basic troubleshooting)
- Ενημέρωση DevOps/Engineering team για escalated incidents
- Τεκμηρίωση περιστατικών και ενεργειών
- Συνεργασία για βελτίωση του monitoring stack