Uptime izleme araçları genellikle bir sorun algıladığında anında alarmlar göndermeye programlanır. Ancak bu alarmların büyük bir kısmı, aslında geçici dalgalanmalar ya da yanlış yapılandırılmış testlerden kaynaklanır. Bu durumda, ekiplerin çoğu gereksiz bildirimler arasında gerçek bir kesintiyi fark etmek için saatlerce uğraşır. Hermes, StatusCake gibi popüler izleme araçlarından gelen uyarıları otomatik olarak doğrulayan, gereksiz bildirimleri filtreleyen ve sadece kritik durumlarda ilgili kişilere ulaşan akıllı bir ara katman olarak çalışır.
Hermes ile Uyarı Yönetimini Yeniden Tanımlayın
Çoğu kuruluşun karşılaştığı ortak bir sorun vardır: izleme sistemleri sürekli olarak "bir şeyler ters gidiyor" sinyali gönderir, ancak bu sinyallerin ne kadarının gerçek bir acil duruma karşılık geldiği belirsizdir. Hermes, bu boşluğu doldurarak StatusCake gibi araçlardan gelen uyarıları üç temel adımdan geçirir:
- Doğrulama: Hermes, kesintinin gerçek olup olmadığını kendi ağından sorgulayarak doğrular. Geçici bir ağ gecikmesi mi yoksa kalıcı bir sunucu arızası mı?
- Önceliklendirme: Alarmları zaman dilimine göre sınıflandırır. Örneğin, iş saatleri dışında gelen uyarılar farklı bir yöntemle ele alınır.
- Kayıt Tutma: Tüm gelen uyarılar ve yapılan işlemler JSONL formatında kaydedilir. Böylece gelecekteki incelemelerde neler olduğunu net bir şekilde görebilirsiniz.
Bu yaklaşım, izleme araçlarınızdan gelen gereksiz uyarıları azaltırken, gerçek acil durumların hızlı ve etkili bir şekilde ele alınmasını sağlar.
Neden Hermes’e İhtiyaç Duyuluyor?
Birçok ekip, her uyarıyı aynı şekilde ele almanın operasyonel olarak verimsiz olduğunu bilir. Örneğin:
- İş saatleri içinde gelen bir
downuyarısı, acil müdahale gerektirebilirken, gece yarısı gelen aynı uyarı ertelenebilir. - On saniyelik bir kesinti, sistemde geçici bir sorun olabilirken, bir dakikadan uzun süren bir kesinti acil müdahale gerektirebilir.
- İzleme aracının gönderdiği uyarıların içeriği, bazen hatalı ya da eksik olabilir.
Hermes, bu tür senaryoları yönetmek için basit ama etkili kurallar uygular. Örneğin, uyarıların geldiği saate göre farklı ekiplere yönlendirme yapabilir veya sadece belirli koşullar altında (örneğin, aynı uyarının birkaç kez tekrarlanması durumunda) bildirim gönderebilir.
Basit Bir Mimariyle Başlayın
Hermes’in en büyük avantajlarından biri, karmaşık bir altyapı gerektirmemesidir. StatusCake’ten gelen uyarıları doğrudan işlemek için küçük bir HTTP alıcı ve doğrulama adımları yeterlidir. Örneğin, Python ile yazılmış basit bir alıcı şu şekilde çalışır:
# scripts/statuscake_webhook_receiver.py
python3 scripts/statuscake_webhook_receiver.py \
--config var/escalation-config.json \
--host 127.0.0.1 \
--port 8934Bu alıcı, StatusCake’ten gelen POST isteklerini alır, içeriğini doğrular ve gerekirse ilgili kişilere e-posta yoluyla bildirim gönderir. Altyapıyı hızlıca test etmek için Cloudflare Tunnel gibi bir araç kullanabilirsiniz.
Webhook’lar Neden Daha İyi Bir Seçenek?
E-posta tabanlı uyarı sistemleri, yapılandırılması ve hata ayıklanması zor olan eski bir yaklaşımdır. Webhook’lar ise:
- StatusCake gibi modern araçlar tarafından doğrudan desteklenir.
- Verilerin yapısal olarak iletilmesini sağlar, böylece manuel metin eşleştirmeye gerek kalmaz.
- Gelen isteklerin tam olarak kaydedilmesini ve incelenmesini kolaylaştırır. Örneğin, bir uyarının neden beklendiği gibi davranmadığını araştırırken, ilk soru genellikle "StatusCake gerçekten bu veriyi gönderdi mi?" olur. Webhook’lar bu soruya yanıt vermek için gerekli veriyi sağlar.
Doğrulama Adımı: Gerçek Kesinti mi Yoksa Geçici Bir Sorun mu?
Hermes’in en önemli özelliği, gelen uyarıları otomatik olarak doğrulamasıdır. Örneğin, StatusCake bir down uyarısı gönderdiğinde, Hermes:
- Hedef web sitesine kendi ağından bir istek gönderir.
- Belirli bir sayıda başarısız istek varsa, uyarıyı onaylar.
- Bu doğrulama adımı sayesinde, geçici ağ sorunları ya da izleme aracının hatalı algılamaları otomatik olarak filtrelenir.
Bu doğrulama süreci, basit bir yapılandırma dosyasıyla yönetilir:
{
"timezone": "Europe/Istanbul",
"probe_timeout_seconds": 10,
"min_failed_probes": 2,
"probe_urls": [],
"notifications": {
"immediate": [
{
"type": "email",
"transport": "sendmail",
"from": "statuscake-hermes@localhost",
"to": ["destek@firma.com"],
"events": ["DOWN_CONFIRMED", "UP_CONFIRMED"],
"subject_prefix": "[StatusCake Uyarısı]"
}
]
}
}Burada dikkat edilmesi gereken bir nokta, probe_urls alanının boş bırakılmasıdır. Bu, Hermes’in StatusCake’in gönderdiği website_url adresini doğrulayacağı anlamına gelir. Eğer daha spesifik bir sağlık kontrolü URL’iniz varsa, onu kullanabilirsiniz.
Zaman Tabanlı Yönlendirme ile Esnek Kontrol
Birçok ekip, uyarıları zaman dilimine göre sınıflandırarak daha esnek bir yönetim sağlamak ister. Hermes, basit bir zaman çizelgesi yapılandırmasıyla bu ihtiyacı karşılar:
{
"escalation_schedule": {
"windows": [
{
"name": "is-saatleri",
"start": "09:00",
"end": "18:00",
"days": ["Pazartesi", "Salı", "Çarşamba", "Perşembe", "Cuma"]
},
{
"name": "gece",
"start": "18:00",
"end": "09:00",
"days": ["Pazartesi", "Salı", "Çarşamba", "Perşembe", "Cuma"]
}
]
}
}Bu yapılandırma sayesinde, örneğin iş saatleri içinde gelen uyarılar doğrudan ekiplere gönderilirken, gece saatlerinde gelen uyarılar sadece acil durum ekiplerine iletilebilir. Bu, operasyonel verimliliği artırır ve gereksiz gece uyarılarından kaçınılmasını sağlar.
Sonuç: Daha Akıllı, Daha Az Uyarı
Hermes, StatusCake gibi araçlarla entegre olarak, uyarı yönetimini daha akıllı ve verimli hale getirir. Gereksiz bildirimleri filtreleyerek ekiplerin gerçekten önemli olan durumlara odaklanmasını sağlar. Ayrıca, tüm işlemlerin kaydedilmesi sayesinde gelecekteki incelemelerde neler olduğunu net bir şekilde görmek mümkün olur.
Bu yaklaşım, izleme araçlarınızdan en iyi şekilde yararlanmanıza ve operasyonel yükü önemli ölçüde azaltmanıza yardımcı olur. Eğer siz de gereksiz uyarılarla boğuşuyor ve gerçek acil durumları kaçırma riskiyle karşı karşıyaysanız, Hermes gibi bir ara katman aracını değerlendirmek iyi bir başlangıç olabilir.
Yapay zeka özeti
StatusCake gibi izleme araçlarından gelen uyarıları otomatik olarak doğrulayan ve gereksiz bildirimleri filtreleyen Hermes aracını keşfedin. Daha akıllı uyarı yönetimi için basit adımlar.