Durum sayfanızda her şeyin çalışır durumda olduğu belirtiliyor. APM'niz yeşil görünüyor. Bu arada Singapur'daki bir müşteri oturum açamıyor. Brezilya'daki bir potansiyel müşteri kaydolmayı bıraktı. Almanya'daki kurumsal bir anlaşma, "demo zaman aşımına uğradığı için" başarısız oldu.
SaaS için küresel çalışma süresi izleme isteğe bağlı değildir; müşterilerinizin gerçekte ne deneyimlediğini bu şekilde görürsünüz.
Sağlam bir ürün oluşturdunuz. Altyapı AWS veya GCP'dedir. Cloudflare veya Fastly kullanıyorsunuz. Temel çalışma süresi izleme olanağınız var; muhtemelen birkaç dakikada bir bir veya iki konumdan kontrol ediyorsunuz.
Daha sonra belirli bölgelerden destek biletleri almaya başlıyorsunuz. "Uygulamaya erişilemiyor." "Giriş başarısız olmaya devam ediyor." "Sayfalar yüklenmiyor." Kontrol panelinizi kontrol ediyorsunuz; her şey yolunda görünüyor. Onlardan tekrar denemelerini istersiniz; bazen işe yarar, bazen yaramaz.
Bunu kullanıcı hatası, ağ sorunları veya geçici sorunlar olarak görmezden geliyorsunuz. Ama biletler gelmeye devam ediyor. Ve şunu fark ediyorsunuz: Singapur, São Paulo veya Johannesburg'daki kullanıcıların gerçekte ne deneyimlediğini doğrulamanın hiçbir yolu yok.
İzlemeniz size yalan söylüyor; kasıtlı olarak değil, ihmal yoluyla. Tek bir yerden kontrol ediyor ve bunun tüm dünyayı temsil ettiğini varsayıyor.
SaaS için küresel çalışma süresi izlemenin kritik hale geldiği nokta burasıdır. Sahip olunması güzel bir şey olarak değil, ürününüzün ulaşmaya çalıştığınız müşterilere gerçekten ulaşıp ulaşmadığını bilmenin tek yolu olarak.
İnternet tek tip değil. Tokyo'dan ABD-Doğu menşeinize yapılan bir talep, Londra'dan gelen bir talepten tamamen farklı bir altyapıdan geçer.
DNS anlık veya evrensel değildir. DNS sağlayıcınızın kullanıcıya en yakın herhangi bir noktaya yayın düğümü aşırı yüklenmişse, yanlış yapılandırılmışsa veya erişilemez durumdaysa, sunucularınız düzgün çalışıyor olsa bile bu kullanıcı alanınızı çözemez. Farklı DNS çözümleyiciler farklı sonuçlar döndürebilir ve bazıları eski veya yanlış kayıtları önbelleğe alabilir.
Gerçek senaryo: Büyük bir bulut DNS sağlayıcısında yalnızca Asya-Pasifik ad sunucularını etkileyen 4 saatlik bir kesinti yaşandı. Bu sağlayıcıyı kullanan SaaS ürünleri, 2 milyar potansiyel kullanıcı için tamamen çevrimdışıyken ABD merkezli izlemede %100 çalışma süresi gösterdi.
BGP rotaları herhangi bir uyarı yapılmadan değişebilir, bozulabilir veya idealin altında hale gelebilir. Bir rota sızıntısı, yanlış yapılandırılmış bir AS yolu veya toplu taşıma sağlayıcısının kesintisi, sunucularınıza tüm ülkelerden erişilemez hale gelirken diğer ülkelerden mükemmel şekilde erişilebilir olmasına neden olabilir. Bu sorunlar düzenli olarak meydana gelir ve saatlerce devam edebilir.
Gerçek senaryo: Brezilya'daki büyük bir İSS, yönlendirmesini yanlış yapılandırdı ve ABD merkezli bir SaaS'a giden tüm trafiğin ABD'ye ulaşmadan önce Avrupa üzerinden yönlendirilmesine neden oldu. Gecikme 120 ms'den 800 ms'ye çıktı; işlevsel ancak gerçek zamanlı özellikler için kullanılamayacak kadar yavaş.
CDN'nizde yüzlerce uç konum bulunur ancak bunların hepsi her zaman sağlıklı değildir. Cakarta'da avantaj zayıfken, Singapur'da iyi durumda olabilir. CDN durum sayfası bölgesel bozulmaları yansıtmayabilir ve sorunlu uç noktaya yönlendirilen kullanıcılar hatalar veya aşırı yavaşlama yaşayabilir.
Gerçek senaryo: São Paulo'daki bir CDN kenarı, arka uç yapılandırma sorunu nedeniyle 6 saat boyunca 502 hata sunuyordu. Kenarların %95'i iyi olduğundan CDN'nin genel durumu "Operasyonel" olarak görünüyordu. Brezilyalı kullanıcılar SaaS'ın tamamen bozuk olduğunu gördü.
Büyük İSS'lerin trafiğin akışını etkileyen eşleme düzenlemeleri vardır. Bölgesel bir İSS ile bulut sağlayıcınız arasındaki eşleme noktası sıkışıksa veya paket kaybı yaşıyorsa, aynı şehirdeki farklı bir İSS'deki kullanıcılar herhangi bir sorun yaşamasa bile, o İSS'deki kullanıcıların SaaS'ınıza erişimi azalacaktır.
Gerçek senaryo: Büyük bir Hintli İSS, ABD'li bir bulut sağlayıcısıyla 3 hafta süren bir eşleme anlaşmazlığı yaşadı. Bu İSS'deki kullanıcılar 5+ saniyelik yükleme süreleri yaşadı. SaaS şirketi, bir sorun olduğunun farkına bile varmadan Hindistan'da önemli bir pazar payı kaybetti.
Temel sorun: Bu hataların tümü konuma özgüdür. Altyapınız çalışıyor. Kodunuz iyi. Ancak sunucularınız ve belirli bölgelerdeki kullanıcılarınız arasında bir yerlerde bir şeyler bozuktur ve bunu tespit etmenin tek yolu, bu kullanıcıların gerçekte nerede olduklarını kontrol etmektir.
Çalışma süresi izleme araçlarının çoğu, "sunucu ne zaman yanıt veriyor?" gibi daha basit bir dönem için geliştirildi. yeterli bir soruydu Küresel kullanıcıları olan SaaS için bu artık yeterli değil.
Birçok SaaS izleme kurulumu, genellikle ABD ve Avrupa'da kümelenmiş 1 ila 5 konumu kontrol eder. Kullanıcılarınız APAC, LATAM, Orta Doğu veya Afrika'da bulunuyorsa deneyimlerine ilişkin görünürlük sıfırdır. Bölgesel bir kesinti kesinlikle kaydedilmeyecektir.
AWS bölgelerinden AWS tarafından barındırılan altyapıya kadar kontroller yürütmek, optimize edilmiş bulut omurga bağlantısından yararlanır. Konut veya kurumsal ağlardaki gerçek kullanıcılar, farklı arıza modlarıyla tamamen farklı yollardan geçerler.
SaaS'ınız teknik olarak yanıt verebilir ancak yüklenmesi 15 saniye sürebilir. Basit bir HTTP 200 kontrolü "yukarı" diyor; ancak kullanıcılar için bu durum fiilen kapalı. Bölge başına gecikme eşikleri olmadığında, kullanıcıları sinirlendiren yavaş hataları kaçırırsınız.
Bölgesel bir kesinti meydana geldiğinde şunları bilmeniz gerekir: DNS mi? Ağ yolu mu? TLS anlaşması zaman aşımına mı uğradı? Traceroute, MTR ve gecikme dökümü olmadan temel nedeni teşhis edemez veya barındırma sağlayıcınıza kanıt sağlayamazsınız.
Yalnızca birkaç yerden izleme yaptığınızda kullanıcılarınızın deneyimlerinin yalnızca küçük bir kısmını görürsünüz. Gerisi, kesintilerin fark edilmeden gerçekleştiği kör bir noktadır.
Bir bölgede SaaS'ınızın erişilemez olduğu her dakika, çoğu zaman farkında olmadan kullanıcıları, geliri ve itibarı kaybedersiniz.
SaaS'ınıza erişemeyen kullanıcılar her zaman şikayet etmez; ayrılırlar. Bir deneme kullanıcısı ilk oturumu sırasında bir kesinti yaşarsa kaybolur. Ödeme yapan bir müşteri tekrarlanan sorunlarla karşılaşırsa alternatif aramaya başlar. Metriklerde dalgalanma göreceksiniz ancak bunun bölgesel kullanılabilirlik sorunlarından kaynaklandığını bilemezsiniz.
Pazarlamanız dünyanın her yerinden trafik çekiyor. Belirli bölgelerde kayıt akışı bozulursa veya inanılmaz derecede yavaşlarsa trafik geri döner. Satın alma için ödeme yaptınız ancak dönüşüm, varlığından haberdar olmadığınız bölgesel bir sorun nedeniyle başarısız oldu. CAC yükselir; LTV düşer.
Google birden çok küresel konumdan tarama yapar. Googlebot belirli bölgelerde yavaş yanıtlarla veya hatalarla karşılaşırsa, bu durum Önemli Web Verileri puanlarını, tarama sıklığını ve sonuçta bu pazarlardaki sıralamaları etkiler. Belirli ülkelerde organik trafiğiniz düşüyor ve bunun nedeni hakkında hiçbir fikriniz yok.
Söz yayılıyor. "SaaS'ın Asya Pasifik'te güvenilmez olduğu." "Onları denedik ancak uygulama hiçbir zaman Berlin ofisimizden düzgün şekilde yüklenmiyor." G2 incelemeleri, Twitter yazışmaları ve Slack topluluğu sohbetleri algıyı tersine çevrilmesi zor şekillerde şekillendiriyor. Sorunu öğrendiğinizde hasar bitmiş demektir.
Etkili küresel çalışma süresi izleme, coğrafi çeşitlilik, teşhis derinliği ve doğru uyarı eşiklerini gerektirir.
Kapsam yalnızca nicelikle ilgili değildir; kullanıcı coğrafyanızı eşleştirmeyle de ilgilidir. Güneydoğu Asya'da kullanıcılarınız varsa Singapur, Jakarta, Mumbai, Tokyo, Sidney'deki düğümlere ihtiyacınız vardır. Latin Amerika'yı hedefliyorsanız São Paulo, Buenos Aires ve Mexico City'ye ihtiyacınız var. Her konum farklı ağ koşullarını ortaya çıkarır.
İzleme konumlarını ödeme yapan müşterilerinizin bulunduğu yerlerle eşleştirin.
Bir kesinti meydana geldiğinde, arızanın ağ yolunda nerede meydana geldiğini bilmeniz gerekir. DNS çözümlemesi mi? Belirli bir ağ atlaması mı? CDN avantajınız mı? Etkilenen bölgeden gelen Traceroute ve MTR verileri, temel nedeni teşhis etmeniz ve sağlayıcılara etkili bir şekilde iletmeniz için size kanıt sağlar.
Teşhis verileri "bir yerlerde bir sorun var" ifadesini "tam olarak nedeni bu" ifadesine dönüştürür.
Tokyo'dan gelen 300 ms'lik yanıt süresi normal mi yoksa bir bozulma mı? Geçmiş veriler olmadan bunu söyleyemezsiniz. Sürekli izleme, konum başına temel oluşturur; böylece normalden sapmalar konusunda uyarıda bulunabilir, yavaş bozulmaları kesintiye dönüşmeden önce yakalayabilir ve gerçek sorunları bir defaya mahsus kesintilerden ayırt edebilirsiniz.
Temel çizgiler, yalnızca "düşük" değil, "normalden daha kötü" konusunda da uyarıda bulunmanıza olanak tanır.
Bölgesel kesintileri gerçekten yakalayan izlemeyi uygulamaya yönelik adım adım kılavuz.
Aktif kullanıcılara ve gelire göre ilk 20 ülkenizi belirlemek için analizleri inceleyin. Kayıtların nereden geldiğini, denemelerin nereden dönüştüğünü ve genişletme gelirinin nereden geldiğini kontrol edin. Bunlar izlemeniz gereken bölgelerdir.
Her uç noktanın küresel izlemeye ihtiyacı yoktur. Şunlara odaklanın: ana uygulama URL'si, oturum açma/kimlik doğrulama uç noktaları, kayıt akışı, müşteriler tarafından kullanılan API uç noktaları ve SEO veya dönüşümler için kritik olan, herkese açık tüm sayfalar.
Geniş coğrafi kapsama sahip (tüm kıtalarda en az 50 konum) bir izleme hizmeti seçin. Kapsamın kullanıcı coğrafyanızla eşleştiğinden emin olun. Kritik uç noktalar için kontrol aralıklarını 1 dakikaya ayarlayın; İkincil sayfalar için 5 dakika.
Yalnızca arızalarda uyarı vermeyin; yanıt süresi kabul edilebilir eşikleri aştığında da uyarı verin. SaaS için şunları göz önünde bulundurun: Oturum açma sayfası için <1 saniye, kontrol paneli yüklemeleri için <2 saniye, API çağrıları için <500 ms. Uzak konumlar için bölgesel eşiklerin biraz daha yüksek olması gerekebilir.
Belirli bölgeler arızalandığında veya bozulduğunda uyarıları tetiklenecek şekilde yapılandırın. Yüksek öncelikli bölgesel uyarıları çağrı üzerine çalışan mühendislere yönlendirin. Slack, PagerDuty veya mevcut olay yönetimi iş akışınızla entegre edin.
Traceroute ve MTR'yi isteğe bağlı olarak herhangi bir izleme konumundan çalıştırabildiğinizden emin olun. Bir uyarı tetiklendiğinde, sorunun DNS mi, ağ yönlendirmesi mi, CDN mi yoksa kaynak mı olduğunu belirlemek için anında tanılama verileri isteyeceksiniz.
Bölgesel çalışma süresi ve gecikme eğilimlerini incelemek için yinelenen bir takvim hatırlatıcısı ayarlayın. Uyarıları tetiklemeyen yavaş bozulmaları, sürekli olarak daha yüksek gecikme süresine sahip bölgeleri ve kullanıcı şikayetleri veya kayıp verileriyle ilişkili modelleri arayın.
Bölgesel bir kesinti tespit edildiğinde ne yapılması gerektiğini belgeleyin: sorunun nasıl doğrulanacağı, CDN'nizde veya barındırma sağlayıcınızda kiminle iletişim kurulacağı, hangi tanılama verilerinin toplanacağı ve durumdan etkilenen müşterilere durumun nasıl iletileceği.
Latency Global, SaaS ürünlerinin ihtiyaç duyduğu küresel görünürlük türü için özel olarak geliştirildi. Kullanıcılarınızın bulunabileceği tüm önemli bölgeleri kapsayan 6 kıtadaki 70'ten fazla gerçek konumu izliyoruz.
Her kontrol, tam zamanlama dökümünü (DNS, TCP, TLS, TTFB) içerir ve sorunları araştırırken traceroute ve MTR'yi istediğiniz yerden çalıştırabilirsiniz. Geçmiş veriler size bölge bazındaki eğilimleri gösterir, böylece bozulmaları kesintiye dönüşmeden önce tespit edebilirsiniz. Fiyatlandırma basittir: Tüm konumlara erişimi olan 5 monitör için ayda 5 ABD doları.
Küresel izleme altyapı açısından yoğun bir iştir; bu nedenle çoğu araç ayda 50 ila 500 ABD Doları tutarında ücret alır. Önemli olana odaklanarak onu erken aşama SaaS için erişilebilir tutuyoruz: coğrafi kapsam ve teşhis derinliği.
SaaS ürünleri genellikle yalnızca tek bir coğrafyadaki kullanıcılara değil dünya çapındaki kullanıcılara hizmet verir. Geleneksel şirket içi yazılımların aksine, SaaS'ınızın müşterilerinizin olduğu her yerden erişilebilir olması gerekir. DNS sorunlarından, BGP yönlendirme sorunlarından, CDN hatalarından veya ISP eşleme sorunlarından kaynaklanan bölgesel kesintiler, izleme konumunuzdan tam olarak çalışır durumda görünürken ürününüzün tüm pazarlar için erişilemez olmasına neden olabilir. Küresel çalışma süresi izleme, uluslararası kullanıcılarınızın gerçekte ne deneyimlediğini görmenin tek yoludur.
Bu, kullanıcı coğrafyanıza bağlıdır, ancak 50'den fazla konum, kapsamlı kapsam için iyi bir temeldir. Önemli olan, önemli kullanıcılarınızın veya gelirinizin olduğu her bölgede izleme yapabilmenizi sağlamaktır. ARR'nizin %15'i APAC'tan geliyorsa, Asya-Pasifik genelinde birden fazla düğüme ihtiyacınız vardır. Latin Amerika'ya doğru genişliyorsanız Brezilya, Arjantin ve Meksika'da düğümlere ihtiyacınız var. İzleme kapsamını yalnızca kullanıcı hacmiyle değil, işin önemiyle de eşleştirin.
CDN ve bulut sağlayıcı kontrol panelleri, genellikle sınırlı olan dahili görünümlerini gösterir. Belirli bölgelerdeki kullanıcılar eşleme sorunları, BGP yönlendirme sorunları veya tam kesinti olarak kaydedilmeyen uç düzeyindeki bozulmalar nedeniyle hatalar yaşarken "tüm sistemler çalışır durumda" olarak görünebilirler. Altyapınızın dışından bağımsız izleme, son kullanıcıların gerçekte ne deneyimlediğine ilişkin temel gerçekleri sunar ve bu, genellikle sağlayıcı kontrol panellerinin gösterdiğinden farklıdır.
Her ikisi de iş etkisine göre önceliklendirilir. Şununla başlayın: (1) ana uygulama URL'si/kontrol paneli, (2) oturum açma/kimlik doğrulama uç noktaları, (3) kayıt akışı, (4) müşteriler tarafından kullanılan API uç noktaları, (5) pazarlama sitesi ana sayfası. SaaS için kimlik doğrulama akışı özellikle kritik öneme sahiptir; kullanıcılar bir bölgeden oturum açamıyorsa ürününüzü kullanamazlar. API uç noktaları, bir entegrasyon platformunuz varsa veya API'nizi kullanan müşterileriniz varsa önemlidir.
1 dakikalık kontrol aralıkları ile kesintileri 1-2 dakika içerisinde tespit edebilirsiniz. Bir arıza onaylandıktan sonra uyarı hemen verilmelidir (geçici uyarı sinyallerinden kaçınmak için genellikle 2-3 ardışık arızadan sonra). Büyük pazarlardaki kritik uç noktalar için, kesinti başladıktan sonraki 5 dakika içinde bilgi edinmek istersiniz. Ne kadar hızlı tespit ederseniz, o kadar hızlı teşhis edebilir ve durumu hafifletebilirsiniz veya en azından durumdan etkilenen müşterilere durumu iletebilirsiniz.
Sorun yukarı yönlü olsa bile, izleme size şunları sağlar: (1) sorunun var olduğuna dair kanıt (kanıtlayamadığınız şeyi düzeltemezsiniz), (2) belirli sağlayıcıyı veya sorunlara neden olan atlamayı belirlemek için teşhis verileri (traceroute, MTR), (3) etkili bir şekilde CDN'nize veya barındırma sağlayıcınıza iletmek için belgeler ve (4) yedeklilik eklemeniz, sağlayıcıları değiştirmeniz veya etkilenen bölgelerde uç konumlar eklemeniz gerekip gerekmediği konusunda bilgi veren veriler. Sorunu bilmek, herhangi bir hafifletmenin ilk adımıdır.
SaaS'ınızın Singapur, São Paulo veya Sidney'de gerçekten erişilebilir olup olmadığını merak etmeyi bırakın. Uç noktalarınızı ekleyin, izleme konumlarınızı seçin ve küresel kullanıcılarınızın size söylemeden önce gerçekte neler deneyimlediklerini görün.
Ayda 5 ABD doları • 70'den fazla konum (yakında +40 daha) • Sözleşme yok • İstediğiniz zaman iptal edin