Démarrez aujourd'hui et bénéficiez de 20% de réduction sur votre première facture. Disponible sur toutes les formules.

Une des fonctionnalités principales du service de surveillance Uptrends est l'alerte : lorsque des erreurs sont détectées pour vos moniteurs, vous serez averti par des messages d'alerte.

Dans l'application Uptrends, cela fonctionne de la manière suivante :

Si une vérification par un moniteur génère une erreur, une alerte est déclenchée dans l'application Uptrends. Cette alerte déclenche à son tour l'envoi d'un message à un opérateur ou à une application tierce.

Pour que cela se produise, quatre choses doivent être définies : le moniteur, la condition d'erreur, la définition d'alerte et l'intégration. Elles spécifient si et quand une alerte est créée et quel type de message est envoyé.

Dans cet article, nous aborderons les bases de ce processus, comment la vérification moniteur génère un message d'alerte.

Les vérifications moniteurs

Tout commence par les vérifications périodiques du moniteur que vous avez définies Les vérifications de moniteur comprennent certaines vérifications de base qui dépendent du type de moniteur, comme la disponibilité. De plus, vous pouvez définir vos propres conditions d'erreur, comme une limite pour le temps de chargement ou une correspondance dans le contenu de la page.

La Leçon : Configuration des conditions d'erreur du Cours de l'Academie : Alertes explique plus en détail comment configurer les conditions d'erreur.

Si la vérification moniteur détecte un problème, soit parce qu'une vérification standard échoue ou qu'une condition d'erreur est remplie, alors une erreur est signalée.

Erreurs

Toutes les erreurs sont indiquées dans la Vue d'ensemble des erreurs (élément de menu Tableaux de bord> Disponibilité et erreurs - Vue d'ensemble des erreurs). Vous pouvez définir les types d'erreurs que vous souhaitez voir (OK, non confirmés, confirmés) ainsi que les périodes que vous souhaitez consulter. Ces paramètres peuvent être définis pour l'ensemble des tuiles en haut du tableau de bord. De plus, vous pouvez les définir individuellement pour chaque tuile du tableau de bord. Placez la souris sur le coin supérieur droit de la tuile pour accéder à ses paramètres.

L'exemple suivant Vue d'ensemble des erreurs montre les erreurs non confirmées (marquées en jaune) et confirmées (marquées en rouge):

La première occurrence d'une erreur est appelée une erreur non confirmée. Cela peut être dû à une situation temporaire ou un problème avec le point de contrôle. C'est pourquoi une deuxième vérification moniteur est effectuée à partir d'un autre point de contrôle. Si la même erreur est signalée, le résultat est une erreur confirmée. Seules les erreurs confirmées peuvent entraîner des alertes.

Plus d'informations sur ce fonctionnement peuvent être trouvées dans l'article Erreurs non confirmées et confirmées.

Les séquences d'erreurs

Il existe différents scénarios pour les séquence d'erreurs ; ils sont illustrés dans l'image ci-dessous :

  • Une erreur non confirmée suivie d'un résultat OK. Cela ne produira pas d'alerte.
  • Une erreur non confirmée suivie d'une erreur confirmée, puis un résultat OK. Cela se traduira par une alerte, si votre définition d'alerte est "générer une alerte lorsqu'une ou plusieurs erreurs se sont produites".
  • Un certain nombre (n) d'erreurs non-confirmées et confirmées se produisent d'affilée. Cela se traduira par une alerte, si votre définition d'alerte est "générer une alerte lorsque n ou plusieurs erreurs se sont produites". Sinon, vous pouvez également définir un délai pour les erreurs. Si la séquence d'erreurs atteint ce délai, par exemple si les erreurs se produisent pendant plus de 5 minutes, une alerte est créée.

Alertes

La définition d'alerte détermine la génération d'alertes pour différents niveaux d'escalade. Les niveaux d'escalade sont utilisés pour créer des alertes par étapes et pour informer les bonnes personnes de la bonne manière, en tenant compte de l'urgence du problème et de l'urgence croissante si le problème persiste.

Pour chaque niveau, vous devez définir si une alerte est créée lorsqu'un délai est atteint (des erreurs se produisent pendant plus de x minutes) ou lorsqu'un certain nombre d'erreurs se sont produites (n erreurs ou plus se sont produites). Toutes les erreurs doivent être confirmées. Les erreurs non-confirmées ne sont pas prises en compte pour ces conditions.

En plus de l'alerte d'origine, vous pouvez générer une ou plusieurs alertes de rappel. Vous devez définir le nombre maximum de rappels et l'intervalle de temps entre deux rappels. Cette option existe pour chaque niveau d'escalade individuellement.

La Leçon : Création de définitions d'alerte et la Leçon : Alertes avancées - Niveaux d'escalade du cours de l'Académie : Les Alertes contiennent plus d'informations sur les définitions des alertes.

Notez que pour activer la génération des alertes d'un moniteur, il faut avoir coché la case Générer des alertes.

Une fois l'erreur résolue (ce qui signifie que la même vérification a maintenant renvoyé OK au lieu d'une erreur), une alerte de récupération (alerte OK) est créée.

Toutes les alertes sont affichées dans le Journal des alertes (élément de menu Alertes> Journal des alertes). Les alertes dues à une erreur sont marquées en rouge et les alertes OK sont marquées en vert. Tant que l'erreur n'est pas résolue et qu'aucune alerte de récupération n'a été générée, l'alerte est une alerte active. Les alertes actives sont listées dans la fenêtre Statut d'alertes (élément de menu Alertes> Statut d'alertes).

Messages

À ce stade, vous disposez déjà d'un système d'alerte de base. Les alertes apparaissent sur le tableau de bord Statut d'alertes. Pour remarquer une situation d'alerte manuellement, vos opérateurs devraient regarder le tableau de bord en continu.

C'est pourquoi les alertes sont automatisées ; des messages sont envoyées aux personnes ou aux systèmes pour les informer de la situation d'alerte. Dans ce cas, il faut configurer des intégrations et des niveaux d'escalade (dans une définition d'alerte).

Vous définissez des niveaux d'escalade pour indiquer qui reçoit quel type de message, en fonction de la durée ou de la fréquence d'une erreur. De plus, des rappels peuvent être envoyés pour s'assurer que la situation est prise en compte. Voir Niveaux d'escalade pour plus d'informations.

Pour qu'un message soit envoyé lorsqu'une alerte est générée, vous devez configurer Alertes par intégrations dans la définition d'alerte.

Définition d'alerte - onglet Niveau d'escalade

Les intégrations pour téléphone (voix), SMS et e-mail existent par défaut dans l'application Uptrends. D'autres intégrations avec des systèmes tiers comme Slack sont prédéfinies, mais doivent être configurées par vous. De plus, vous pouvez configurer une intégration entièrement personnalisée pour votre système tiers. Allez au menu Alertes> Intégrations pour une liste des intégrations dans votre application. Si l'intégration est présente ici, vous pouvez l'utiliser dans votre configuration Alertes par intégrations.

Voir Que sont les intégrations ? pour en savoir plus sur la gamme complète d'options d'envoi des messages d'alerte, à des personnes ou à des systèmes tiers. Consultez également l'article KB Configuration d'une intégration personnalisée pour en savoir plus sur l'envoi d'un message à un système qui n'a pas de définition d'intégration par défaut.

Voici un exemple de messages envoyés pour la même alerte, par email et Slack:

Tester l'envoi de messages

Vous avez besoin d'être sûr que vos messages sont envoyés lorsqu'une situation d'erreur survient.

La première étape consiste à s'assurer que l'envoi des messages fonctionne. L'article KB Test des messages d'alerte décrit pour les différentes intégrations, comment tester l'envoi des messages.

Pour consulter les astuces de dépannage, regardez la section Dépanner de la page "Vue d'ensembles des Alertes".