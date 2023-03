L’observabilité métiers, une des composantes du socle de la supervision informatique ; ces dernières années, une tendance intéressante se développe : celle de l’infrastructure hybride. La plupart des entreprises se sont en effet mises au défi de mixer leur infrastructure physique dont elles sont propriétaires (serveurs physiques, gérés par l’entreprise) avec une ou plusieurs solutions de Cloud public et/ou privé administrées par des prestataires externes.

Mais bien que considérés comme une nécessité pour la compétitivité, les infrastructures informatiques hybrides présentent cependant l’inconvénient d’être complexes et donc très difficiles à gérer et ont aussi un coût de gestion important. Malheureusement, les systèmes modernes complexes sont aussi très susceptibles de rencontrer des défaillances, des bogues et des goulots d’étranglement des performances qui se produisent très fréquemment si des solutions ne sont pas trouvées pour les éviter.

C’est là qu’intervient l’observabilité ! En mettant à votre disposition des informations exploitables à partir de données générées par des systèmes informatiques et logiciels instrumentés, l’observabilité vous permet de déterminer la cause première de ces événements et vous saurez avec une très grande précision quand un événement ou un problème s’est produit et pourquoi.

Le concept d’observabilité n’est pas nouveau ! Il est souvent présenté par les experts comme une nouvelle notion qui remplacera la supervision IT, alors qu’en réalité, le besoin d’observabilité rend plus pertinente que jamais l’utilisation d’une plateforme de supervision solide, complète et orientée métier. Mais quel est véritablement le lien entre l’observabilité et la supervision informatique ?

Découvrez dans cet article comment l’observabilité métiers, est devenue une des composantes du socle de la supervision informatique ? Analysons un peu plus en détail.

Qu’est-ce que l’observabilité ?

Pour comprendre l’observabilité, il convient d’abord de parler de la surveillance informatique, qui au passage est aussi une fonction essentielle de la supervision informatique, dit différemment c’est la capacité de mesurer les états internes d’un système en détaillant sa production.

Le système est considéré comme « observable » si son état actuel peut être estimé uniquement en utilisant les informations de sortie, à savoir les données des capteurs, et autres outils de mesure qui peuvent et doivent le composer.

La surveillance informatique ou network monitoring en anglais fournit aux équipes informatiques les outils nécessaires pour collecter des données sur les systèmes observés. Le but est d’exploiter ces données pour pouvoir réagir rapidement en cas d’erreurs et de problèmes. En d’autres termes, la surveillance informatique se résume à la mise en place de systèmes capables de recueillir de données afin de détecter les problèmes et réagir rapidement.

L’observabilité, pour sa part, va plus loin ! Pour une entreprise, elle consiste à s’équiper d’outils pouvant recueillir sur les systèmes à observer des données exploitables permettant d’identifier les erreurs, les incidents et autres évènements anormaux, mais aussi de savoir pourquoi ils se produisent.

Sans cette information, les équipes informatiques ne peuvent pas résoudre les problèmes et empêcher qu’ils ne se reproduisent à nouveau, car le but de l’observabilité est nous citerons les propos du Gartner : c’est l’évolution de la supervision en un process qui va offrir des indications et des informations sur toutes les applications numériques ou métiers de l’entreprise, dans l’objectif d’accélérer l’innovation et d’améliorer l’expérience clients

On dit qu’un réseau est « observable » à partir du moment où son actuel peut être estimé avec une très grande précision rien qu’en utilisant les informations de sortie, à savoir les données fournies par les capteurs et autres instruments de mesure, et non de sa composition ou de son architecture.

L’observabilité exige bien évidemment la mise en place d’outils adaptés qui sont conçus pour collecter et agréger autant de métriques que possible à partir de chaque composant du système, y compris l’infrastructure, les applications, les services sans serveur, le middleware et les bases de données, afin de fournir des vues complètes sur les états internes d’un système au point le plus critique.

Les trois piliers de l’observabilité

L’observabilité vous permet de comprendre ce qui se passe dans votre logiciel ou système en examinant les informations disponibles en externe.

Pour ce faire, les outils d’observabilité utilisent principalement trois classes de données qu’on appelle aussi les trois piliers de l’observabilité, à savoir les logs ou journaux d’évènements, les métriques et les traces.

Une fois combinées et traitées, ces données livrent en temps réel aux responsables informatiques et commerciaux suffisamment d’informations sur le spectre plus large des performances du système dans l’ensemble de l’entreprise.

LES JOURNAUX D’EVENEMENTS – Pilier N° 1

Les enregistrements d’événements, appelés aussi logs ou encore journaux d’évènements se présentent sous forme textuelle. Il s’agit d’enregistrements horodatés d’événements qui se sont produits dans les logiciels qui les ont générés. Mais il n’y a pas que les logiciels, les systèmes d’exploitation, les intergiciels, les périphériques réseau, les serveurs génèrent eux aussi des journaux d’évènements que les responsables informatiques et les solutions de network monitoring peuvent exploiter à des fins de surveillance informatique.

Les journaux fournissent des informations sur ce qui s’est passé avant, pendant et après qu’un problème se soit produit. Un expert qui surveille et analyse les journaux peut donc savoir ce qui s’est passé pendant un segment de temps spécifique dans un logiciel spécifique.

Toutefois, les journaux d’évènements ont ses limites. Autrement, on se contenterait de leur analyse pour l’observabilité d’un système. S’ils peuvent montrer ce qui se passe ou ce qui s’est passé dans un logiciel ou périphérique donné, les journaux d’évènements ne révèlent cependant pas les liens entre les microservices. Or, il arrive que certains problèmes ne se cachent pas dans un service donné, mais dans la manière dont différentes fonctions sont connectées. Pour comprendre les liens entre les microservices, les responsables informatiques doivent se pencher sur l’analyse des traces.

LES TRACES – Pilier N° 2

En informatique, les traces sont des enregistrements de voies d’information ou de flux de travail conçus pour suivre une unité de travail, telle qu’une transaction entre deux ou plusieurs microservices, à travers la séquence de processus que la logique d’application lui ordonne de suivre.

Les traces utilisent un identifiant universel unique pour chaque élément de données. Cet identifiant unique voyage avec les données, ce qui permet de suivre leur cycle de vie tout au long de vos microservices.

En analysant les traces, les équipes DevOps peuvent comprendre quel chemin les données ont emprunté, combien de temps leur a fallu pour parcourir tel chemin. C’est de cette manière aussi que les goulots d’étranglement dans un système sont identifiés.

Ce concept de traçage a été introduit alors que l’informatique distribuée et les microservices gagnaient en popularité. Le traçage s’avèrera surtout nécessaire lorsque plusieurs composants existent dans un système et que des données sont transmises entre eux, ce qui est presque toujours le cas !

LES METRIQUES DE SUPERVISION – Pilier N° 3

Les métriques de supervision représentent les données de performance du système surveillé sur un certain temps sous forme de valeur numérique. Dès qu’on parle de système ou réseau, les métriques les plus importants sont la latence (mesure du temps nécessaire pour que les données atteignent leur destination sur un réseau), la gigue (variation de la latence au fil du temps qu’on appelle tout simplement interruption de la transmission des données), la perte de paquets (le nombre de paquets de données envoyés avec succès à partir d’un point d’un réseau, mais qui ont été abandonnés pendant la transmission des données), le débit (la quantité de données passant par le réseau d’un point A à un point B dans un laps de temps déterminé), la duplication de paquets (les paquets de données sont dupliqués quelque part dans le réseau, puis sont reçus deux fois à leur destination), la réorganisation des paquets et plus encore.

Les systèmes de surveillance et de supervision informatiques sont généralement configurés pour déclencher des alertes lorsque la valeur des métriques dépassant un seuil prédéfini, en tous cas, ils sont là pour alerter les gestionnaires d’astreinte qui pourront intervenir même à distance.

Et la supervision informatique c’est quoi ?

La supervision informatique réseau est une technique mêlant surveillance informatique, suivi, pilotage informatique, diffusion d’alertes et génération de rapports. À l’aide d’outils logiciels spécialisés, elle garantit le bon fonctionnement du réseau supervisé, notamment en prévenant les défaillances, en évitant les interruptions de service et aussi en améliorant la détection de potentiels problèmes réseau, y compris les failles de sécurité afin de limiter par exemple les risques de cyberattaques.

Elle réponde à plusieurs préoccupations dont notamment la surveillance de l’infrastructure informatique qui inclut le réseau (disponibilité des services en ligne, débits, contrôle des flux…), les composants matériels, le système d’exploitation, mais aussi à la surveillance de tout ce qui est fonctionnel comme les machines informatiques et de production par exemple.

La supervision informatique s’intéresse également aux applications, à leur disponibilité, aux antivirus, aux sites web et plus encore. Enfin vous pouvez aussi utiliser des outils de supervision informatique pour surveiller et améliorer les processus métiers. Ces derniers étant définis comme un ensemble d’activités mis en place pour réaliser une tâche, un projet ou atteindre un objectif.

Lorsqu’un problème est détecté (exemple : indisponibilité de service, périphérique introuvable, intrusion de logiciel malveillant, site web introuvable…), le système de supervision déclenche des alertes pour prévenir les responsables informatiques. C’est ainsi que la supervision informatique contribue à garantir le bon fonctionnement d’un système ou réseau.

Quelle est la différence entre la supervision et l’observabilité ?

La supervision et l’observabilité sont des concepts distincts qui dépendent l’un de l’autre. Certains experts considèrent l’observabilité comme l’évolution de la supervision. Pour d’autres, elle est l’extension de la supervision informatique. Mais une chose est sûre : on effectue une supervision pour accroître l’observabilité du système. En d’autres termes, l’observabilité ne peut se faire sans la supervision.

Voici les principales différences entre la supervision et l’observabilité :

Pratiquement n’importe quel système peut être supervisé. Mais l’observabilité est une propriété d’un système. Cela implique que pour être « observable », un système doit être conçu pour l’observation.

La supervision demande si votre système fonctionne. L’observation, pour sa part, demande ce que fait votre système.

La supervision comprend essentiellement l’analyse des métriques, des événements et des journaux. Il faut ajouter à tout cela l’analyse des traces pour faire de l’observabilité.

Les outils de supervision informatique extraient et collectent des données. Ceux de l’observabilité sont totalement passifs, se contentant de collecter et de publier des données.

Si la supervision permet aux responsables informatiques de répondre rapidement aux pannes ; l’observabilité, elle, vise à réduire la durée des pannes.

La supervision collecte des métriques ; l’observabilité génère des métriques.

La supervision identifie l’état du système ; l’observabilité identifie pourquoi le système a échoué.

Quel est le rôle de la supervision informatique dans l’observabilité ?

La supervision informatique ne doit pas être comparée à observabilité, car les deux se complètent. Plus concrètement, l’observabilité nécessite une bonne stratégie de supervision informatique. La raison à cela en est simple : l’observabilité se nourrit d’un éventail de données dont seule la supervision informatique peut fournir.

La raison d’être de la supervision informatique est d’ailleurs de rendre le réseau plus visible et donc plus observable par les responsables informatiques, grâce notamment à la collecte de données, à l’analyse de données, à la corrélation de données ou encore à l’agrégation de données, étant donné que les environnements d’aujourd’hui sont fortement distribués.

Conclusion sur observabilité et supervision informatique

Pour amener à l’observabilité, la supervision informatique doit répondre à deux conditions suivantes. D’abord, elle doit couvrir l’ensemble des SI, doit fournir une vue complète des activités métiers et aussi établir un lien entre les performances des infrastructures et les résultats métiers qu’elle contribue à générer.

Ensuite, la plateforme de supervision informatique utilisée doit aussi pouvoir s’échanger des données avec d’autres solutions clés qui contribuent à l’observabilité de l’entreprise. En effet, il est important de préciser qu’il faut tout un arsenal d’outils pour adopter une démarche d’observabilité; complément essentiel de la supervision informatique.

Auteur Antonio Rodriguez Mota Editeur et Directeur de Clever Technologies