Common data
As a rule, metrics are grouped by component.
JVM
There are JVM metrics for every JVM component
Données communes
De façon générale, les métriques sont regroupées par composant.
JVM
Pour chaque composant, vous pourrez trouver les métriques concernant la JVM :
- bm-<composant>.hprof: le nombre de fichier hprof existant sur la machine, permet de constater s'il y a eu un plantagethe number of hprof files on the server can be used as an indication of a crash
- bm-<composant>.jvm.*: toutes les informations concernant la jvm pour ce composant (consommation mémoire courante, maximumall the jvm information for this component (current or maximum memory usage, etc.)
Heartbeat
Dans chaque composant ayant des interactions avec le core, on retrouvera les métriques suivantes qui servent à surveiller que les données de l'état de santé (heartbeat - littéralement « battement de cœur ») du core sont bien reçues par le composant :
In each component with interactions with the core, you will find the following metrics which are used to make sure that the component is receiving the core's health data:
Metric Name | Type | Content | Additional Information |
---|
Nom de la métrique | type | contenu | Informations complémentaires |
---|
heartbeat.receiver.age | Gauge |
âge de la réception du dernier heartbeat | Correspond à la durée entre 2 heartbeat.
Le core est censé envoyer son état de santé toutes les 4 secondes, des durées supérieures, voire dépassant les 8 secondes, doivent donc alerter sur le bon état de fonctionnement de celui-ciage of the last heartbeat received | The time between 2 heartbeats. The core is supposed to send its health information every 4 seconds. Durations exceeding this, or exceeding 8 seconds, may indicate some issue. |
heartbeat.receiver.failures | Counter |
nombre d'échecs de réceptionnumber of failed heartbeats |
|
heartbeat.receiver.latency | Gauge |
durée de réception du durée entre l'émission du heartbeat par le core et la réception par le composantdelivery time | Time between the heartbeat being sent by the core and it being received by the component. |
heartbeat.receiver.latencyMax | Gauge |
durée de réception maximum heartbeat delivery time |
|
heartbeat.receiver.received | Counter |
nombre de réceptions OKnumber of successful heartbeats |
|
Hazelcast
Les serveurs membres du cluster hazelcast comportent la métrique suivante :
The servers members of the hazelcast cluster comprise the following metric:
Metric Name | Type | Content | Additional Information |
---|
Nom de la métrique | type | contenu | Informations complémentairesla valeur de cette métrique doit être
| The value of this metric must be '3' |
Les métriques
Metrics
Metric Name | Type | Content | Additional Information |
---|
Nom de la métrique | type | contenu | Informations complémentaires |
---|
agent.metricsGathered | Counter |
nombre de métriques collectées par l'agent | cette métriques sert principalement à vérifier que l'agent est toujours en fonctionnement : l'absence de données indique que l'agent ne collecte plus rien, donc qu'il ne fonctionne plusnumber of metrics collected by the agent | This metric is mostly useful for checking whether the agent is working properly: no data means that the agent isn't collecting anything and therefore that it is no longer working. |
agent.vmware* |
données concernant la machine hébergeant l'agent | L'agent est actif uniquement si les vmware tools sont détectés sur les machines hébergeant BlueMind. Dans cas les métriques du
| agent host server data | The agent is enabled only if vmware tools are detected on the BlueMind host servers. In this case, the "vSphere Guest SDK" |
sont extraites et historisées.metrics are extracted and historized. These metrics are used to diagnose issues with BlueMind's virtualization on |
Ces métriques permet de diagnostiquer des problèmes liés à la façon dont serait virtualisé BlueMind sur vmware. |
bluemind.cluster |
|
|
|
bluemind.cluster.partitions |
|
|
|
bm-core |
---|
moteur principal de Main BlueMind Engine |
---|
callsCount | Counter |
nombre d'appels reçus par le number of calls received by the core |
|
dirVersion | Gauge |
|
|
directory.cluster.events | Counter |
|
|
handlingDuration | Timer |
durée de traitement des requêtesrequest handling time |
|
heartbeat.broadcast | Counter |
|
|
heartbeat.maxPeriod | Gauge |
|
|
heartbeat.period | Gauge |
|
|
bm-eas |
---|
service de connexion mobileMobile Connection Service |
---|
executionTime | Timer |
|
|
responseSize | DistSum |
|
|
bm-hps |
---|
service d'authentificationAuthentication Service |
---|
authCount | Counter |
nombre de demandes de connexions à number of connections requests to BlueMind |
status connexion réussiestatus connexion échouée (mauvais identifiant et/ou mot de passe- failed connection (wrong username and/or password)
|
ftlTemplates.requests | Counter |
nombre de pages générées demandéesnumber of page requests |
|
requestsCount | Counter |
nombre de requêtes servies par hps affichage de la page de maintenance- maintenance page displays
- kind: protected -
|
affichage d'une page protégéePermet notamment de vérifier le nombre d'affichage effectifs de la page de maintenance. Trop de requêtes de type "maintenance" peut être le signe d'un problèmeUsed, among other things, to check the number of times the maintenance page has been displayed. Too many "maintenance" requests may indicate an issue. |
staticFile.requests | Counter |
nombre de pages statiques demandées | exemple : page de loginnumber of static page requests | e.g.: login page |
upstreamRequestSize | DistSum |
taille des requêtesdurée de traitement des requêtesrequest handling duration |
|
upstreamRequestsCount | Counter |
nombre de requêtestraçage des opérations IMAP Operations Tracking |
---|
activeConnections | Gauge |
nombre de connexions ips activesnumber of active ips connections |
|
bm-lmtpd |
---|
service de remise des emailsEmail Delivery Service |
---|
activeConnections | Gauge |
nombre de connexions activesnumber of active connections |
|
connectionCount | Counter |
|
|
deliveries | Counter |
|
|
emailRecipients | DistSum |
nombre de destinataires par number of recipients per email |
|
emailSize | DistSum |
taille des emailssize of messages |
|
sessionDuration | Timer |
durée de session |
|
|
traffic.transportLatency | Timer |
|
|
bm-locator |
---|
localisation des servicesService Localization |
---|
executionTime | Timer |
temps d'exécution des requêtesrequest execution time |
|
requestsCount | Counter |
nombre de requêtes reçues par le number of requests received by the service | |
composant ayant émis la requête- component that makes the request
- statusCode: http return code
|
retour httpAnalyse et modification des emails au niveau SMTPAnalysis and Modification of Emails at SMTP Level |
---|
connectionsCount | Counter |
|
|
sessionDuration | Timer |
|
|
traffic.class | Counter |
|
|
traffic.size | Counter |
|
|
bm-webserver |
---|
serveur d'application webWeb Application Server |
---|
appCache.requestTime | Timer |
|
|
appCache.requests | Counter |
|
|
ftlTemplates.requests | Counter |
nombre de requêtes d'affichage de pages générées par le number of display requests generated by the webserver |
|
staticFile.requests | Counter |
nombre de requêtes d'affichage de pages statiquesnumber of static page display requests |
|
bm-xmpp |
---|
service de messagerie instantanéeInstant Messaging Service |
---|
packetsCount | Counter |
nombre de paquets transmis par le service | sert à voir à quel point le service de messagerie est utilisé ainsi que s'il fonctionne correctement ou a cessé de fonctionnénumber of packets sent by the service | used to assess messaging service usage and whether it is working properly or has stopped |
bm-ysnp |
---|
service de validation des donnéesData Validation Service |
---|
authCount | Counter |
nombre de demandes traitées | - status ok : demandes validées (par exemple authentification acceptée pour le login/pass entré par une personne)
- statuts failed : validation rejetée (par exemple authentification échouée car mot de passe incorrect)
| Autres | cpu | données d'utilisation des processeurs | permet de contrôler l'utilisation et la répartition des processeurs | disk | données de gestion de l'espace disque | permet de contrôler l'espace disque utilisé/libre/total/etc. par disque, partition, chemin, etc. | diskio | nombre d'octets écrits/lus en temps réel | permet de voir si le disque travaille correctement ou trop | elasticsearch* | données concernant ElasticSearch | pour plus d'informations et de détails sur les métriques ES, voir la documentation dédiée number of requests handled | - ok statuses: confirmed requests (e.g. authentications accepted for a username/password entered by a user)
- failed statuses: rejected validations (e.g. failed authentications due to a wrong password)
|
Other |
|
---|
cpu |
| processor usage data | used to monitor usage and processor distribution |
disk |
| disk handling space | used to monitor disk usage space used/free/total/etc. by disk, partition, path, etc. |
diskio |
| number of bites written/read in real time | used to see whether the disk is working properly or excessively |
elasticsearch* |
| ElasticSearch data | for more information and details about ES metrics, please refer to the dedicated documentation https://github.com/influxdata/telegraf/tree/master/plugins/inputs/elasticsearch |
imapd.process |
|
|
|
influxdb* |
données de la base de stockage des métriques
| metrics storage database data |
|
kapacitor* |
données concernant l'outil lui-même
| tool-specific data |
|
kernel |
|
|
|
kernel_vmstat |
|
|
|
mem |
|
|
|
memcached |
|
|
|
net |
|
|
|
netstat |
|
|
|
nginx |
|
|
|
phpfpm |
|
|
|
postfix_queue |
|
|
|
postgresql |
informations sur la base de données de BlueMind
| BlueMind database information |
|
processes |
|
|
|
swap |
|
|
|
syslog |
|
|
|
system |
|
|
|