Zum Inhalt

Check-Typen-Referenz

Diese Seite ist die Referenz aller Check-Typen, die Vesana kennt — sortiert nach Modus.

Aktive Checks (vom Server)

Werden direkt auf dem Vesana-Server ausgeführt, sind primär für die Selbst-Überwachung gedacht. Für Kunden-Hosts: Collector verwenden.

ping

ICMP-Echo zum Ziel.

Config Default Bedeutung
count 4 Anzahl Pakete
timeout_ms 1000 Timeout pro Paket

Resultat: OK wenn count erfolgreich, WARNING bei Paketverlust, CRITICAL wenn alle verloren.

check_type: ping
check_config:
  count: 4
  timeout_ms: 1000

http

HTTP-/HTTPS-Request mit optionaler Body-Validierung.

Config Default Bedeutung
url URL inkl. Schema
method GET HTTP-Methode
expected_status 200 Erwarteter Status-Code
body_contains Substring im Response-Body
timeout_s 10 Verbindungs-Timeout
verify_tls true TLS-Cert verifizieren
check_type: http
check_config:
  url: https://api.example.com/health
  expected_status: 200
  body_contains: '"ok":true'

port

TCP-Connect-Test.

Config Default Bedeutung
port TCP-Port
timeout_s 5 Connect-Timeout

ssl_certificate

Zertifikats-Ablauf prüfen.

Config Default Bedeutung
host Hostname
port 443 TLS-Port
warn_days 21 WARN bei < N Tagen Restlaufzeit
crit_days 7 CRITICAL bei < N Tagen
check_type: ssl_certificate
check_config:
  host: example.com
  port: 443
  warn_days: 30
  crit_days: 7

Passive Checks (vom Collector)

Vom Collector im Kundennetz ausgeführt. Voraussetzung: host.collector_id gesetzt.

snmp

Einzelne OID abfragen, numerischer Vergleich.

Config Default Bedeutung
oid numerische OID
version 2c 1, 2c, 3
community Community (verschlüsselt gespeichert)
multiplier 1 Wert × multiplier
check_type: snmp
check_config:
  oid: ".1.3.6.1.4.1.9.9.13.1.3.1.3.1"
  version: 2c
  community: public
threshold_warn: 60
threshold_crit: 75
value_type: gauge

snmp_string

OID, Wert wird als String interpretiert, optional gegen Pattern matched.

Config Bedeutung
oid OID
match_value erwarteter Wert oder Regex
mode exact, regex, contains

snmp_table

Bulk-Walk auf eine Tabelle, Resultat als JSONB in check_results.perfdata. Grundlage für switch_portmap und nas_diskbay Visuals.

check_type: snmp_table
check_config:
  walk_oid: ".1.3.6.1.2.1.2.2.1"
  columns:
    name:        ".1.3.6.1.2.1.2.2.1.2"
    speed:       ".1.3.6.1.2.1.2.2.1.5"
    oper_status: ".1.3.6.1.2.1.2.2.1.8"

ssh_command

SSH-Login, Befehl ausführen, Exit-Code + Output auswerten.

Config Bedeutung
username SSH-User
auth_method password oder key
password (verschlüsselt)
private_key PEM-Inhalt (verschlüsselt)
command Shell-Command
expected_exit_code Default 0

ssh_cpu, ssh_mem, ssh_disk

Wrapper um ssh_command mit Standard-Befehlen — typisch für ESXi und Linux ohne Agent.

http und port (passive Variante)

Gleiche Config wie aktiv, aber vom Collector ausgeführt — sieht das Ziel aus dem Kundennetz, nicht vom Vesana-Server aus.

Agent-Checks

Voraussetzung: host.agent_managed = true, Agent installiert, Token gültig.

agent_cpu

CPU-Auslastung in %, gemittelt über das letzte Intervall.

check_type: agent_cpu
threshold_warn: 80
threshold_crit: 95
value_type: gauge

agent_memory

RAM-Auslastung in % (Used / Total).

agent_disk

Disk-Usage pro Mount in %.

Config Bedeutung
path /, /var, C:, D:

agent_service

Status eines OS-Service.

Config Bedeutung
service systemd-Unit oder Windows-Service-Name

Resultat: OK wenn active, CRITICAL sonst.

agent_process

Läuft mindestens N Prozesse mit dem Namen?

Config Bedeutung
process Prozessname oder Pattern
min_count Default 1
max_count optional

agent_eventlog (Windows)

Windows Event Log auswerten.

Config Bedeutung
log Application / System / Security
level Error / Warning / Information
minutes Lookback-Fenster
source optionaler Source-Filter

Resultat: Anzahl Einträge im Fenster.

agent_custom

Eigener Befehl mit Pattern-Matching auf Output.

Config Bedeutung
command Shell-Befehl
ok_pattern Regex für OK
warn_pattern Regex für WARNING
crit_pattern Regex für CRITICAL
timeout_s Default 30
check_type: agent_custom
check_config:
  command: "/usr/local/bin/checkbackup.sh"
  ok_pattern: "^Backup OK"
  crit_pattern: "(failed|error)"

agent_script

Server-managed Monitoring-Script ausführen. Siehe Monitoring-Scripts.

Config Bedeutung
script_id UUID des Scripts

agent_services_auto (Windows)

Alle Services mit Startup-Type Auto prüfen — alle die nicht laufen sind CRIT.

Config Bedeutung
exclude Liste von Service-Namen, die ignoriert werden

Spezial

nsca_passive

Pakete vom NSCA-Empfänger landen als „virtuelle Checks" mit check_mode = passive in der Pipeline. Detail: NSCA-Migration.

Common Felder (alle Check-Typen)

Feld Bedeutung
interval_seconds wie oft (10 s ≤ x ≤ 7 Tage)
retry_interval_seconds im Soft-State (≥ 5 s, ≤ Hauptintervall)
max_check_attempts Soft → Hard nach N Fehlschlägen
threshold_warn numerische Warnschwelle
threshold_crit numerische Krit-Schwelle
value_type gauge / counter / status / info / duration

Resultat-Format

Jedes Result, das im Receiver eingeht, hat:

{
  "host_token_or_api_key": "...",
  "service_id": "uuid",
  "status": 0,           // 0 OK, 1 WARN, 2 CRIT, 3 NO_DATA, 4 UNKNOWN
  "value": 42.5,
  "message": "OK - load 42.5%",
  "perfdata": { "load1": 0.42, "load5": 0.31 },
  "checked_at": "2026-04-25T10:15:30Z"
}

perfdata als JSONB ist optional — wird für Charts und Visuals genutzt.

Welcher Check-Type für welches Problem

Problem Empfehlung
Ist der Server erreichbar? ping (passive)
Ist die Webseite oben? http (passive)
Läuft Apache? agent_service (Linux) oder agent_service (Windows)
CPU-Last? agent_cpu
Disk volläuft? agent_disk mit path
Switch-Port-Status? snmp_table mit ifTable, Visual-Type switch_portmap
UPS-Battery-Voltage? snmp mit OID aus UPS-MIB
Backup gestern erfolgreich? agent_script mit Custom-Script, das Log auswertet
Eigene Logik? agent_custom mit Pattern-Matching
ESXi-Host ohne Agent? ssh_cpu / ssh_mem / ssh_disk

Anschluss