Glossar¶
A¶
Acknowledgement (ACK)¶
Operator-Bestätigung, dass ein Problem gesehen wurde. Unterdrückt weitere Notifications und blockiert die Promotion degraded → alerting, bis Recovery eintritt. → Acknowledgements
Active Check¶
Check, der vom Vesana-Server selbst ausgeführt wird (z. B. ping, http von der API-Maschine aus). Veraltet für die meisten Anwendungsfälle — Collector ist die bevorzugte Variante.
Agent¶
Go-Single-Binary, das auf der überwachten Maschine läuft und Checks lokal ausführt. Push-basiert — meldet Ergebnisse via HTTPS POST an den Receiver. → Agents & Collectors → Agent
Agent-Token¶
Token im Format vesana_agent_<32 url-safe chars>. 1:1 an einen Host gebunden. Vom Server SHA256-gehasht in agent_tokens.token_hash. Wird genau ein Mal beim Erzeugen angezeigt. → Sicherheit → Tokens
AI-Analyse¶
Service-spezifische Diagnose durch ein LLM mit Wiki-RAG, Web-Suche und State-Kontext. Eingebaut in Error-Overview und Host-Detail. → AI-Chat & Analyse
Alerting (State)¶
Phase im Three-Layer-State-Modell — Fehler dauerhaft, Push-Notification raus, Operator alarmiert. Spalte: current_status.alerting_state = 'alerting'. → State-Modell
Alert Rule¶
Regel, die definiert, wann eine Notification ausgelöst wird. Schwellwerte, Pattern, Eskalation, Gruppierung. → Alert Rules
API-Key¶
Token für Collectors. Format: Custom-Prefix + 32 Bytes. SHA256-Hash in api_keys.key_hash. → Sicherheit → Tokens
Auto-Discovery¶
Automatische Erkennung neuer Hosts via nmap-Scan und SNMP-sysOID-Match. Im Collector implementiert. → Hosts → Discovery
B¶
Baseline¶
28-Tage-Mittelwert + Standardabweichung pro Service, gespeichert pro 1-Stunde-Bucket (168 Buckets). Grundlage für Anomaly Detection. → Anomaly Detection
Builtin¶
Mit Vesana mitgelieferte Profile, Profile-Checks oder Wiki-Artikel. is_builtin = true. Werden bei Updates über Seed-Scripts upserted, modifizierte Builtins (is_modified = true) nicht überschrieben.
C¶
Check¶
Eine einzelne Messung — z. B. „CPU-Last" oder „Battery-Voltage". In Vesana realisiert als Profile-Check (Definition) und Host-Service (Instanz). → Profile & Checks
Check-Mode¶
active (Server prüft selbst), passive (Collector prüft remote), agent (Agent prüft lokal).
Check-Result¶
Eine eingegangene Messung mit Status, Wert, Message, Timestamp. Speicherung in check_results (TimescaleDB-Hypertable).
Collector¶
Linux-VM im Kundennetz, führt Remote-Checks aus (SNMP, Ping, SSH, HTTP). Push-basiert wie der Agent. → Agents & Collectors → Collector
Compose-Profile¶
Optionale Service-Gruppen in docker-compose.prod.yml — z. B. ai, backup. Aktiviert via --profile <name>.
Confirmation-Intervall¶
Im probing-State wartet der Worker confirmation_interval_seconds (Default 10 s) bevor er den Check erneut ausführt — nach confirmation_attempts (Default 1) bestätigten Fehlschlägen geht der UI-State auf degraded. → State-Modell
Custom Dashboard¶
Frei konfigurierbare Sicht aus Widgets. Variablen, Sharing, Public-Links. → Custom Dashboards
D¶
Dead-Agent-Watcher / Dead-Collector-Watcher¶
Background-Job, der Hosts auf NO_DATA setzt, wenn Agent/Collector lange schweigt. Distributed Lock via Redis sorgt dafür, dass nur ein Replica läuft.
Degraded¶
Phase im Three-Layer-State-Modell — Fehler durch Confirmation bestätigt, noch keine Push-Notification. Promotion zu alerting läuft nach Sustained-Schwelle (60-120 s). Spalte: current_status.ui_state = 'degraded'. ACK in dieser Phase blockiert die Promotion. → State-Modell
Dependency¶
Eltern-Kind-Beziehung zwischen Hosts oder Services. Grundlage für Inhibition. → Dependencies & Inhibition
Discovery-Result¶
Ergebnis eines Network-Scans pro IP, mit sysOID, sysDescr, Service-Erkennung, vorgeschlagenem Profil.
Distributed Locking¶
Redis-basierter Lock mit 55 s Timeout, sodass Watcher in einem Multi-Replica-Setup nur einmal laufen.
Downtime¶
Geplantes oder ungeplantes Wartungsfenster, in dem Alerts unterdrückt werden. Einmalig oder per RRULE wiederkehrend. → Downtimes
E¶
Effective Config¶
Verschmelzung aus Profile-Check-Default und Host-Service-Override. Per COALESCE und JSONB-Merge im SQL berechnet. → Profile & Checks → Effective Config
Eskalation¶
Mehrstufige Alert-Strategie: erst Stufe 1 (z. B. E-Mail an Operator), nach 15 min ohne Ack Stufe 2 (Push an Manager), nach 30 min Stufe 3.
F¶
FCM (Firebase Cloud Messaging)¶
Google-Service für Push-Notifications an Android-Geräte. Vesana kann Shared-FCM (Standard) oder eigenes Firebase-Projekt nutzen. → Mobile App → Push-Notifications
Field-Encryption¶
AES-256-GCM-Verschlüsselung sensibler Spalten (z. B. hosts.snmp_community). Schlüssel in FIELD_ENCRYPTION_KEY. → Sicherheit → Verschlüsselung
H¶
Heartbeat¶
Regelmäßige Lebenszeichen-Anfrage des Agents an den Server (POST /api/v1/agent/heartbeat). Default: alle 60 s. Setzt agent_tokens.last_seen_at.
Host¶
Konkrete überwachte Maschine oder Gerät. Hat genau ein Profil. → Hosts
Host-Service¶
Instanz eines Profile-Checks für einen konkreten Host. Mit optionalen Overrides. → Profile & Checks
Hypertable¶
TimescaleDB-Konstrukt für Zeitreihen-Tabellen mit automatischer Partitionierung. In Vesana: check_results, logs, agent_metrics.
I¶
Inhibition¶
Unterdrückung von Alerts für abhängige Services, wenn der Eltern-Host im alerting-State ist (nicht schon bei degraded). → Dependencies & Inhibition
Instance-UUID¶
Eindeutige ID einer Vesana-Installation, in system_settings.instance_uuid. Wird beim ersten Phone-Home oder Feedback erzeugt, race-safe via INSERT ON CONFLICT.
L¶
Lizenz-Tier¶
Community, Pro, Enterprise. → Lizenz-Tiers
Log-Alert-Regel¶
Pattern-Matching auf Log-Einträge mit Threshold, Absence- oder Any-Match-Auslöser. → Logs
LLD (Low-Level Discovery)¶
Konzept aus Zabbix für dynamische Item-Generierung — z. B. „für jedes gefundene Filesystem einen Disk-Check anlegen". In Vesana aktuell nicht implementiert; Workaround: agent_services_auto-Check und SNMP-Picker.
M¶
MIB (Management Information Base)¶
SNMP-Datenbeschreibung. Vendor-spezifisch (z. B. Cisco-ENVMON-MIB, APC-PowerNet-MIB).
MIB-Snippet¶
YAML-Datei mit Vendor-MIB-Wissen — OIDs, Status-Mappings, Discovery-Hints. → MIB-Snippets
Mobile-Push¶
Push-Notification an die Android-App via FCM. Severity-Filter, User-Targeting, Recovery-Toggle pro Channel. → Mobile App
MSP (Managed Service Provider)¶
IT-Dienstleister, der mehrere Kundenumgebungen monitort. Standardanwender für Multi-Tenant-Mode.
N¶
NO_DATA¶
Status-Wert: keine Daten innerhalb der Erwartungs-Frist empfangen. Orange im UI. → State-Modell
Notification Channel¶
Konfigurierter Output-Kanal für Alerts: E-Mail, Mobile-Push, Webhook, Slack, Teams. → Notification Channels
NSCA¶
Nagios Service Check Acceptor. Legacy-Protokoll auf Port 5667. Vesana kann als NSCA-Empfänger fungieren — Migrations-Pfad für Nagios-Bestände. → NSCA-Migration
O¶
OID (Object Identifier)¶
SNMP-Identifier, z. B. .1.3.6.1.2.1.1.5.0 für sysName.
Override¶
Host-spezifische Abweichung von einem Profile-Check-Default. → Effective Config
P¶
Passive Check¶
Check, der von einem Collector ausgeführt wird (check_mode = passive).
Permission¶
Rechte-Bit. Beispiele: host.create, alert_rule.edit, ai.query. → Rollen & Permissions
Pipeline-Health¶
System-Endpoint /api/v1/admin/health/snapshot mit Stream-Backlog, Insert-Rate, DB+Disk-Free, Worker-Pool-Status. → System-Health
Probing¶
Erste Phase im Three-Layer-State-Modell — Check hat einmal Fehler gemeldet, Confirmation-Retry läuft. Operator sieht eine grau-pulsierende Pille. Spalte: current_status.ui_state = 'probing'. Geht entweder nach Confirmation auf degraded, oder direkt zurück auf ok wenn der Retry-Versuch grün ist. → State-Modell
Profil¶
Geräte-Definition mit Capabilities und visuellem Layout-Typ. → Profile & Checks
Profile-Check¶
Check-Definition pro Profil. → Profile & Checks
R¶
RAG (Retrieval-Augmented Generation)¶
Technik, bei der ein LLM mit relevantem Kontext aus einer Datenbank gefüttert wird. Vesana nutzt pgvector + Wiki-Embeddings als RAG-Quelle. → AI-Features
Receiver¶
Eingangs-Service, der Agent- und Collector-Pakete annimmt und in den Redis Stream schreibt. Schnellster Pfad — keine DB-Schreibzugriffe.
Recovery¶
Übergang aus alerting zurück zu ok. Optional eine eigene Notification.
Recovery-Poll-Intervall¶
Im degraded-State pollt der Worker-Scheduler den Active-Check enger (Default 15 s) für schnelleres Recovery-Detection. Feld: recovery_poll_interval_seconds. → State-Modell
S¶
Severity¶
Schweregrad-Reihenfolge: CRITICAL > WARNING > NO_DATA > UNKNOWN > OK.
Soft-Delete¶
Logisches Löschen via deleted_at-Spalte. Items landen im Papierkorb, werden nach 30 Tagen physisch gelöscht. → Soft-Delete & Papierkorb
Status-Page¶
Öffentlich erreichbare Seite mit ausgewählten Komponenten-Status. Branding pro Tenant. → Public Status Pages
Sustained-Schwelle¶
Wie lange ein degraded ununterbrochen bestehen muss, bevor der Watcher zu alerting promoviert. Defaults: 60 s für CRITICAL, 120 s für WARNING (Settings default_alert_after_critical_seconds, default_alert_after_warning_seconds). → State-Modell
sysOID¶
SNMP-Object-ID, die ein Gerät identifiziert (.1.3.6.1.2.1.1.2.0). Grundlage für Profile-Auto-Match.
T¶
Tenant¶
Mandanten-Trennlinie. Jeder Host, jede Alert-Rule, jedes Dashboard hat eine tenant_id. → Architektur
Tester-Mode¶
Env-Bypass für Beta-Tester. Alle Features ohne Lizenzschlüssel. → Lizenz
Three-Layer-State-Modell¶
Aktuelles State-Modell seit v0.48 (Migration 147 hat das alte Soft/Hard-Modell entfernt). Trennt UI-State (probing/degraded/alerting/no_data/unknown/ok — was der Operator sieht) von Alerting-State (ok/alerting — was Notifications und SLA antreibt). → State-Modell
track_change¶
Audit-Helper, der old_values und new_values einer Update-Operation als JSONB im audit_log speichert. → Audit-Log
U¶
UI-State¶
Operator-sichtbarer Layer im Three-Layer-State-Modell. Werte: ok, probing, degraded, alerting, no_data, unknown. Treibt die Pille in der Fehlerübersicht. → State-Modell
UNKNOWN¶
Status-Wert: Check lief, aber Ergebnis nicht eindeutig. Grau im UI. → State-Modell
Updater-Sidecar¶
Container, der GUI-Updates ausführt: Pre-Update-Backup, Pull, Migrations, Restart, Auto-Rollback. → Updates
V¶
Variable (Dashboard)¶
Platzhalter wie $host, $tenant für dynamische Widget-Filterung. Multi-Select möglich. URL-persistiert. → Custom Dashboards
Visual-Type¶
Spezielle Hardware-Visualisierung pro Profil (switch_portmap, ups_panel, …).
W¶
Watchdog¶
Background-Job, der Status-Übergänge überwacht (Dead-Agent, Dead-Collector, Service-Overdue, Downtime-Expiry).
Wiki¶
Eingebaute Wissensbasis. Markdown, Kategorien, Tags, Service-Linking, pgvector-Embeddings. → Wiki
Worker¶
Konsumer-Service, der Redis-Stream-Messages verarbeitet, Status updated, Alerts auswertet. Mehrfach instanziierbar.
Z¶
Zstd¶
Kompressions-Algorithmus für Log-Pakete. Agent komprimiert Log-Einträge vor dem POST.