HOWTO · FAQ · OPENCLAW · MESHMAC · GATEWAY · RATE-LIMIT · MEHRKNOTEN · 2026

2026 OpenClaw MeshMac in der Praxis: Rate-Limit und Session-Concurrency am geteilten Gateway — minimale reproduzierbare Schritte gegen Überlast (HowTo+FAQ)

Lesezeit: ca. 8 Min.
Token-Bucket, Sessions, CI, Health, Logs
Teams mit gemeinsamem OpenClaw-Gateway auf MeshMac sehen oft 429, hängende Webhooks oder CI-Flakes, wenn Pipelines und Chat gleichzeitig den Einlass treffen. Hier: Token-Bucket, Verbindungs- und Session-Caps, Abstimmung mit CI- und Kanal-Parallelität, Health bei Sättigung und Logfelder — Mehrknoten verteilen Last statt einen Host zu sprengen. Mehr: Load-Balance/Failover, Health-Probes, TLS-Einlass/Rate-Limit.

Drei Überlast-Muster am gemeinsamen Gateway

  1. Burst-Kollision: Viele parallele CI-Jobs erzeugen Webhooks — der Gateway sieht RPS-Spitzen, während CPUs noch idle wirken. Ohne Bucket oder faire Queue wirkt Traffic feindlich.
  2. Session-Stau: Lange Streams und offene Skill-Antworten halten Sitzungen — RPS-Limits allein reichen nicht; dokumentieren Sie max gleichzeitiger Sessions.
  3. Schlechte Logs: 429/503 ohne mesh_node_id, limit_type, retry_after erzwingen Raten. Mehrknoten nützen nur mit einheitlichen Feldern.

Matrix: Token-Bucket, Verbindungsdeckel und Session-Concurrency

Schutzmechanismen nach Lastform und Ops-Aufwand für Pools mit gemeinsamem Einlass.

Mechanismus Primäre Last Burst-Verhalten Fairness Typische Kennzahl Ops-Hinweis
Token-Bucket (HTTP) Kurze RPS-Spitzen Kontrollierter Burst, dann Drossel Pro API-Key, Tenant oder IP refill_rate, burst_capacity Im Reverse-Proxy nah am Internet-Terminierungspunkt
Harte Verbindungsgrenze TLS- und TCP-Handshakes Scharfer Cut, wenig Glättung Schützt Kernel und Dateideskriptoren max_connections, backlog Kombinieren mit Keepalive und Timeouts
Session-Concurrency-Cap Langlebige Gateway-Sitzungen Warteschlange oder 503 Pro authentifiziertem Principal max_concurrent_sessions Retry-After Header dokumentieren
Kombination empfohlen CI plus Chat plus API Bucket vor harter Cap Zwei Ebenen: Edge und App getrennte Metriken je Ebene Gleiche Policy auf allen MeshMac-Gateways

Kurz: Bucket glättet Spitzen; Verbindungs- und Session-Limits schützen den Host. Ein Prozess auf Miet-Mac trägt weniger gleichzeitige Last, als CPUs vermuten lassen.

CI-, Webhook- und Gateway-Parallelität — Abhängigkeiten

Summe aus CI-Jobs, Kanal-Events und offenen Sessions muss unter Ihren dokumentierten Caps bleiben — sonst 429-Kaskaden wie flaky Builds.

Quelle Typische Parallelität Gateway-Effekt Gegensteuer Mehrknoten-Nutzen
CI-Pipeline matrix jobs, shards Viele kurze POSTs Job-Groups drosseln, Staging-Queue Round-Robin über Gateway-Instanzen
Chat / Matrix / Teams Webhook-Worker, prefetch Bursts bei Raumereignissen Worker concurrency an Gateway anbinden Kanal spiegelt auf zweites Gateway
Interne Tools Dashboard-Polling Stetige Hintergrundlast Etag, längere Intervalle Lesende Anfragen auf read-only Knoten

Sieben Minimal-Schritte: Limit-Policy, Health und Logs

  1. Baseline: Pro Knoten RPS, gleichzeitige Sessions, p95, Anteil 429/503 mindestens eine Woche messen; CI- und Release-Fenster im gleichen Dashboard markieren.
  2. Edge-Limit: Im TLS-Reverse-Proxy (Nginx/Caddy-Matrix) Token-Bucket pro Pfad oder Schlüssel; Webhooks per Secret oder mTLS von anonymem Health trennen.
  3. Session-Cap im Gateway: max_concurrent_sessions oder Worker-Tiefe fixieren; Verhalten bei Überlauf dokumentieren (503 + Retry-After oder Queue). Gleicher Wert auf allen Pool-Knoten.
  4. CI und Broker: job concurrency und prefetch so wählen, dass Summe der Aufrufe unter Edge- und Gateway-Caps bleibt; 429 mit Backoff statt sofortigem Fail, wenn SLA passt.
  5. Health: Aggregierte Probe (Health-Leitfaden) um Session-Auslastung, Queue und Anteil Drosselungen erweitern; bei anhaltender Überschreitung unhealthy — Load-Balancer verteilt auf Geschwister.
  6. Logs: Bei Drosselung immer request_id, mesh_node_id, limit_type, Zähler (tokens_remaining oder concurrent_sessions), http_status, retry_after_seconds, upstream_latency_ms, plus client_key_scope.
  7. Rollout: Canary auf einem Gateway, dann Config-Hash auf allen Hosts; openclaw gateway status und kurze synthetische Last vor Produktionsfreigabe.
openclaw gateway status --json
curl -sS -o /dev/null -w "%{http_code}\n" -H "Authorization: Bearer $TOKEN" https://gateway.example/health

Mehrknoten: gleiche Limits auf allen Hosts und Health-gesteuerte Umverteilung schlagen asymmetrische Sonderwerte.

Zitierfähige Schwellen für Reviews und Change-Advisory

  • Edge-RPS: Anonyme Pfade oft 10–30/s pro IP oder Key; Webhooks eigene Buckets mit Auth.
  • Session-Cap: Ca. 0,7–0,85 des Punktes, an dem p95 vor dem Limit knickt.
  • Retry-After: 1–5 s interaktiv, 5–30 s Batch, mit Jitter.
  • Health: Knoten rotieren, wenn >15 % Drosselungen über 60 s oder Session >90 % der Cap — an SLO anpassen.

FAQ: Rate-Limits, 429 und Zusammenspiel mit Kanälen

Token-Bucket oder Verbindungsgrenze?
Beides: Bucket für HTTP-Bursts, Cap für FDs/TLS; Session-Cap für lange OpenClaw-Sitzungen.
Niedrige CPU, aber 429?
Limits sind pro Key/Tenant. Key-Sharing, zu kleines burst_capacity oder ein Knoten, der die ganze Last trägt, sind typisch.
Chat-Webhooks überlasten das Gateway?
Worker-Concurrency und CI an Gateway-Caps koppeln; zweites Gateway nur für Chat möglich (Load-Balance-Runbook oben verlinkt).
Pflicht-Logfelder?
request_id, mesh_node_id, limit_type, Status, retry_after_seconds, Latenz, Scope und Zähler.

Gateway-Kapazität auf mehreren MeshMac-Knoten verteilen

Wenn Rate-Limits und Session-Caps greifen, ist zusätzliche physische Apple-Silicon-Kapazität der sauberste Weg, ohne die Policy zu verwässern. Unter Preise und auf der Startseite wählen Sie passende Mietknoten; das Hilfezentrum unterstützt SSH-, VNC- und Einlass-Fragen ohne Login-Pflicht. Im OpenClaw-Hub und im Blog finden Sie verwandte Runbooks — buchen Sie weitere Knoten, wenn Ihre Lastkurven reproduzierbar an die Obergrenze stoßen.

Mehr Gateway-Knoten