2026 OpenClaw MeshMac in der Praxis: Rate-Limit und Session-Concurrency am geteilten Gateway — minimale reproduzierbare Schritte gegen Überlast (HowTo+FAQ)
Drei Überlast-Muster am gemeinsamen Gateway
- Burst-Kollision: Viele parallele CI-Jobs erzeugen Webhooks — der Gateway sieht RPS-Spitzen, während CPUs noch idle wirken. Ohne Bucket oder faire Queue wirkt Traffic feindlich.
- Session-Stau: Lange Streams und offene Skill-Antworten halten Sitzungen — RPS-Limits allein reichen nicht; dokumentieren Sie max gleichzeitiger Sessions.
- Schlechte Logs:
429/503ohne mesh_node_id, limit_type, retry_after erzwingen Raten. Mehrknoten nützen nur mit einheitlichen Feldern.
Matrix: Token-Bucket, Verbindungsdeckel und Session-Concurrency
Schutzmechanismen nach Lastform und Ops-Aufwand für Pools mit gemeinsamem Einlass.
| Mechanismus | Primäre Last | Burst-Verhalten | Fairness | Typische Kennzahl | Ops-Hinweis |
|---|---|---|---|---|---|
| Token-Bucket (HTTP) | Kurze RPS-Spitzen | Kontrollierter Burst, dann Drossel | Pro API-Key, Tenant oder IP | refill_rate, burst_capacity | Im Reverse-Proxy nah am Internet-Terminierungspunkt |
| Harte Verbindungsgrenze | TLS- und TCP-Handshakes | Scharfer Cut, wenig Glättung | Schützt Kernel und Dateideskriptoren | max_connections, backlog | Kombinieren mit Keepalive und Timeouts |
| Session-Concurrency-Cap | Langlebige Gateway-Sitzungen | Warteschlange oder 503 | Pro authentifiziertem Principal | max_concurrent_sessions | Retry-After Header dokumentieren |
| Kombination empfohlen | CI plus Chat plus API | Bucket vor harter Cap | Zwei Ebenen: Edge und App | getrennte Metriken je Ebene | Gleiche Policy auf allen MeshMac-Gateways |
Kurz: Bucket glättet Spitzen; Verbindungs- und Session-Limits schützen den Host. Ein Prozess auf Miet-Mac trägt weniger gleichzeitige Last, als CPUs vermuten lassen.
CI-, Webhook- und Gateway-Parallelität — Abhängigkeiten
Summe aus CI-Jobs, Kanal-Events und offenen Sessions muss unter Ihren dokumentierten Caps bleiben — sonst 429-Kaskaden wie flaky Builds.
| Quelle | Typische Parallelität | Gateway-Effekt | Gegensteuer | Mehrknoten-Nutzen |
|---|---|---|---|---|
| CI-Pipeline | matrix jobs, shards | Viele kurze POSTs | Job-Groups drosseln, Staging-Queue | Round-Robin über Gateway-Instanzen |
| Chat / Matrix / Teams | Webhook-Worker, prefetch | Bursts bei Raumereignissen | Worker concurrency an Gateway anbinden | Kanal spiegelt auf zweites Gateway |
| Interne Tools | Dashboard-Polling | Stetige Hintergrundlast | Etag, längere Intervalle | Lesende Anfragen auf read-only Knoten |
Sieben Minimal-Schritte: Limit-Policy, Health und Logs
- Baseline: Pro Knoten RPS, gleichzeitige Sessions, p95, Anteil 429/503 mindestens eine Woche messen; CI- und Release-Fenster im gleichen Dashboard markieren.
- Edge-Limit: Im TLS-Reverse-Proxy (Nginx/Caddy-Matrix) Token-Bucket pro Pfad oder Schlüssel; Webhooks per Secret oder mTLS von anonymem Health trennen.
- Session-Cap im Gateway: max_concurrent_sessions oder Worker-Tiefe fixieren; Verhalten bei Überlauf dokumentieren (
503+Retry-Afteroder Queue). Gleicher Wert auf allen Pool-Knoten. - CI und Broker: job concurrency und prefetch so wählen, dass Summe der Aufrufe unter Edge- und Gateway-Caps bleibt; 429 mit Backoff statt sofortigem Fail, wenn SLA passt.
- Health: Aggregierte Probe (Health-Leitfaden) um Session-Auslastung, Queue und Anteil Drosselungen erweitern; bei anhaltender Überschreitung unhealthy — Load-Balancer verteilt auf Geschwister.
- Logs: Bei Drosselung immer
request_id,mesh_node_id,limit_type, Zähler (tokens_remainingoderconcurrent_sessions),http_status,retry_after_seconds,upstream_latency_ms, plusclient_key_scope. - Rollout: Canary auf einem Gateway, dann Config-Hash auf allen Hosts;
openclaw gateway statusund kurze synthetische Last vor Produktionsfreigabe.
openclaw gateway status --json
curl -sS -o /dev/null -w "%{http_code}\n" -H "Authorization: Bearer $TOKEN" https://gateway.example/health
Mehrknoten: gleiche Limits auf allen Hosts und Health-gesteuerte Umverteilung schlagen asymmetrische Sonderwerte.
Zitierfähige Schwellen für Reviews und Change-Advisory
- Edge-RPS: Anonyme Pfade oft 10–30/s pro IP oder Key; Webhooks eigene Buckets mit Auth.
- Session-Cap: Ca. 0,7–0,85 des Punktes, an dem p95 vor dem Limit knickt.
- Retry-After: 1–5 s interaktiv, 5–30 s Batch, mit Jitter.
- Health: Knoten rotieren, wenn >15 % Drosselungen über 60 s oder Session >90 % der Cap — an SLO anpassen.
FAQ: Rate-Limits, 429 und Zusammenspiel mit Kanälen
- Token-Bucket oder Verbindungsgrenze?
- Beides: Bucket für HTTP-Bursts, Cap für FDs/TLS; Session-Cap für lange OpenClaw-Sitzungen.
- Niedrige CPU, aber 429?
- Limits sind pro Key/Tenant. Key-Sharing, zu kleines burst_capacity oder ein Knoten, der die ganze Last trägt, sind typisch.
- Chat-Webhooks überlasten das Gateway?
- Worker-Concurrency und CI an Gateway-Caps koppeln; zweites Gateway nur für Chat möglich (Load-Balance-Runbook oben verlinkt).
- Pflicht-Logfelder?
request_id,mesh_node_id,limit_type, Status,retry_after_seconds, Latenz, Scope und Zähler.
Gateway-Kapazität auf mehreren MeshMac-Knoten verteilen
Wenn Rate-Limits und Session-Caps greifen, ist zusätzliche physische Apple-Silicon-Kapazität der sauberste Weg, ohne die Policy zu verwässern. Unter Preise und auf der Startseite wählen Sie passende Mietknoten; das Hilfezentrum unterstützt SSH-, VNC- und Einlass-Fragen ohne Login-Pflicht. Im OpenClaw-Hub und im Blog finden Sie verwandte Runbooks — buchen Sie weitere Knoten, wenn Ihre Lastkurven reproduzierbar an die Obergrenze stoßen.