Token-Bucket oder harte Verbindungsgrenze vor dem Gateway?

Token-Bucket glättet Bursts aus CI und Webhooks und ist für öffentliche HTTP-Pfade meist flexibler. Harte Obergrenzen für gleichzeitige TCP- oder TLS-Handshakes schützen vor Ressourcenerschöpfung auf kleinen Mac-Knoten; in der Praxis kombinieren Teams beides: Bucket für Requests und eine zusätzliche Connection-Cap.

Warum schlagen legitime Clients mit 429 fehl, obwohl die CPU frei wirkt?

Limits greifen oft pro API-Schlüssel, IP oder Tenant — nicht global nach CPU. Prüfen Sie burst_capacity, refill_rate und ob mehrere Dienste denselben Schlüssel teilen; verteilen Sie Last auf weitere MeshMac-Gateway-Instanzen und spiegeln Sie Retry-After in Clients.

Wie hängen CI-Parallelität und Matrix- oder Teams-Webhooks mit dem Gateway zusammen?

Jeder parallele Job kann Webhooks oder Gateway-Aufrufe erzeugen. Die Summe aus job concurrency, Queue-Prefetch und offenen Sessions muss unterhalb Ihrer dokumentierten Gateway- und Kanal-Limits bleiben; andernfalls entstehen zufällige 429 oder Timeouts, die wie flaky Tests wirken.

Welche Logfelder sollten bei Rate-Limits und Session-Ablehnungen immer gesetzt sein?

Mindestens request_id, mesh_node_id, client_key_scope, limit_type, tokens_remaining oder concurrent_sessions, http_status, retry_after_seconds und upstream_latency_ms. So lassen sich Mehrknoten-Vergleiche und Eskalationen ohne Raten raten auswerten.

HOWTO · FAQ · OPENCLAW · MESHMAC · GATEWAY · RATE-LIMIT · MEHRKNOTEN · 2026

2026 OpenClaw MeshMac in der Praxis: Rate-Limit und Session-Concurrency am geteilten Gateway — minimale reproduzierbare Schritte gegen Überlast (HowTo+FAQ)

7. April 2026

Lesezeit: ca. 8 Min.

Token-Bucket, Sessions, CI, Health, Logs

Teams mit gemeinsamem OpenClaw-Gateway auf MeshMac sehen oft 429, hängende Webhooks oder CI-Flakes, wenn Pipelines und Chat gleichzeitig den Einlass treffen. Hier: Token-Bucket, Verbindungs- und Session-Caps, Abstimmung mit CI- und Kanal-Parallelität, Health bei Sättigung und Logfelder — Mehrknoten verteilen Last statt einen Host zu sprengen. Mehr: Load-Balance/Failover, Health-Probes, TLS-Einlass/Rate-Limit.

Drei Überlast-Muster am gemeinsamen Gateway

Burst-Kollision: Viele parallele CI-Jobs erzeugen Webhooks — der Gateway sieht RPS-Spitzen, während CPUs noch idle wirken. Ohne Bucket oder faire Queue wirkt Traffic feindlich.
Session-Stau: Lange Streams und offene Skill-Antworten halten Sitzungen — RPS-Limits allein reichen nicht; dokumentieren Sie max gleichzeitiger Sessions.
Schlechte Logs: 429/503 ohne mesh_node_id, limit_type, retry_after erzwingen Raten. Mehrknoten nützen nur mit einheitlichen Feldern.

Matrix: Token-Bucket, Verbindungsdeckel und Session-Concurrency

Schutzmechanismen nach Lastform und Ops-Aufwand für Pools mit gemeinsamem Einlass.

Mechanismus	Primäre Last	Burst-Verhalten	Fairness	Typische Kennzahl	Ops-Hinweis
Token-Bucket (HTTP)	Kurze RPS-Spitzen	Kontrollierter Burst, dann Drossel	Pro API-Key, Tenant oder IP	refill_rate, burst_capacity	Im Reverse-Proxy nah am Internet-Terminierungspunkt
Harte Verbindungsgrenze	TLS- und TCP-Handshakes	Scharfer Cut, wenig Glättung	Schützt Kernel und Dateideskriptoren	max_connections, backlog	Kombinieren mit Keepalive und Timeouts
Session-Concurrency-Cap	Langlebige Gateway-Sitzungen	Warteschlange oder 503	Pro authentifiziertem Principal	max_concurrent_sessions	Retry-After Header dokumentieren
Kombination empfohlen	CI plus Chat plus API	Bucket vor harter Cap	Zwei Ebenen: Edge und App	getrennte Metriken je Ebene	Gleiche Policy auf allen MeshMac-Gateways

Kurz: Bucket glättet Spitzen; Verbindungs- und Session-Limits schützen den Host. Ein Prozess auf Miet-Mac trägt weniger gleichzeitige Last, als CPUs vermuten lassen.

CI-, Webhook- und Gateway-Parallelität — Abhängigkeiten

Summe aus CI-Jobs, Kanal-Events und offenen Sessions muss unter Ihren dokumentierten Caps bleiben — sonst 429-Kaskaden wie flaky Builds.

Quelle	Typische Parallelität	Gateway-Effekt	Gegensteuer	Mehrknoten-Nutzen
CI-Pipeline	matrix jobs, shards	Viele kurze POSTs	Job-Groups drosseln, Staging-Queue	Round-Robin über Gateway-Instanzen
Chat / Matrix / Teams	Webhook-Worker, prefetch	Bursts bei Raumereignissen	Worker concurrency an Gateway anbinden	Kanal spiegelt auf zweites Gateway
Interne Tools	Dashboard-Polling	Stetige Hintergrundlast	Etag, längere Intervalle	Lesende Anfragen auf read-only Knoten

Sieben Minimal-Schritte: Limit-Policy, Health und Logs

Baseline: Pro Knoten RPS, gleichzeitige Sessions, p95, Anteil 429/503 mindestens eine Woche messen; CI- und Release-Fenster im gleichen Dashboard markieren.
Edge-Limit: Im TLS-Reverse-Proxy (Nginx/Caddy-Matrix) Token-Bucket pro Pfad oder Schlüssel; Webhooks per Secret oder mTLS von anonymem Health trennen.
Session-Cap im Gateway: max_concurrent_sessions oder Worker-Tiefe fixieren; Verhalten bei Überlauf dokumentieren (503 + Retry-After oder Queue). Gleicher Wert auf allen Pool-Knoten.
CI und Broker: job concurrency und prefetch so wählen, dass Summe der Aufrufe unter Edge- und Gateway-Caps bleibt; 429 mit Backoff statt sofortigem Fail, wenn SLA passt.
Health: Aggregierte Probe (Health-Leitfaden) um Session-Auslastung, Queue und Anteil Drosselungen erweitern; bei anhaltender Überschreitung unhealthy — Load-Balancer verteilt auf Geschwister.
Logs: Bei Drosselung immer request_id, mesh_node_id, limit_type, Zähler (tokens_remaining oder concurrent_sessions), http_status, retry_after_seconds, upstream_latency_ms, plus client_key_scope.
Rollout: Canary auf einem Gateway, dann Config-Hash auf allen Hosts; openclaw gateway status und kurze synthetische Last vor Produktionsfreigabe.

openclaw gateway status --json
curl -sS -o /dev/null -w "%{http_code}\n" -H "Authorization: Bearer $TOKEN" https://gateway.example/health

Mehrknoten: gleiche Limits auf allen Hosts und Health-gesteuerte Umverteilung schlagen asymmetrische Sonderwerte.

Zitierfähige Schwellen für Reviews und Change-Advisory

Edge-RPS: Anonyme Pfade oft 10–30/s pro IP oder Key; Webhooks eigene Buckets mit Auth.
Session-Cap: Ca. 0,7–0,85 des Punktes, an dem p95 vor dem Limit knickt.
Retry-After: 1–5 s interaktiv, 5–30 s Batch, mit Jitter.
Health: Knoten rotieren, wenn >15 % Drosselungen über 60 s oder Session >90 % der Cap — an SLO anpassen.

FAQ: Rate-Limits, 429 und Zusammenspiel mit Kanälen

Token-Bucket oder Verbindungsgrenze?: Beides: Bucket für HTTP-Bursts, Cap für FDs/TLS; Session-Cap für lange OpenClaw-Sitzungen.
Niedrige CPU, aber 429?: Limits sind pro Key/Tenant. Key-Sharing, zu kleines burst_capacity oder ein Knoten, der die ganze Last trägt, sind typisch.
Chat-Webhooks überlasten das Gateway?: Worker-Concurrency und CI an Gateway-Caps koppeln; zweites Gateway nur für Chat möglich (Load-Balance-Runbook oben verlinkt).
Pflicht-Logfelder?: request_id, mesh_node_id, limit_type, Status, retry_after_seconds, Latenz, Scope und Zähler.

Gateway-Kapazität auf mehreren MeshMac-Knoten verteilen

Wenn Rate-Limits und Session-Caps greifen, ist zusätzliche physische Apple-Silicon-Kapazität der sauberste Weg, ohne die Policy zu verwässern. Unter Preise und auf der Startseite wählen Sie passende Mietknoten; das Hilfezentrum unterstützt SSH-, VNC- und Einlass-Fragen ohne Login-Pflicht. Im OpenClaw-Hub und im Blog finden Sie verwandte Runbooks — buchen Sie weitere Knoten, wenn Ihre Lastkurven reproduzierbar an die Obergrenze stoßen.

Jetzt mieten Knoten & Zugriff Hilfe & SSH/VNC Blog