Prompt Caching: Anthropic Cache-Control für wiederkehrende Prompts #25
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Beschreibung
Anthropics
cache_controlParameter für statische Prompt-Teile (System-Prompts, Scoring-Templates) aktivieren, um ~90% der Input-Token-Kosten einzusparen.Hintergrund
Der Scoring-System-Prompt und die allgemeinen Anweisungen sind bei jedem Ticket identisch. Anthropic Prompt Caching reduziert Input-Token-Kosten von $3.00/M auf $0.30/M für gecachte Prefixe. Bei hunderten Tickets pro Woche summiert sich das erheblich.
Akzeptanzkriterien
cache_controlfür den statischen AnteilTechnische Hinweise
backend/services/scoring_engine.py—cache_control: {type: 'ephemeral'}an System-Messagebackend/services/preparation_engine.py— Caching für statische Prompt-Teilebackend/services/review_agent.py— Caching für Review-System-Promptcache_controldirekt im Messages-API-CallAufwand: S