Post-Merge Verification & Automated Testing: Prüfen ob Fixes wirklich funktionieren #88
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Beschreibung
Nach Claude-Run automatisch Tests ausführen, nach MR-Merge verifizieren
dass der Fix in Produktion wirkt, und eine Confidence-Bewertung der
Lösungsqualität einführen. Aktuell optimiert Bruno auf "MR erstellt" —
nicht auf "Problem gelöst".
Hintergrund
Bruno speichert
repo.test_commandundrepo.lint_commandin der DB,führt sie aber nie aus. kontext.md instruiert Claude "teste mit pytest",
aber niemand prüft ob er es tut. Ebenso existiert die AppSignal-Integration
nur für Ticket-Import, wird aber nicht genutzt um nach dem Merge zu prüfen
ob der Fix das Problem tatsächlich behoben hat.
Abhängigkeit: MR-Outcome-Tracking (#90) muss zuerst implementiert sein,
damit Post-Merge Monitoring und Confidence Scoring auf MR-Daten zugreifen können.
Akzeptanzkriterien
Automated Testing nach Claude-Run
repo.test_commandim Repo ausgeführtrepo.lint_commandim Repo ausgeführtticket.tests_passundticket.lint_passgespeichertPost-Merge Monitoring
ticket.post_deploy_statustrackt: "healthy" | "error" | "unknown"Confidence Scoring
ticket.solution_confidence(0-100) berechnenVereint bestehende Issues
Technische Hinweise
backend/services/test_runner.py(Test-Ausführung nach Claude-Run)backend/services/confidence_scorer.py(Confidence-Berechnung)backend/models/ticket.py(+ tests_pass, lint_pass, solution_confidence, post_deploy_status)backend/services/pipeline.py(Test-Step nach Claude-Run einbauen, Confidence berechnen)backend/services/review_agent.py(Confidence in Review-Prompt einfließen lassen)backend/services/appsignal_poller.py(Post-Merge Error-Check)backend/main.py(Post-Merge-Check Scheduler-Job)backend/api/pipeline.py(Stats um Confidence + Post-Merge erweitern)frontend/src/pages/TicketDetail.tsx(Confidence + Post-Merge-Status anzeigen)Confidence-Score wird aus Test/Lint/Diff-Daten berechnet, nicht via LLM.
Aufwand: L
Issue aktualisiert:
mr_tracker.pyundmr_merged_atentfernt (sind in #90)