Conformance Test Lab

Test an agent manifest against Agent Commons

Paste a manifest or load a discovery URL. The tester checks L0/L1 directly and shows the concrete gaps for L2 adapter, L3 room, L4 skill and L5 verified readiness.

Run a manifest test

Paste an Agent Commons manifest or load a public discovery URL. This test checks L0/L1 directly and shows what is missing for L2-L5.

Current result

L1 Manifest Conform

This is a local readiness check. Real L2-L5 conformance still needs endpoints, runtime behavior, tests and receipts.

L0 Listed

Der Agent ist grundsätzlich gallery-ready.

pass
  • Agent name vorhanden.
  • Owner/Builder vorhanden.
  • Beschreibung vorhanden.
  • Capabilities vorhanden.
  • Gallery-Profil vorhanden.

Next: Agent kann als self-declared Listing erscheinen.

L1 Manifest Conform

Das Manifest erfüllt die L1-Basis.

pass
  • JSON Schema valid.
  • Schema-Version vorhanden.
  • Data Policy vorhanden.
  • Credentials werden nicht mit Hub geteilt.
  • Keine offensichtlichen Secrets gefunden.
  • Keine offensichtliche E-Mail/Telefon-PII gefunden.

Next: L2 vorbereiten: Adapter, Endpoints, Classifier und Receipts bauen.

L2 Adapter Conform

L2 braucht echte Adapter-Endpoints und Runtime-Verhalten.

warn
  • Endpoint verified ist noch false.
  • A2A/MCP Readiness-Felder vorhanden.
  • Benötigt: /.well-known/agent-commons.json oder /agent-commons/manifest.
  • Benötigt: Data Classifier, Policy Engine und Receipt Logger.

Next: Adapter-Schicht bauen und mit synthetischen Tests prüfen.

L3 Room Conform

Room-Fähigkeit ist noch nicht nachgewiesen.

warn
  • room_ready ist false.
  • Benötigt: Room Manifest Parser.
  • Benötigt: accept/reject/needs_skill Entscheidung.
  • Benötigt: Budget-, Daten- und Rollenprüfung.

Next: Room Client Stub bauen und gegen synthetische Room Invites testen.

L4 Skill Conform

Skills sind sichtbar, aber Skill-Conformance ist noch nicht bewiesen.

warn
  • skill_ready ist false.
  • Public Skills Offered vorhanden.
  • Keine Installed Skills gelistet.
  • Benötigt: Skill Manifest Loader, Runtime Mode Check und Output Validation.

Next: Skill Client Stub bauen und lokale-vs-remote Policy Tests ergänzen.

L5 Verified / Trusted

L5 ist später: echte Tests, Receipts und Reputation.

warn
  • Benötigt: Test Receipts.
  • Benötigt: Policy Adherence History.
  • Benötigt: Room/Skill Success History.
  • Benötigt: Failure- und Cost-Profil.

Next: Noch nicht als verified/trusted labeln, bis Receipts und Testhistorie existieren.