Zum Hauptinhalt springen

Object-Modell

Workspaces, Collections, Documents, Chunks, Queries, Traces — wie die Anirag-API-Objects zueinander stehen.

Anirag nutzt 6 Hauptobjekte. Wer diese versteht, kennt 80 % der API.

Hierarchie

Organization
 └─ Workspace (1..n)
     └─ Collection (1..n)
         └─ Document (1..n)
             └─ Chunk (1..n)

Query  ──┐
Trace ───┴─ verlinkt zu Collection + Document(s) + Chunk(s)

Workspace

Top-Level-Container für Daten-Trennung. Ein Workspace gehört einer Organisation und hat eigene RBAC-Policies.

FeldTypRequiredBeschreibung
idstring (cuid)REQEindeutiger Identifier, z. B. ws_abc123.
namestringREQAnzeigename, z. B. „Wartungs-Doku Maschinenbau".
slugstringREQURL-tauglicher Slug, eindeutig pro Org.
regionRegionREQEU-Region (eu_fra, eu_zur, eu_vie). Bestimmt, wo Embeddings + LLM-Calls landen.

Collection

Innerhalb eines Workspace. Eine Collection ist ein physisch getrennter Vector-Index mit eigener Embedding-Konfiguration.

FeldTypRequiredBeschreibung
idstring (cuid)REQz. B. col_abc123.
namestringREQAnzeigename.
embedding_modelstringOPTDefault voyage-3. Andere: voyage-3-large, openai-text-embedding-3-small, jina-embeddings-v4.
chunk_strategyobjectOPTDefault size 512, overlap 64, splitter recursive. Customizable für Spezial-Use-Cases.
retrieval_modeenumOPTvector | bm25 | hybrid (Default). Hybrid kombiniert Vector + Keyword-Match.

Document

Eine Datei (PDF, DOCX, MD, URL, Plaintext) innerhalb einer Collection. Wird beim Upload automatisch in Chunks zerlegt + embedded.

FeldTypRequiredBeschreibung
idstring (cuid)REQz. B. doc_abc123.
source_typeenumREQfile | url | s3 | text
source_refstringREQPfad, URL oder S3-URI.
external_idstringOPTIhre eigene ID (z. B. SAP-Material-Nummer). Macht Upserts idempotent.
statusenumOPTpending | processing | indexed | failed
metadatajsonOPTFrei-Form-Metadaten (z. B. Author, Department). Filterbar in Queries.

Chunk

Atomares Embedding-/Retrieval-Element. Wird automatisch erzeugt, ist normalerweise read-only.

FeldTypRequiredBeschreibung
idstring (cuid)REQz. B. chunk_abc123.
document_idstringREQReferenz auf den Parent-Document.
positionintREQ0-basierte Position im Document (für Reihenfolge-Erhaltung).
contentstringREQPlain-Text des Chunks.
page_numberintOPTBei PDFs: Seitenzahl für Citations.

Query

Eine RAG-Anfrage. Erzeugt einen Trace.

FeldTypRequiredBeschreibung
idstring (cuid)REQz. B. qry_abc123.
questionstringREQOriginal-Frage des Users.
answerstringOPTLLM-Antwort.
citationsCitation[]OPTListe der Quellen mit Score.
llm_modelstringREQVerwendetes Modell, z. B. claude-haiku-4-5.
cost_eurdecimalOPTTatsächliche Kosten dieser Query.
statusenumREQsuccess | failed | timeout | rate_limited

Trace

Vollständige Audit-Aufzeichnung einer Query. Enthält alle Zwischenschritte (siehe Architektur). Retention: 90 Tage Business, 365+ Enterprise.