Concepts
Architektur
Wie die Plattform intern aufgebaut ist — Postgres, Qdrant, Multi-LLM-Router, EU-Region.
Anirag besteht aus fünf Hauptkomponenten, alle in der EU-Region deployed.
Komponenten
text┌──────────┐ ┌──────────────┐ ┌────────┐
│ Frontend │◀────▶│ API-Gateway │◀────▶│ Edge │
│ (Next.js)│ │ (Hono) │ │ Cache │
└──────────┘ └──────┬───────┘ └────────┘
│
┌─────────────────┼─────────────────┐
▼ ▼ ▼
┌────────────┐ ┌────────────┐ ┌──────────────┐
│ Postgres │ │ Qdrant │ │ Multi-LLM │
│ (Neon EU) │ │ (Railway) │ │ Router │
└────────────┘ └────────────┘ └──────┬───────┘
│
┌────────────┴────────────┐
▼ ▼ ▼
┌────────┐ ┌────────┐ ┌─────────────┐
│Anthr.EU│ │OpenAI │ │Mistral / AA │
│ (FRA) │ │Ireland │ │ (FR / DE) │
└────────┘ └────────┘ └─────────────┘1 · API-Gateway (Hono on Vercel)
Einstiegspunkt für alle API-Calls. Authentifizierung, Rate-Limiting, Request-Routing. Läuft auf Vercel Fluid Compute in eu-fra1.
2 · Postgres (Neon EU)
Transaktionale Daten: Workspaces, User, Documents-Metadata, Audit-Log, API-Keys (verschlüsselt). Multi-AZ in eu-central-1.
3 · Qdrant (Railway EU)
Vector-Datenbank für Embeddings. Gleiche Region wie Postgres. Multi-AZ-Replikation. Pro Workspace ein Qdrant-Collection mit Permission-Filter-Indizes.
4 · Multi-LLM-Router
Routet Anfragen an das passende Modell mit Auto-Failover bei Provider-Outages. Default-Routing nach Use-Case + Latency + Cost. BYOK-Provider werden direkt geroutet, ohne Anirag-Mittler-Account.
5 · Edge-Cache
Read-Heavy-Endpoints (Workspace-Listen, Schemas, FAQ-Queries) werden in Vercel-Edge-Cache gehalten. p99 < 50 ms.
Datenflüsse — High-Level
- 01Upload: Datei → API-Gateway → Postgres (Metadata) → Qdrant-Worker (async Embedding) → Qdrant.
- 02Query: Frage → API-Gateway → Postgres (Permission-Check) → Qdrant (Vector-Search mit Permission-Filter) → Multi-LLM-Router → LLM-Provider → Antwort + Citations.
- 03Audit-Log: Pro Query schreibt Anirag einen Hash-Chained-Eintrag in ein Append-Only-Log in Postgres.
Detaillierte Datenflüsse
Siehe Datenfluss.