anirag.io

Concepts

Architektur

Wie die Plattform intern aufgebaut ist — Postgres, Qdrant, Multi-LLM-Router, EU-Region.

Anirag besteht aus fünf Hauptkomponenten, alle in der EU-Region deployed.

Komponenten

text┌──────────┐      ┌──────────────┐      ┌────────┐
│ Frontend │◀────▶│  API-Gateway │◀────▶│  Edge  │
│ (Next.js)│      │   (Hono)     │      │ Cache  │
└──────────┘      └──────┬───────┘      └────────┘
                         │
       ┌─────────────────┼─────────────────┐
       ▼                 ▼                 ▼
┌────────────┐    ┌────────────┐    ┌──────────────┐
│ Postgres   │    │  Qdrant    │    │ Multi-LLM    │
│ (Neon EU)  │    │ (Railway)  │    │ Router       │
└────────────┘    └────────────┘    └──────┬───────┘
                                           │
                              ┌────────────┴────────────┐
                              ▼            ▼            ▼
                        ┌────────┐  ┌────────┐  ┌─────────────┐
                        │Anthr.EU│  │OpenAI  │  │Mistral / AA │
                        │ (FRA)  │  │Ireland │  │ (FR / DE)   │
                        └────────┘  └────────┘  └─────────────┘

1 · API-Gateway (Hono on Vercel)

Einstiegspunkt für alle API-Calls. Authentifizierung, Rate-Limiting, Request-Routing. Läuft auf Vercel Fluid Compute in eu-fra1.

2 · Postgres (Neon EU)

Transaktionale Daten: Workspaces, User, Documents-Metadata, Audit-Log, API-Keys (verschlüsselt). Multi-AZ in eu-central-1.

3 · Qdrant (Railway EU)

Vector-Datenbank für Embeddings. Gleiche Region wie Postgres. Multi-AZ-Replikation. Pro Workspace ein Qdrant-Collection mit Permission-Filter-Indizes.

4 · Multi-LLM-Router

Routet Anfragen an das passende Modell mit Auto-Failover bei Provider-Outages. Default-Routing nach Use-Case + Latency + Cost. BYOK-Provider werden direkt geroutet, ohne Anirag-Mittler-Account.

5 · Edge-Cache

Read-Heavy-Endpoints (Workspace-Listen, Schemas, FAQ-Queries) werden in Vercel-Edge-Cache gehalten. p99 < 50 ms.

Datenflüsse — High-Level

  1. 01Upload: Datei → API-Gateway → Postgres (Metadata) → Qdrant-Worker (async Embedding) → Qdrant.
  2. 02Query: Frage → API-Gateway → Postgres (Permission-Check) → Qdrant (Vector-Search mit Permission-Filter) → Multi-LLM-Router → LLM-Provider → Antwort + Citations.
  3. 03Audit-Log: Pro Query schreibt Anirag einen Hash-Chained-Eintrag in ein Append-Only-Log in Postgres.

Detaillierte Datenflüsse

Siehe Datenfluss.