RAG selber bauen vs. kaufen — eine ehrliche TCO-Rechnung
Pinecone + LangChain + Eval-Framework + Multi-Tenant-RBAC: Was kostet das wirklich in 12 Monaten? TCO-Vergleich gegen Anirag-Business — mit echten Zahlen.
Die Frage „RAG bauen oder kaufen" ist meist eine Self-Selling-Frage von Senior-Engineers, die ihren eigenen Wert sichern wollen. Lass uns ehrlich rechnen — mit echten Zahlen aus 12 Entscheidungen, die wir in den letzten 18 Monaten begleitet haben.
Eigenbau-Komponenten (Year 1)
Ein realistisches Eigenbau-RAG, das in der DACH-Region (DSGVO + AI-Act) verkauft werden kann, hat folgende Bausteine:
Vector-Datenbank
- →Pinecone Standard — 70 $/mo × 12 = 840 $. Reicht für ~50k Vektoren mit Standard-Metadata.
- →Alternative: Qdrant Self-Hosted — Hardware-Kosten ~150 €/mo, plus Ops-Aufwand. Gleicher Bucket.
LLM- und Embeddings-API
- →OpenAI für 1M Embeddings + 100k Queries: ca. 2.400 $. Dann ist man auf US-Cloud — DSGVO-relevant.
- →Anthropic EU + Mistral: 30-40 % Aufpreis, dafür EU-Region.
LangChain-Stack + Eval-Framework
- →Engineering-Aufwand: 3 Personenmonate für ein produktives Setup mit Pipeline, Eval, Monitoring, Re-Indexing-Logik.
- →Senior-Engineer in DACH Vollkosten ~20k €/Monat = 60 k €.
Multi-Tenant-RBAC + Audit-Log
- →2 Personenmonate = 40 k €. Inklusive Permission-Mirror-Logik, Hash-Chained-Logs, Tenant-Isolation auf DB-Ebene.
- →Wer das nicht baut, hat keinen B2B-vertriebs-fähigen Stack.
AVV/DPA-Vertragstext + Sub-Processor-Map
- →1 Tag Anwalt = ca. 1.500 €.
- →Re-Verhandlungen pro Sub-Processor-Wechsel: weitere 500-1.000 € pro Vorgang.
Pen-Test (Pflicht für B2B-Vertrieb)
- →8 k € für ein qualifizierten DACH-Anbieter (z. B. Cure53, SySS).
- →Wiederholungs-Pen-Test jährlich: gleiche Größe.
Compliance-Audit-Vorbereitung
- →5-15 k € je nach Tiefe — DSGVO-Audit, ISO-27001-Lite, AI-Act-Mapping.
**Total Year 1: ~115 k €**
Plus:
- →Laufende Cloud-Kosten (840 $ + 2.400 $ + Hosting ca. 200 €/mo).
- →Continuous Engineering ~30 % einer Senior-Engineer-Position für Maintenance.
- →Versicherungen, Compliance-Updates, Sub-Processor-Tracking.
Anirag Business (Year 1)
- →199 €/mo × 12 = 2.388 € Subscription. BYOK-Option reduziert API-Kosten weiter (eigene Anthropic-/OpenAI-Keys).
- →AVV inklusive, Sub-Processor-Map verfügbar, Pen-Test-Bericht inklusive.
- →Multi-Tenant-RBAC, Audit-Log, Permissions-Mirroring out-of-the-box.
**Total Year 1: ~2.400 €**
Differenz: ~112.500 € in Year 1.
Aber — wann macht Eigenbau Sinn?
Es gibt drei Konstellationen, in denen wir explizit zu Eigenbau raten.
1. RAG ist Ihr Kerngeschäft
Sie sind ein RAG-Tooling-Anbieter (Pinecone, Weaviate, Chroma, LangChain etc.) — dann ist Eigenbau nicht Verschwendung, sondern Produkt-Kompetenz.
2. Sehr spezielle Custom-Embeddings
Wenn Ihre Domäne so spezifisch ist, dass Standard-Embeddings (OpenAI text-embedding-3-large, Cohere embed-multilingual-v3, Mistral mistral-embed) nicht reichen — z. B. medizinische Codes, juristische Klassifikation, hochspezifische Industrie-Taxonomien.
In diesen Fällen brauchen Sie ein eigenes fine-tuned Embedding-Modell. Das ist kein RAG-Eigenbau-Argument, sondern ein Embeddings-Eigenbau-Argument. Anirag erlaubt Custom-Embedding-Modelle in der API — Sie können also Anirag als RAG-Layer nutzen und nur das Embedding-Modell selbst stellen.
3. On-Prem mit eigenen Modellen — dann lieber Anirag Sovereign
Wenn der Stack auf On-Prem mit eigenen LLMs muss (Llama-3-70B-EU, Mistral 8x7B, eigene fine-tunes), ist Eigenbau eine Option. Aber Anirag Sovereign ist die schnellere Antwort: Helm-Charts für Kubernetes, Air-Gap-Bundle, EU-Modelle vorinstalliert. Setup 4-8 Wochen statt 6-9 Monate Eigenbau.
Was häufig in der TCO-Rechnung fehlt
Eval-Pipeline-Drift
Wenn Sie Pinecone updaten, OpenAI ein Modell deprecaten lassen, oder LangChain ein Breaking-Change ausliefert — Ihre Eval-Pipeline kracht. Das passiert pro Jahr 3-5 Mal. Verlorene Engineer-Zeit pro Drift: 1-3 Tage.
Compliance-Updates
DSGVO-Aktualisierungen, AI-Act-Auslegungs-Hinweise, Schrems-II-Folgejudikate — das muss in der Architektur nachgezogen werden. Ein Eigenbau-Stack hat keinen Compliance-Officer dafür eingebaut. Anirag hat.
Burnout-Risiko
Wir kennen 4 Cases aus den letzten 18 Monaten, wo der Eigenbau-Stack vom Senior-Engineer betreut wurde — der dann gewechselt hat. Knowledge-Transfer war ein 6-Wochen-Projekt, Stack lief währenddessen mit reduzierter Aufmerksamkeit. Compliance-Lücke entstand in dieser Phase, wurde dann teurer aufgearbeitet.
API-Kompatibilität: Pinecone-API auf Anirag
Wir hören oft: "Wir wollen unsere Pinecone-Investments schützen." Anirag bietet einen Pinecone-kompatiblen API-Layer, der die häufigsten SDK-Calls 1:1 mappt. Migration-Beispiel:
typescript// Pinecone (alt)
import { Pinecone } from "@pinecone-database/pinecone";
const pc = new Pinecone({ apiKey: process.env.PINECONE_API_KEY });
const index = pc.index("knowledge");
const results = await index.query({ vector, topK: 5 });
// Anirag (neu) — gleiche Signatur
import { Anirag } from "@anirag/sdk";
const a = new Anirag({ apiKey: process.env.ANIRAG_API_KEY });
const index = a.index("knowledge");
const results = await index.query({ vector, topK: 5 });Migrations-Aufwand für die meisten Stacks: 1-2 Tage, plus Test-Phase.
Wann ist Anirag *die* falsche Antwort?
Ehrlich:
- →Sehr kleine Use-Cases (unter 1k Queries/Monat) — der Free-Tier (100k Embeddings, 10k Queries) deckt das ab, aber die Setup-Kurve eines RAG-Frameworks ist Overkill für 5 Embedding-Calls pro Tag.
- →Sehr exotische Custom-Pipelines (z. B. Multi-Modal-Video-RAG, Audio-Embedding mit Custom-Whisper-Forks) — wir können das, aber wir sagen Ihnen vorher: Anirag ist Text-First. Audio + Video läuft, ist aber nicht optimiert.
- →Hard-AGPL-Forks erforderlich — wenn Sie Open-Source-Lizenz-Hygiene-Anforderungen haben, die kommerzielle SDKs ausschließen, dann ist Anirag nicht passend.
In allen anderen Fällen ist die TCO-Differenz so groß, dass die Build-or-Buy-Diskussion klar zu "Buy" fällt — wenn man ehrlich rechnet und nicht den Senior-Engineer-Reflex zur Selbst-Selbst-Auslastung folgt.
Empfehlung
Wenn Ihr Team aktuell überlegt, RAG selbst zu bauen, machen Sie diese drei Schritte:
- 01TCO-Worksheet ausfüllen mit echten Engineer-Vollkosten für Ihre Region (in DACH ~17-22k €/Monat fully loaded).
- 02AVV + Sub-Processor + Pen-Test als Pflicht in die Rechnung einplanen — nicht "machen wir später".
- 03Anirag-Free-Tier 4 Wochen testen mit einer abgegrenzten Use-Case-Slice. Dann liegt eine echte Vergleichsbasis vor.
Die Free-Tier-Phase erlaubt es, Build-vs-Buy mit Daten und nicht mit Bauchgefühl zu entscheiden.
NÄCHSTER SCHRITT
API-Key in 30 Sekunden.
Free-Tier ohne Kreditkarte: 100k Embeddings + 10k Queries/Monat. p99 < 800 ms, OpenAPI 3.1, TypeScript- und Python-SDK.
API-Plans ansehen →VERWANDTE BEITRÄGE
Mehr aus der gleichen Branche.
- Wissensmanagement8 Min
Wissensmanagement im Mittelstand — 3 Schritte zur SharePoint-Alternative
SharePoint-Suche ist seit Jahren das Anti-Beispiel für Mittelständler. Wie Anirag denselben Daten-Pool durchsucht — mit Permissions-Mirroring statt -Wegabstrahieren.
- E-Commerce & Support8 Min
60 % weniger Tickets in 4 Stunden — wie DTC-Brands Q4 ohne Headcount durchstehen
Black Week + Adventszeit = +400 % Tickets bei DTC-Brands. Mehr Headcount? Zu spät. Wie Tom Schäfer 60 % der Tickets mit RAG-Auto-Reply löste — Brand-Voice intakt.