Zum Hauptinhalt springen

Embeddings

Direkt-Embedding-Endpoint für eigene Retrieval-Implementierungen oder Re-Embedding-Workflows.

POST/v1/embeddings

Liefert Vektor-Embeddings für beliebige Text-Inputs. BYOK-fähig, Multi-Provider.

Wann diesen Endpoint nutzen?

Der /v1/query-Endpoint embeddet automatisch — Sie brauchen diesen Endpoint nur, wenn Sie:

  • Eigene Retrieval-Logik bauen (z. B. neuronale Re-Ranker)
  • Embeddings für Cluster-Analyse oder Topic-Modeling brauchen
  • Bestehende Embeddings nach Modell-Update re-embedden wollen
  • Embeddings ohne Workspace-Kontext erzeugen (für lokale Speicherung)

Request-Body

ParameterTypRequiredBeschreibung
inputstring | string[]REQEinzeltext oder Array (bis 100 Strings pro Request).
modelstringOPTDefault voyage-3 (1024d). Andere: voyage-3-large (2048d), openai-text-embedding-3-small (1536d), jina-embeddings-v4 (1024d).
input_typeenumOPTdocument | query (default document). Manche Modelle (Voyage) optimieren je nach Typ.
truncateenumOPTstart | end | none (default end). Wie lange Inputs gekürzt werden.

Response

{
  "data": [
    {
      "embedding": [0.0123, -0.0456, 0.0789, ...],
      "index": 0,
      "tokens": 12
    }
  ],
  "model": "voyage-3",
  "usage": {
    "total_tokens": 12,
    "cost_eur": 0.000012
  }
}

Modell-Auswahl

ModellDimensionenStärkenKosten / 1M Tokens
voyage-31024Beste Quality/EUR-Ratio, mehrsprachig (DE/EN/FR/...)0,12 €
voyage-3-large2048Höchste Recall, für regulierte Branchen0,24 €
openai-text-embedding-3-small1536Kompatibel zu vorhandenen OpenAI-Indizes0,02 €
jina-embeddings-v41024EU-Hosted (Jina Berlin), gute deutsche Qualität0,18 €

Status-Codes

CodeLabelBedeutung
200OKEmbeddings im Body.
400Bad RequestInput zu lang (über 8 192 Tokens) oder Array zu groß (über 100).
429Rate LimitedPlan-Limit überschritten. Default: 600 Embeddings/min Starter, 6 000/min Business, custom Enterprise.