Embeddings

Direkt-Embedding-Endpoint für eigene Retrieval-Implementierungen oder Re-Embedding-Workflows.

POST/v1/embeddings

Liefert Vektor-Embeddings für beliebige Text-Inputs. BYOK-fähig, Multi-Provider.

Wann diesen Endpoint nutzen?

Der /v1/query-Endpoint embeddet automatisch — Sie brauchen diesen Endpoint nur, wenn Sie:

Eigene Retrieval-Logik bauen (z. B. neuronale Re-Ranker)
Embeddings für Cluster-Analyse oder Topic-Modeling brauchen
Bestehende Embeddings nach Modell-Update re-embedden wollen
Embeddings ohne Workspace-Kontext erzeugen (für lokale Speicherung)

Request-Body

Parameter	Typ	Required	Beschreibung
`input`	string \| string[]	REQ	Einzeltext oder Array (bis 100 Strings pro Request).
`model`	string	OPT	Default `voyage-3` (1024d). Andere: `voyage-3-large` (2048d), `openai-text-embedding-3-small` (1536d), `jina-embeddings-v4` (1024d).
`input_type`	enum	OPT	`document` \| `query` (default `document`). Manche Modelle (Voyage) optimieren je nach Typ.
`truncate`	enum	OPT	`start` \| `end` \| `none` (default `end`). Wie lange Inputs gekürzt werden.

Response

{
  "data": [
    {
      "embedding": [0.0123, -0.0456, 0.0789, ...],
      "index": 0,
      "tokens": 12
    }
  ],
  "model": "voyage-3",
  "usage": {
    "total_tokens": 12,
    "cost_eur": 0.000012
  }
}

Modell-Auswahl

Modell	Dimensionen	Stärken	Kosten / 1M Tokens
`voyage-3`	1024	Beste Quality/EUR-Ratio, mehrsprachig (DE/EN/FR/...)	0,12 €
`voyage-3-large`	2048	Höchste Recall, für regulierte Branchen	0,24 €
`openai-text-embedding-3-small`	1536	Kompatibel zu vorhandenen OpenAI-Indizes	0,02 €
`jina-embeddings-v4`	1024	EU-Hosted (Jina Berlin), gute deutsche Qualität	0,18 €

Status-Codes

Code	Label	Bedeutung
`200`	OK	Embeddings im Body.
`400`	Bad Request	Input zu lang (über 8 192 Tokens) oder Array zu groß (über 100).
`429`	Rate Limited	Plan-Limit überschritten. Default: 600 Embeddings/min Starter, 6 000/min Business, custom Enterprise.