Embeddings
Direkt-Embedding-Endpoint für eigene Retrieval-Implementierungen oder Re-Embedding-Workflows.
POST
/v1/embeddingsLiefert Vektor-Embeddings für beliebige Text-Inputs. BYOK-fähig, Multi-Provider.
Wann diesen Endpoint nutzen?
Der /v1/query-Endpoint embeddet automatisch — Sie brauchen diesen Endpoint nur, wenn Sie:
- Eigene Retrieval-Logik bauen (z. B. neuronale Re-Ranker)
- Embeddings für Cluster-Analyse oder Topic-Modeling brauchen
- Bestehende Embeddings nach Modell-Update re-embedden wollen
- Embeddings ohne Workspace-Kontext erzeugen (für lokale Speicherung)
Request-Body
| Parameter | Typ | Required | Beschreibung |
|---|---|---|---|
input | string | string[] | REQ | Einzeltext oder Array (bis 100 Strings pro Request). |
model | string | OPT | Default voyage-3 (1024d). Andere: voyage-3-large (2048d), openai-text-embedding-3-small (1536d), jina-embeddings-v4 (1024d). |
input_type | enum | OPT | document | query (default document). Manche Modelle (Voyage) optimieren je nach Typ. |
truncate | enum | OPT | start | end | none (default end). Wie lange Inputs gekürzt werden. |
Response
{
"data": [
{
"embedding": [0.0123, -0.0456, 0.0789, ...],
"index": 0,
"tokens": 12
}
],
"model": "voyage-3",
"usage": {
"total_tokens": 12,
"cost_eur": 0.000012
}
}Modell-Auswahl
| Modell | Dimensionen | Stärken | Kosten / 1M Tokens |
|---|---|---|---|
voyage-3 | 1024 | Beste Quality/EUR-Ratio, mehrsprachig (DE/EN/FR/...) | 0,12 € |
voyage-3-large | 2048 | Höchste Recall, für regulierte Branchen | 0,24 € |
openai-text-embedding-3-small | 1536 | Kompatibel zu vorhandenen OpenAI-Indizes | 0,02 € |
jina-embeddings-v4 | 1024 | EU-Hosted (Jina Berlin), gute deutsche Qualität | 0,18 € |
Status-Codes
| Code | Label | Bedeutung |
|---|---|---|
200 | OK | Embeddings im Body. |
400 | Bad Request | Input zu lang (über 8 192 Tokens) oder Array zu groß (über 100). |
429 | Rate Limited | Plan-Limit überschritten. Default: 600 Embeddings/min Starter, 6 000/min Business, custom Enterprise. |