Documentation

Trois parcours, un seul réseau. Choisissez celui qui vous correspond — utilisateur, développeur, ou hôte.

Utilisateurs

Démarrer en 30 secondes

Ouvrez le chat, posez une question. Aucune inscription nécessaire pour les usages basiques.

Développeurs

Intégrer l'API

API compatible OpenAI, streaming SSE, recherche web intégrée. Clés API depuis votre compte.

Hôtes

Partager un GPU

Installer un worker en 5 minutes — Linux, macOS, Windows (WSL). Détection matérielle automatique.

Guides

Comment ça marche, en 4 étapes

  1. 1
    Votre client envoie un prompt
    Chat web, CLI Korai Kode, ou API compatible OpenAI — tous pointent vers l'orchestrateur à Paris.
  2. 2
    L'orchestrateur choisit un worker
    Matching selon le modèle demandé, le contexte requis, et la latence des GPUs disponibles en Europe.
  3. 3
    Le worker infère en streaming
    vLLM (NVIDIA) ou MLX (Apple Silicon) génère la réponse, token par token, via WebSocket.
  4. 4
    Le flux remonte au client
    SSE depuis l'orchestrateur, sans qu'aucun contenu ne soit persisté côté Korai.

Question technique ou bug à signaler ?

support@korai.one