Fleet v1 · Mise à jour 4 mai 2026
Les modèles que Korai sert
Korai sert toujours les meilleurs modèles open-weight du marché. Aucun modèle propriétaire (GPT, Claude, Gemini) ne tourne sur notre réseau — seulement des modèles ouverts, auditables, dont les poids sont publiquement téléchargeables.
Mise à jour automatique du fleet
Quand Korai ajoute, remplace, ou retire un modèle, le changement se propage automatiquement sur tous les GPU du réseau, sans intervention humaine ni interruption de service pour vous.
01Publication signée
Korai pousse un nouveau manifest signé Ed25519. Aucune machine extérieure ne peut substituer un modèle malicieux.
02Détection des hosts
Chaque GPU du réseau poll le manifest toutes les 5 minutes. La signature est vérifiée contre une clé pinnée localement.
03Téléchargement en arrière-plan
Le nouveau modèle est pull via HuggingFace pendant que l'ancien continue de servir vos prompts. Aucun downtime.
04Bascule transparente
Une fois le download complet, le host swappe ses subprocess. L'orchestrateur route ailleurs pendant les 30 secondes de transition.
Les anciens modèles restent 24h en cache disque (rollback possible si un problème est détecté), puis sont automatiquement purgés.
Modèles surveillés
Korai surveille ces modèles pour ajout au fleet dès qu'ils sortent ou que les conditions hardware le permettent.
GLM-5.1 (Reasoning)Existe · trop gros pour le hardware actuelQuand un host avec 4× RTX 6000 Pro rejoint le réseau
GLM-5 AirNon sortiDès release officielle Z.AI sur HuggingFace
Mistral Medium 4AnnoncéDès release · alignement souveraineté EU pure 🇪🇺
Llama 4 ScoutExiste · contexte unique 10M tokensDès qu'un host prosumer 96 GB rejoint le réseau
MiniMax M2.7Existe · Intelligence 50 sur 230B/10B actifsQuand 2× RTX 6000 Pro disponibles chez un host
Kimi K2.6-distill-32BNon sortiDès release · remplacera probablement DeepSeek R1-distill-32B
Voir le fleet en action
Ouvrez le chat et basculez entre les modes. Le routing automatique choisit le meilleur modèle pour votre prompt.