Aller au contenu principal
IA Générative & Agents29 juin 20265 min de lecture

GPT-5.6 : Sol, Terra et Luna, les trois nouveaux modèles d’OpenAI expliqués

OpenAI présente GPT-5.6, une nouvelle génération déclinée en trois modèles : Sol, Terra et Luna. Ce que sont ces modèles, à quoi sert chacun, leurs tarifs et leur disponibilité au lancement.

Par Eliott Bidault-Hervouet

GPT-5.6 : Sol, Terra et Luna, les trois nouveaux modèles d’OpenAI expliqués
Sommaire(7 sections)

OpenAI, l’éditeur de ChatGPT, a présenté GPT-5.6, sa nouvelle génération de modèles d’IA. La nouveauté n’est pas tant un modèle « plus puissant » qu’une organisation différente : au lieu d’un modèle unique, l’entreprise décline cette génération en trois modèles, Sol, Terra et Luna. Cet article fait le point sur ce que sont ces modèles, à quoi chacun est destiné, et ce qu’on sait de leurs tarifs et de leur disponibilité au lancement.

Une génération, trois modèles

GPT-5.6 désigne une génération, pas un modèle isolé. OpenAI en profite pour clarifier sa logique de nommage : le numéro (5.6) marque la génération, et les noms (Sol, Terra, Luna) désignent des modèles pensés pour des usages différents, appelés à progresser à leur propre rythme. Une même génération réunit donc plusieurs modèles aux profils distincts plutôt qu’un seul modèle phare.

Concrètement, les trois modèles partagent la même base générationnelle mais ne visent pas les mêmes besoins : un modèle taillé pour le raisonnement difficile, un modèle d’usage quotidien, et un modèle rapide et économique pour le volume. C’est ce qui distingue Sol, Terra et Luna, qu’on détaille ci-dessous. Pour qui suit l’actualité de l’IA, c’est aussi la confirmation d’une tendance : les éditeurs, à commencer par OpenAI, proposent désormais des gammes plutôt que des modèles uniques.

Sol, Terra, Luna : à quoi sert chaque modèle

Sol est le modèle le plus capable de la famille, présenté par OpenAI comme son modèle le plus avancé à ce jour. Il est taillé pour le raisonnement long et les tâches agentiques difficiles : code complexe, analyses scientifiques et cybersécurité, là où le modèle doit suivre un fil de raisonnement étendu sans se perdre. Son niveau d’effort de raisonnement est réglable : on peut demander un raisonnement plus profond quand la tâche le justifie, au prix de davantage de calcul.

Terra est le modèle équilibré, pensé pour la production et l’usage quotidien. OpenAI le présente comme offrant une performance comparable à la génération précédente, GPT-5.5, pour environ deux fois moins cher. C’est le modèle « par défaut » pour la majorité des tâches courantes : rédaction, synthèse, classification, conversation.

Luna est le modèle rapide et le moins cher de la famille, conçu pour la vitesse et l’efficacité. Il vise le volume et les tâches simples et répétitives, où la latence et le coût comptent plus que la profondeur de raisonnement : reformulation, tri, extraction d’informations à grande échelle.

Combien coûtent les trois modèles

Les tarifs se comptent par million de tokens, l’unité de facturation de ces modèles (un token correspond grosso modo à un fragment de mot, et un texte est découpé en tokens à l’entrée comme à la sortie). Aux prix annoncés par OpenAI, Sol coûte 5 $ en entrée et 30 $ en sortie, Terra 2,50 $ et 15 $, et Luna 1 $ et 6 $. Entre Sol et Luna, l’écart atteint donc un facteur 5, à l’entrée comme à la sortie.

Ces chiffres sont des prix éditeur, pas un classement de performance indépendant ; ils ont été repris par la presse spécialisée comme Engadget et le cabinet d’analyse Constellation Research. À noter : sur Sol, un effort de raisonnement plus élevé consomme davantage de tokens en sortie, justement les plus chers. Le coût d’un même travail dépend donc autant du modèle retenu que de la manière dont on le sollicite.

Un accès d’abord limité

Au lancement, GPT-5.6 n’est pas ouvert à tous. OpenAI le réserve d’abord à un petit groupe de partenaires de confiance, une vingtaine d’organisations approuvées au cas par cas, via l’API et Codex, son environnement de code, avant une ouverture plus large annoncée « dans les prochaines semaines ». Cette restriction fait suite à une demande de l’administration américaine, le temps de mettre en place un cadre d’évaluation de la sécurité des nouveaux modèles. OpenAI précise, dans des propos rapportés par le média spécialisé TechCrunch, ne pas souhaiter que ce type d’accès encadré par l’État devienne la norme.

Le cas n’est pas isolé. Anthropic, l’éditeur du modèle Claude, a vu l’accès à ses modèles Mythos 5 et Fable 5 coupé à la mi-juin après des contrôles à l’export, avant que Mythos 5 soit réautorisé à une diffusion limitée auprès de partenaires de confiance, comme l’a rapporté le magazine économique Fortune. La disponibilité d’un modèle de pointe n’est donc plus acquise par défaut : elle peut évoluer vite, au gré des décisions réglementaires.

Ce que ça implique pour intégrer ces modèles

Pour une entreprise qui veut brancher l’un de ces modèles dans une application, cette famille à trois profils a quelques conséquences pratiques. Comme les modèles n’ont ni le même coût ni le même usage, une application peut adresser chaque tâche au modèle adapté plutôt qu’au plus avancé. Suivre les tokens consommés et fixer des plafonds aide à garder de la visibilité sur la dépense, un travail d’infrastructure autant que de modèle. Et puisque la disponibilité d’un modèle peut changer, prévoir une couche capable de parler à plusieurs modèles ou fournisseurs limite la dépendance à un seul.

Deux membres de l’équipe Koul en réunion de travail devant un écran, lors du cadrage d’un projet d’IA

Du choix du modèle à l’intégration et à la mise en production, ces sujets font partie du quotidien de notre équipe sur les projets d’automatisation et d’IA. Le point de départ est en général un audit et une étude de cadrage, pour cartographier les usages avant de déployer.

Pour aller plus loin

Sources

Actualité recoupée par la source primaire OpenAI et plusieurs rédactions tech indépendantes au 29 juin 2026 :


EB

Eliott Bidault-Hervouet

Automatisation et agents IA

Pour aller plus loin

Quality monitoring IA : analyser 100 % des conversations client avec Raisetalk
IA Générative & Agents1 juillet 20266 min

Quality monitoring IA : analyser 100 % des conversations client avec Raisetalk

Découvrez comment Raisetalk utilise l’IA pour automatiser le quality monitoring, analyser les conversations client, détecter les irritants et améliorer la relation client.

MFMatthieu Fougery
Anthropic lance Claude Tag, un coéquipier IA persistant dans Slack
IA Générative & Agents25 juin 20268 min

Anthropic lance Claude Tag, un coéquipier IA persistant dans Slack

Anthropic lance Claude Tag, un agent IA partagé et persistant qui vit dans les canaux Slack d’une équipe. Pour un dirigeant, la vraie question avant de l’ouvrir n’est pas ce qu’il sait faire, mais à quoi il a droit : périmètre d’accès, données exposées, budget de tokens et audit.

EBEliott Bidault-Hervouet
Mistral lance OCR 4 : lire vos documents sans cloud tiers
IA Générative & Agents24 juin 20267 min

Mistral lance OCR 4 : lire vos documents sans cloud tiers

Mistral a publié OCR 4, son moteur de lecture de documents. Auto-hébergeable dans un seul conteneur, capable de lire manuscrits et 170 langues, il rend une sortie structurée directement exploitable pour une recherche interne ou un RAG. Ce que ça change pour un projet de dématérialisation.

EBEliott Bidault-Hervouet

Réservez un rendez-vous gratuit avec un spécialiste

30 minutes pour échanger sur votre projet digital et vos enjeux tech.

Spécialiste Koul travaillant sur un logiciel métier à son bureau
Questions fréquentes

Le blog Koul

Ligne éditoriale, sources, usage : ce qui sort sur ce blog et comment vous pouvez vous en servir.