Aller au contenu principal
IA24 juin 20267 min de lecture

Mistral lance OCR 4 : lire vos documents sans cloud tiers

Mistral a publié OCR 4, son moteur de lecture de documents. Auto-hébergeable dans un seul conteneur, capable de lire manuscrits et 170 langues, il rend une sortie structurée directement exploitable pour une recherche interne ou un RAG. Ce que ça change pour un projet de dématérialisation.

Par Eliott

Mistral lance OCR 4 : lire vos documents sans cloud tiers
Sommaire(8 sections)

Vous avez des années d’archives papier qui dorment dans des cartons : courriers, formulaires, contrats, dossiers manuscrits. Les numériser, tout le monde en parle, mais deux objections reviennent à chaque réunion. La première : faut-il vraiment envoyer ces documents sensibles dans le cloud d’un prestataire pour qu’une intelligence artificielle les lise ? La seconde : une fois numérisés, à quoi servent vraiment ces fichiers texte si personne ne peut les chercher ni les exploiter ? L’OCR 4 annoncé par Mistral le 23 juin 2026 répond précisément à ces deux questions, et c’est ce qui en fait un sujet de décideur plus que de spécialiste.

Mistral AI, l’éditeur français de modèles d’intelligence artificielle, a publié cette nouvelle version de son moteur de lecture de documents avec deux promesses qui changent la donne pour un projet de dématérialisation : le modèle tient dans un seul conteneur déployable sur l’infrastructure de l’entreprise, et il ne produit plus du texte brut mais une sortie structurée directement exploitable. Voyons concrètement ce que cela permet, et où se cachent les nuances à connaître avant de s’emballer.

Lire des documents sans qu’ils quittent votre infrastructure

Le premier argument d’OCR 4 n’est pas sa performance brute, c’est l’endroit où il tourne. D’après l’annonce officielle de Mistral, le modèle est assez compact pour fonctionner dans un seul conteneur, en auto-hébergement sur le serveur ou le cloud privé du client, un terme que reprend Numerama, média français spécialisé dans le numérique. Concrètement, les documents ne sortent jamais du périmètre de l’entreprise.

Pour un dirigeant ou une direction des systèmes d’information, c’est l’objection numéro un qui tombe. Numériser un fonds d’archives sensibles, des dossiers RH, des contrats ou des courriers clients sans qu’aucune page ne transite par un service tiers, c’est un argument de conformité directement actionnable dans les secteurs réglementés. Mistral étant une société française sous juridiction européenne, l’angle souveraineté et résidence des données se renforce d’autant pour un acheteur public ou un grand compte. Ce mode auto-hébergé est réservé aux clients entreprise ; à côté, OCR 4 reste disponible en cloud managé via l’API Mistral, Mistral Studio, ou des plateformes comme Amazon SageMaker et Microsoft Foundry. Le choix entre cloud managé et auto-hébergement est exactement le genre d’arbitrage qu’on pose en amont, lors d’un audit et d’une étude de cadrage, plutôt qu’au moment du déploiement.

Du texte brut à une sortie vraiment exploitable

Le second changement est plus discret mais tout aussi décisif. Un OCR classique vous rend du texte : une suite de caractères, à charge pour vous de retrouver où était quoi dans la page. OCR 4 produit, selon Mistral et le média Cryptobriefing, une sortie structurée : des boîtes de délimitation qui localisent chaque élément dans la page, une classification typée des blocs (titres, tableaux, équations, signatures) et des scores de confiance ligne par ligne, le tout avec un texte au format Markdown.

La différence se mesure au moment d’exploiter le résultat. Avec du texte brut, il faut souvent reconstruire à la main ce qui était un tableau, deviner où commençait un titre, ou accepter de ne jamais savoir si une zone a été lue correctement. Avec une sortie typée et localisée, ces informations arrivent déjà rangées. C’est précisément ce qui transforme une simple numérisation en couche d’ingestion pour une recherche interne ou un assistant documentaire. Si vous outillez vos équipes autour de l’automatisation et de l’IA, cette qualité de sortie est ce qui sépare un projet qui aboutit d’un fichier texte que personne n’utilise.

La brique d’entrée d’un projet RAG

C’est là que l’angle devient stratégique. Mistral positionne OCR 4 comme une brique d’ingestion pour le RAG (retrieval-augmented generation), cette approche où un assistant répond à partir de vos propres documents au lieu d’inventer. Dans un RAG, la qualité des réponses dépend d’abord de la qualité de ce qu’on a donné à lire à la machine : si l’extraction est bruitée, l’assistant cite mal ou se trompe.

En fournissant des entrées localisées, typées et assorties de scores de confiance, OCR 4 vise à donner des passages prêts à citer aux pipelines de recherche. Le schéma ci-dessous rappelle où se place cette étape : l’extraction documentaire alimente une base de connaissances que l’assistant interroge pour répondre en citant ses sources.

Schéma du fonctionnement d’un RAG : une question utilisateur déclenche une recherche dans une base vectorielle alimentée par des documents, puis un modèle génère une réponse sourcée à partir des passages retrouvés

Pour un décideur, l’enseignement est simple : la valeur d’un assistant interne se joue en grande partie en amont, dans l’ingestion. Un OCR qui rend une sortie déjà structurée raccourcit le chemin entre vos archives papier et un moteur de recherche capable de répondre avec ses sources. C’est un classique des projets que mène notre équipe : avant de brancher un grand modèle de langage, on s’assure que la matière première est propre.

Manuscrits, formulaires et 170 langues

Le titre retenu par Numerama insiste sur deux capacités spectaculaires : déchiffrer les manuscrits et couvrir 170 langues. Une précision honnête s’impose ici. La page officielle d’OCR 4 met surtout l’accent sur la sortie structurée et le multilingue ; c’est Numerama qui titre sur les manuscrits. La lecture de l’écriture manuscrite est néanmoins une capacité documentée de la gamme : la page officielle d’OCR 3 décrivait déjà l’interprétation de l’écriture cursive et des annotations superposées à des formulaires imprimés.

Sur le multilingue, le chiffre annoncé par Mistral est de 170 langues réparties en dix groupes linguistiques, confirmé par Cryptobriefing et Numerama. L’intérêt n’est pas le chiffre en soi mais ce qu’il permet : selon Mistral, OCR 4 gagnerait le plus de terrain sur les écritures rares et peu dotées, là où d’autres systèmes se dégradent (hindi, géorgien, bengali, arménien, hébreu, grec, tamoul, entre autres). Pour une organisation dont les archives mêlent plusieurs langues, cela évite d’empiler un outil par langue.

Ce que disent les chiffres, et comment les lire

Mistral met en avant des résultats de performance qu’il faut savoir lire pour ce qu’ils sont. L’éditeur revendique un taux de victoire moyen de 72 % en évaluation à l’aveugle par des annotateurs indépendants, face aux principaux systèmes d’OCR et de document-AI qu’il a testés. Ce taux de préférence de 72 % est repris par Stratégies, magazine économique spécialisé dans les médias et le marketing, mais c’est une mesure constructeur, c’est-à-dire produite par Mistral sur son propre protocole : on le présente donc comme une annonce de l’éditeur, pas comme un verdict neutre et indépendant.

La même prudence vaut pour les scores de benchmark publics que Mistral cite (autour de 85 sur OlmOCRBench et 93 sur OmniDocBench). Mistral lui-même les assortit de réserves sur d’éventuels artefacts de mesure. Le réflexe sain, pour un projet réel, n’est pas de se fier à un score global mais de tester le modèle sur vos propres documents, ceux qui ressemblent à ce que vous voulez vraiment numériser. C’est tout l’objet d’un cadrage sérieux avant un déploiement.

Combien ça coûte, et ce que ça implique pour un projet

Côté tarif, l’API d’OCR 4 est annoncée par Mistral, et confirmée par Cryptobriefing, à 4 dollars pour 1 000 pages, ramenés à 2 dollars avec la remise Batch de 50 % pour les traitements en lot. Pour situer un projet de dématérialisation, l’ordre de grandeur est donc de quelques dollars pour mille pages numérisées, selon le mode de consommation.

Ce coût de lecture n’est qu’une ligne du budget d’un vrai projet. Numériser un fonds d’archives, c’est aussi préparer les documents, choisir entre cloud managé et auto-hébergement, raccorder la sortie à une recherche interne ou à un RAG, et maintenir tout cela dans la durée. C’est là qu’une agence pluridisciplinaire apporte de la continuité : des compétences complémentaires qui se relaient de l’intégration de l’API Mistral à l’infrastructure qui héberge le conteneur, avec une connaissance partagée et documentée du projet. Un outil comme OCR 4 abaisse le coût de la brique de lecture ; le reste se construit, et c’est précisément ce qu’on cadre ensemble avant la première ligne de code.

Pour aller plus loin

  • Automatisation et IA : agents, RAG et IA générative au service de vos équipes et de vos documents.
  • Mistral AI : comment nous intégrons l’écosystème Mistral, du prototype à la production.
  • Cloud et DevOps : héberger un modèle en conteneur sur votre propre infrastructure, en toute maîtrise.
  • Audit et étude de cadrage : la porte d’entrée pour décider en connaissance de cause avant de lancer un projet.
  • Notre méthode : comment nous accompagnons nos clients de la décision jusqu’à la mise en production.

Sources


EL

Eliott

Automatisation et agents IA

Pour aller plus loin

Anthropic lance Claude Tag, un coéquipier IA persistant dans Slack
IA25 juin 20268 min

Anthropic lance Claude Tag, un coéquipier IA persistant dans Slack

Anthropic lance Claude Tag, un agent IA partagé et persistant qui vit dans les canaux Slack d’une équipe. Pour un dirigeant, la vraie question avant de l’ouvrir n’est pas ce qu’il sait faire, mais à quoi il a droit : périmètre d’accès, données exposées, budget de tokens et audit.

Lire l'article
Claude Fable 5 : l'IA la plus puissante du monde, lancée puis suspendue en 72 heures
IA14 juin 2026

Claude Fable 5 : l'IA la plus puissante du monde, lancée puis suspendue en 72 heures

Anthropic a lancé Claude Fable 5, son IA la plus puissante ouverte au public, avant que les États-Unis n'en ordonnent la suspension mondiale 72 heures plus tard pour raisons de sécurité nationale. Retour sur cet épisode et ses deux leçons clés : l'IA est devenue un enjeu géopolitique, et mieux vaut ne jamais dépendre d'un seul modèle

Lire l'article
Shadow AI : comment reprendre le contrôle de l'IA invisible dans votre entreprise
IA13 février 20267 min

Shadow AI : comment reprendre le contrôle de l'IA invisible dans votre entreprise

68 % des salariés français utilisent déjà l'IA sans en informer leur hiérarchie. Risques RGPD, failles de sécurité, hallucinations : voici comment reprendre le contrôle sans brider l'innovation.

Lire l'article

Réservez un rendez-vous gratuit avec un spécialiste

30 minutes pour échanger sur votre projet digital et vos enjeux tech.

Spécialiste Koul travaillant sur un logiciel métier à son bureau
Questions fréquentes

Le blog Koul

Ligne éditoriale, sources, usage : ce qui sort sur ce blog et comment vous pouvez vous en servir.