Qu’est-ce que Mistral OCR 4 ?

OCR 4 est la nouvelle version du moteur de lecture de documents de Mistral, l’éditeur français de modèles d’IA, annoncée le 23 juin 2026. Il lit des documents complexes (texte, tableaux, équations, écriture manuscrite) dans de nombreuses langues et produit une sortie structurée : il ne se contente pas de transcrire des caractères, il localise et classe chaque élément de la page. C’est ce qui le rend directement exploitable pour une recherche interne ou un assistant documentaire.

Qu’est-ce qu’un OCR à sortie structurée, et pourquoi est-ce important ?

Un OCR classique rend du texte brut : une suite de caractères, sans indication de ce qui était un titre, un tableau ou une signature. Une sortie structurée ajoute la localisation de chaque élément dans la page, une classification des blocs (titres, tableaux, équations) et des scores de confiance. Concrètement, on n’a plus à reconstruire à la main la structure du document : le résultat arrive déjà rangé, ce qui raccourcit le chemin entre une archive papier et un moteur de recherche exploitable.

Peut-on faire tourner OCR 4 sur sa propre infrastructure ?

Oui. C’est son principal argument pour les organisations sensibles à la confidentialité. Selon Mistral, le modèle est assez compact pour tourner dans un seul conteneur, en auto-hébergement sur le serveur ou le cloud privé du client : les documents ne quittent jamais le périmètre de l’entreprise. Ce mode est réservé aux clients entreprise. À côté, OCR 4 reste disponible en cloud managé via l’API Mistral et plusieurs plateformes, pour ceux qui n’ont pas de contrainte de résidence des données.

En quoi OCR 4 aide-t-il un projet de RAG ou de recherche interne ?

Un RAG (retrieval-augmented generation) est une approche où un assistant répond à partir de vos propres documents plutôt qu’inventer. La qualité des réponses dépend d’abord de la qualité de ce qu’on a donné à lire à la machine. En fournissant des passages localisés, typés et assortis de scores de confiance, OCR 4 vise à donner des entrées prêtes à citer aux pipelines de recherche, ce qui réduit le travail de nettoyage avant de brancher un grand modèle de langage. C’est exactement le genre de brique que nous intégrons en automatisation et IA.

OCR 4 lit-il vraiment les manuscrits ?

Numerama titre sur la lecture des manuscrits. La page officielle d’OCR 4 met surtout l’accent sur la sortie structurée et le multilingue. La lecture de l’écriture manuscrite reste une capacité documentée de la gamme OCR de Mistral : la page officielle de la version précédente, OCR 3, décrivait déjà l’interprétation de l’écriture cursive et des annotations superposées à des formulaires imprimés. Le réflexe sain est de tester le modèle sur vos propres documents manuscrits avant de vous engager.

Combien de langues OCR 4 prend-il en charge ?

Mistral annonce 170 langues réparties en dix groupes linguistiques, un chiffre repris par plusieurs médias spécialisés. L’intérêt n’est pas le nombre en soi mais ce qu’il permet : selon Mistral, OCR 4 gagne le plus de terrain sur les écritures rares et peu dotées (hindi, géorgien, bengali, arménien, hébreu, grec, tamoul, entre autres), là où d’autres systèmes se dégradent. Pour des archives multilingues, cela évite d’empiler un outil par langue.

Faut-il croire le taux de victoire de 72 % annoncé par Mistral ?

Mistral revendique un taux de victoire moyen de 72 % en évaluation à l’aveugle par des annotateurs indépendants, face aux principaux systèmes qu’il a testés. C’est une mesure constructeur, produite par l’éditeur sur son propre protocole : on la prend comme une annonce de Mistral, pas comme un verdict neutre. La même prudence vaut pour les scores de benchmark publics, que Mistral lui-même assortit de réserves. Pour un projet réel, mieux vaut tester le modèle sur ses propres documents que se fier à un score global.

Combien coûte OCR 4, et qu’est-ce que ça représente dans un projet ?

Mistral annonce une tarification API de 4 dollars pour 1 000 pages, ramenés à 2 dollars avec la remise Batch de 50 % pour les traitements en lot. Cet ordre de grandeur ne couvre que la brique de lecture. Un vrai projet de dématérialisation implique aussi de préparer les documents, de choisir entre cloud managé et auto-hébergement, de raccorder la sortie à une recherche interne ou un RAG, et de maintenir le tout dans la durée. La meilleure façon de chiffrer cet ensemble est de partir d’un audit et d’une étude de cadrage.

Par où commencer un projet de dématérialisation avec l’IA ?

Par un cadrage, pas par l’outil. Avant de déployer un moteur de lecture comme OCR 4, on identifie les documents à plus forte valeur, les contraintes de confidentialité, le mode d’hébergement et l’usage final (recherche interne, RAG, archivage). Un audit et une étude de cadrage transforment cette intention en un périmètre clair et décidable. C’est la porte d’entrée que notre équipe propose avant d’écrire la première ligne de code, pour avancer en connaissance de cause plutôt qu’à l’aveugle.

IA24 juin 20267 min de lecture

Mistral lance OCR 4 : lire vos documents sans cloud tiers

Mistral a publié OCR 4, son moteur de lecture de documents. Auto-hébergeable dans un seul conteneur, capable de lire manuscrits et 170 langues, il rend une sortie structurée directement exploitable pour une recherche interne ou un RAG. Ce que ça change pour un projet de dématérialisation.

Par Eliott

Mistral lance OCR 4 : lire vos documents sans cloud tiers

En bref

OCR 4, annoncé par Mistral le 23 juin 2026, est une nouvelle version de son moteur de lecture de documents. Deux promesses intéressent un décideur engagé dans la dématérialisation : le modèle tient dans un seul conteneur auto-hébergeable, donc les documents ne quittent jamais l’infrastructure de l’entreprise (confidentialité, souveraineté, conformité), et il produit une sortie structurée (localisation du texte, blocs typés comme titres, tableaux ou signatures, scores de confiance) directement branchable sur une recherche interne ou un pipeline RAG. Mistral revendique 170 langues, la lecture des écritures rares et un taux de victoire de 72 % à l’aveugle, chiffre constructeur à prendre comme une annonce de l’éditeur. Numerama titre sur la lecture des manuscrits, capacité documentée sur la lignée OCR. Tarif API annoncé : 4 dollars pour 1 000 pages, ramenés à 2 dollars en lot. Le bon réflexe avant de se lancer reste de tester le modèle sur ses propres documents et de cadrer le projet.

Sommaire(8 sections)

1
Lire des documents sans qu’ils quittent votre infrastructure
2
Du texte brut à une sortie vraiment exploitable
3
La brique d’entrée d’un projet RAG
4
Manuscrits, formulaires et 170 langues
5
Ce que disent les chiffres, et comment les lire
6
Combien ça coûte, et ce que ça implique pour un projet
7
Pour aller plus loin
8
Sources

Vous avez des années d’archives papier qui dorment dans des cartons : courriers, formulaires, contrats, dossiers manuscrits. Les numériser, tout le monde en parle, mais deux objections reviennent à chaque réunion. La première : faut-il vraiment envoyer ces documents sensibles dans le cloud d’un prestataire pour qu’une intelligence artificielle les lise ? La seconde : une fois numérisés, à quoi servent vraiment ces fichiers texte si personne ne peut les chercher ni les exploiter ? L’OCR 4 annoncé par Mistral le 23 juin 2026 répond précisément à ces deux questions, et c’est ce qui en fait un sujet de décideur plus que de spécialiste.

Mistral AI, l’éditeur français de modèles d’intelligence artificielle, a publié cette nouvelle version de son moteur de lecture de documents avec deux promesses qui changent la donne pour un projet de dématérialisation : le modèle tient dans un seul conteneur déployable sur l’infrastructure de l’entreprise, et il ne produit plus du texte brut mais une sortie structurée directement exploitable. Voyons concrètement ce que cela permet, et où se cachent les nuances à connaître avant de s’emballer.

Lire des documents sans qu’ils quittent votre infrastructure

Le premier argument d’OCR 4 n’est pas sa performance brute, c’est l’endroit où il tourne. D’après l’annonce officielle de Mistral, le modèle est assez compact pour fonctionner dans un seul conteneur, en auto-hébergement sur le serveur ou le cloud privé du client, un terme que reprend Numerama, média français spécialisé dans le numérique. Concrètement, les documents ne sortent jamais du périmètre de l’entreprise.

Pour un dirigeant ou une direction des systèmes d’information, c’est l’objection numéro un qui tombe. Numériser un fonds d’archives sensibles, des dossiers RH, des contrats ou des courriers clients sans qu’aucune page ne transite par un service tiers, c’est un argument de conformité directement actionnable dans les secteurs réglementés. Mistral étant une société française sous juridiction européenne, l’angle souveraineté et résidence des données se renforce d’autant pour un acheteur public ou un grand compte. Ce mode auto-hébergé est réservé aux clients entreprise ; à côté, OCR 4 reste disponible en cloud managé via l’API Mistral, Mistral Studio, ou des plateformes comme Amazon SageMaker et Microsoft Foundry. Le choix entre cloud managé et auto-hébergement est exactement le genre d’arbitrage qu’on pose en amont, lors d’un audit et d’une étude de cadrage, plutôt qu’au moment du déploiement.

Du texte brut à une sortie vraiment exploitable

Le second changement est plus discret mais tout aussi décisif. Un OCR classique vous rend du texte : une suite de caractères, à charge pour vous de retrouver où était quoi dans la page. OCR 4 produit, selon Mistral et le média Cryptobriefing, une sortie structurée : des boîtes de délimitation qui localisent chaque élément dans la page, une classification typée des blocs (titres, tableaux, équations, signatures) et des scores de confiance ligne par ligne, le tout avec un texte au format Markdown.

La différence se mesure au moment d’exploiter le résultat. Avec du texte brut, il faut souvent reconstruire à la main ce qui était un tableau, deviner où commençait un titre, ou accepter de ne jamais savoir si une zone a été lue correctement. Avec une sortie typée et localisée, ces informations arrivent déjà rangées. C’est précisément ce qui transforme une simple numérisation en couche d’ingestion pour une recherche interne ou un assistant documentaire. Si vous outillez vos équipes autour de l’automatisation et de l’IA, cette qualité de sortie est ce qui sépare un projet qui aboutit d’un fichier texte que personne n’utilise.

La brique d’entrée d’un projet RAG

C’est là que l’angle devient stratégique. Mistral positionne OCR 4 comme une brique d’ingestion pour le RAG (retrieval-augmented generation), cette approche où un assistant répond à partir de vos propres documents au lieu d’inventer. Dans un RAG, la qualité des réponses dépend d’abord de la qualité de ce qu’on a donné à lire à la machine : si l’extraction est bruitée, l’assistant cite mal ou se trompe.

En fournissant des entrées localisées, typées et assorties de scores de confiance, OCR 4 vise à donner des passages prêts à citer aux pipelines de recherche. Le schéma ci-dessous rappelle où se place cette étape : l’extraction documentaire alimente une base de connaissances que l’assistant interroge pour répondre en citant ses sources.

Schéma du fonctionnement d’un RAG : une question utilisateur déclenche une recherche dans une base vectorielle alimentée par des documents, puis un modèle génère une réponse sourcée à partir des passages retrouvés

Pour un décideur, l’enseignement est simple : la valeur d’un assistant interne se joue en grande partie en amont, dans l’ingestion. Un OCR qui rend une sortie déjà structurée raccourcit le chemin entre vos archives papier et un moteur de recherche capable de répondre avec ses sources. C’est un classique des projets que mène notre équipe : avant de brancher un grand modèle de langage, on s’assure que la matière première est propre.

Manuscrits, formulaires et 170 langues

Le titre retenu par Numerama insiste sur deux capacités spectaculaires : déchiffrer les manuscrits et couvrir 170 langues. Une précision honnête s’impose ici. La page officielle d’OCR 4 met surtout l’accent sur la sortie structurée et le multilingue ; c’est Numerama qui titre sur les manuscrits. La lecture de l’écriture manuscrite est néanmoins une capacité documentée de la gamme : la page officielle d’OCR 3 décrivait déjà l’interprétation de l’écriture cursive et des annotations superposées à des formulaires imprimés.

Sur le multilingue, le chiffre annoncé par Mistral est de 170 langues réparties en dix groupes linguistiques, confirmé par Cryptobriefing et Numerama. L’intérêt n’est pas le chiffre en soi mais ce qu’il permet : selon Mistral, OCR 4 gagnerait le plus de terrain sur les écritures rares et peu dotées, là où d’autres systèmes se dégradent (hindi, géorgien, bengali, arménien, hébreu, grec, tamoul, entre autres). Pour une organisation dont les archives mêlent plusieurs langues, cela évite d’empiler un outil par langue.

Ce que disent les chiffres, et comment les lire

Mistral met en avant des résultats de performance qu’il faut savoir lire pour ce qu’ils sont. L’éditeur revendique un taux de victoire moyen de 72 % en évaluation à l’aveugle par des annotateurs indépendants, face aux principaux systèmes d’OCR et de document-AI qu’il a testés. Ce taux de préférence de 72 % est repris par Stratégies, magazine économique spécialisé dans les médias et le marketing, mais c’est une mesure constructeur, c’est-à-dire produite par Mistral sur son propre protocole : on le présente donc comme une annonce de l’éditeur, pas comme un verdict neutre et indépendant.

La même prudence vaut pour les scores de benchmark publics que Mistral cite (autour de 85 sur OlmOCRBench et 93 sur OmniDocBench). Mistral lui-même les assortit de réserves sur d’éventuels artefacts de mesure. Le réflexe sain, pour un projet réel, n’est pas de se fier à un score global mais de tester le modèle sur vos propres documents, ceux qui ressemblent à ce que vous voulez vraiment numériser. C’est tout l’objet d’un cadrage sérieux avant un déploiement.

Combien ça coûte, et ce que ça implique pour un projet

Côté tarif, l’API d’OCR 4 est annoncée par Mistral, et confirmée par Cryptobriefing, à 4 dollars pour 1 000 pages, ramenés à 2 dollars avec la remise Batch de 50 % pour les traitements en lot. Pour situer un projet de dématérialisation, l’ordre de grandeur est donc de quelques dollars pour mille pages numérisées, selon le mode de consommation.

Ce coût de lecture n’est qu’une ligne du budget d’un vrai projet. Numériser un fonds d’archives, c’est aussi préparer les documents, choisir entre cloud managé et auto-hébergement, raccorder la sortie à une recherche interne ou à un RAG, et maintenir tout cela dans la durée. C’est là qu’une agence pluridisciplinaire apporte de la continuité : des compétences complémentaires qui se relaient de l’intégration de l’API Mistral à l’infrastructure qui héberge le conteneur, avec une connaissance partagée et documentée du projet. Un outil comme OCR 4 abaisse le coût de la brique de lecture ; le reste se construit, et c’est précisément ce qu’on cadre ensemble avant la première ligne de code.

Pour aller plus loin

Automatisation et IA : agents, RAG et IA générative au service de vos équipes et de vos documents.
Mistral AI : comment nous intégrons l’écosystème Mistral, du prototype à la production.
Cloud et DevOps : héberger un modèle en conteneur sur votre propre infrastructure, en toute maîtrise.
Audit et étude de cadrage : la porte d’entrée pour décider en connaissance de cause avant de lancer un projet.
Notre méthode : comment nous accompagnons nos clients de la décision jusqu’à la mise en production.

Sources

Eliott

Automatisation et agents IA

Partager l'article

Mistral lance OCR 4 : lire vos documents sans cloud tiers

Lire des documents sans qu’ils quittent votre infrastructure

Du texte brut à une sortie vraiment exploitable

La brique d’entrée d’un projet RAG

Manuscrits, formulaires et 170 langues

Ce que disent les chiffres, et comment les lire

Combien ça coûte, et ce que ça implique pour un projet

Pour aller plus loin

Sources

Pour aller plus loin

Réservez un rendez-vous gratuit avec un spécialiste

Le blog Koul