Ecriture de roman – Révision de style à l’aide d’un modèle IA local — 32 Go de RAM

08/06/2026 0 Par Bruno

Je suis ingénieur de formation et métier. Pour le plaisir de la création, dans mon temps libre, les soirs et week-end, j’écris un roman à la main, je le fais imprimer tous les deux mois, et je le relis avec un surligneur et un stylo.
Alors pourquoi tester des modèles d’IA pour la révision de style ? Précisément pour ça : mesurer l’écart entre ce qu’une machine produit aujourd’hui et ce qu’un cerveau humain fait naturellement.
–> Mon objectif premier était au travers de ce test, d’en apprendre plus sur les usages de l’IA, maîtriser les concepts sous jacent des modèles, leur fonctionnement, etc. Ce test m’a servit de fil rouge pour apprendre et progresser en connaissance de l’IA.

La machine et les modèles

J’utilise un Mac Studio M1 Max, 32 Go de RAM, millésime 2022. Pas la dernière génération, mais une machine solide pour ce genre de travail.

Trois modèles sont en lice. Un mot d’explication pour les non-initiés : un modèle, c’est le cerveau. La quantization (Q4, Q6…), c’est le niveau de compression appliqué à ce cerveau pour qu’il tienne en mémoire. Plus le chiffre est élevé, plus le modèle est précis — mais plus il consomme de RAM. Avec 32 Go, on ne peut pas tout se permettre.

Mistral 3.2 : 24B Q6_K — un modèle de 24 milliards de paramètres, compression haute qualité. Téléchargé depuis Hugging Face via Ollama.
Gemma4 : 31B Q4_K_M — version standard de Gemma4, 31 milliards de paramètres, compression Q4. Disponible directement via ollama pull gemma4:31B.
Gemma4 : 31B qat Q4_K_XL — même modèle, mais dans sa variante QAT. La quantization QAT (Quantization-Aware Training) signifie que le modèle a été entraîné en tenant compte de sa future compression : il est plus précis à bitrate égal, et plus rapide. C’est le seul que j’ai trouvé sur Hugging Face dans ce format.

Pour chaque modèle, j’ai créé un profil Ollama avec les mêmes paramètres :

PARAMETER num_ctx    16384
PARAMETER temperature  0.65
PARAMETER num_predict  10240
PARAMETER top_p      0.92
PARAMETER min_p      0.02

Température à 0,65 : ni trop sage, ni trop créatif. C’est le réglage qui donne, dans mon expérience, les résultats les plus équilibrés pour la révision littéraire.

Le protocole

Trois chapitres de mon roman en cours, au format Markdown, déposés dans un répertoire sources/ :

L’unité des bizarreries	1906
Méditation	1443
Nooon	2165

La source est gelée pendant toute la durée des tests. Les scripts sont identiques, seul le modèle change. Un script Python lit les fichiers du répertoire sources/ et écrit les résultats dans sorties/, avec un suffixe indiquant le modèle utilisé.

Le prompt de révision de style est le suivant :

Tu es un éditeur littéraire professionnel français.
Tu révises le texte en améliorant :
- la qualité stylistique
- le sous-texte
- la fluidité et le rythme des phrases
- la précision du vocabulaire
- les dialogues (naturel, vivacité, crédibilité)
- le principe show don't tell (montrer plutôt que raconter)
- la force émotionnelle

FORMAT DE SORTIE OBLIGATOIRE :
- Suppression sans remplacement : ~~texte supprimé~~
- Ajout sans remplacement : **texte ajouté**
- Remplacement : ~~ancien texte~~ **nouveau texte**

Tu ne modifies pas les événements, les personnages, ni l'intrigue.
Tu ne résumes pas. Tu restitues le texte intégral avec les modifications visibles.
Aucun commentaire en dehors du texte révisé.

Une précision sur la comparaison : certains noteront que je compare un Q6 de Mistral avec un Q4 de Gemma. C’est juste. Mais ce n’est pas un test de performances informatiques — c’est un cas réel. Un auteur qui dispose de 32 Go de RAM va toujours installer les meilleurs modèles compatibles avec sa configuration. Dans 32 Go, ce sont ces quantizations-là qui tournent bien. Le test reflète donc ce qu’un utilisateur réel peut faire aujourd’hui avec cette machine.

Les résultats

Vitesse de traitement

	Mistral 3.2 24B Q6	Gemma4 31B Q4_K_M	Gemma4 31B qat Q4_K_XL
Traitement des 3 fichiers	10 min 42 sec	22 min 43 sec	15 min 10 sec
Mémoire libre (Typora seul ouvert)	± 2,75 Go	± 2,2 Go	± 3,2 Go

Mistral est le plus rapide — presque deux fois plus vite que Gemma4-classique. Gemma4-qat se situe entre les deux. Notons que Gemma4-qat laisse davantage de mémoire libre que la version classique (3,2 Go contre 2,2 Go) : il est plus économe en RAM, mais pas nécessairement en temps de traitement.

Compréhension du prompt

Les trois modèles ont correctement compris la consigne : générer un fichier Markdown externe avec les modifications visibles. Un quatrième modèle, Qwen, était initialement dans la boucle — il n’a pas compris la demande à plusieurs reprises et a tout affiché dans le terminal. Je l’ai retiré du test.

Traçabilité des modifications

C’est le critère qui me tient le plus à cœur. Je révise à la main. Je veux que la machine me montre exactement ce qu’elle a changé — l’ancien texte barré, le nouveau en gras — pour que je puisse valider ou rejeter chaque modification, comme je le ferais avec un correcteur humain.

Mistral suit les instructions au début du document, puis les oublie systématiquement : l’ancien texte barré disparaît au fil des pages.
Gemma4 et Gemma4-qat respectent la traçabilité à 100 % du début à la fin.

Avantage Gemma.

Changements fantômes

Mistral produit en moyenne 5 modifications par tranche de 2 000 mots qui n’en sont pas vraiment : le texte d’origine et le texte proposé sont identiques. J’ai vérifié les accents, la ponctuation, les espaces. Je n’ai pas trouvé d’explication. Ce phénomène n’apparaît jamais avec les deux versions de Gemma.

Concordance des temps

Quand j’écris, je suis dans l’histoire — focalisé sur l’intrigue et les émotions. L’orthographe passe au second plan. Et je l’avoue franchement : je mélange parfois l’imparfait et le passé simple. C’est mon point faible, que je corrige à la relecture. J’ai eu l’idée d’automatiser ce contrôle.

Le prompt est le suivant :

Je te fournis un texte en français. Ton rôle : vérifier l'usage de l'imparfait
et du passé simple selon cette règle unique :
L'imparfait = décor, états, habitudes (ce qui dure).
Le passé simple = actions ponctuelles (ce qui fait avancer la scène).

Tâche :
1. Identifie tous les verbes au passé simple et à l'imparfait dans le texte.
2. Pour chacun, détermine si le temps utilisé est correct.
3. Produis un tableau récapitulatif : Phrase originale | Verbe + temps utilisé
   | Diagnostic (✓ correct / ✗ à corriger) | Correction proposée.

Résultat : Mistral est remarquable sur ce point. Il identifie les erreurs avec précision et propose des corrections justes. Gemma a laissé passer quelques rares cas.

Avantage Mistral.

Orthographe

Prompt dédié, sans toucher au style :

Tu es un correcteur littéraire professionnel français.
Tu corriges uniquement :
- les fautes d'orthographe
- les fautes de grammaire
Tu ne modifies pas le style, les dialogues, le vocabulaire,
ni la structure des phrases.

Mistral : 20/20. Impeccable, sans débordement.
Gemma : 18,5/20. Bon travail, mais avec une tendance à proposer des retouches grammaticales qui ne lui étaient pas demandées.

Avantage Mistral. Et il est presque 50 % plus rapide sur ce test.

Méthodologie d’analyse qualitative

C’est ici qu’on entre dans le subjectif — mais j’ai essayé de le quantifier. Après impression et relecture complète de toutes les versions, j’ai attribué à chaque modification proposée un score entre −3 et +3 :

Score	Signification
+3	Vraie trouvaille, apporte une plus-value réelle
+2	Reformulation qui améliore la compréhension du lecteur
+1	Reformulation qui allège le texte
0	Reformulation sans intérêt majeur
−1	Changement non approprié
−2	Erreur de contexte, erreur de sens légère
−3	Erreur de sens lourde, qui modifie la signification du texte

Résultats sur environ 2 000 mots :

Modèle	Score net	Nombre de modifications	Erreurs −3	Erreurs −2
Mistral 3.2 24B Q6	+5	5	0	0
Gemma4 31B Q4_K_M	+14	28	3	2
Gemma4 31B qat Q4_K_XL	+9	27	3	3

Ce que ces chiffres disent :

Mistral intervient peu, mais juste. Aucune bourde. Chaque modification est pertinente. C’est l’éditeur qui n’ouvre la bouche que lorsqu’il a quelque chose à dire.
Gemma4-classique intervient beaucoup : 28 modifications et obtient le meilleur score net (+14). Il améliore réellement la fluidité du texte. Mais il commet aussi des erreurs, dont une seule vraiment grave sur l’ensemble du corpus.
Gemma4-qat produit presque autant de modifications que la version classique ( 27 ), mais pour un score inférieur (+9) et davantage d’erreurs graves (3 occurrences à −3). Il a notamment produit une phrase trop ronde et artificielle, tellement parfaite stylistiquement, qu’elle n’aurait jamais pu sortir de la bouche d’un policier sur une scène de crime. Il y a eu aussi 2 modifications du sous-texte qui ont un impact sur les scènes suivantes.

La quantization QAT rend Gemma4-qat plus efficace en termes de vitesse et de mémoire — mais elle le rend aussi plus confiant. Plus enclin à prendre des libertés avec votre texte. Pour un auteur qui tient à sa voix, c’est un risque réel.

Conclusion

Tous les tests ont été menés dans les mêmes conditions : même température, mêmes fichiers, même après-midi. Les modèles ont été vidés de la mémoire entre chaque test.

Mistral 3.2 24B Q6 : l’enfant sage — peut-être un peu trop. Irréprochable en orthographe et en concordance des temps. Pour le style, il est prudent : aucune faute grave, mais peu d’audace. Le candidat idéal si vous rédigez un document technique, académique, etc. Trop sérieux pour du Urban-Fantasy.
Gemma4 31B classique : l’assistant de style par excellence. Il intervient beaucoup, améliore vraiment la fluidité, et ses erreurs restent limitées. C’est lui qui s’en sort le mieux pour la révision stylistique.
Gemma4 31B qat : trop débridé. Plus rapide, plus léger en mémoire, mais dangereux si vous ne vérifiez pas chaque modification. Ses contresens sont peu nombreux, mais suffisamment visibles pour nuire à votre crédibilité aux yeux d’un lecteur attentif.

Ma recommandation pratique

Deux options:

Option 1 (simple) : Mistral uniquement, avec la température remontée légèrement (0,70 à 0,75) pour l’encourager à prendre davantage d’initiatives stylistiques. Avantage : il fonctionne aussi (en Q4)sur une RTX5060 Ti avec 16Go de VRAM sur un PC, pour +/- 630€.

Option 2 (deux passes) : une première passe avec Mistral à t = 0,65 pour l’orthographe et la concordance des temps, puis une seconde passe avec Gemma4-classique en la calmant ( température = 0,55 ou 0,60) pour le style.

Quant à moi, je continuerai à imprimer le manuscrit complet tous les deux mois pour une révision de style manuelle. La machine prépare le terrain ; le stylo rouge reste le dernier mot, même si je vais m’aider de l’option 1.

J’espère que ceci vous aura été utile.

Et l’écriture, le weekend et les soirs, quand j’ai du temps de libre :

CatégorieHumeurs Informatique

À propos de l’auteur

Bruno

FRENCH: Je vis et travaille en Chine; Curieux de cultures humaines, j'ai pris des postes opérationnels aux USA, Hongrie, Grande Bretagne, Mexique, Espagne, Corée du Sud et en France pour une multinationale américaine puis un groupe français. Ce blog est juste le partage du quotidien, destiné principalement à ma famille et aux amis, pour maintenir un lien. Mais, il est aussi le témoignage d'expériences de vies dans différents pays, et diverses cultures. Un simple éclairage sur des différences culturelles, certes, mais aussi une mise en Lumière sur les valeurs communes que l'on retrouve quelque soit la couleur de notre peau, notre religion, notre langue. Les conditions géopolitiques du pays où je vis actuellement font que je me limite délibérément à une simple description du quotidien, et ne publie pas d'analyse de la société ou de sa gouvernance. ENGLISH: Working and living in Shanghai, I'm interested in Human cultures around the world. This pushed me to take position in Hungary, England, Mexico, South Korea, and recently China. With this blog, I intend to share moments of life with familly and friends. However, with the political context of the country hosting me currently, I will limitate this content to life sharing and never touch more subjective topics.