LegalTech

IA juridique : le vrai sujet n’est pas de rédiger, c’est de retrouver juste

April 3, 2026
Written By
Next Editorial
IA juridique : le vrai sujet n’est pas de rédiger, c’est de retrouver juste
Benchmark COLIEE

Évolution des performances 2022 → 2026

2022
Complexité confirmée

COLIEE 2022 confirme que le sujet est encore très difficile. Meilleur score F1 officiel : 0,3715.

2023
Exigence du benchmark

En Task 1, le meilleur F1 redescend à 0,3001, rappelant que les performances restent sensibles à la distribution des données.

2024
Signal positif

Progression de presque 50% par rapport à 2023 (de 0,30 à 0,44). Les approches hybrides s'imposent.

2025
Pipelines multi-étapes

Importance croissante du re-ranking. Task 1 : 0,3353 / Task 2 : 0,3195.

2026
Accélération majeure

Le meilleur F1 monte à 0,4220 in Task 1 and 0,4899 in Task 2. Les résultats deviennent exploitables pour le métier.

On parle beaucoup d’IA dans le droit. Mais pour un cabinet, le besoin le plus stratégique n’est pas forcément de faire écrire une machine.

Le vrai sujet, c’est souvent beaucoup plus concret : retrouver le bon précédent, le bon article, le bon passage, dans un corpus métier, avec un niveau de fiabilité compatible avec les exigences du juridique. COLIEE, le benchmark de référence sur l’extraction et le retrieval juridiques, travaille précisément sur ce type de tâches, notamment la recherche de cas pertinents et l’identification du passage qui soutient une décision.

C’est exactement là que se joue la valeur d’une solution d’IA pour un cabinet. Pas dans l’effet démo. Pas dans un chatbot générique. Mais dans la capacité à comprendre une intention métier, interroger plusieurs milliers de documents, puis remonter une information exploitable, vérifiable et utile au dossier. Et dans ce contexte, la qualité de l’information compte plus que la latence. Les organisateurs de COLIEE rappellent eux-mêmes que ces tâches restent difficiles, parce qu’il faut retrouver quelques cas vraiment pertinents dans un très grand ensemble, sans pouvoir s’appuyer sur des signaux triviaux comme les citations explicites laissées dans les documents.

Le vrai sujet n'est pas de faire écrire une machine, mais de retrouver le bon précédent dans un corpus métier avec un niveau de fiabilité compatible avec les exigences du juridique.
Next Editorial Team
IA Juridique et Recherche Documentaire
Toutes les disciplines de l’IA juridique ne se valent pas

Sous le terme “IA juridique”, on mélange souvent plusieurs disciplines : rédaction assistée, recherche documentaire, extraction d’informations, classification, analyse contractuelle, question-réponse sur corpus, aide au repérage de précédents. Dans cet article, le focus est volontairement limité à deux disciplines : la recherche d’information juridique dans un corpus et la restitution du bon extrait en fonction de l’intention de l’utilisateur. C’est le terrain le plus concret pour un cabinet qui veut gagner du temps sans perdre en maîtrise.

L’état du marché : ça progresse, mais ce n’est pas “résolu”

Le point intéressant, c’est que le marché avance enfin dans la bonne direction. Les grands acteurs du secteur constatent une montée rapide de l’adoption de l’IA chez les professionnels du droit, avec une attente forte autour des usages documentaires, de la recherche et de la productivité. Mais ce mouvement s’accompagne encore de beaucoup de surpromesses. Les benchmarks comme COLIEE montrent une réalité plus utile : les systèmes progressent nettement, mais ils restent imparfaits. [1]

Ce que montre vraiment COLIEE

COLIEE est un référent sérieux parce qu’il permet de mesurer ce qui marche réellement sur des tâches proches du besoin métier. La compétition existe depuis plusieurs années et, depuis 2018, elle inclut des tâches de case law retrieval et de case entailment sur de la jurisprudence canadienne. L’édition 2026 a publié ses résultats le 22 mars 2026.

La lecture des résultats est très claire : oui, les scores montent ; non, on n’est pas à 100 % de fiabilité. C’est exactement le bon message. Une IA sérieuse peut augmenter fortement les chances de retrouver le bon contenu. En revanche, elle ne peut pas garantir qu’une formulation utilisateur floue, incomplète ou ambiguë donnera toujours accès au document parfait.

Ce qui fait la performance aujourd’hui

Les meilleurs systèmes ne reposent pas sur un simple prompt. Ils reposent sur une chaîne complète : préparation du corpus, structuration, chunking, indexation, recherche lexicale, recherche sémantique, reformulation éventuelle de la requête, re-ranking, puis restitution sourcée. Les synthèses COLIEE 2024 et 2025 montrent toutes les deux que les approches dominantes sont hybrides, avec un rôle toujours important pour des méthodes comme BM25, combinées à des modèles neuronaux et à des composants plus récents. [3]

C’est là qu’un bon RAG devient utile : non pas comme gadget, mais comme architecture de retrieval sur corpus privé. Le sujet n’est pas seulement de “parler avec ses documents”. Le sujet est d’augmenter la probabilité de retrouver les bons candidats, puis de présenter une réponse ou un extrait traçable. Cette tendance se retrouve aussi dans COLIEE 2026, où les organisateurs ont renforcé les exigences de reproductibilité autour des modèles utilisés. [6]

Souveraineté, confidentialité, secret professionnel

Pour un cabinet, la performance seule ne suffit pas. La confidentialité des données est un critère de conception, pas une option.

Le CNB rappelle que l’usage de l’IA doit rester compatible with le secret professionnel, le RGPD, la prudence, la compétence et l’indépendance de l’avocat. La CNIL recommande, lorsqu’il existe des données personnelles ou des informations sensibles — notamment dans des systèmes de type RAG — de privilégier un déploiement on-premise ou, à défaut, une infrastructure externe strictement encadrée. [6]

En résumé

L’IA juridique la plus utile aujourd’hui n’est pas celle qui promet de remplacer l’avocat. C’est celle qui sait retrouver juste, citer ses sources, s’intégrer dans les outils existants et protéger les données sensibles. COLIEE montre que la discipline progresse vite. Il montre aussi, très clairement, qu’on ne peut pas vendre honnêtement une certitude absolue. La bonne promesse est ailleurs : réduire le risque d’erreur documentaire et accélérer l’accès à l’information utile. [5]

Chez Next, nous travaillons précisément sur ce sujet : construire des solutions d’IA juridique capables d’exploiter un corpus documentaire métier avec un haut niveau d’exigence sur la fiabilité, la traçabilité et la confidentialité. [1]

 


Sources :

[1] Collie.org

[2] COLIEE2023_summary.pdf

[3] COLIEE2024_task1summary.pdf

[4] COLIEE2025

[5] COLIEE2026

[6] s12626-026-00199-9

Orchestrez vos flux d’appel

Nous contacter