Demande envoyée

Refus implicite

Embargo levé

Madame, Monsieur,

Dans le cadre de son programme « Data AI », France Travail a mis en place un outil d'IA générative intitulé « ChatFT» et développé sur le modèle de ChatGPT.

Cet outil, pour l'instant destiné aux seuls conseillers de France Travail, vise à leur offrir un outil de chat basé sur des modèles « LLM ».

A notre connaissance, une première version de cet outil est en expérimentation dans plusieurs agences France Travail.

Au titre du droit d’accès aux documents administratifs, tel que prévu notamment par le Livre III du Code des relations entre le public et l’administration, je sollicite auprès de vous la communication des documents suivants relatifs à ChatFT:
- Principaux documents techniques présentant notamment les modèles utilisés, leur entraînement (fine-tuning), les bases de données d'apprentissage, les bases de données de « contexte » (textes réglementaires, dossier personnel demandeur d'emploi...) et l'infrastructure technique autour de laquelle ChatFT est construit;
-Principaux documents à destination des utilisateurs finaux (manuels, bibliothèques de prompts...);
- L'eventuelle Analyse d'Impact relative à la Protection des Données si elle existe.
- Code source de ChatFT.

Concernant le dernier point, il est à noter que comme tout modèle de chat se basant sur de l'IA générative, ChatFT est construit autour de plusieurs briques techniques dont notamment:
- Un ou plusieurs LLMs,
- Une interface d'échange avec le ou les LLMS,
- Un système de « chat ».

Je souhaite en priorité obtenir:
- Le code source du système de Chat, c'est à dire de l'interface prenant en entrée une « question » d'un conseiller et retournant la « réponse » de chatFT.
- Les modèles LLMs utilisés (leurs « poids »).

Le code source du « backend », gérant notamment les connections aux API des modèles LLMs peut être écartée de la demande.

Je tiens à rappeler que la transmission du code source du système de « chat » est un enjeu crucial en terme de transparence de l'utilisation d'algorithmes d'IA generatives et qu'elle ne pose pas de problèmes en terme de sécurité de l'infrastructure technique (contrairement, peut-être à certaines partie du code « backend »).

Rappelons qu'un tel système de « chat » est construit autour de différentes briques incluant notamment des:
- Interface d'interaction
- Modèles de chat,
- Templates de prompts,
- Agents,
- Outils,
- Modules de gestion de contexte pour les RAG (base de données, document loaders, vector stores, retrievers, embeddings...),
- ....

Je souhaite obtenir le code source de l'ensemble de ces éléments.

Je souhaite recevoir ces documents sous forme électronique, dans un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé, comme le prévoit l’article L300-4 du Code des relations entre le public et l’administration.

Comme l’article L311-2 du code précité le prévoit lorsque le demandeur a mal identifié celui qui est susceptible de répondre à sa requête, je vous prie de bien vouloir transmettre ma demande au service qui détient les documents demandés si tel est le cas.

Veuillez agréer, Madame, Monsieur, l'expression de mes sentiments distingués.

Noémie Levain
La Quadrature du Net