Skip to content

Projet
Partenaires
Cas d’usage
Equipe & Emploi

Projet structuré en 4 Lots

Lot 1 : Modèles de fondation
Lot 2 : Modèles sectoriels et agents

Lot 3 : Sécurité et évaluation
Lot 4 : Données et communs

Lot 1 : Modèles de fondation

OBJECTIF

Créer des modèles multimodaux performants adaptés à la langue française.

CONTENU

Entraînement sur corpus multilingue
Architecture, fine-tuning optimisé
Comparaison vs modèles propriétaires
Réduction des coûts d’entraînement

Lot 2 : Modèles sectoriels et agents

OBJECTIF

Créer des modèles spécialisés + système d’agents modulaires.

CONTENU

Alignement métier via RLHF, DPO…
Systèmes multi-agents orchestrés
Performance systémique (ex : 95% par agent → 86% enchaînement)
Exemple d’agent (SAP, RAG, Teams, Synthèse…)

Lot 3 : Sécurité et évaluation

OBJECTIF

Évaluer rigoureusement les performances et sécuriser l’usage des IA.

CONTENU

Benchmarks sectoriels en français
Méthodes de redteaming, jailbreak
Création de jeux d’évaluation et outils d’audit

Lot 4 : Données et communs

OBJECTIF

Créer une bibliothèque souveraine de données & outils.

CONTENU

Corpus sectoriels
Open source sur Hugging Face, GENCI
GENKIT : boîte à outils pour le pipeline complet IA Générative

Industrialisez l’IA générative pour les industriels français.

©Scribe – 2025, tous droits réservés. www.scribe.fr

À propos

Equipe & emploi
Projet scribe
Réseaux Sociaux
- GitHub
- Hugging Face