- Lot 1 : Modèles de fondation
- Lot 2 : Modèles sectoriels et agents
- Lot 3 : Sécurité et évaluation
- Lot 4 : Données et communs
Lot 1 : Modèles de fondation
OBJECTIF
Créer des modèles multimodaux performants adaptés à la langue française.
CONTENU
- Entraînement sur corpus multilingue
- Architecture, fine-tuning optimisé
- Comparaison vs modèles propriétaires
- Réduction des coûts d’entraînement
Lot 2 : Modèles sectoriels et agents
OBJECTIF
Créer des modèles spécialisés + système d’agents modulaires.
CONTENU
- Alignement métier via RLHF, DPO…
- Systèmes multi-agents orchestrés
- Performance systémique (ex : 95% par agent → 86% enchaînement)
- Exemple d’agent (SAP, RAG, Teams, Synthèse…)
Lot 3 : Sécurité et évaluation
OBJECTIF
Évaluer rigoureusement les performances et sécuriser l’usage des IA.
CONTENU
- Benchmarks sectoriels en français
- Méthodes de redteaming, jailbreak
- Création de jeux d’évaluation et outils d’audit
Lot 4 : Données et communs
OBJECTIF
Créer une bibliothèque souveraine de données & outils.
CONTENU
- Corpus sectoriels
- Open source sur Hugging Face, GENCI
- GENKIT : boîte à outils pour le pipeline complet IA Générative