Passer au contenu principal

Un modèle européen, optimisé pour les charges de travail en entreprise

Alfred-sv5 Alfred-sv5 s’appuie sur une architecture moderne de 24 milliards de paramètres, finetunée par l’équipe R&D de LightOn pour s’aligner au mieux avec la pipeline de retrieval et d’orchestration. Résultat : un comportement plus stable, des réponses plus fiables sur les données métier et une intégration fluide dans les workflows de recherche, de retrieval et d’agents d’entreprise. Comparé à Alfred 4.2, Alfred-sv5 corrige un phénomène qui pouvait occasionnellement provoquer des instabilités ou des comportements de génération en boucle. Le modèle offre désormais une stabilité nettement renforcée, en particulier sur les requêtes longues, complexes ou très structurées.

Éléments techniques

Dans l’esprit de LightOn, le LLM reste un composant d’une stack RAG et agentique plus large. La vraie valeur se joue dans le retrieval et l’orchestration. Pour les équipes qui souhaitent néanmoins quelques repères techniques, Alfred-sv5 propose :
  • une fenêtre de contexte jusqu’à 32 768 tokens permettant de traiter des prompts riches et multi-documents tout en gardant la latence sous contrôle,
  • des capacités renforcées de suivi des instructions et une réduction des sorties répétitives ou en boucle,
  • un support robuste du function calling et des sorties structurées, facilitant l’intégration avec des outils, agents et systèmes métiers.
Ces capacités viennent compléter, sans le remplacer, le travail réalisé en amont : indexation, embeddings, retrieval, filtrage et composition de contexte.

Frontier vs Sovereign : deux lignes de modèles complémentaires

Alfred-sv5 s’adresse aux organisations qui exigent spécifiquement un LLM d’origine européenne, même lorsque d’autres modèles open source permettent déjà d’atteindre un niveau de confidentialité complet. Pour répondre de façon transparente à ces attentes parfois très différentes, l’offre LightOn se structure autour de deux familles de modèles complémentaires :
  • Alfred-ft5 : pour les organisations qui privilégient avant tout la performance brute, le raisonnement et l’usage intensif des outils, indépendamment de l’origine du modèle.
  • Alfred-sv5 : pour les équipes qui doivent satisfaire des exigences de souveraineté ou d’origine européenne du LLM, quitte à ne pas choisir le modèle global intrinsèquement le plus performant.
Ces deux familles bénéficient de la même expertise R&D LightOn et des mêmes pipelines d’évaluation. Cette séparation permet aux organisations de choisir une ligne de modèles alignée avec leurs priorités de risque, de conformité et de performance, tout en conservant inchangée le reste de leur stack RAG et agentique.

Un composant d’un système RAG, pas une fin en soi

Dans une architecture RAG aboutie, le LLM n’est qu’un maillon parmi d’autres : indexation, embeddings, retrieval, contrôles, agents, post-traitements…
Alfred-sv5 s’inscrit comme un modèle cœur souverain au sein de cette chaîne, sans prétendre à lui seul faire la performance du système.
C’est précisément cette combinaison pipeline RAG bien conçu + modèle finetuné pour les usages en entreprise + options souveraineté/performance qui permet aux organisations de concilier exigences politiques, contraintes réglementaires et impact concret sur le terrain.