Présentation et contexte
Après plusieurs semaines d’attente, l’EPFZ et l’EPFL ont dévoilé Apertus, un grand modèle de langage destiné à des usages nationaux. Swissinfo a évalué le système en dialoguant avec les développeurs et des spécialistes IA afin de mettre en lumière les points forts et les limites observés.
Destinataire et usages potentiels
Apertus est présenté comme un modèle d’IA de base conçu pour s’adapter à diverses applications et services, notamment dans l’économie et la recherche. Il pourrait être utilisé pour filtrer des informations essentielles à partir de données multilingues, par exemple dans le commerce électronique ou le secteur médical. Le responsable technique, Imanol Schlag, précise que le grand public n’est pas la cible principale du projet.
Apertus et les grands LLM: comparaison et enjeux
Apertus face aux modèles les plus répandus
À ce stade, Apertus est présenté comme l’un des LLM Open Source les plus puissants, mais il n’est pas dans la même catégorie que les modèles brevetés tels que GPT-4, Gemini ou Claude, qui reposent sur des ensembles de données beaucoup plus vastes et une puissance de calcul considérable. Un professeur interrogé souligne que comparer Apertus aux IA des grandes entreprises revient à opposer un petit acteur local à un grand producteur industriel.
Avantages pour les PME et qualité des données
Les modèles plus petits peuvent offrir une productivité adaptée et une consommation d’énergie plus modeste, ce qui les rend attractifs pour les PME et les organisations publiques. Les chercheurs insistent sur le fait que la qualité des données peut primer sur leur quantité.
Éthique, transparence et cadre juridique
Apertus est conçu pour répondre aux critères clés de l’European AI Act, en privilégiant la transparence, la traçabilité des données et le respect de la propriété intellectuelle et de la vie privée. Les bases utilisées pour l’entraînement proviennent de sources publiques et légales et n’incluent pas de contenus protégés sans autorisation.
En contraste, certains géants de la tech exploitent des données de milliards d’utilisateurs sans consentement pour leurs propres modèles. Dans ce contexte, Apertus se présente comme une option attrayante pour les entreprises, les instituts de recherche et les organismes publics qui souhaitent développer des applications IA de manière éthique et conforme. Le responsable technique rappelle qu’il est possible d’entraîner une IA de manière responsable sans porter atteinte à la propriété intellectuelle d’autrui.
Capacités linguistiques et limites
Apertus est annoncé avec une couverture linguistique étendue, revendiquant plus de 1800 langues, y compris des langues minoritaires et dialectes peu représentés par d’autres LLM, comme le romanche et le suisse allemand. Cependant, comprendre une langue ne garantit pas une prononciation ou une traduction parfaites. Des erreurs surviennent dans certaines langues moins répandues, et des formulations en italien peuvent manquer de précision. Le directeur du développement reconnaît des marges d’amélioration dans les capacités conversationnelles, tout en précisant que le modèle excelle déjà sur certaines tâches, notamment certaines traductions allemand–romanche selon le dernier rapport technique.
Portée géographique et ambitions futures
Bien que développé en Suisse, Apertus ne se limite pas au seul territoire helvète. La majeure partie des données d’entraînement est internationale, avec des particularités pour le romanche et le suisse allemand, et l’intégration d’une charte de valeurs suisses qui fixe des principes tels que neutralité et diversité linguistique. Les responsables estiment que, hors ce cadre, le modèle peut être utile à d’autres pays et envisagent une expansion européenne et mondiale.
Actualisations et contraintes techniques
Contrairement à une idée répandue, aucun LLM ne peut se mettre à jour en temps réel simplement parce qu’il est connecté à Internet. Après l’entraînement, le modèle demeure statique et les corrections nécessitent un nouvel entraînement, processus coûteux qui limite les mises à jour fréquentes. Pour le prochain cycle d’entraînement, Apertus bénéficiera d’un financement fédéral de 20 millions de francs et du supercalculateur Swiss Alps, alimenté exclusivement par l’énergie hydraulique. À terme, des ressources supplémentaires seront nécessaires afin de soutenir la souveraineté numérique du pays.