LLaMA: Mark Zuckerberg dévoile le puissant nouveau modèle de langage étendu de Meta

Les multinationales et les start-ups se lancent dans une course au développement de produits dotés d’une IA avancée intégrée. Mark Zuckerberg, fondateur du fameux réseau social Facebook; a annoncé la mise à disposition imminente par Meta Platforms aux chercheurs d’un nouveau modèle de langage volumineux appelé LLaMA (Large Language Model Meta AI).

LLaMa-Smarktic-nouveau modèle de langage étendu de Meta

 

Ce modèle développé par l’équipe FAIR (Fundamental AI Research) de Meta; est destiné à aider les scientifiques et les ingénieurs à explorer les applications et les fonctions de l’IA, telles que les réponses aux questions et le résumé de documents.

La sortie de LLaMA survient alors que les firmes technologiques se lancent dans une course pour promouvoir les progrès des techniques d’IA; et intégrer la technologie dans leurs produits commerciaux. Comme le note CNBC, le lancement de Meta se distingue des modèles de ses concurrents; car il sera disponible dans une variété de dimensions, de 7 milliards de paramètres à 65 milliards de paramètres.

En outre, M. Zuckerberg a déclaré que la nouvelle technologie LLM de sa firme qui pourrait résoudre des problèmes mathématiques et mener des recherches scientifiques; sera mise à la disposition de la communauté des chercheurs. Il s’agit d’un changement par rapport aux modèles sous-jacents de LaMDA et ChatGPT de Google; qui ne sont pas accessibles au public.

Meta rejoint la course de l’AI avec son modèle LLaMA :

Meta rejoint une course de plus en plus intense pour dominer la technologie de l’IA; qui a commencé sérieusement en fin 2022 avec le ChatGPT d’OpenAI. En ce qui concerne Meta, le lancement de LLaMA représente également son engagement en faveur de la science ouverte; d’où le choix de publier le modèle de langage fondamental de pointe; tout en permettant aux chercheurs de disposer d’une ressource ouverte pour faire avancer leurs travaux. Meta estime que, contrairement aux modèles plus fins conçus à des objectifs spécifiques, le sien s’avérera polyvalent; avec de multiples cas d’utilisation.

Selon Meta, LLaMA est également différent. Il nécessite beaucoup moins de puissance de calcul que les offres précédentes et est entraîné dans 20 langues. Avec ses 13 milliards de paramètres, LLaMA devrait surpasser GPT-3, le modèle sur lequel ChatGPT est fondé. Meta a également attribué les performances de LLaMA à des données « plus claires »; et à des « améliorations structurelles » du modèle pour améliorer la stabilité de son fonctionnement.

Afin de préserver l’intégrité du modèle et d’éviter toute utilisation abusive; Meta diffusera son modèle sous une licence non commerciale axée sur les cas d’utilisation de la recherche.

Les chercheurs universitaires, le gouvernement; les institutions académiques et les laboratoires de recherche industriels obtiendront l’accès au modèle au cas par cas.

Le lancement de LLaMA par Meta pourrait constituer une évolution majeure des modèles de langage de l’intelligence artificielle. L’engagement du géant des médias sociaux en faveur de la science ouverte et l’autorisation donnée aux chercheurs d’étudier sous une licence non commerciale limiteront l’utilisation abusive ou inappropriée du modèle.

La polyvalence de LLaMA et son potentiel de résolution de problèmes donnent un aperçu des avantages potentiels de l’IA pour des milliards de personnes à plus grande échelle.