Comprendre les modèles de language
Les modèles de langage de grande taille ou Large Language Models (LLM) sont une des technologies au coeur de la révolution de l'intelligence artificielle.Ce livre traite de manière concise et complète les principes fondamentaux de la modélisation lingusitique des grands modeles de language actuels. Les développeurs, les data scientists et les spécialistes du machine learning y acquéront la compréhension des concepts théoriques et des applications pratiques des LLM.Il permet en particulier de :maîtriser les fondements mathématiques du machine learning et des réseaux neuronaux ;construire et entraîner trois architectures de modèles de langage en Python ;comprendre les modèlesTransformer et d'en coder à partir de zéro dans PyTorch (principale biliothèque open source) ;travailler avec des LLM, y compris le réglage fin des instructions (finetuning) et l'ingénierie des pompts.Grâce à un style résolument accessible et de nombreux exemples de code en Python exécutables sur Google Collab, cet ouvrrage met ces concepts complexes à la portée des chercheurs, développeurs et professionnels souhaitant comprendre les mécanismes avancés du machine learning et du traitement du langage.Des ressources supplémentaires pour les sujets avancés sont disponible via le wiki du livre.