Avec des équations et sans code
Cet ouvrage présente le deep learning. À des fins de concision, et les codes sources étant aisément trouvés sur internet, on évitera d’inclure du code, tout en encourageant le lecteur à ne pas avoir peur?: les plateformes modernes (comme Pytorch, en Python) sont très aisées à manier, et on trouve facilement des “colab”, que l’on peut même, parfois, faire tourner à distance si on ne dispose pas d’une machine assez puissante. Grâce à ce choix éditorial, accompagné d’une formalisation en équations, on couvrira une grande partie du deep learning (en français “apprentissage profond”), sans être exagérément long. En particulier, tous les éléments permettant de comprendre les IA conversationnelles ou génératrices d’images sont inclus.Les prérequis sont essentiellement la compréhension du produit matrice / vecteur (le passage au tenseur est aisé) et de ce qu’est un gradient (ce qui devrait être simple pour qui connaît le concept de dérivée).Sommaire1 Avant-propos 2 Introduction3 Principes généraux : apprendre de grands modèles à partir de grandes données 4 Fonctions de perte 5 Architectures neuronales 6 Optimisation numérique 7 Éthique 8 Sujets supplémentaires sur l'apprentissage profond9 Conclusion: l’IA et nous 10 Acronymes et glossaire 11 Bibliographie 12 Table des matières détaillée