JavaRush /Blog Java /Random-FR /Deep Learning, intelligence artificielle et machine learn...

Deep Learning, intelligence artificielle et machine learning pour les nuls : expliqué avec un exemple

Publié dans le groupe Random-FR
Voulez-vous briller de votre intellect en compagnie de collègues ou surprendre vos amis lors d'une conversation sur des sujets techniques d'actualité ? Mentionnez « Intelligence artificielle » ou « Machine Learning » dans une conversation et le tour est joué. Deep Learning, intelligence artificielle et machine learning pour les nuls : expliqué avec un exemple - 1Le terme « Intelligence Artificielle » est désormais largement utilisé. Les programmeurs veulent apprendre l'IA. Les dirigeants souhaitent mettre en œuvre l’IA dans leurs services. Mais dans la pratique, même les professionnels ne comprennent pas toujours ce qu’est « l’IA ». Cet article a pour but de vous aider à comprendre les termes « intelligence artificielle » et « apprentissage automatique ». Vous apprendrez également comment fonctionne le Deep Learning, le type d’apprentissage automatique le plus populaire. Et, ce qui est important, ces instructions sont rédigées dans un langage assez accessible. Les mathématiques ici ne seront pas trop difficiles à comprendre.

Les bases

La première étape pour comprendre ce qu’est le Deep Learning est de comprendre la différence entre les termes clés.
Deep Learning, intelligence artificielle et machine learning pour les nuls : expliqué avec un exemple - 2
Photo : Datanami

Intelligence artificielle vs apprentissage automatique

L'intelligence artificielle (IA ou AI agnl.) est une tentative de copier le processus de pensée humaine par un ordinateur. Lorsque les recherches dans le domaine de l'intelligence artificielle commençaient tout juste, les scientifiques essayaient de copier le comportement de l'intelligence humaine strictement sous certaines conditions, c'est-à-dire de l'affiner pour résoudre certains problèmes. Par exemple, pour que la machine puisse jouer à des jeux. Ils ont établi un certain nombre de règles que la machine informatique devait suivre. L’ordinateur disposait d’une liste d’actions possibles et prenait des décisions basées sur les règles et restrictions définies lors de la phase de conception.
L'apprentissage automatique (ML ou ML en anglais) désigne la capacité d'une machine à apprendre en traitant de grands ensembles d'informations au lieu de règles clairement définies.
ML permet aux ordinateurs d’apprendre par eux-mêmes. Ce type d’apprentissage tire parti de la technologie informatique moderne, qui permet de traiter facilement d’énormes quantités de données.

Apprentissage supervisé vs apprentissage non supervisé

L'apprentissage supervisé utilise des ensembles de données étiquetés composés d'entrées et de résultats attendus. Lorsque vous entraînez l’intelligence artificielle à l’aide de l’apprentissage supervisé, vous fournissez des données en entrée et spécifiez quelle doit être la sortie. Si le résultat produit par l’IA est différent de celui attendu, alors l’IA doit corriger ses calculs. Le processus est répété plusieurs fois sur le tableau de données tant que l'IA commet des erreurs. Un exemple d’apprentissage supervisé serait l’intelligence artificielle qui prédit la météo. Il apprend à prédire la météo à l'aide de données historiques. Les données d’entrée sont la pression, l’humidité et la vitesse du vent, et nous devrions donc obtenir la température. L’apprentissage non supervisé est une tâche qui consiste à entraîner l’IA à l’aide de données non structurées. Lorsque vous entraînez l’intelligence artificielle à l’aide d’un apprentissage non supervisé, vous permettez à l’IA d’effectuer des classifications logiques des données. Un exemple d’intelligence artificielle utilisant l’apprentissage automatique non supervisé est un robot prédicteur du comportement des clients dans une boutique en ligne. Il apprend sans utiliser d’entrées et de sorties pré-connues. Au lieu de cela, il doit classer lui-même les données d’entrée. L'algorithme doit identifier et vous indiquer quel type d'utilisateurs préfèrent quels produits.

Comment fonctionne l'apprentissage automatique

Le Deep Learning est donc l’une des approches de l’apprentissage automatique. Il vous permet de prédire les résultats à partir de données d'entrée données. Pour entraîner l’IA, vous pouvez utiliser les deux options ci-dessus : apprentissage supervisé et non supervisé. Nous comprendrons le fonctionnement du Deep Learning à l’aide d’un exemple clair : disons que nous devons développer un service de prévision des prix des voyages en avion. Nous entraînerons notre algorithme en utilisant une méthode supervisée. Nous souhaitons que notre service de prévision des prix des voyages aériens prédise le prix sur la base des données d'entrée suivantes (nous ne prenons pas en compte le vol aller-retour pour faciliter la présentation) :
  • Aéroport de départ;
  • Aéroport d'arrivée;
  • date de départ prévue ;
  • Compagnie aérienne.
Réseaux de neurones Jetons un coup d'œil au cerveau de l'intelligence artificielle. Comme dans le cas des êtres vivants biologiques, notre prédicteur a des neurones dans sa « tête ». Sur la photo, ils sont présentés sous forme de cercles. Les neurones sont connectés les uns aux autres.
Deep Learning, intelligence artificielle et machine learning pour les nuls : expliqué avec un exemple - 3
Dans l’image, les neurones sont combinés en trois groupes de couches :
  • couche d'entrée ;
  • couche cachée 1 (couche cachée 1) et couche cachée 2 (couche cachée 2) ;
  • couche de sortie.
Certaines données entrent dans la couche d'entrée. Dans notre cas, nous avons quatre neurones sur la couche d'entrée : aéroport de départ, aéroport d'arrivée, date de départ, compagnie aérienne. La couche d'entrée transmet les données à la première couche cachée. Les couches cachées effectuent des calculs mathématiques basés sur les données d'entrée reçues. L’un des principaux problèmes lors de la construction de réseaux de neurones est le choix du nombre de couches cachées et du nombre de neurones dans chaque couche.
Le mot Deep dans l’expression Deep Learning indique la présence de plus d’une couche cachée.
La couche de sortie nous renvoie les informations résultantes. Dans notre cas, le prix attendu du vol.
Deep Learning, intelligence artificielle et machine learning pour les nuls : expliqué avec un exemple - 4
Jusqu’à présent, nous avons raté le plus intéressant : comment est calculé exactement le prix attendu ? C’est là que commence la magie du Deep Learning. Chaque connexion entre neurones se voit attribuer un certain poids (coefficient). Ce poids détermine l'importance de la valeur d'entrée. Les poids initiaux sont fixés de manière aléatoire. Lors de la prévision du coût d’un voyage en avion, la date de départ affecte le plus le prix. Les connexions du neurone « date de départ » ont donc plus de poids.
Deep Learning, intelligence artificielle et machine learning pour les nuls : expliqué avec un exemple - 5
Chaque neurone est associé à une fonction d’activation. Il est difficile de comprendre ce qu'est cette fonction sans connaissances mathématiques. Faisons donc quelques simplifications : le but de la fonction d'activation est de « standardiser » la sortie du neurone. Une fois que l’ensemble de données a traversé toutes les couches du réseau neuronal, il renvoie le résultat via la couche de sortie. Jusqu’à présent, tout est clair, n’est-ce pas ?

Formation aux réseaux de neurones

Entraîner un réseau de neurones est la partie la plus difficile du Deep Learning ! Pourquoi? Parce que vous avez besoin d’une grande quantité de données. Parce que vous avez besoin de plus de puissance de calcul. Pour notre projet, nous devons trouver des données historiques sur les tarifs aériens. De plus, pour toutes les combinaisons possibles d’aéroports de départ et de destination, de dates de départ et de différentes compagnies aériennes. Nous avons besoin d’une très grande quantité de données sur les prix des billets. Nous devons transmettre les données d'entrée de notre ensemble aux entrées de notre réseau neuronal et vérifier si elles correspondent aux résultats dont nous disposons déjà. Si les résultats obtenus par l’intelligence artificielle diffèrent de ceux attendus, cela signifie qu’elle ne s’est pas encore suffisamment entraînée. Une fois que nous avons parcouru la totalité des données via notre réseau neuronal, nous pouvons créer une fonction qui indiquera à quel point les résultats de l'IA sont différents des résultats réels de notre ensemble de données. Une telle fonction est appelée fonction de coût . Dans le cas idéal, auquel nous aspirons de toutes nos forces, les valeurs de notre fonction de coût sont égales à zéro. Cela signifie que les résultats de coût sélectionnés par le réseau neuronal ne diffèrent pas du coût réel des billets dans notre ensemble de données.

Comment réduire la valeur de la fonction de coût ?

Nous modifions les poids des connexions entre les neurones. Cela peut être fait de manière aléatoire, mais cette approche n'est pas efficace. Au lieu de cela, nous utiliserons une méthode appelée Gradient Descent .
La descente de gradient est une méthode qui permet de trouver le minimum d'une fonction. Dans notre cas, nous recherchons le minimum de la fonction de coût.
Cet algorithme fonctionne en augmentant progressivement les poids après chaque nouvelle itération de traitement de notre ensemble de données. En calculant la dérivée (ou gradient) de la fonction de coût pour certains ensembles de poids, nous pouvons voir dans quelle direction se situe le minimum.
Deep Learning, intelligence artificielle et machine learning pour les nuls : expliqué avec un exemple - 6
Dans l'image : Poids initial - poids initial, Coût global minimum - minimum global de la fonction de coût. Pour minimiser la fonction de coût, nous devons effectuer plusieurs fois des calculs sur notre ensemble de données. C'est pourquoi vous avez besoin de beaucoup de puissance de calcul. Les poids sont mis à jour automatiquement à l'aide de la méthode de descente de gradient. C'est la magie du Deep Learning ! Une fois que nous avons formé notre service de prévision IA des prix des vols, nous pouvons l’utiliser en toute sécurité pour prédire les prix réels.

Résumons-le...

  • L'apprentissage profond utilise les réseaux de neurones pour simuler l'intelligence.
  • Il existe trois types de neurones dans un réseau de neurones : la couche d'entrée, les couches cachées et la couche de sortie.
  • Chaque connexion entre neurones a son propre poids, indiquant l’importance de cette entrée.
  • Les neurones utilisent une fonction d'activation pour « standardiser » la sortie du neurone.
  • Pour entraîner un réseau de neurones, vous avez besoin d’une grande quantité de données.
  • Si nous traitons un tableau de données à l'aide d'un réseau neuronal et comparons les données de sortie avec les données réelles, nous obtiendrons une fonction de coût qui montre à quel point l'IA se trompe.
  • Après chaque traitement de données, les poids entre neurones sont ajustés à l'aide de la méthode de descente de gradient pour obtenir une réduction de la fonction de coût.
Lien vers l'original
Commentaires
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION