JavaRush /Java-Blog /Random-DE /Deep Learning, künstliche Intelligenz und maschinelles Le...

Deep Learning, künstliche Intelligenz und maschinelles Lernen für Dummies: erklärt anhand eines Beispiels

Veröffentlicht in der Gruppe Random-DE
Möchten Sie im Kreise Ihrer Kollegen mit Ihrem Intellekt glänzen oder Ihre Freunde bei einem Gespräch über aktuelle Technikthemen in Erstaunen versetzen? Erwähnen Sie in einem Gespräch „Künstliche Intelligenz“ oder „Maschinelles Lernen“ und schon sind Sie fertig. Deep Learning, künstliche Intelligenz und maschinelles Lernen für Dummies: erklärt am Beispiel - 1Der Begriff „Künstliche Intelligenz“ ist mittlerweile weit verbreitet. Programmierer wollen KI lernen. Führungskräfte möchten KI in ihren Diensten implementieren. Doch in der Praxis verstehen selbst Profis nicht immer, was „KI“ ist. Dieser Artikel soll Ihnen helfen, die Begriffe „künstliche Intelligenz“ und „maschinelles Lernen“ zu verstehen. Außerdem erfahren Sie, wie Deep Learning, die beliebteste Art des maschinellen Lernens, funktioniert. Und was wichtig ist: Diese Anweisungen sind in einer leicht verständlichen Sprache verfasst. Die Mathematik hier wird nicht allzu schwer zu verstehen sein.

Grundlagen

Der erste Schritt zum Verständnis von Deep Learning besteht darin, den Unterschied zwischen den Schlüsselbegriffen zu verstehen.
Deep Learning, künstliche Intelligenz und maschinelles Lernen für Dummies: erklärt am Beispiel - 2
Bild: Datanami

Künstliche Intelligenz vs. maschinelles Lernen

Künstliche Intelligenz (KI oder AI agnl.) ist ein Versuch, den menschlichen Denkprozess durch einen Computer zu kopieren. Als die Forschung auf dem Gebiet der Künstlichen Intelligenz gerade erst begann, versuchten Wissenschaftler, das Verhalten der menschlichen Intelligenz unter bestimmten Bedingungen streng zu kopieren, also zur Lösung bestimmter Probleme zu schärfen. Zum Beispiel, damit der Automat Spiele spielen kann. Sie legten eine Reihe von Regeln fest, denen die Rechenmaschine folgen musste. Der Computer verfügte über eine Liste möglicher Aktionen und traf Entscheidungen auf der Grundlage der während der Entwurfsphase festgelegten Regeln und Einschränkungen.
Unter maschinellem Lernen (ML oder ML auf Englisch) versteht man die Fähigkeit einer Maschine, durch die Verarbeitung großer Informationsmengen anstelle klar definierter Regeln zu lernen.
ML ermöglicht es Computern, selbstständig zu lernen. Diese Art des Lernens nutzt moderne Computertechnologie, die problemlos große Datenmengen verarbeiten kann.

Überwachtes Lernen vs. unbeaufsichtigtes Lernen

Beim überwachten Lernen werden gekennzeichnete Datensätze verwendet, die aus Eingaben und erwarteten Ausgaben bestehen. Wenn Sie künstliche Intelligenz mithilfe von überwachtem Lernen trainieren, stellen Sie Daten als Eingabe bereit und legen fest, wie die Ausgabe aussehen soll. Wenn das Ergebnis, das die KI liefert, von dem erwarteten abweicht, muss die KI ihre Berechnungen korrigieren. Der Vorgang wird über das Datenarray viele Male wiederholt, solange die KI Fehler macht. Ein Beispiel für überwachtes Lernen wäre künstliche Intelligenz, die das Wetter vorhersagt. Es lernt, das Wetter anhand historischer Daten vorherzusagen. Die Eingabedaten sind Druck, Luftfeuchtigkeit und Windgeschwindigkeit, und als Ergebnis sollten wir die Temperatur erhalten. Unüberwachtes Lernen ist eine Aufgabe, die darin besteht, KI mithilfe unstrukturierter Daten zu trainieren. Wenn Sie künstliche Intelligenz durch unüberwachtes Lernen trainieren, ermöglichen Sie der KI, logische Klassifizierungen von Daten vorzunehmen. Ein Beispiel für künstliche Intelligenz, die unbeaufsichtigtes maschinelles Lernen nutzt, ist ein Roboter, der das Kundenverhalten in einem Online-Shop vorhersagt. Es lernt, ohne vorher bekannte Ein- und Ausgänge zu verwenden. Stattdessen muss es die Eingabedaten selbst klassifizieren. Der Algorithmus sollte erkennen und Ihnen mitteilen, welche Art von Benutzern welche Produkte bevorzugen.

Wie maschinelles Lernen funktioniert

Deep Learning ist also einer der Ansätze des maschinellen Lernens. Es ermöglicht Ihnen, Ergebnisse aus gegebenen Eingabedaten vorherzusagen. Um KI zu trainieren, können Sie beide oben genannten Optionen nutzen: überwachtes und unüberwachtes Lernen. Wir werden die Funktionsweise von Deep Learning anhand eines anschaulichen Beispiels verstehen: Nehmen wir an, wir müssen einen Dienst zur Vorhersage von Preisen für Flugreisen entwickeln. Wir werden unseren Algorithmus mithilfe einer überwachten Methode trainieren. Wir möchten, dass unser Service zur Preisvorhersage für Flugreisen den Preis anhand der folgenden Eingabedaten vorhersagt (aus Gründen der einfacheren Darstellung berücksichtigen wir den Rückflug nicht):
  • Abflughafen;
  • Ankunftsflughafen;
  • geplantes Abreisedatum;
  • Fluggesellschaft.
Neuronale Netze Werfen wir einen Blick in das Gehirn der künstlichen Intelligenz. Wie bei biologischen Lebewesen hat unser Prädiktor Neuronen in seinem „Kopf“. Im Bild sind sie in Form von Kreisen dargestellt. Neuronen sind miteinander verbunden.
Deep Learning, künstliche Intelligenz und maschinelles Lernen für Dummies: erklärt am Beispiel - 3
Im Bild sind Neuronen in drei Schichtgruppen zusammengefasst:
  • Eingabeschicht;
  • verborgene Schicht 1 (verborgene Schicht 1) und verborgene Schicht 2 (verborgene Schicht 2);
  • Ausgabeschicht.
Einige Daten gelangen in die Eingabeebene. In unserem Fall haben wir vier Neuronen auf der Eingabeschicht: Abflughafen, Ankunftsflughafen, Abflugdatum, Fluggesellschaft. Die Eingabeebene übergibt Daten an die erste verborgene Ebene. Verborgene Schichten führen mathematische Berechnungen basierend auf den empfangenen Eingabedaten durch. Eines der Hauptprobleme beim Aufbau neuronaler Netze ist die Wahl der Anzahl der verborgenen Schichten und der Anzahl der Neuronen in jeder Schicht.
Das Wort „Deep“ im Begriff „Deep Learning“ weist auf das Vorhandensein von mehr als einer verborgenen Ebene hin.
Die Ausgabeschicht gibt die resultierenden Informationen an uns zurück. In unserem Fall der erwartete Preis des Fluges.
Deep Learning, künstliche Intelligenz und maschinelles Lernen für Dummies: erklärt am Beispiel - 4
Das Interessanteste haben wir bisher übersehen: Wie genau berechnet sich der voraussichtliche Preis? Hier beginnt die Magie des Deep Learning. Jeder Verbindung zwischen Neuronen wird ein bestimmtes Gewicht (Koeffizient) zugewiesen. Dieses Gewicht bestimmt die Wichtigkeit des Eingabewerts. Die Anfangsgewichte werden zufällig festgelegt. Bei der Vorhersage der Flugkosten hat das Abflugdatum den größten Einfluss auf den Preis. Daher haben die Verbindungen des Neurons „Abreisedatum“ mehr Gewicht.
Deep Learning, künstliche Intelligenz und maschinelles Lernen für Dummies: erklärt anhand eines Beispiels - 5
Mit jedem Neuron ist eine Aktivierungsfunktion verbunden. Ohne mathematische Kenntnisse ist es schwierig zu verstehen, was diese Funktion ist. Nehmen wir also eine Vereinfachung: Der Zweck der Aktivierungsfunktion besteht darin, die Ausgabe des Neurons zu „standardisieren“. Nachdem der Datensatz alle Schichten des neuronalen Netzwerks durchlaufen hat, gibt er das Ergebnis über die Ausgabeschicht zurück. Bisher ist alles klar, oder?

Training neuronaler Netze

Das Training eines neuronalen Netzwerks ist der schwierigste Teil des Deep Learning! Warum? Weil Sie eine große Datenmenge benötigen. Weil Sie mehr Rechenleistung benötigen. Für unser Projekt müssen wir historische Flugpreisdaten finden. Darüber hinaus für alle möglichen Kombinationen aus Abflug- und Zielflughafen, Abflugterminen und verschiedenen Fluggesellschaften. Wir benötigen sehr viele Daten zu Ticketpreisen. Wir müssen die Eingabedaten aus unserem Satz den Eingaben unseres neuronalen Netzwerks zuführen und prüfen, ob sie mit den Ergebnissen übereinstimmen, die wir bereits haben. Weichen die von der künstlichen Intelligenz erzielten Ergebnisse von den Erwartungen ab, bedeutet dies, dass sie noch nicht ausreichend trainiert hat. Sobald wir die gesamte Datenmenge durch unser neuronales Netzwerk laufen lassen, können wir eine Funktion erstellen, die angibt, wie unterschiedlich die Ergebnisse der KI von den tatsächlichen Ergebnissen in unserem Datensatz sind. Eine solche Funktion wird Kostenfunktion genannt . Im Idealfall, den wir mit aller Kraft anstreben, sind die Werte unserer Kostenfunktion gleich Null. Dies bedeutet, dass die vom neuronalen Netzwerk ausgewählten Kostenergebnisse nicht von den tatsächlichen Ticketkosten in unserem Datensatz abweichen.

Wie können wir den Wert der Kostenfunktion reduzieren?

Wir ändern die Gewichte der Verbindungen zwischen Neuronen. Dies kann wahllos erfolgen, dieser Ansatz ist jedoch nicht effizient. Stattdessen verwenden wir eine Methode namens Gradient Descent .
Der Gradientenabstieg ist eine Methode, mit der wir das Minimum einer Funktion ermitteln können. In unserem Fall suchen wir nach dem Minimum der Kostenfunktion.
Dieser Algorithmus funktioniert, indem er die Gewichte nach jeder neuen Iteration der Verarbeitung unseres Datensatzes schrittweise erhöht. Indem wir die Ableitung (oder den Gradienten) der Kostenfunktion für bestimmte Gewichtssätze berechnen, können wir sehen, in welcher Richtung das Minimum liegt.
Deep Learning, künstliche Intelligenz und maschinelles Lernen für Dummies: erklärt anhand eines Beispiels - 6
Im Bild: Anfangsgewicht – Anfangsgewicht, Globales Kostenminimum – globales Minimum der Kostenfunktion. Um die Kostenfunktion zu minimieren, müssen wir viele Male Berechnungen an unserem Datensatz durchführen. Deshalb benötigen Sie viel Rechenleistung. Die Gewichtungen werden mithilfe der Gradientenabstiegsmethode automatisch aktualisiert. Das ist die Magie des Deep Learning! Sobald wir unseren KI-Dienst zur Vorhersage von Flugpreisen trainiert haben, können wir ihn bedenkenlos nutzen, um Preise in der Realität vorherzusagen.

Fassen wir es zusammen...

  • Deep Learning nutzt neuronale Netze, um Intelligenz zu simulieren.
  • Es gibt drei Arten von Neuronen in einem neuronalen Netzwerk: Eingabeschicht, verborgene Schichten, Ausgabeschicht.
  • Jede Verbindung zwischen Neuronen hat ihr eigenes Gewicht, was die Wichtigkeit dieser Eingabe anzeigt.
  • Neuronen verwenden eine Aktivierungsfunktion, um die Ausgabe des Neurons zu „standardisieren“.
  • Um ein neuronales Netzwerk zu trainieren, benötigt man eine große Datenmenge.
  • Wenn wir ein Datenarray mithilfe eines neuronalen Netzwerks verarbeiten und die Ausgabedaten mit den tatsächlichen Daten vergleichen, erhalten wir eine Kostenfunktion, die zeigt, wie stark die KI falsch liegt.
  • Nach jeder Datenverarbeitung werden die Gewichte zwischen Neuronen mithilfe der Gradientenabstiegsmethode angepasst, um eine Reduzierung der Kostenfunktion zu erreichen.
Link zum Original
Kommentare
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION