JavaRush /Java Blog /Random-TL /Deep Learning, artificial intelligence at machine learnin...

Deep Learning, artificial intelligence at machine learning para sa mga dummies: ipinaliwanag nang may halimbawa

Nai-publish sa grupo
Nais mo bang magpakinang sa iyong talino sa kumpanya ng mga kasamahan o humanga ang iyong mga kaibigan sa isang pag-uusap sa kasalukuyang mga teknikal na paksa? Banggitin ang "Artificial Intelligence" o "Machine Learning" sa isang pag-uusap at tapos ka na. Deep Learning, искусственный интеллект и машинное обучение для чайников: объяснение на примере  - 1Ang terminong "Artificial Intelligence" ay naririnig na ngayon. Gustong matutunan ng mga programmer ang AI. Nais ng mga pinuno na ipatupad ang AI sa kanilang mga serbisyo. Ngunit sa pagsasagawa, kahit na ang mga propesyonal ay hindi palaging nauunawaan kung ano ang "AI". Nilalayon ng artikulong ito na tulungan kang maunawaan ang mga terminong "artificial intelligence" at "machine learning". Malalaman mo rin kung paano gumagana ang Deep Learning, ang pinakasikat na uri ng machine learning. At, ang mahalaga, ang mga tagubiling ito ay nakasulat sa medyo naa-access na wika. Ang matematika dito ay hindi masyadong mahirap intindihin.

Mga pangunahing kaalaman

Ang unang hakbang sa pag-unawa kung ano ang Deep Learning ay upang maunawaan ang pagkakaiba sa pagitan ng mga pangunahing termino.
Deep Learning, искусственный интеллект и машинное обучение для чайников: объяснение на примере  - 2
Larawan: Datanami

Artificial Intelligence vs Machine Learning

Ang artificial intelligence (AI o AI agnl.) ay isang pagtatangka na kopyahin ang proseso ng pag-iisip ng tao sa pamamagitan ng isang computer. Noong nagsisimula pa lamang ang pananaliksik sa larangan ng Artipisyal na Katalinuhan, sinubukan ng mga siyentipiko na kopyahin ang pag-uugali ng katalinuhan ng tao nang mahigpit sa ilalim ng ilang mga kundisyon, iyon ay, upang patalasin ito upang malutas ang ilang mga problema. Halimbawa, para makapaglaro ang makina. Nagtatag sila ng ilang panuntunan na kailangang sundin ng computing machine. Ang computer ay may listahan ng mga posibleng aksyon, at gumawa ito ng mga desisyon batay sa mga panuntunan at paghihigpit na itinakda sa yugto ng disenyo.
Ang machine learning (ML o ML sa English) ay nangangahulugang ang kakayahan ng isang machine na matuto sa pamamagitan ng pagproseso ng malalaking hanay ng impormasyon sa halip na malinaw na tinukoy na mga panuntunan.
Pinapayagan ng ML ang mga computer na matuto nang mag-isa. Sinasamantala ng ganitong uri ng pag-aaral ang makabagong teknolohiya sa pag-compute, na madaling makapagproseso ng malaking halaga ng data.

Pinangangasiwaang pag-aaral kumpara sa Hindi pinangangasiwaang pag-aaral

Контролируемое обучение использует маркированные наборы данных, которые состоят из входных данных и ожидаемых результатов. Когда вы обучаете искусственный интеллект с помощью контролируемого обучения, вы подаете на вход данные и указываете Howим должен быть результат. Если результат, который выдал ИИ отличается от ожидаемого, то ИИ должен исправить свои вычисления. Процесс повторяется многократно над массивом данных, до тех пор, пока ИИ допускает ошибки. Примером контролируемого обучения может служить Искусственный интеллект, предсказывающий погоду. Он обучается предсказывать погоду, используя исторические данные. Входными данными служат давление, влажность и speed ветра, а в результате мы должны получить температуру. Неконтролируемое обучение — это задача которая состоит в обучении ИИ с используя не структурированные данные. Когда вы тренируете искусственный интеллект с помощью неконтролируемого обучения, вы позволяете ИИ осуществить логическую классификацию данных. Пример искусственного интеллекта, использующего неконтролируемое машинное обучение — робот-предсказатель поведения клиентов интернет магазина. Он обучается, не используя заранее известные входные и выходные данные. Вместо этого он должен самостоятельно классифицировать входные данные. Алгоритм должен определить и сообщить вам, Howой тип пользователей предпочитает Howие продукты.

Как работает машинное обучение

Итак, Deep Learning — это один из подходов к машинному обучению. Он позволяет предсказывать результаты по заданным входным данным. Для тренировки ИИ можно использовать оба вышеописанных варианта: контролируемое и неконтролируемое обучение. Мы будем разбираться с тем How работает Deep Learning на наглядном примере: допустим, нам нужно разработать сервис предсказания цен на авиаперелеты. Обучать наш алгоритм мы будем контролируемым методом. Мы хотим, чтобы наш сервис по предсказанию цен на авиаперелет предсказывал цену по следующим входным данным (обратный перелет мы не учитываем для простоты подачи материала):
  • аэропорт отправления;
  • аэропорт прибытия;
  • планируемая дата вылета;
  • авиакомпания.
Нейронные сети Давайте заглянем в мозг искусственного интеллекта. Как и в случае биологических живых существ, у нашего предсказателя в «голове» есть нейроны. На картинке они представлены в виде кругов. Нейроны соединены между собой.
Deep Learning, искусственный интеллект и машинное обучение для чайников: объяснение на примере  - 3
На изображении нейроны объединены в три группы слоев:
  • входной слой (input layer);
  • скрытый слой 1 (hidden layer 1) и скрытый слой 2 (hidden layer 2);
  • выходной слой (output layer).
На входной слой заходят некие данные. В нашем случаи мы имеем четыре нейрона на входном слое: аэропорт отправления, аэропорт прибытия, дата вылета, авиакомпания. Входной слой передает данные на первый скрытый слой. Скрытые слои выполняют математические вычисления, оперируя полученными входными данными. Одним из основных вопросов при построении нейросетей является выбор количества скрытых слоев и количества нейронов в каждом слое.
Слово Deep (глубокий) в словосочетании Deep Learning How раз и указывает на наличие более чем одного скрытого слоя.
Выходной слой возвращает нам результирующую информацию. В нашем случае — ожидаемую цену перелёта.
Deep Learning, искусственный интеллект и машинное обучение для чайников: объяснение на примере  - 4
Самое интересное мы пока пропустor: How именно происходит вычисление ожидаемой цены? Вот здесь и начинается магия Deep Learning. Каждому соединению между нейронами присваивается определенный вес (коэффициент). Этот вес определяет важность входного значения. Начальные веса устанавливаются случайным образом. Когда предсказываешь стоимость авиаперелета, дата отправления влияет на цену больше всего. Поэтому соединения нейрона «дата отправления» имеют бОльший вес.
Deep Learning, искусственный интеллект и машинное обучение для чайников: объяснение на примере  - 5
К каждому нейрону привязана функция активации. What представляет собой эта функция без математических знаний понять трудновато. Поэтому давайте пойдём на некоторое упрощение: смысл функции активации в том, чтобы «стандартизировать» выходные данные от нейрона. После того, How набор данных прошел через все слои нейросети, она возвращает результат через выходной слой. Пока что все понятно, правда?

Обучение нейросети

Обучение нейросети — самая сложная часть Deep Learning! Почему? Потому, что вам нужен большой объем данных. Потому, что вам нужны большие вычислительные мощности. Для нашего проекта нам необходимо найти исторические данные стоимости авиабилетов. Причем для всевозможных комбинаций аэропортов вылета и назначения, дат отправления и разных авиалиний. Нам нужен очень большой объем данных с ценами на билеты. Мы должны подавать на входы нашей нейросети входные данные из нашего набора и проверять, совпадают ли они с теми результатами, которые у нас уже есть. Если получаемые искусственным интеллектом результаты отличаются от ожидаемых, это значит, что он ещё недостаточно натренировался. После того, How мы пропустor через нашу нейросеть весь объем данных, мы можем построить функцию, которая укажет, насколько результаты ИИ отличаются от фактически имеющихся результатов в нашем наборе данных. Такая функция называется функцией стоимости. В идеальном случае, к которому мы всеми силами стремимся, значения нашей функции стоимости равны нулю. Это значит, что результаты стоимости, подобранные нейросетью, не отличаются от реальной стоимости билетов в нашем наборе данных.

Как мы можем уменьшить meaning функции стоимости?

Мы изменяем веса соединений между нейронами. Это можно сделать случайным образом, однако такой подход не эффективен. Вместо этого мы будем использовать метод, который называется Градиентный спуск.
Градиентный спуск — это метод который позволяет нам найти минимум функции. В нашем случаи мы ищем минимум функции стоимости.
Этот алгоритм работает путем постепенного увеличения весов после каждой новой итерации обработки нашего массива данных. Вычисляя производную (or градиент) функции стоимости для определенных наборов весов, мы можем увидеть в Howом направлении находится минимум.
Deep Learning, искусственный интеллект и машинное обучение для чайников: объяснение на примере  - 6
На картинке: Initial weight — изначальный вес, Global cost minimum — глобальный минимум стоимостной функции. Для минимизации функции стоимости мы должны провести вычисления над нашим массивом данных много раз. Вот почему вам нужно много вычислительных мощностей. Обновление весов при помощи метода градиентного спуска происходит автоматически. Вот она — магия Deep Learning! После того, How мы обучor наш ИИ-сервис предсказания цен на авиаперелеты, мы можем смело использовать его для предсказания цен в реальности.

Подведем итоги…

  • Deep learning использует нейросети для имитации интеллекта.
  • Существует три типа нейронов в нейросети: входной слой, скрытые слои, выходной слой.
  • Каждое соединение между нейронами имеет свой вес, указывающий на важность этого входа.
  • Нейроны применяют функцию активации для «стандартизации» данных на выходе с нейрона.
  • Для обучения нейросети вам необходим большой объем данных.
  • Если обработать массив данных с помощью нейросети, и сравнить выходные данные с фактически имеющимися, мы получим функцию стоимости, которая показывает насколько ИИ ошибается.
  • После каждой обработки данных, веса между нейронами корректируются с использованием метода градиентного спуска, для достижения уменьшения функции стоимости.
Ссылка на оригинал
Mga komento
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION