JavaRush /Blog Java /Random-VI /Học sâu, trí tuệ nhân tạo và học máy cho người mới bắt đầ...

Học sâu, trí tuệ nhân tạo và học máy cho người mới bắt đầu: giải thích bằng ví dụ

Xuất bản trong nhóm
Bạn muốn tỏa sáng trí tuệ của mình khi ở bên đồng nghiệp hay làm bạn bè ngạc nhiên trong một cuộc trò chuyện về các chủ đề kỹ thuật hiện tại? Đề cập đến “Trí tuệ nhân tạo” hoặc “Học máy” trong cuộc trò chuyện và bạn đã hoàn tất. Deep Learning, trí tuệ nhân tạo và machine learning cho người mới bắt đầu: giải thích bằng ví dụ - 1Thuật ngữ “Trí tuệ nhân tạo” hiện nay đã được nghe rộng rãi. Lập trình viên muốn học AI. Các nhà lãnh đạo muốn triển khai AI trong các dịch vụ của họ. Nhưng trên thực tế, ngay cả những người có chuyên môn cũng không phải lúc nào cũng hiểu “AI” là gì. Bài viết này nhằm giúp bạn hiểu các thuật ngữ “trí tuệ nhân tạo” và “học máy”. Bạn cũng sẽ tìm hiểu cách thức hoạt động của Deep Learning, loại máy học phổ biến nhất. Và điều quan trọng là những hướng dẫn này được viết bằng ngôn ngữ khá dễ tiếp cận. Toán học ở đây sẽ không quá khó hiểu.

Khái niệm cơ bản

Bước đầu tiên để hiểu Deep Learning là hiểu sự khác biệt giữa các thuật ngữ chính.
Deep Learning, trí tuệ nhân tạo và machine learning cho người mới bắt đầu: giải thích bằng ví dụ - 2
Ảnh: Datanami

Trí tuệ nhân tạo và học máy

Trí tuệ nhân tạo (AI hoặc AI agnl.) là một nỗ lực sao chép quá trình suy nghĩ của con người bằng máy tính. Khi nghiên cứu trong lĩnh vực Trí tuệ nhân tạo mới bắt đầu, các nhà khoa học đã cố gắng sao chép hành vi của trí thông minh con người trong những điều kiện nhất định, tức là mài giũa nó để giải quyết một số vấn đề nhất định. Ví dụ như để máy có thể chơi game. Họ thiết lập một số quy tắc mà máy tính phải tuân theo. Máy tính có một danh sách các hành động có thể thực hiện được và đưa ra quyết định dựa trên các quy tắc và hạn chế được đặt ra trong giai đoạn thiết kế.
Học máy (ML hoặc ML trong tiếng Anh) có nghĩa là khả năng của máy học bằng cách xử lý các tập hợp thông tin lớn thay vì các quy tắc được xác định rõ ràng.
ML cho phép máy tính tự học. Kiểu học này tận dụng công nghệ điện toán hiện đại, có thể dễ dàng xử lý lượng dữ liệu khổng lồ.

Học có giám sát và học không giám sát

Học có giám sát sử dụng các tập dữ liệu được dán nhãn bao gồm đầu vào và đầu ra dự kiến. Khi đào tạo trí tuệ nhân tạo bằng phương pháp học có giám sát, bạn cung cấp dữ liệu làm đầu vào và chỉ định đầu ra sẽ là gì. Nếu kết quả mà AI tạo ra khác với mong đợi thì AI phải sửa lại tính toán của mình. Quá trình này được lặp lại nhiều lần trên mảng dữ liệu cho đến khi AI mắc lỗi. Một ví dụ về học có giám sát là Trí tuệ nhân tạo dự đoán thời tiết. Nó học cách dự đoán thời tiết bằng cách sử dụng dữ liệu lịch sử. Dữ liệu đầu vào là áp suất, độ ẩm và tốc độ gió và kết quả là chúng ta sẽ nhận được nhiệt độ. Học tập không giám sát là một nhiệm vụ bao gồm đào tạo AI bằng cách sử dụng dữ liệu phi cấu trúc. Khi bạn huấn luyện trí tuệ nhân tạo bằng phương pháp học tập không giám sát, bạn cho phép AI thực hiện phân loại dữ liệu một cách hợp lý. Một ví dụ về trí tuệ nhân tạo sử dụng máy học không giám sát là robot dự đoán hành vi của khách hàng trong cửa hàng trực tuyến. Nó học mà không sử dụng đầu vào và đầu ra đã biết trước. Thay vào đó, nó phải tự phân loại dữ liệu đầu vào. Thuật toán sẽ xác định và cho bạn biết loại người dùng nào thích sản phẩm nào.

Cách thức hoạt động của máy học

Vì vậy, Deep Learning là một trong những phương pháp tiếp cận máy học. Nó cho phép bạn dự đoán kết quả từ dữ liệu đầu vào nhất định. Để đào tạo AI, bạn có thể sử dụng cả hai tùy chọn trên: học có giám sát và không giám sát. Chúng ta sẽ hiểu cách Deep Learning hoạt động bằng một ví dụ rõ ràng: giả sử chúng ta cần phát triển một dịch vụ dự đoán giá du lịch hàng không. Chúng tôi sẽ đào tạo thuật toán của mình bằng phương pháp được giám sát. Chúng tôi muốn dịch vụ dự đoán giá vé máy bay của mình dự đoán giá dựa trên dữ liệu đầu vào sau (chúng tôi không tính đến chuyến bay khứ hồi để dễ trình bày):
  • sân bay khởi hành;
  • sân bay đến;
  • ngày khởi hành dự kiến;
  • hãng hàng không.
Mạng lưới thần kinh Chúng ta hãy nhìn vào bộ não của trí tuệ nhân tạo. Giống như trường hợp của các sinh vật sống, bộ dự đoán của chúng ta có tế bào thần kinh ở “đầu” của nó. Trong hình chúng được trình bày dưới dạng vòng tròn. Các nơ-ron được kết nối với nhau.
Deep Learning, trí tuệ nhân tạo và machine learning cho người mới bắt đầu: giải thích bằng ví dụ - 3
Trong hình ảnh, các nơ-ron được kết hợp thành ba nhóm lớp:
  • lớp đầu vào;
  • lớp ẩn 1 (lớp ẩn 1) và lớp ẩn 2 (lớp ẩn 2);
  • lớp đầu ra.
Một số dữ liệu đi vào lớp đầu vào. Trong trường hợp của chúng tôi, chúng tôi có bốn nơ-ron trên lớp đầu vào: sân bay khởi hành, sân bay đến, ngày khởi hành, hãng hàng không. Lớp đầu vào chuyển dữ liệu đến lớp ẩn đầu tiên. Các lớp ẩn thực hiện các phép tính toán học dựa trên dữ liệu đầu vào nhận được. Một trong những vấn đề chính khi xây dựng mạng lưới thần kinh là việc lựa chọn số lớp ẩn và số lượng nơ-ron trong mỗi lớp.
Từ Deep trong cụm từ Deep Learning biểu thị sự hiện diện của nhiều hơn một lớp ẩn.
Lớp đầu ra trả về thông tin kết quả cho chúng tôi. Trong trường hợp của chúng tôi, giá dự kiến ​​của chuyến bay.
Deep Learning, trí tuệ nhân tạo và machine learning cho người mới bắt đầu: giải thích bằng ví dụ - 4
Chúng ta đã bỏ lỡ điều thú vị nhất cho đến nay: giá dự kiến ​​được tính chính xác như thế nào? Đây là nơi sự kỳ diệu của Deep Learning bắt đầu. Mỗi kết nối giữa các nơ-ron được gán một trọng số (hệ số) nhất định. Trọng số này xác định tầm quan trọng của giá trị đầu vào. Trọng số ban đầu được đặt ngẫu nhiên. Khi dự đoán giá vé máy bay, ngày khởi hành ảnh hưởng nhiều nhất đến giá cả. Do đó, các kết nối của nơ-ron “ngày khởi hành” có trọng lượng hơn.
Deep Learning, искусственный интеллект и машинное обучение для чайников: объяснение на примере  - 5
Mỗi nơ-ron có một chức năng kích hoạt gắn liền với nó. Thật khó để hiểu hàm này là gì nếu không có kiến ​​thức toán học. Vì vậy, hãy đơn giản hóa một chút: mục đích của hàm kích hoạt là “chuẩn hóa” đầu ra từ nơ-ron. Sau khi tập dữ liệu đã đi qua tất cả các lớp của mạng nơ-ron, nó sẽ trả về kết quả qua lớp đầu ra. Cho đến nay mọi thứ đều rõ ràng, phải không?

Đào tạo mạng lưới thần kinh

Huấn luyện mạng lưới thần kinh là phần khó nhất của Deep Learning! Tại sao? Bởi vì bạn cần một lượng lớn dữ liệu. Bởi vì bạn cần nhiều sức mạnh tính toán hơn. Đối với dự án của chúng tôi, chúng tôi cần tìm dữ liệu lịch sử giá vé máy bay. Hơn nữa, đối với tất cả các kết hợp có thể có của sân bay khởi hành và sân bay điểm đến, ngày khởi hành và các hãng hàng không khác nhau. Chúng tôi cần một lượng dữ liệu rất lớn về giá vé. Chúng ta phải cung cấp dữ liệu đầu vào từ tập hợp của mình cho đầu vào của mạng nơ-ron và kiểm tra xem chúng có khớp với kết quả mà chúng ta đã có hay không. Nếu kết quả mà trí tuệ nhân tạo thu được khác với kết quả mong đợi, điều này có nghĩa là nó chưa được đào tạo đủ. Sau khi chạy toàn bộ lượng dữ liệu thông qua mạng thần kinh của mình, chúng tôi có thể xây dựng một hàm cho biết kết quả của AI khác với kết quả thực tế trong tập dữ liệu của chúng tôi như thế nào. Hàm như vậy được gọi là hàm chi phí . Trong trường hợp lý tưởng mà chúng tôi cố gắng hết sức để đạt được, các giá trị của hàm chi phí của chúng tôi bằng 0. Điều này có nghĩa là kết quả chi phí do mạng nơ-ron lựa chọn không khác với chi phí thực tế của vé trong tập dữ liệu của chúng tôi.

Làm thế nào chúng ta có thể giảm giá trị của hàm chi phí?

Chúng tôi thay đổi trọng số của các kết nối giữa các tế bào thần kinh. Điều này có thể được thực hiện ngẫu nhiên, nhưng cách tiếp cận này không hiệu quả. Thay vào đó, chúng ta sẽ sử dụng một phương thức có tên là gradient Descent .
Giảm dần độ dốc là một phương pháp cho phép chúng ta tìm mức tối thiểu của hàm. Trong trường hợp của chúng tôi, chúng tôi đang tìm kiếm mức tối thiểu của hàm chi phí.
Thuật toán này hoạt động bằng cách tăng dần trọng số sau mỗi lần lặp lại xử lý tập dữ liệu của chúng tôi. Bằng cách tính đạo hàm (hoặc độ dốc) của hàm chi phí cho các tập hợp trọng số nhất định, chúng ta có thể biết mức tối thiểu nằm theo hướng nào.
Deep Learning, искусственный интеллект и машинное обучение для чайников: объяснение на примере  - 6
Trong hình: Trọng lượng ban đầu - trọng lượng ban đầu, Chi phí toàn cầu tối thiểu - tối thiểu toàn cầu của hàm chi phí. Để giảm thiểu hàm chi phí, chúng ta phải thực hiện các phép tính trên tập dữ liệu của mình nhiều lần. Đây là lý do tại sao bạn cần rất nhiều sức mạnh tính toán. Các trọng số được cập nhật tự động bằng phương pháp giảm độ dốc. Đây chính là điều kì diệu của Deep Learning! Sau khi đào tạo dịch vụ dự đoán giá chuyến bay AI của mình, chúng tôi có thể sử dụng nó một cách an toàn để dự đoán giá trong thực tế.

Hãy tóm tắt lại...

  • Học sâu sử dụng mạng lưới thần kinh để mô phỏng trí thông minh.
  • Có ba loại nơ-ron trong mạng nơ-ron: lớp đầu vào, lớp ẩn, lớp đầu ra.
  • Mỗi kết nối giữa các nơ-ron đều có trọng số riêng, cho thấy tầm quan trọng của đầu vào đó.
  • Các nơ-ron sử dụng chức năng kích hoạt để “chuẩn hóa” đầu ra từ nơ-ron.
  • Để huấn luyện mạng lưới thần kinh, bạn cần một lượng lớn dữ liệu.
  • Nếu chúng ta xử lý một mảng dữ liệu bằng mạng nơ-ron và so sánh dữ liệu đầu ra với dữ liệu thực tế, chúng ta sẽ nhận được hàm chi phí cho biết AI sai bao nhiêu.
  • Sau mỗi lần xử lý dữ liệu, trọng số giữa các nơ-ron được điều chỉnh bằng phương pháp giảm độ dốc để đạt được mức giảm hàm chi phí.
Liên kết tới bản gốc
Bình luận
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION