JavaRush /Blog Java /Random-VI /Mạng lưới thần kinh: cái nôi của AI trong tương lai hay c...

Mạng lưới thần kinh: cái nôi của AI trong tương lai hay chỉ là một xu hướng công nghệ khác?

Xuất bản trong nhóm
Trong các tài liệu trên JavaRush, chúng ta đã đề cập đến chủ đề trí tuệ nhân tạo (AI), học máy và các công nghệ khác liên quan đến AI theo cách này hay cách khác. Đặc biệt, chúng tôi đã nói về mối liên hệ của trí tuệ nhân tạo với lập trình Java , thảo luận về những huyền thoại và câu chuyện kinh dị về AI và trong một số bài viết, chúng tôi đã đề cập đến các công nghệ chính được sử dụng trong lĩnh vực này. Mạng lưới thần kinh: cái nôi của AI trong tương lai hay chỉ là một xu hướng công nghệ khác?  - 1Do đó, chúng tôi quyết định rằng bây giờ là thời điểm tốt để nghiên cứu sâu hơn nữa về lĩnh vực AI và xem xét kỹ hơn về công nghệ thực sự làm nền tảng cho AI hiện đại và học máy - mạng lưới thần kinh. Cụ thể: khái niệm mạng lưới thần kinh ban đầu bắt nguồn như thế nào và công nghệ này được chuyển đổi sang trạng thái hiện tại như thế nào, mạng lưới thần kinh nhân tạo khác với các tế bào thần kinh trong não người như thế nào, liệu chúng có thực sự biết cách học hay không và ngày nay chúng thực sự có khả năng gì. Mạng lưới thần kinh: cái nôi của AI trong tương lai hay chỉ là một xu hướng công nghệ khác?  - 2

Mạng lưới thần kinh nhân tạo và bộ não con người. Như nhau?

Ban đầu, mạng nơ-ron máy tính nhận được tên này vì nguyên tắc thiết kế của chúng giống với hệ thống nơ-ron trong não người. Như vậy, bộ não con người trung bình bao gồm hơn 100 triệu tế bào nhỏ gọi là tế bào thần kinh. Trên thực tế, không ai biết chính xác có bao nhiêu tế bào như vậy thực sự có trong não người - ước tính dao động từ 50 đến 500 tỷ. Mỗi tế bào thần kinh bao gồm một thân tế bào với nhiều cái gọi là đuôi gai (đầu vào tế bào - truyền thông tin đến tế bào). ) và một sợi trục (đầu ra của tế bào - truyền thông tin từ tế bào). Các tế bào thần kinh nhỏ đến mức khoảng một trăm tế bào như vậy có thể được đặt trong diện tích một milimet vuông. Bên trong máy tính, tương đương với tế bào thần kinh là các thiết bị chuyển mạch cực nhỏ gọi là bóng bán dẫn. Các bộ vi xử lý hiện đại mới nhất (máy tính đơn chip) chứa hơn 30 tỷ bóng bán dẫn. Ngay cả bộ vi xử lý Pentium đầu tiên được tạo ra cách đây khoảng 20 năm cũng có khoảng 50 triệu bóng bán dẫn được gói gọn trong một mạch tích hợp có diện tích chỉ 25 mm. Trên thực tế, các chuyên gia cho biết, đây là nơi kết thúc mối liên hệ giữa bộ xử lý máy tính và tế bào thần kinh trong não con người, bởi vì nếu không thì chúng rất khác nhau và hoạt động hoàn toàn khác nhau. Các bóng bán dẫn máy tính được kết nối thành các mạch nối tiếp tương đối đơn giản, mỗi mạch có thể được kết nối với hai hoặc ba mạch khác, trong khi các tế bào thần kinh trong não được kết nối chặt chẽ theo những cách song song phức tạp. Do đó, các nhà khoa học đã tính toán rằng mỗi nơ-ron có thể được kết nối với hơn 10 nghìn tế bào lân cận.

Mạng lưới thần kinh nhân tạo là gì?

Vì vậy, sự khác biệt lớn nhất về cấu trúc giữa máy tính và tế bào thần kinh trong não là cách chúng hoạt động. Ý tưởng cơ bản đằng sau mạng nơ-ron là mô phỏng hoặc nếu bạn muốn, mô hình hóa ở dạng đơn giản hóa hoạt động của nhiều nơ-ron liên kết với nhau trong não. Đây là điều cho phép mạng lưới thần kinh thực hiện những việc mà bộ vi xử lý thông thường không thể làm, đó là học hỏi, nhận biết các mẫu và đưa ra quyết định theo nguyên tắc tương tự như bộ não con người. Tuy nhiên, điều quan trọng cần nhấn mạnh là hiện tại, mạng lưới thần kinh là một phần mềm mô phỏng đơn giản hoạt động của các tế bào thần kinh trong não. Mạng lưới thần kinh: cái nôi của AI trong tương lai hay chỉ là một xu hướng công nghệ khác?  - 3Một mạng nơ-ron thông thường chứa từ vài chục đến hàng trăm, hàng nghìn thậm chí hàng triệu nơ-ron nhân tạo, gọi là đơn vị, được sắp xếp thành nhiều lớp. Một số đơn vị này, được gọi là đơn vị đầu vào, chịu trách nhiệm nhận các dạng thông tin khác nhau từ thế giới bên ngoài, sau đó mạng lưới thần kinh sẽ cố gắng học, ghi nhớ và xử lý theo những cách khác. Các đơn vị khác, được gọi là đơn vị đầu ra, nằm ở phía đối diện của mạng, chịu trách nhiệm về cách mạng tương tác với thông tin này. Giữa hai lớp này là các đơn vị khác thực hiện tính toán và tạo nên phần lớn mạng lưới thần kinh. Hầu hết các mạng nơron đều được kết nối với nhau, nghĩa là mỗi đơn vị được kết nối với các đơn vị khác theo các lớp ở hai bên. Các kết nối giữa các đơn vị được thể hiện bằng một con số gọi là trọng số. Trọng số trong mạng lưới thần kinh có thể dương (nếu một đơn vị kích hoạt đơn vị khác) hoặc âm (nếu một đơn vị triệt tiêu hoặc làm suy yếu đơn vị khác). Trọng lượng càng cao thì ảnh hưởng của đơn vị này đến đơn vị khác càng lớn. Một mạng lưới thần kinh đơn giản được thiết kế để giải quyết các vấn đề đơn giản có thể chỉ bao gồm ba lớp cơ bản, như trong hình. Tuy nhiên, giữa lớp đầu vào và lớp đầu ra có thể có một số lớp khác nhau thực hiện các chức năng khác nhau. Mạng lưới thần kinh có cấu trúc phức tạp hơn (so với trong hình minh họa ở trên) được gọi là mạng lưới thần kinh sâu và thường được sử dụng để giải quyết các vấn đề phức tạp. Về lý thuyết, việc sử dụng cấu trúc sâu cho phép mạng lưới thần kinh ánh xạ bất kỳ loại dữ liệu đầu vào nào tới bất kỳ loại dữ liệu đầu ra nào, do đó giúp nó có khả năng giải quyết mọi vấn đề. Tuy nhiên, để làm được điều này, mạng lưới thần kinh sẽ yêu cầu “đào tạo” nghiêm túc và lâu dài, bao gồm việc xử lý hàng triệu, thậm chí hàng tỷ ví dụ về thông tin mà mạng cần phải xử lý. Mạng lưới thần kinh: cái nôi của AI trong tương lai hay chỉ là một xu hướng công nghệ khác?  - 4

Mạng lưới thần kinh: một chút lịch sử

Chà, chúng ta đã sắp xếp những giải thích cơ bản về bản chất của mạng lưới thần kinh, bây giờ chúng ta có thể lùi lại một chút về lý thuyết và nói về lịch sử của công nghệ này và thời điểm nó xuất hiện. Điều này có thể khiến nhiều người ngạc nhiên, nhưng mạng lưới thần kinh đã xuất hiện trong khoa học hơn 70 năm trước. Khái niệm này lần đầu tiên được đề xuất vào năm 1944 bởi Warren McCullough và Walter Pitts, hai nhà nghiên cứu tại Đại học Chicago, người đã chuyển đến Viện Công nghệ Massachusetts vào năm 1952, nơi họ thành lập nhóm nghiên cứu khoa học nhận thức đầu tiên. Mạng lưới thần kinh thực sự là một lĩnh vực nghiên cứu chính trong cả khoa học thần kinh và khoa học máy tính cho đến năm 1969. Nghĩa là, công nghệ làm nền tảng cho các hệ thống trí tuệ nhân tạo hiện đại này, theo thuật ngữ hiện đại, đã được cường điệu hóa trong hơn một thập kỷ - từ khoảng giữa những năm 50 đến cuối những năm 60. Người ta tin rằng “kẻ giết người” của sự cường điệu này là cuốn sách được viết bởi hai nhà khoa học máy tính - Marvin Minsky và Seymour Papert - những người trong công trình của họ đã tiết lộ tất cả những hạn chế của mạng lưới thần kinh. Thực tế là các mạng nơ-ron ban đầu chỉ có một hoặc hai lớp có thể huấn luyện được. Minsky và Papert đã chỉ ra rằng những mạng đơn giản như vậy về mặt toán học không có khả năng mô hình hóa các hiện tượng phức tạp trong thế giới thực. Kết quả là, sự quan tâm đến mạng lưới thần kinh như một công nghệ đã không còn trong nhiều năm - trong suốt những năm 70 và nửa đầu những năm 80, về mặt khách quan, người ta rất ít chú ý đến chúng. Sự quan tâm chỉ được đổi mới vào năm 1986, với việc xuất bản một bài báo giới thiệu khái niệm lan truyền ngược, một phương pháp thực tế để huấn luyện mạng lưới thần kinh sâu. Nhờ lan truyền ngược, mạng lưới thần kinh sâu trở nên thân thiện hơn về mặt tính toán nhưng vẫn cần tài nguyên máy tính khổng lồ để hoạt động. Và nghiên cứu trong những năm 1990 và 2000 thường cho thấy các mạng lưới thần kinh phức tạp không tạo ra kết quả mong muốn về mặt hiệu quả. Kết quả là, mạng lưới thần kinh đã không còn là làn sóng cường điệu trong một thời gian và chỉ quay trở lại vào thập kỷ thứ hai của những năm 2000, phần lớn là do sức mạnh tính toán của chip đồ họa tăng lên, cho phép mạng lưới thần kinh sâu hoạt động hiệu quả hơn trước. Hiện tượng mang tính chu kỳ như vậy trong khoa học nói chung được giải thích rõ ràngTomaso Poggio, giáo sư tại Viện Công nghệ Massachusetts: “Có lời giải thích rằng các ý tưởng trong khoa học lan truyền theo cách giống như virus. Ví dụ, có năm hoặc sáu chủng vi-rút cúm chính và mỗi chủng sẽ quay trở lại khoảng 25 năm một lần. Mọi người bị nhiễm bệnh, phát triển khả năng miễn dịch và được bảo vệ khỏi bị nhiễm trùng trong 25 năm tiếp theo. Và rồi một thế hệ mới đến và lại bị nhiễm cùng một loại virus. Trong khoa học, con người yêu thích các ý tưởng và làm việc với chúng đến mức kiệt sức, đến mức họ phát triển khả năng miễn dịch dưới dạng mệt mỏi với ý tưởng. Và rồi ý tưởng này lại quay trở lại với một thế hệ nhà khoa học khác.” Với thực tế là mạng lưới thần kinh và công nghệ trí tuệ nhân tạo vẫn là một công nghệ khá mới và kém phát triển, có thể sự cường điệu xung quanh nó sẽ sớm bắt đầu suy yếu trở lại và chỉ quay trở lại sau vài thập kỷ nữa. Mạng lưới thần kinh: cái nôi của AI trong tương lai hay chỉ là một xu hướng công nghệ khác?  - 5

Mạng lưới thần kinh học như thế nào?

Thông thường, thông tin đi qua mạng lưới thần kinh theo hai cách. Khi mạng mới đang học hoặc đã chạy sau khi đào tạo, các mẫu thông tin sẽ nhập vào mạng thông qua các đơn vị đầu vào, khởi chạy các lớp đơn vị ẩn, sau đó các đơn vị ẩn sẽ nhập vào các đơn vị đầu ra. Cấu trúc tổng thể này được gọi là mạng tiếp liệu. Không phải tất cả các đơn vị đều hoạt động cùng một lúc. Mỗi đơn vị nhận dữ liệu đến từ các đơn vị ở bên trái và nhân dữ liệu đó với trọng số của các kết nối mà nó đi qua. Mỗi đơn vị cộng tất cả dữ liệu mà nó nhận được theo cách này và trong loại mạng đơn giản nhất, nếu tổng vượt quá một ngưỡng nhất định, đơn vị sẽ kích hoạt các đơn vị khác mà nó được kết nối (những đơn vị ở bên phải). Một trong những điểm quan trọng cho phép bất kỳ mạng lưới thần kinh nào có thể học hỏi là phản hồi. Giống như một đứa trẻ cần được nuôi dưỡng bởi người lớn, người sẽ cho nó biết điều gì là tốt và điều gì là xấu, mạng lưới thần kinh cần phản hồi và hướng dẫn. Họ sử dụng một phương pháp đào tạo được gọi là lan truyền ngược . Trong phương pháp này, mạng so sánh đầu ra mà nó tạo ra với đầu ra mà nó sẽ tạo ra và sử dụng sự khác biệt giữa hai yếu tố này để thay đổi trọng số của các kết nối giữa các đơn vị trong mạng, từ đơn vị đầu ra, qua đơn vị trung gian đến đơn vị đầu vào - tức là ngược lại. Theo thời gian, lan truyền ngược buộc mạng phải học hỏi, giảm sự khác biệt giữa đầu ra thực tế và đầu ra ước tính đến mức chúng khớp chính xác. Mạng lưới thần kinh: cái nôi của AI trong tương lai hay chỉ là một xu hướng công nghệ khác?  - 6

Mạng lưới thần kinh hoạt động như thế nào và chúng được sử dụng ở đâu?

Và cuối cùng, hãy xem một ví dụ về cách hoạt động của mạng lưới thần kinh như vậy. Sau khi mạng nơ-ron có đủ mẫu dữ liệu để huấn luyện, nó sẽ đạt đến điểm mà người dùng có thể cung cấp cho mạng dữ liệu hoàn toàn mới mà mạng chưa từng xử lý trước đó và nhận được kết quả mong muốn từ đó. Ví dụ: giả sử bạn huấn luyện mạng lưới thần kinh của mình để phát hiện vũ khí khi nó xuất hiện ở đâu đó trong tầm nhìn của camera an ninh. Bạn huấn luyện mạng bằng cách hiển thị cho nó hàng trăm, hàng nghìn và hàng chục nghìn hình ảnh về các loại vũ khí khác nhau, chẳng hạn như súng lục và súng trường. Tại một thời điểm nào đó, bạn tải lên hình ảnh về một loại vũ khí mới mà cô ấy chưa từng thấy trước đây, chẳng hạn như súng. Kết quả là mạng đã xác định thành công đối tượng này là vũ khí dựa trên một số tiêu chí cơ bản, chẳng hạn như hình dạng chung, sự hiện diện của tay cầm và báng, sự hiện diện của cò súng, v.v. Nghĩa là, mạng lưới thần kinh xác định vũ khí trong ảnh dựa trên một số mẫu “đã học được”. Tất nhiên, đồng thời, điều này không có nghĩa là mạng lưới thần kinh có thể xem dữ liệu mới và đưa ra quyết định một cách độc lập như con người. Nó nhận tất cả thông tin dưới dạng mã nhị phân và mỗi đơn vị đầu vào (thông tin vào mạng) chỉ có thể ở hai vị trí: bật hoặc tắt. Theo đó, nếu bạn sử dụng cùng một ví dụ để huấn luyện một mạng lưới thần kinh để tìm vũ khí, thông tin sẽ chuyển qua một tập hợp các đơn vị đầu vào trả lời các câu hỏi cơ bản “có/không”. Ví dụ như: đối tượng có trigger không?; có mõm không?; món đồ đó có được làm bằng kim loại không?; hình dạng của nó có giống với một khẩu súng lục không? Theo đó, đối với súng, phản hồi của mạng sẽ là: “có, có, có, không” hoặc “1110” ở dạng mã nhị phân. Tất nhiên, trong hệ thống thực sẽ có nhiều câu hỏi như vậy hơn, nhưng bản chất vẫn giống nhau: mạng lưới thần kinh nhận dữ liệu dưới dạng mã nhị phân và với sự trợ giúp của nó học cách phân biệt thông tin cần thiết với thông tin không cần thiết. Bây giờ, khi đã biết cơ chế cơ bản của mạng lưới thần kinh, thật dễ dàng hình dung ngày nay công nghệ này được sử dụng như thế nào để giải quyết nhiều vấn đề khác nhau. Ví dụ: một ví dụ cổ điển là việc sử dụng mạng lưới thần kinh để ngăn chặn gian lận ngân hàng - khi hệ thống học cách tự tìm và chặn ngay lập tức những giao dịch chuyển tiền mà vì lý do này hay lý do khác có vẻ đáng ngờ. Hoặc, ví dụ, việc sử dụng mạng lưới thần kinh cho chế độ lái tự động cơ bản của ô tô hoặc máy bay: khi các đơn vị đầu vào nhận được thông tin từ các hệ thống điều khiển khác nhau và các đơn vị đầu ra sẽ điều chỉnh chế độ lái theo một khóa học nhất định.

kết luận

Bây giờ bạn thấy rằng mạng lưới thần kinh là một công nghệ tương đối không phức tạp, về tổng thể, thực sự đưa máy tính và hệ thống máy tính tiến một bước gần hơn đến con người. Mặt khác, rõ ràng là mạng lưới thần kinh vẫn chưa phức tạp và hiệu quả như bộ não con người. Vì vậy, hãy biết ơn vì tất cả chúng ta đều được sinh ra với mạng lưới thần kinh tiên tiến được tích hợp ngay trong não và hãy sử dụng sự giàu có tự nhiên này thường xuyên hơn, chẳng hạn như để học tập và hoàn thiện bản thân.
Bình luận
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION