JavaRush /Java Blog /Random-KO /신경망: 미래 AI의 요람인가, 아니면 또 다른 테크노 트렌드인가?

신경망: 미래 AI의 요람인가, 아니면 또 다른 테크노 트렌드인가?

Random-KO 그룹에 게시되었습니다
JavaRush 자료에서 우리는 이미 인공 지능(AI), 기계 학습 및 AI와 관련된 기타 기술에 대한 주제를 어떤 방식으로든 다루었습니다. 특히 우리는 이미 인공 지능이 Java 프로그래밍과 어떻게 관련되어 있는지 에 대해 이야기하고 AI에 대한 신화와 공포 이야기를 논의했으며 여러 기사에서 이 분야에 사용되는 핵심 기술을 언급했습니다 . 신경망: 미래 AI의 요람인가, 아니면 또 다른 테크노 트렌드인가?  - 1따라서 우리는 지금이야말로 AI 분야를 더욱 깊이 탐구하고, 실제로 현대 AI와 머신러닝의 근간이 되는 기술인 신경망을 자세히 살펴볼 좋은 시기라고 판단했습니다. 즉, 신경망의 개념이 원래 어떻게 시작되었고 이 기술이 어떻게 현재 상태로 변형되었는지, 인공 신경망이 인간 두뇌의 뉴런과 어떻게 다른지, 실제로 학습하는 방법을 알고 있는지, 그리고 오늘날 실제로 무엇을 할 수 있는지에 대한 것입니다. 신경망: 미래 AI의 요람인가, 아니면 또 다른 테크노 트렌드인가?  - 2

인공 신경망과 인간의 두뇌. 같은?

처음에 컴퓨터 신경망은 설계 원리가 인간 두뇌의 뉴런 시스템과 유사하기 때문에 이 이름을 얻었습니다. 따라서 평균적인 인간의 뇌에는 뉴런이라고 불리는 1억 개가 넘는 작은 세포가 포함되어 있습니다. 실제로 인간의 뇌에 실제로 그러한 세포가 얼마나 많이 있을 수 있는지 정확히 아는 사람은 아무도 없습니다. 추정 범위는 500억에서 5000억까지입니다. 각 뉴런은 소위 수상돌기라고 불리는 많은 세포체로 구성됩니다(세포 입력 - 정보를 세포에 전달) ) 및 하나의 축삭 ( 세포 출력 - 세포에서 정보를 전송함). 뉴런은 너무 작아서 1제곱밀리미터의 면적에 약 100개의 세포가 배치될 수 있습니다. 컴퓨터 내부에서 뉴런과 동등한 것은 트랜지스터라고 불리는 작은 스위칭 장치입니다. 최신 최신 마이크로프로세서(단일 칩 컴퓨터)에는 300억 개 이상의 트랜지스터가 포함되어 있습니다. 약 20년 전에 만들어진 최초의 펜티엄 마이크로프로세서조차 고작 25mm 면적의 집적회로에 약 5천만 개의 트랜지스터를 담았습니다. 실제로 전문가들은 컴퓨터 프로세서와 인간 뇌의 뉴런 사이의 연결이 끝나는 곳이라고 말합니다. 그렇지 않으면 서로 매우 다르고 완전히 다르게 작동하기 때문입니다. 컴퓨터 트랜지스터는 상대적으로 단순한 직렬 회로로 연결되어 있으며 각 회로는 2~3개의 다른 회로에 연결될 수 있는 반면, 뇌의 뉴런은 복잡한 병렬 방식으로 긴밀하게 연결되어 있습니다. 따라서 과학자들은 각 뉴런이 1만 개 이상의 이웃 뉴런과 연결될 수 있다고 계산했습니다.

인공 신경망이란 무엇입니까?

따라서 컴퓨터와 뇌의 뉴런 사이의 가장 중요한 구조적 차이점은 작동 방식입니다. 신경망의 기본 아이디어는 뇌의 상호 연결된 많은 뉴런의 작동을 단순화된 형태로 시뮬레이션하거나 모델링하는 것입니다. 이것이 바로 신경망이 일반 마이크로프로세서가 할 수 없는 일, 즉 학습, 패턴 인식, 인간의 두뇌와 유사한 원리로 결정을 내리는 일을 할 수 있게 해주는 것입니다. 그러나 현재 신경망은 뇌의 뉴런 작업을 간단히 소프트웨어로 에뮬레이션한 것임을 강조하는 것이 중요합니다. 신경망: 미래 AI의 요람인가, 아니면 또 다른 테크노 트렌드인가?  - 삼일반적인 신경망에는 단위라고 불리는 수십에서 수백, 수천 또는 수백만 개의 인공 뉴런이 여러 층으로 배열되어 있습니다. 입력 장치라고 불리는 이러한 장치 중 일부는 외부 세계로부터 다양한 형태의 정보를 수신하는 역할을 하며, 신경망은 이를 다른 방식으로 학습, 기억 및 처리하려고 합니다. 네트워크 반대편에 위치한 출력 장치라고 하는 다른 장치는 네트워크가 이 정보와 상호 작용하는 방식을 담당합니다. 이 두 계층 사이에는 계산을 수행하고 신경망의 대부분을 구성하는 다른 단위가 있습니다. 대부분의 신경망은 서로 연결되어 있습니다. 즉, 각 단위는 양쪽 레이어의 다른 단위에 연결됩니다. 단위 사이의 연결은 무게라는 숫자로 표시됩니다. 신경망의 가중치는 양수(한 단위가 다른 단위를 활성화하는 경우) 또는 음수(한 단위가 다른 단위를 억제하거나 약화시키는 경우)일 수 있습니다. 무게가 높을수록 한 단위가 다른 단위에 미치는 영향이 커집니다. 간단한 문제를 해결하기 위해 설계된 간단한 신경망에는 그림과 같이 세 가지 기본 계층만 포함될 수 있습니다. 그러나 입력 계층과 출력 계층 사이에는 서로 다른 기능을 수행하는 여러 개의 서로 다른 계층이 있을 수 있습니다. 위 그림보다 더 복잡한 구조를 가진 신경망을 심층 신경망이라고 하며 일반적으로 복잡한 문제를 해결하는 데 사용됩니다. 이론적으로 심층 구조를 사용하면 신경망이 모든 유형의 입력 데이터를 모든 유형의 출력 데이터에 매핑하여 모든 문제를 해결할 수 있습니다. 그러나 이를 위해 신경망에는 네트워크가 작업해야 하는 수백만, 심지어 수십억 개의 정보 사례를 처리하는 심각하고 긴 "훈련"이 필요합니다. 신경망: 미래 AI의 요람인가, 아니면 또 다른 테크노 트렌드인가?  - 4

신경망: 약간의 역사

글쎄, 우리는 신경망이 본질적으로 무엇인지에 대한 기본 설명을 정리했습니다. 이제 이론에 대해 조금 뒤로 물러나 이 기술의 역사와 그것이 언제 등장했는지에 대해 이야기할 수 있습니다. 이는 많은 사람들을 놀라게 할 수 있지만 신경망은 70여년 전에 과학에 등장했습니다. 이 개념은 1944년 시카고 대학의 두 연구원인 Warren McCullough와 Walter Pitts에 의해 처음 제안되었으며, 이들은 1952년 MIT로 옮겨 최초의 인지 과학 연구 그룹을 설립했습니다. 신경망은 실제로 1969년까지 신경과학과 컴퓨터 과학의 주요 연구 분야였습니다. 즉, 현대 인공 지능 시스템의 기초가 되는 이 기술은 현대적인 측면에서 약 50년대 중반부터 60년대 말까지 10년 이상 동안 이미 과대평가되어 왔습니다. 이 과대광고의 "킬러"는 두 명의 컴퓨터 과학자인 Marvin Minsky와 Seymour Papert가 저술한 책으로, 그들의 작업에서 신경망의 모든 한계를 드러낸 것으로 믿어집니다. 사실 초기 신경망에는 훈련 가능한 레이어가 한두 개밖에 없었습니다. Minsky와 Papert는 이러한 단순한 네트워크로는 복잡한 실제 현상을 수학적으로 모델링할 수 없음을 보여주었습니다. 결과적으로 기술로서의 신경망에 대한 관심은 수년 동안 사라졌습니다. 70년대와 80년대 전반에 걸쳐 객관적으로 신경망에 대한 관심은 거의 없었습니다. 1986년에야 심층 신경망 훈련을 위한 실용적인 방법인 역전파의 개념을 소개한 논문이 출판되면서 관심이 다시 시작되었습니다. 역전파 덕분에 심층 신경망은 더욱 계산 친화적이게 되었지만 작동하려면 여전히 막대한 컴퓨팅 리소스가 필요했습니다. 그리고 1990년대와 2000년대의 연구에서는 복잡한 신경망이 효율성 측면에서 원하는 결과를 산출하지 못하는 경우가 종종 있었습니다. 그 결과, 신경망은 한동안 과대 광고에서 벗어났다가 2000년대 두 번째 10년이 되어서야 다시 돌아왔습니다. 주로 그래픽 칩의 컴퓨팅 성능이 향상되어 심층 신경망이 이전보다 더 효율적으로 작동할 수 있게 되었기 때문입니다. 과학 전반에 걸쳐 이러한 순환 현상이 잘 설명되어 있습니다.매사추세츠 공과대학 교수인 토마소 포지오(Tomaso Poggio)는 이렇게 말했습니다. “과학의 아이디어는 바이러스와 거의 같은 방식으로 퍼진다는 설명이 있습니다. 예를 들어, 인플루엔자 바이러스에는 5~6개의 주요 변종이 있으며 각 변종은 약 25년마다 한 번씩 재발합니다. 사람들은 감염되고 면역력이 발달하여 향후 25년 동안 감염으로부터 보호됩니다. 그리고 새로운 세대가 와서 같은 종류의 바이러스에 다시 감염됩니다. 과학에서 사람들은 아이디어와 사랑에 빠지고 지칠 때까지 아이디어를 연구하기 때문에 아이디어 피로의 형태로 면역력이 발달합니다. 그리고 그 아이디어는 다른 세대의 과학자들과 함께 다시 돌아옵니다.” 신경망과 인공 지능 기술이 여전히 상당히 새롭고 덜 개발된 기술이라는 사실을 감안할 때, 이에 대한 과대 광고는 곧 다시 약해지기 시작하고 몇 십 년 후에 다시 돌아올 가능성이 있습니다. 신경망: 미래 AI의 요람인가, 아니면 또 다른 테크노 트렌드인가?  - 5

신경망은 어떻게 학습하나요?

일반적으로 정보는 두 가지 방식으로 신경망을 통과합니다. 네트워크가 방금 학습 중이거나 훈련 후 이미 실행 중인 경우 정보 패턴이 입력 장치를 통해 입력되며, 숨겨진 유닛의 레이어가 시작되고 출력 유닛으로 들어갑니다. 이 전체 구조를 피드포워드 네트워크라고 합니다. 모든 장치가 동시에 작동하는 것은 아닙니다. 각 장치는 왼쪽에 있는 장치로부터 들어오는 데이터를 수신하고 이를 통과하는 연결의 무게를 곱합니다. 각 장치는 이러한 방식으로 수신한 모든 데이터를 합산하며, 가장 간단한 유형의 네트워크에서는 그 합계가 특정 임계값을 초과하면 장치는 연결된 다른 장치(오른쪽에 있는 장치)를 활성화합니다. 모든 신경망이 학습할 수 있게 하는 핵심 포인트 중 하나는 피드백입니다. 아이가 무엇이 좋고 무엇이 나쁜지 말해 줄 어른에 의해 양육되어야 하는 것처럼 신경망에도 피드백과 지도가 필요합니다. 그들은 역전파(backpropagation) 라는 훈련 접근 방식을 사용합니다 . 이 방법에서 네트워크는 자신이 생성하는 출력과 생성해야 하는 출력을 비교하고 이 두 요소 사이의 차이를 사용하여 출력 단위에서 중간 단위를 거쳐 입력 단위로 네트워크의 단위 간 연결 가중치를 변경합니다. 즉, 그 반대입니다. 시간이 지남에 따라 역전파는 네트워크가 학습하도록 강제하여 실제 출력과 추정 출력 간의 차이를 정확히 일치하는 지점까지 줄입니다. 신경망: 미래 AI의 요람인가, 아니면 또 다른 테크노 트렌드인가?  - 6

신경망은 어떻게 작동하며 어디에 사용되나요?

마지막으로 이러한 신경망이 어떻게 작동하는지 예를 살펴보겠습니다. 신경망에 학습할 충분한 데이터 예제가 있으면 사용자가 네트워크가 이전에 처리한 적이 없는 완전히 새로운 데이터를 제공하고 그로부터 원하는 결과를 얻을 수 있는 지점에 도달합니다. 예를 들어, 보안 카메라의 시야 내에 무기가 나타나면 이를 탐지하도록 신경망을 훈련한다고 가정해 보겠습니다. 권총, 소총과 같은 다양한 유형의 무기에 대한 수백, 수천, 수만 개의 이미지를 보여줌으로써 네트워크를 훈련시킵니다. 어떤 시점에서는 이전에 그녀에게 보여주지 않았던 새로운 유형의 무기(예: 총)의 이미지를 업로드합니다. 그 결과, 네트워크는 일반적인 모양, 손잡이와 손잡이의 존재, 방아쇠의 존재 등과 같은 다양한 기본 기준을 기반으로 이 개체를 무기로 식별하는 데 성공했습니다. 즉, 신경망은 여러 가지 "학습된" 패턴을 기반으로 이미지의 무기를 결정합니다. 물론 동시에 이것이 신경망이 사람처럼 새로운 데이터를 보고 독립적으로 결정을 내릴 수 있다는 의미는 아닙니다. 이진 코드 형태로 모든 정보를 수신하며 각 입력 장치(네트워크에 대한 정보)는 켜짐 또는 꺼짐의 두 위치에만 있을 수 있습니다. 따라서 동일한 예를 사용하여 무기를 찾기 위해 신경망을 훈련시키는 경우 정보는 기본적인 "예/아니요" 질문에 대답하는 일련의 입력 장치를 통과하게 됩니다. 예를 들어, 객체에 트리거가 있습니까?; 총구가 있나요?; 그 물건은 금속으로 만들어졌나요?; 그 모양이 권총 모양과 일치합니까? 따라서 총의 경우 네트워크의 응답은 "예, 예, 예, 아니오" 또는 이진 코드로 "1110"이 됩니다. 물론 실제 시스템에서는 그러한 질문이 훨씬 더 많겠지만 본질은 동일하게 유지됩니다. 신경망은 이진 코드 형태로 데이터를 수신하고 그 도움을 받아 필요한 정보와 불필요한 정보를 구별하는 방법을 배웁니다. 이제 신경망의 기본 메커니즘을 알면 이 기술이 오늘날 다양한 문제를 해결하는 데 어떻게 사용되는지 쉽게 상상할 수 있습니다. 예를 들어, 전형적인 예는 은행 사기를 방지하기 위해 신경망을 사용하는 것입니다. 시스템이 어떤 이유로든 의심스러워 보이는 이체를 독립적으로 찾아 즉시 차단하는 방법을 학습하는 경우입니다. 또는 예를 들어 자동차나 비행기의 기본 자동 조종 장치에 신경망을 사용하는 경우가 있습니다. 입력 장치가 다양한 제어 시스템으로부터 정보를 수신하고 출력 장치가 주어진 경로에 따라 조종 모드를 조정하는 경우입니다.

결론

이제 신경망은 컴퓨터와 컴퓨터 시스템을 한 단계 더 발전시켜 사람들에게 더 가까이 다가가게 해주는 상대적으로 복잡하지 않고 전반적으로 기술이라는 것을 알 수 있습니다. 반면에 신경망이 아직 인간의 두뇌만큼 복잡하고 효율적이지 않다는 것도 분명합니다. 그러므로 우리 모두가 뇌에 내장된 고급 신경망을 가지고 태어났다는 사실에 감사하고 이 자연적 부를 학습과 자기계발 등을 위해 더 자주 사용합시다.
코멘트
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION