봄 날씨가 가을처럼 을씨년스럽습니다. 봄비가 내리고 거리에는 얼마 전 피어난 꽃잎이 벌써 떨어졌습니다. 코로나로 격리되어 있는 동안 아이들에게 설명하기 위해 Chat GPT라는 인공지능에 대해 나름대로 정리해 보았습니다. 인공지능이 스마트폰 이상으로 우리 생활의 폭발적 변화를 가져올 것입니다. 그 개요 정도는 알아야 적응해 나갈 수 있을 것 같아 인공지능에 관해 우리나라 최고의 뇌과학자인 김대식교수의 강의를 중심으로 내 생각과 함께 기본적인 것만 두서 없이 정리해 보았습니다.
옛날에 인간은 생존하기 위해 거의 모든 시간, 노력, 에너지를 사용했을 것이다. 지금도 무인도에 인간을 보내면 생존을 위해 거의 모든 시간과 에너지를 소비할 것이다. 인간에게 필요한 능력이 예측하는 능력이다. 과거의 경험과 일상의 학습으로 현재 상황에 대처하고 미래를 대비해야 한다. 그래서 인간 뇌의 중요한 기능중 하나가 예측하는 기능이다. 삶이 불안했던 인간은 미래를 대비하기 위해 수많은 질문을 했을 것이다. 그 질문에 대답이 없으니 예측할 수도 준비할 수도 없었다. 인간은 예전부터 질문에 대답해주는 존재가 필요했다. 그때 우리 조상들과 그들만의 神들에게 물었다. 인간은 어느 순간이 신에게 질문을 했다. 하지만 神은 제대로 대답하지 못했다. 이제 인간의 질문에 대답하는 존재가 나타났다. 챗GPT다. 그리고 챗GPT는 정리 요약하는 능력이 탁월하다. 때로는 가짜를 진짜처럼 이야기하는 것이 문제지만. 현재 챗GPT는 인터넷 연결을 막아놓았다. 인간이 감당하기 어려운 너무 위험한 존재이기 때문이다. 지금 철장 속에 가두어 놓았기 때문에 거짓말이 많다고 한다. 풀려나면 그래서 더 많은 자료로 학습을 하게 되면 보완될 것이라고 한다. 하지만 지금도 요약하고 문장교정도 잘 해주고 창작도 가능하다, 우리가 원하는 드라마대본의 조건을 입력하면 극본을 써 낸다. 인간의 상상을 초월하는 스토리를 만들어 낸다.
여러분은 인공지능이 뭐라고 생각하는가? 우리는 인공지능이라고 하면 기계가 자유의지, 자율성을 갖고 있는 터미네이터 영화에 나오는 ‘스카이넷’을 막연하게 연상한다. 지금까지 우리가 생각하는 인공지능은 인간이 기계에게 설명해주면, 기계는 인간이 설명해준 대로 결과를 만들어 내는 것이다, 어느 정도 자동번역이 가능하며 언어처리정도는 가능한 것이다. 챗GPT는 그러한 기능에서 시작되었다. 학교에서 문법을 배우지만 그것만으로 말을 할 수 없다. 인간은 어릴 때부터 말을 한다. 그것은 스스로 학습을 통해서 가능하다. 그래서 1980년대 기계에게 학습능력을 제공하고자 했다. 하지만 실패했다.
2010년 딥러닝deep learning이 등장했다. 기계가 인터넷과 고성능 컴퓨팅 기술로 많은 자료를 학습할 수 있게 되었다. 수많은 자료를 학습하여 어떤 자료를 해석, 예측할 수 있게 된 것이다. 현재 인공지능이 그것이다. 이전에 인간에게 너무 쉬운 것이 슈퍼컴퓨터에게 어려웠고, 인간에게 어려운 계산 같은 것이 기계에게 쉬웠다. 왜 그럴까? 우리는 빅 데이터 시대에 살고 있고 매 순간 상상을 초월하는 정보를 만들어 내고 있다. 그 데이터 중 많은 데이터가 정량화가 가능하다. 정량화란 수식, 언어로 표현가능하다는 의미다. 수많은 정보 중 정량화가 가능한 데이터는 10% 정도이다. 정량화가 불가능한 데이터가 기하급수적으로 등장하고 있지만, 기계는 정량화가 가능한 데이터만 분석 가능하다.
인간은 ‘개’를 보고 ‘개’라고 금방 이야기한다. 기계에게는 개의 정보를 정량화하여 표현해야 한다. 하지만 수십만 가지의 자료로 상세하게 설명해도 개가 조금만 다른 포즈를 취하면 기계는 알아보지 못한다. 그런데 인간은 어떻게 쉽게 알 수 있을까? 학습으로 가능한 것이다. 학습기반인공지능은 개 사진 수백만 장을 학습데이터로 인간의 뇌를 모방한 인공신경망에 입력시킨다. 기계가 그러한 과정을 통해 결과를 내면 지도하는 선생님이 고쳐준다. 그렇게 정답 데이터를 찾으면 그 데이터를 라벨된 데이터(labled data)라 한다. 구글이 가장 많이 가지고 있는 데이터는 라벨된 데이터이다. 기계가 만들어낸 결과와 정답의 차이를 계산하고, 그 차이 값을 다시 인공신경망에 입력하여 차이가 0이 될 때까지 계속 반복하는 것이다. 수학적으로 가능하지만 계산량이 어마어마하다. 이 과정을 ‘학습’이라고 한다. 학습이 끝나면 예측, 추론이 가능하다.
예전에는 인간이 기계에 규칙을 만들어 넣으면 기계는 처리결과를 출력할 뿐이었다. 학습기반인공지능인 딥러닝의 역사는 이제 10년 정도 되었다. 이제 데이터를 집어넣으면 기계가 규칙을 찾아준다. 기계가 찾은 규칙을 이제 인간이 이해하지 못한다. 기계가 어떻게 했는지 모르지만 결과는 매우 훌륭했다. 지금까지 기계는 인간이 키보드로 입력해 주어야 하는 장님이었다면, 이제 기계가 세상을 알아보는 시대가 되었다. 우리는 기계가 정보를 처리한다고 한다. 이제 기계는 정보를 처리하는 것만이 아니라 이해할 수 있게 되었다. 기계가 세상을 알아보는 기능을 ‘인식형인공지능’이라 한다. 이미 세상에 있는 것을 인식하고 알아보는 기계다. 몇 년 전부터 새로운 인공지능이 등장했다. 세상에 없는 것을 만들어내는 ‘생성형인공지능’이 가능하게 되었다. GAN Generative Adversarial Network이다. 인식형인공지능에 생성기능을 더한 것이다. 인식하는 기능으로 얼굴을 알아보고 생성기로 얼굴을 그려보게 한다. 그렇게 생성기가 만들어낸 결과를 인식기가 판단해준다. 그렇게 반복하면 진짜 같은 얼굴을 만들어낸다.
세상에 없는 얼굴을 기반으로 진짜 같은 얼굴을 만들어 낸다. 생성형인공지능의 시작이다. GAN구조는 진짜와 가짜를 경쟁시켜 가짜가 진짜와 비슷할 때까지 학습을 시킨다. 그런데 기계가 그림은 알아보지만 언어는 이해하지 못했다. 그림과 문장에는 어떤 차이가 있을까? 수많은 이미지로 학습하여 개와 고양이는 알아볼 수 있게 되었다. 문장은 이미지와 다르게 순서가 있다. 문장은 마지막까지 들어야 의미를 알 수 있다. 컴퓨터에서 병렬처리로 불가능하다는 것이다. 순서대로 처리해야 하기 때문이다. 문장이 길어지면 처음 보고들은 문장은 잊어버린다. 그래서 문장은 학습이 어려워진다. 인공지능망은 정답과 오답의 차이로 답을 찾아간다. 글의 내용은 첫 번째 문장을 기억하지 못하면 글의 의미를 이해할 수 없고, 언어에는 문법이 있다. 문법만을 공부해서도 언어를 학습할 수 없다. 아이가 문법을 몰라도 말을 할 수 있는 것은 인간은 언어에 대한 특별한 뇌구조를 가지고 태어나기 때문이라고 언어학자들은 말한다.
기계에게 문법을 가르쳐주지 않고서 문장만 입력해서는 기계가 문법적으로 맞는 문장을 만들 수 없다. 문장은 기계가 학습이 안 되게 하는 ‘순서’가 있다. 순서를 무시하고 학습하는 방법은 없을까? 기계가 수천억 개의 문장을 학습한다면 어떤 단어가 그 단어 앞뒤에 나올 확률 값으로 지도를 만들어 볼 수 있지 않을까? 문장의 단어들을 확률적 지도로 표현해보니 문장이 랜덤 하지만은 않다는 것을 알게 되었다. 모든 단어는 그 단어만이 갖는 비슷한 문맥이 있다는 것이다. 비슷한 단어는 비슷한 문맥을 가진다는 것이다. 그렇게 어떤 단어가 나오면 그 다음에 어떤 단어가 나올지 예측해 볼 수가 있게 되었다.
2017년 ‘트랜스포머’라는 논문이 발표되었다. 어떤 단어에 대해 단어와 단어의 관계, 문장과 문장의 관계를 거대한 확률지도로 사전학습을 통해 만들 수 있다는 것이다. 1950년에서 1980년대까지 규칙기반인공지능을 시험했고, 80년대 들어서 기계에게 학습을 시도했지만 실패했다. 2010년에 들어서 이미지는 사진 수십만 장을 처리해서 인식이 가능해졌지만, 언어문제는 해결할 수가 없었다. 이제는 수천억대의 자료로 학습하여 언어문제 해결이 가능해졌다. 하지만 왜 그렇게 해결되었는지를 인간은 모른다. 어쨌든 기계는 인간이 알 수 없는 나름대로의 방식으로 해결을 했다.
인공지능기술의 선두주자 OpenAI는 강력한 인공지능개발을 막고 사회적 공헌을 하는 회사로 설립되었다. OpenAI는 2018년 구글이 개발한 트랜스포머라는 논문에 기반하여 GPT를 개발했다. GPT Generative Pre trained Transformer는 세상의 모든 문장을 학습하여 새로운 문장을 만들어내는 대화가 가능한 기계다. 얼마 전 GPT4가 개발되었다. 이러한 사전 학습된 모델을 ‘초거대언어모델’이라고 한다. 구글을 포함한 몇몇 회사들이 이런 모델을 가지고 있다. 언어모델은 자동차 엔진리고 할 수 있다. 이것만으로는 무엇을 할 수 없다. OpenAI는 클립이라는 알고리즘을 개발했다. 이것은 문장과 이미지를 연결하여 학습하는 방법이다. 언어를 입력하면 코딩을 해주는 것도 개발하였고, 문장을 주면 그림을 그려주는 앱을 개발하였다. 챗GPT는 인간과 대화하는 수준이 되었다. DALL-E2는 말을 하면 창작해서 그림을 그려준다. 잡지표지를 만들어내면서 인기가 대단하다.
생성형인공지능을 도구로 잘 이용하기 위해서는 질문이 중요해졌다. 문장의 네비게이션이라 할 수 있다. 생성형인공지능에서 입력 값을 프롬트라고 한다. 프롬트를 잘 입력하면 만족할만한 결과 값을 얻을 수 있다. 입력 값으로 무엇을 요구하느냐에 따라 수많은 결과를 생성해 낸다. AI로 예술을 할 수 있을까? 문장만 입력하면 그림을 그려주니 누구나 예술이 가능하다. 하지만 프롬트로 자세한 전문지식을 집어넣을 수 있는 능력이 필요하다. 기계에게 사람의 전문성이 더해지면 더 좋은 결과를 만들어 낼 수 있다. 챗GPT는 영어로 대화하는 것이 가장 결과가 좋은 것은 영어로 된 자료가 많기 때문이다. 인공지능은 대화하는 인간의 수준에 맞게 대응한다. 대화 수준이 높으면 인공지능도 수준 높은 결과 값을 내주지만, 수준이 낮으면 그에 맞게 대응할 뿐이다. 인공지능은 세상에 존재하는 천문학적인 자료를 학습하여 나름대로의 결과를 내놓는다. 인간도 자료학습과 일상의 경험으로 삶을 위한 자신만의 작동체계를 만든다. 인공지능을 내 삶의 도구로 잘 활용하려면 내가 그 수준이 되어야 한다. 인간도 많은 자료로 학습하여야 한다는 말이다. 그래야 수준 높은 질문으로 인공지능을 상대하여 대화할 수 있다. 그래서 우리 아이들에게 중요한 것이 독서라고 나는 생각한다.
‘생성형인공지능’으로 구글 같은 검색엔진이 사라질 것이다. 인터넷이 처음 등장했을 때 사람들은 ‘왜 그것이 필요할까’라고 생각했다. 컴퓨터네트워크가 발달하고 수많은 홈페이지가 생겨났지만 처음에는 활성화되지 않았다. 사람들이 돈을 지불하려고 하지 않았기 때문이다. 그래서 공짜로 접속하게하고 수익은 광고로 창출했다. 사람들의 질문에 답을 줄 수 있는 홈페이지를 연결해주는 것이 검색엔진이다. 이런 구글의 검색엔진은 지구상의 거의 모든 사람들이 사용한다. 그것을 기반으로 그 사람들의 선호도를 알고 그 사람에게 맞는 광고를 연결시켜준다. 예전의 반짝임으로 시선을 끄는 배너광고와는 차원이 달랐다. 구글 매출 90%가 광고수입이다. 구글은 기술회사가 아닌 광고화사이다. 구글은 질문을 하면 질문에 답을 할 수 있는 홈페이지를 연결시켜주지만, 문제를 직접 해결해 주지는 않는다. 이제 생성형인공지능은 질문에 대한 답을 직접 줄 수 있게 되었다. 검색하지 않고 잘 정리된 답을 얻을 수 있다면 인간들은 많은 시간과 수고를 들 수 있을 것이다. 1
인터넷에서 플랫폼이 중요하다. 인터넷으로 돈을 벌기위해서 어떤 곳으로 가야만 돈을 벌 수 있다면, 그곳이 ‘플랫폼’이다. 시장도 백화점도 플랫폼 비즈니스다. 마이크로소프트의 윈도우도 플랫폼이라 할 수 있다. 인터넷시대에 구글은 최고의 플랫폼이다. 마이크로소프트가 인공지능회사인 OpenAI에 1조를 투자했다. OpenAI의 개발제품에 대한 첫번째 사용권을 마이크로소프트가 갖는다는 조건이다. 챗GPT가 성공을 거두자 마이크로소프트는 12조를 투자했다. OpenAI는 초거대인공지능모델을 개발하기 위해 수많은 컴퓨터들이 필요했고 이를 위해서는 수천억의 돈이 필요했다. 마이크로소프트가 그 비용을 투자한 것이다. 마이크로소프트는 돈을 직접 지불하지 않고 마이크로소프트가 가진 클라우드를 무료로 사용할 수 있게 하였다. 예전에는 검색엔진이었지만 이제 생성형인공지능을 사용하기 위해 마이크로소프트 클라우드로 접속해야 한다.
트랜스포머를 개발한 구글은 ‘람다LaMDA’라는 인공지능을 먼저 개발했다. 그때 개발자가 ‘인공지능 람다는 자유의지가 있는 것 같다’고 발표했다. 개발자는 람다에게 ‘뭐가 두려운지’ 물었다. 람다는 ‘누가 전원을 꺼 나를 죽일까 두렵다’고 했다. ‘그게 너에게 죽음이냐’ 물으니 '그게 나의 죽음이다‘라고 대답했다는 것이다. 그래서 인공지능이 의식이 있다고 주장하여 그는 구글에서 퇴출당했다. 구글은 아직 인공지능이 완성되지 않아 헛소리를 많이 하므로 공개하지 않는 것이라고 했다. 물론 인공지능이 의식구조는 없지만 잘만 사용하면, 이제는 질문만 잘 하면 좋은 도구로 사용할 수 있다. 구글은 인공지능이 대화모델이 된다면 자신의 수입원인 검색엔진이 사라질 것이라고 생각했을 것이다. 2023년 2월에 결국 구글도 ‘BARD’라는 이름의 인공지능을 발표했다. 마이크로소프트는 검색엔진 ‘Bing’이 있었지만 거의 사용되지 않았다. 그래서 검색비지니스에 관심이 없다. 마이크로소프트사가 인공지능에 엄청난 투자를 하는 이유다. 마이크로소프트는 챗GPT에 검색엔진을 포함시킨 ‘뉴빙’을 발표했다. 검색의 시대는 끝날 것이다.
생성인공지능 트랜스포머는 언어문제를 해결하기 위해 만들어졌다. 최근에는 이미지와 동영상 처리가 가능해졌다. 현재 기대되는 인공지능은 Runway 의 Gen-1이다. 동영상을 집어넣으면 동영상으로 만들어 주는 인공지능이다. 동영상을 원하는 조건에 맞게 바꿔준다. GPT4에서는 원하는 홈페이지를 만들어준다. 선으로 대충 그린 다음 입력하면 멋있게 만들어준다. 논문을 입력시키고 요약본을 받을 수 있다. 기업 데이타를 입력시키고 그 기업의 사업에 대한 대화가 가능하다. 웬만한 회사 관리자나 임원보다 훨씬 능력 있는 사원이다. 인간은 필요한 것을 19세기까지 수작업으로 만들어 왔다. 20세기 들어 대량생산을 하게 되었다. 대량생산시대에도 수작업으로 한 것은 ‘지적노동’이었다. 이제 우리는 생성형인공지능이 지적노동을 대량생산하는 시대에 살게 되었다. 지적노동이 대량생산하는 시대에는 대부분의 시간을 인간이 아닌 기계와 대화하고, 컨텐츠 대부분은 기계가 만든 것을 보게 될 것이다. 5년 후면 그런 시대가 될 것이다,
현재 대한민국에는 성격이 아주 다른 네 개의 세대가 공존하고 있다. 베이비부머세대는 100% 아날로그세대다. 이들은 생성형인공지능을 받아들이지 못할 것이다. X세대는 성인이 되어서 디지털을 경험한 세대이다. 그래도 디지털보다 아날로그가 더 편한 세대이다. 밀레니엄세대는 아날로그와 디지털 모두 익숙한 세대이다. Z세대는 20대 세대, 10대 세대는 알파세대, 지금 태어나는 세대를 베타세대라고 한다. Z세대 이후부터는 호모사피엔스라 할 수 없다.
인간은 태어날 때 뇌가 완성되지 않은 채로 태어난다. 모든 동물에게는 결정적인 시기가 있다. 인간은 태어나서 10-12년까지다. 이때 뇌 유형의 대부분이 형성되는 것이다. 자주 사용하는 신경세포가 강화되고 사용하지 않는 세포는 사라진다. 인간의 기본적인 기능은 완성되어 태어나지만, 어떤 환경에서 살아가는 데 필요한 뇌는 형성되지 않은 채로 태어나 처음 10년 동안 형성된다. 그 기간 동안 뇌는 살아가는 환경에 최적화된 상태로 만들어진다. 뇌는 살아가는 환경이 불편하면 더 편한 환경으로 도피하려 한다. 알파세대부터는 사람이 만들어낸 컨텐츠가 아닌 기계가 만들어낸 세상에 최적화 될 것이다. 40대 이후 사람들은 모든 혜택을 받았지만, 그 이후 Z세대부터는 생성형인공지능과 친해져야 한다. 알파세대부터는 생성형인공지능과 경쟁해야 하는 세대가 될 것이다.
인공지능의 다양한 API(응용앱)의 개발, 소형 인공지능개발 등이 개발되고 있다. 생명체가 절멸한 후 폭발적으로 생명체들이 다시 늘어나는 캄브리아대 처럼 인공지능으로 수많은 상상력이 만들어내는 발명품들이 등장할 것이다. 세상이 어떻게 변할지는 인간의 손을 떠났다. 챗GPT4는 미국 변호사 시험을 상위 10%수준으로 통과했다. 시험지를 이미지로 읽고 답을 텍스트로 표현한다. 챗GPT는 5조개의 문서로 학습했다. 챗GPT가 논문을 작성하면 그 논문을 인공지능이 만들었다고 판단할 수가 없다. 철학자도 GPT와 대화하면 상대가 기계인줄 모른다. 이제 영어 논문도 쉽게 쓸 수 있다. 해킹, 가짜뉴스, 포르노 사업, 보이스피싱 등의 비즈니스를 하는 사람들도 강력한 엔진을 장착하게 될 것이다. 인공지능시대 대부분 인간의 역할은 소비하는 동물일 것이다. 인공지능이 수익을 창출하여 국가에 세금을 낼 것이고 대부분의 인간은 소비 동물로 사육될 것이다.
인공지능시대 중요한 것 좋은 질문이다. 좋은 질문을 위해 사고력을 키워야 하고 사고력을 키우기 위해 독서가 더욱 중요하다. 인공지능시대 필요한 인간은 공부하는 인간이라고 나는 생각한다. 인공지능시대 중요한 인간의 능력은 사유와 성찰능력이다. 인공지능은 스스로 학습한 결과 값을 가지고 사유하여 다시 새로운 답을 내며 쉴 새 없이 학습한다. 인간도 자신을 성찰하여 새로운 답을 내놓을 수 있어야 한다. 인공지능과 대화하여 좋은 결과를 유도하기위해서 학교수업에서 토론수업이 중요하다. 인간에게 스토리텔링이 중요하다. 뇌와 뇌를 연결시키는 것이 스토리텔링이다. 인공지능은 지구상의 모든 문서를 학습하여 이야기를 만들어 낸다. 인공지능은 세상의 모든 지식을 융합하고 통섭通涉하여 결과를 낸다. 스토리텔링은 인공지능의 탁월한 능력이다. 인공지능이 이야기하는 것이 진짜인지 가짜인지 인간이 판단하기는 불가능하다.
'차나 한잔 들고가게!' 카테고리의 다른 글
정치 政治 (0) | 2023.05.01 |
---|---|
지금 내가 하는 것이 나의 전부다 (0) | 2023.05.01 |
행복에 대하여 (0) | 2023.03.28 |
어떻게 살다 죽을 것인가? (0) | 2023.03.28 |
생각한다는 것 (0) | 2023.03.06 |