본문 바로가기

IT 지식

AI가 인간의 비서로 거듭나기 위해 필요한 것

 올해 8월 출간된 도서 「그렇게 쓰면 아무도 안 읽습니다 에서 저자는 "AI가 발전하면 UX 라이터라는 직업은 사라지게 될까?"라는 질문에 "현재 수준의 LLM(Large Language Model) 기반 AI는 UX 라이터를 대체할 수 없을 것"이라고 답했다. 그 이유는 "현재 AI는 맥락 이해에 있어 명백한 한계를 갖고 있다"는 것이다. 

 

이어지는 문장에서 "현재의 AI는 문장구조의 모호성, 비꼬기와 역설, 비유적 표현, 문화적 맥락을 파악해서 적절한 텍스트를 생성하는 데에 인간과 비교할 수 없을 만큼 어려움을 겪는다."고 했는데, 이 문장을 읽고 문득 빌 게이츠의 블로그 글이 떠올랐다.  

 

빌게이츠는 "가까운 미래에 인터넷을 사용하는 사람이라면 누구나 AI 개인 비서(agent)를 가질 수 있다고 했다."(참고자료 1) 그런데 비서 업무를 수행하기 위해서는 자연스러운 대화가 뒷받침되어야 할 텐데, 문장구조의 모호성, 비꼬기와 역설, 비유적 표현, 문화적 맥락을 파악하는 데에 어려움이 많다면 원활한 대화는 곤란하지 않을까? 

 

AI가 작성하는 UX 라이팅이나 AI 개인 비서가 언제 현실로 다가올지 모르겠지만 그 일들이 충분히 가능하다고 믿으려면 AI의 맥락 이해 발전이 어떻게 이루어졌고 어떻게 전개될지 알아볼 필요가 있다. 


AI의 자연어 처리와 트랜스포머 

 

 자연어는 같은 문장일지라도 다양하고 미묘한 조건에 의해 의미가 달라진다. 이 점 때문에 단어, 문법 등 규칙을 일일이 컴퓨터에 코딩하는 규칙 기반 접근 방식의 자연어 처리(NLP:Natural Language Processing)는 한계를 맞았다. 

 

"머신러닝을 도입한 이후부터 비약적인 발전을 맞은 자연어 처리의 핵심은 문장을 잘게 잘라 컴퓨터가 읽을 수 있는 숫자 형태로 변환시키는 것이다."(참고자료 1) 여기서 잘게 자른 문장은 토큰[각주:1], 숫자 형태로 변환한 것은 벡터라고 부른다. 방향을 가진 선과 좌표를 가진 점들이 무한대 차원으로 확장 가능한 벡터는 인공지능에 단어를 연산할 수 있게 한다." 이렇게 머신러닝 기법으로 학습시킨 인공지능을 '사전 학습 모델(Pre-trained Model)이라고 한다."(참고자료 2) 

 

그러나 사전 학습 모델만으로는 맥락 이해를 실현할 수 없었다. 그러던 중 "2017년 등장한 구글의 어텐션 메커니즘 중심 트랜스포머(transformer)모델은 자동번역, 대화형 챗봇, 검색 등에서 자연어 처리 기능을 대폭 강화시켰다." "(참고자료 2) 어텐션 메커니즘의 핵심은 단어들 사이의 관련성을 파악하며 문장을 이루는 단어 전부를 기억한다는 것이다. 모든 단어를 기억하고 있는 메커니즘은 AI가 어디를 주목(attention)해야 하는지도 알려줄 수 있다.   

 

현재 AI의 맥락 이해도

 

 언론 보도에 따르면 "국내 포털 네이버는 올해 8월 출시한 자사 생성형 AI 하이퍼클로바 X의 차별성으로 한국어 표현 포함 한국 사회의 맥락, 제도, 법을 이해"하는 점을 꼽았다. (참고자료 3) 개인적으로도 중요하다고 생각하는 부분인데, 그 이유는 나와 대화하는 상대방이 사용하는 언어와 오래 거주한 국가의 특성을 이해하는 것이 원활한 문답을 이루는 바탕이 되기 때문이다. 

 

최근 출시 발표된 구글의 AI 모델 Gemini는 멀티모달(Multimodality)[각주:2]로 구축되어 텍스트, 이미지, 오디오, 코드에 걸친 다양한 정보를 동시에 이해하고 해석, 결합할 수 있는 점이 특징이다. 

 

항간에는 "Gemini가 대화, 언어, 콘텐츠를 인간의 방식으로 이해할 수 있다(being able to master human-style conversations, language and content, 참고 자료 4)"고 하지만 구글 공식 블로그의 Gemini 소개 글에는 명시되어 있지 않은 내용이라 확실하지 않다. 제품을 사용해 볼 때 사실 여부를 가려본다면 현재 AI의 맥락 이해도를 연구하는 데 도움이 될 것 같다. "Gemini는 현재 구글 챗봇 Bard에 적용되어 있으며 내년 초반에 Gemini Ultra가 적용된 Bard Advanced가 출시될 예정이다." (참고자료 5)


Read me seconds. 

 

AI 발전의 목표

 

 AI의 발전은 결국 인간을 닮는 것이 관건이라고 생각한다. 어느 부문에서는 인간을 뛰어넘었을 수 있지만 여전히 발전을 요구하는 부문, 예를 들어 자연스럽고 원활한 대화, 많은 변수에 따른 추론을 보면 AI는 인간을 닮기 위해 무던히 애쓰고 있다. 

 

이런 생각을 중점으로 생성 AI 스타트업인 인플렉션 AI(Inflection AI)의 챗봇 Pi(Personal Intelligence)를 접한다면 Pi의 공감성은 혁신일 수 있다. "인플렉션 AI는 올해 6월 엔비디아, 마이크로소프트, 빌 게이츠, 구글 공동 창립자 에릭 슈미트가 주도하는 펀딩 라운드에서 13억 달러를 조달해 주목을 받았다."(참고자료 6)

 

Pi에서 인상 깊었던 점은 내가 슬프다고 말하자 무엇 때문에 슬픈지 되물어봤다는 것이다.[각주:3] AI의 감성 지능 또한 맥락 이해와 그 너머의 성장에 큰 영향을 미칠 수 있기에 지속적인 발전이 기대되고 있다.

 

결론적으로 인간이 인간의 사고방식을 최대한 파악해서 컴퓨터에 구현할 수 있다면 AI가 UX 라이팅을 작성할 뿐만 아니라 영화 아이언맨의 자비스 같은 AI 비서가 만들어지는 일이 가능할 것이다. 최근 보도된 기사에 따르면 "카이스트 연구팀이 인간 뇌의 해마에서 일어나는 기억 통합의 생물학적 특징을 AI에 적용해 학습 능력을 향상했다고 한다."(참고자료 7) 

 

AI는 인간에게 답을 찾으며 나날이 발전하고 있다. 일상에서 생성형 AI를 사용하며 발전 속도를 쫓아간다면 미래를 가늠해 보는 데 도움이 될 것이다.


참고 자료

  1. Bill Gates, "AI is about to completely change how you use computers" 「Gatesnotes」 , 2023.11.09. URL 
  2. 이종태, "AI는 너, 참 잘났다, 잘났어를 어떻게 판단할 수 있나", 「시사IN」, 2023.03.30. URL 
  3. 박효길, "최수연 네이버 대표 “하이퍼클로바X, 한국 사회의 맥락 모두 이해 차별화”, 「매일일보」 , 2023.08.24. URL
  4. Marcus Law, "Google unveils Gemini, its largest and most capable AI model", 「Technology Magazine」, 2023.12.07. URL
  5. Sundar Pichai, Demis Hassabis, "Introducing Gemini: our largest and most capable AI model", 「Google blog - Technology」, 2023.12.06. URL  
  6. ERIC HAL SCHWARTZ, "‘Personal’ Generative AI Startup Inflection AI Raises $1.3B From Microsoft, Nvidia, Bill Gates, and Eric Schmidt", 「Voicebot.ai」, URL
  7. 편집팀, "AI 기억 통합, 트랜스포머 모델의 뇌과학적 도전", 「The Science Monitor」, 2023.11.30. URL

용어 설명

  1. 토큰 : GPT4는 공백, 문장 부호, 특수 문자를 기준으로 단어를 나눈다. GPT-4 터보 모델 기준 단일 프롬프트에 128,000개 토큰을 지원한다. [본문으로]
  2. 모달리티 : 사람-컴퓨터 간의 의사소통 방식 한 가지를 뜻한다. 멀티모달이란 다양한 데이터 모달리티를 함께 고려하여 서로의 관계성을 학습 및 표현하는 기술이다. [본문으로]
  3. 구글 Bard는 슬픔이라는 감정에 대해 설명 후 슬픔을 해결하는 방법을 나열했고, 챗GPT는 자신이 할 수 있는 지원을 해주겠다고 말한다. [본문으로]