본문 바로가기
IT/인공지능 AI 활용

ChatGPT의 기반 기술인 GPT-3에 대해 알아보자

by 초롱불잡화점 2023. 1. 23.

이번 포스팅에서는 ChatGPT의 기반 기술인 GPT-3에 대해서 알아보겠습니다. 학술적인 원리보다는 개념과 역사, 전망 위주로 정리해 보았습니다.

달려라 GPT!

GPT-3란?

ChatGPT는 출시한 지 2개월 정도밖에 안 됐지만, 사실 기반 기술인 GPT-3는 2020년 6월에 발표된 기술이다. 해당 기술이 등장한 지는 2년이 넘었고, 그동안 이미 여러 기업에서 GPT-3을 활용해 설루션들을 많이 만들어 냈다. 국내, 해외에 블로그/마케팅/카피라이팅 콘텐츠를 자동으로 만들어주는 서비스들이 많아졌다. 네이버의 하이퍼크로버, 카카오의 kogpt 등 한국 시장을 잡기 위한 국내 대기업들의 경쟁도 활발히 진행되고 있다.

 

GPT는 딥 러닝 기술을 사용하여 인간과 같은 텍스트를 생성하는 언어 모델이며, 주요 아키텍처는 순차적 데이터 처리 능력과 병렬화 가능한 특성으로 유명한 트랜스포머 아키텍처를 기반으로 한다. GPT는 각 세대를 거듭하면서 학습할 데이터셋과 모델에 들어가는 매개 변수(파라미터)를 키워 성능을 높여 왔다. 이 모델은 570GB가 넘는 텍스트 데이터셋에 대해 학습하여, 광범위한 주제와 맥락을 이해할 수 있다. 이 모델은 1,750억 개의 매개 변수를 가지고 있다. 매개 변수는 모델이 답을 내기 위해 고려하는 변수들인데, 쉽게 말해 1750억 개의 선택지를 고려하여 답을 낸다고 볼 수 있다. (사람은 짜장면 짬뽕 고를 때 매개 변수가 2개인데!) 여태까진 데이터셋과 매개변수의 사이즈를 키우면서 성능을 높였지만 언젠간 물리적인 한계가 오지 않을까 싶기도 하다. CPU를 만들 때 클럭을 높이면서 성능을 높여오다가 다른 방법을 찾았던 것처럼.

 

GPT-3의 언어 능력

GPT-3에서 가장 인상적인 것 중 하나는 인간과 같이 텍스트를 이해하고 생성하는 능력이다. 이 모델은 에세이, 시, 심지어 코드 작성과 같은 작업을 높은 수준의 완성도로 작업할 수 있다. GPT-3는 또한 생성되는 텍스트의 맥락을 이해할 수 있으며, 이를 통해 보다 일관성 있고 관련성 있는 응답을 생성할 수 있다. 예를 들어 GPT-3에 특정 주제에 대한 에세이를 작성하라는 메시지를 주면 주제에 맞게 잘 작성된 텍스트가 생성된다. 그러나 한 편으로는 이것이 그저 무의미한 데이터의 모방이며, 의미 없이 떠들어대는 것에 불과하다고 비판하는 사람들도 있다. 또한 천연덕스럽게 틀린 정보를 제시할 수 있기 때문에, 사용하는 사람이 신중히 검토해서 사용해야 한다.


GPT-3의 응용

GPT-3는 이미 다양한 산업에서 효율성 향상과 비용 절감을 위해 사용되고 있다. 예를 들어, 고객 서비스에서 GPT-3는 일반적인 고객 문의에 대한 자동 응답을 생성하는 데 사용될 수 있습니다. 서면으로 GPT-3는 웹사이트와 소셜 미디어를 위한 콘텐츠를 생성하는 데 사용될 수 있다. GPT-3는 언어 번역에도 사용될 수 있으며, 이는 글로벌 커뮤니케이션에 상당한 영향을 미칠 수 있다.


GPT의 향후 전망

앞으로도 GPT는 세대를 거듭해 발전할 여지가 있을 것이다.(2023년에 GPT-4의 출시가 예정돼 있음) GPT-3의 자연어 처리는 컴퓨터 비전과 같은 다른 기술과 통합되어 훨씬 더 강력한 AI 시스템을 만들 수 있다. GPT-3는 사회적 약자가 기술과 더 쉽게 상호작용할 수 있도록 하는 등 접근성을 향상하는 데에도 사용될 수 있다.

 

한편 고민해봐야 할 윤리적 문제도 있다. 한 가지 우려되는 점은 GPT-3가 가짜 뉴스를 양산하는 데 사용될 수 있으며, 이는 심각한 결과를 초래할 수 있다는 것이다. GPT-3는 이전에 인간이 수행했던 작업을 자동화할 수 있는 잠재력을 가지고 있기 때문에 일자리에 영향을 미칠 수 있다는 우려도 있다. GPT-3을 계속 개발하고 사용함에 따라 사회가 이러한 윤리적 문제를 고려하는 것이 중요하다.

 

 

댓글