ChatGPT는 어떻게 작동하나요?

ChatGPT 는 가장 빛나는 새로운 AI 기반 도구 중 하나이지만 백그라운드에서 작동하는 알고리즘은 실제로 2020년 이후로 모든 범위의 앱과 서비스를 지원하고 있습니다. 따라서 ChatGPT의 작동 방식을 이해하려면 먼저 기본 언어에 대해 이야기해야 합니다. 동력을 공급하는 엔진.

ChatGPT의 GPT는 대부분 GPT-3 또는 Generative Pre-trained Transformer 3이지만 GPT-4는 현재 ChatGPT Plus 가입자가 사용할 수 있으며 곧 더 널리 보급될 것입니다. GPT 모델은 OpenAI(ChatGPT 및 이미지 생성기 DALL·E 2의 배후에 있는 회사)에서 개발했지만 Bing의 AI 기능에서 Jasper 및 Copy.ai와 같은 작성 도구에 이르기까지 모든 기능을 지원합니다. 실제로 현재 사용할 수 있는 대부분의 AI 텍스트 생성기는 GPT-3을 사용하며 다음 단계로 GPT-4를 제공할 가능성이 높습니다.

ChatGPT는 AI 텍스트 생성기와 상호 작용하는 프로세스를 간단하고 무엇보다 모든 사람에게 무료로 제공하기 때문에 GPT-3를 각광받게 했습니다. 또한 챗봇이며 SmarterChild 이후로 사람들은 좋은 챗봇을 좋아했습니다.

GPT-3 및 GPT-4는 현재 가장 인기 있는 대규모 언어 모델(LLM)이지만 향후 몇 년 동안 훨씬 더 많은 경쟁이 있을 것입니다. 예를 들어 Google에는 자체 언어 엔진인 PaLM 2(Pathways Language Model)로 구동되는 AI 챗봇인 Bard가 있습니다. 그러나 현재로서는 OpenAI의 제안이 사실상 업계 표준입니다. 사람들이 손에 넣을 수 있는 가장 쉬운 도구일 뿐입니다.

그래서 "ChatGPT는 어떻게 작동합니까?"에 대한 대답입니다. 기본적으로 GPT-3 및 GPT-4입니다. 그러나 조금 더 깊이 파고 들어 봅시다.

ChatGPT가 무엇인가요?

ChatGPT는 OpenAI에서 만든 앱입니다. GPT 언어 모델을 사용하여 질문에 답하고, 사본을 작성하고, 이메일 초안을 작성하고, 대화를 나누고, 다양한 프로그래밍 언어로 코드를 설명하고, 자연어를 코드로 번역하는 등의 작업을 수행하거나 적어도 자연어를 기반으로 시도할 수 있습니다. 먹이를 주라는 메시지가 표시됩니다. 챗봇이지만 정말 정말 좋은 것입니다.

예를 들어 애완 동물에 대한 셰익스피어 소네트를 쓰고 싶거나 일부 마케팅 이메일의 제목에 대한 몇 가지 아이디어를 얻고 싶다면 가지고 노는 것도 좋지만 OpenAI에도 좋습니다. 실제 사용자로부터 많은 데이터를 얻을 수 있는 방법이며 GPT의 강력한 기능에 대한 멋진 데모 역할을 합니다.

현재 ChatGPT는 두 가지 GPT 모델을 제공합니다. 기본값인 GPT-3.5는 덜 강력하지만 누구나 무료로 사용할 수 있습니다. 고급 GPT-4는 ChatGPT Plus 가입자로 제한되며 매일 제한된 수의 질문만 받습니다.

ChatGPT의 큰 특징 중 하나는 여러분이 나누는 대화를 기억할 수 있다는 것입니다. 즉, 이전에 요청한 내용에서 컨텍스트를 수집한 다음 이를 사용하여 대화 내용을 알릴 수 있습니다. 또한 재작업 및 수정을 요청할 수 있으며 이전에 논의한 내용을 다시 참조합니다. AI와 상호 작용하는 것이 진정한 전후 관계처럼 느껴집니다.

실제로 감을 잡고 싶다면 지금 ChatGPT로 5분 동안 플레이한 다음(무료입니다!) 돌아와서 작동 방식에 대해 읽어보세요.

ChatGPT는 어떻게 작동하나요?

이 거대한 데이터 세트는 인간의 뇌를 모델로 한 딥 러닝 신경망 [ ... ] 을 형성하는 데 사용되었습니다. 이를 통해 ChatGPT는 텍스트 데이터의 패턴과 관계를 학습하여 [ ... ] 주어진 문장에서 다음에 오는 텍스트를 예측합니다. .

ChatGPT는 사용자의 프롬프트를 이해하려고 시도한 다음 훈련된 데이터를 기반으로 사용자의 질문에 가장 잘 대답할 것으로 예상되는 일련의 단어를 내뱉는 방식으로 작동합니다.

그 훈련에 대해 실제로 이야기합시다. 초기 AI에 몇 가지 기본 규칙을 부여한 다음 자체 알고리즘을 개발하기 위해 작업할 상황에 놓이거나 많은 양의 데이터를 제공하는 프로세스입니다.

GPT-3는 약 5000억 개의 "토큰"에 대해 교육을 받았는데, 이를 통해 언어 모델이 더 쉽게 의미를 할당하고 그럴듯한 후속 텍스트를 예측할 수 있습니다. 더 길거나 더 복잡한 단어는 종종 여러 토큰으로 분해되지만 많은 단어가 단일 토큰에 매핑됩니다. 평균적으로 토큰의 길이는 약 4자입니다. OpenAI는 GPT-4의 내부 작동에 대해 침묵을 지켰지만 훨씬 더 강력하기 때문에 거의 동일한 데이터 세트에서 훈련되었다고 가정할 수 있습니다.

모든 토큰은 인간이 작성한 방대한 데이터 모음에서 나왔습니다. 여기에는 다양한 주제, 스타일 및 장르에 걸친 책, 기사 및 기타 문서와 개방형 인터넷에서 스크랩한 엄청난 양의 콘텐츠가 포함됩니다. 기본적으로 그것은 인간 지식의 총합을 낱낱이 파헤치는 것이 허용되었습니다.

이 거대한 데이터 세트는 인간의 두뇌를 모델로 한 복잡하고 다층적이며 가중 알고리즘인 딥 러닝 신경망을 형성하는 데 사용되었습니다. 이를 통해 ChatGPT는 텍스트 데이터의 패턴과 관계를 학습하고 인간과 같은 생성 능력을 활용할 수 있었습니다. 주어진 문장에서 다음에 어떤 텍스트가 와야 하는지 예측하여 응답합니다.

실제로는 물건을 엄청나게 과소 평가합니다. ChatGPT는 문장 수준에서 작동하지 않습니다. 대신 단어, 문장, 심지어 단락이나 스탠자가 따를 수 있는 텍스트를 생성합니다. 다음 단어를 무뚝뚝하게 추측하는 것은 휴대폰의 예측 텍스트가 아닙니다. 모든 프롬프트에 대해 완전히 일관된 응답을 생성하려고 합니다.

다양한 프롬프트에 응답하는 ChatGPT의 기능을 더욱 개선하기 위해 인간 피드백을 통한 강화 학습(RLHF)이라는 기술을 사용하여 대화에 최적화되었습니다. 기본적으로 인간은 비교 데이터(AI 트레이너가 2개 이상의 모델 응답 순위 지정)로 보상 모델을 생성하여 AI가 가장 좋은 응답을 학습할 수 있도록 했습니다.

그것이 형성한 신경망으로 돌아갑니다. 모든 훈련을 기반으로 GPT-3의 신경망에는 입력(귀하의 프롬프트)을 허용하는 1,750억 개의 매개변수 또는 변수가 있으며, 다양한 매개변수에 부여하는 값과 가중치(및 소량의 임의성 ), 귀하의 요청과 가장 일치한다고 생각하는 것을 출력합니다. OpenAI는 GPT-4가 얼마나 많은 매개변수를 가지고 있는지 밝히지 않았지만, 1750억개 이상이며 한때 소문이 났던 100조개 매개변수보다 적다는 것이 안전한 추측입니다. 정확한 숫자와 관계없이 더 많은 매개변수가 자동으로 더 나은 것을 의미하지는 않습니다. GPT-4의 향상된 성능 중 일부는 아마도 GPT-3보다 더 많은 매개변수를 가지고 있기 때문일 수 있지만 많은 부분은 훈련 방식의 개선으로 귀결될 것입니다.

결국, 그것을 상상하는 가장 간단한 방법은 어렸을 때 했던 "문장 완성" 게임 중 하나와 같습니다.

결국, 그것을 상상하는 가장 간단한 방법은 어렸을 때 했던 "문장 완성" 게임 중 하나와 같습니다. 예를 들어 GPT-3을 사용하여 ChatGPT에 "Zapier is…"라는 프롬프트를 표시하면 다음과 같이 응답했습니다.

"Zapier는 사용자가 반복적인 작업을 자동화하고 작업 흐름을 개선하기 위해 서로 다른 웹 응용 프로그램을 함께 연결할 수 있게 해주는 웹 기반 자동화 도구입니다."

Zapier가 하는 일을 설명하는 수백 개의 기사에서 찾을 수 있는 종류의 문장이므로 여기에서 내뱉는 종류의 것임이 이해가 됩니다. 그러나 내 편집자가 동일한 프롬프트를 제공했을 때 다음과 같이 말했습니다.

"Zapier는 사용자가 서로 다른 웹 애플리케이션을 연결하고 이들 간의 워크플로를 자동화할 수 있는 웹 기반 자동화 도구입니다."

꽤 비슷하지만 정확히 같은 반응은 아닙니다. 이러한 무작위성("온도"라는 설정으로 일부 GPT-3 앱에서 제어할 수 있음)은 ChatGPT가 재고 답변에 해당하는 모든 단일 응답에 응답하지 않도록 합니다. 매번 전체 신경망을 통해 각 프롬프트를 실행하고 여기저기서 두 개의 주사위를 굴려 최신 상태를 유지합니다. 재피어가 화성에서 온 색이라고 주장하기 시작할 것 같지는 않지만 상대적 가능성에 따라 다음 단어를 섞을 것입니다.

(GPT-4에서 실행할 때 ChatGPT는 다음과 같이 말했습니다. " Zapier는 사용자가 다양한 온라인 응용 프로그램과 서비스 간의 작업을 통합하고 자동화할 수 있는 웹 기반 자동화 도구입니다." 거의 동일합니다!)

지식이 아니라 말을 뱉어

ChatGPT의 제작자는 잘못된(및 유해한) 정보를 생성할 수 있다고 처음으로 말했지만 수정하기 위해 열심히 노력하고 있습니다.

길들인 예가 있습니다. GPT-3와 GPT-4를 사용하여 ChatGPT에 "Harry Guinness is… 좋은 질문입니다. 우리는 말 그대로 둘입니다! 그래서 저는 "작가 해리 기네스"(저입니다)라고 말했습니다. GPT-4는 내가 누구인지 바로 알아맞혔지만 두 가지 반응 모두 매력적이었습니다.

GPT-3: Harry Guinness는 아일랜드에 거주하는 프리랜서 작가이자 저널리스트입니다. 그는 The New York Times, The Guardian, The Huffington Post 및 Popular Mechanics를 비롯한 다양한 간행물에 글을 썼습니다. 그는 기술과 사진에서 여행과 문화에 이르기까지 다양한 주제를 다룹니다.

GPT-4: Harry Guinness는 아일랜드 작가, 사진작가, 기술 전문가입니다. 그는 How-To Geek, Lifehacker 및 Tuts+를 비롯한 다양한 간행물에 글을 썼습니다. 그의 작업은 주로 기술, 튜토리얼, 팁, 사진 및 이미지 편집에 중점을 둡니다. 기네스는 독자가 복잡한 주제를 이해하거나 간단한 방식으로 문제를 해결하는 데 도움이 되는 자세한 가이드를 만드는 것으로 명성을 쌓았습니다.

GPT-3의 첫 번째 줄과 마지막 줄은 내 다양한 웹사이트와 웹상의 저자 약력에서 거의 그대로 가져온 것입니다(비록 나는 보통 저널리스트가 아니라 프리랜서 작가이자 사진작가로 자신을 나열하지만). 그러나 간행물 목록은 기본적으로 구성되어 있습니다. 나는 The New York Times 에 글을 썼지만 The Guardian , The Huffington Post , Popular Mechanics 에는 쓰지 않았습니다.

GPT-4는 사진작가의 역할을 제대로 수행하고 실제로 내가 작성한 출판물의 일부를 나열합니다. 이는 인상적이지만 제가 가장 자랑스러워할 만한 출판물은 아닙니다. OpenAI가 GPT-3에 비해 GPT-4의 정확도를 높일 수 있었던 방법에 대한 좋은 예이지만 항상 가장 정확한 답을 제공하지는 않습니다.

그러나 오류가 ChatGPT의 배후에서 일어나는 일에 대한 흥미로운 예를 제공하므로 GPT-3으로 돌아가 보겠습니다. 실제로 나에 대해 아무것도 모릅니다. 인터넷에서 복사/붙여넣기 및 정보 출처를 신뢰하지도 않습니다. 대신, 수십억 개의 데이터 포인트를 기반으로 다음에 올 일련의 단어를 예측하는 것입니다.

예를 들면: The New York Times는 Wired , Outside , The Irish Times , 그리고 물론 Zapier와 같이 내가 쓴 곳보다 The Guardian 및 The Huffington Post와 훨씬 더 자주 그룹화됩니다. 따라서 The New York Times 에서 후속 조치를 취해야 할 때 게시된 나에 대한 정보에서 가져오지 않습니다. 가지고 있는 모든 교육 데이터에서 큰 출판물 목록을 가져옵니다. 매우 영리하고 그럴듯해 보이지만 사실이 아닙니다.

GPT-4는 훨씬 더 나은 작업을 수행하고 간행물을 못 박지만 나머지 내용은 그럴듯한 후속 문장처럼 느껴집니다. 내 평판에 대한 감사가 별로 없다고 생각합니다. 약력이 말하는 것과 같은 것을 말하는 것뿐입니다. 실제로는 거의 동일한 기술을 사용하지만 GPT-3보다 작동 방식을 숨기는 데 훨씬 더 좋습니다.

그래도 GPT가 이미 얼마나 개선되었는지는 매우 인상적입니다. 현재 GPT-4는 프리미엄 구독으로 잠겨 있으므로 표시되는 대부분의 ChatGPT 콘텐츠는 GPT-3에 의존하지만 향후 변경될 수 있습니다. GPT-5가 무엇을 가져올지 누가 알겠습니까?

ChatGPT API란 무엇인가요?

OpenAI는 자사 기술에 대해 공정한 태도를 취하지 않습니다. 이 회사는 개발자가 ChatGPT의 기능을 자신의 앱과 서비스에 통합할 수 있는 API 플랫폼을 보유하고 있습니다(물론 유료).

Zapier는 ChatGPT API를 사용하여 ChatGPT를 수천 개의 다른 앱에 연결하고 비즈니스에 중요한 워크플로에 AI를 추가할 수 있는 자체 ChatGPT 통합을 지원합니다. 다음은 시작할 수 있는 몇 가지 예이지만 기본적으로 모든 앱에서 ChatGPT를 트리거할 수 있습니다.

또한 Zapier의 OpenAI 통합을 통해 DALL·E 및 Whisper와 같은 OpenAI의 다른 모델을 사용할 수 있습니다. 이미 사용 중인 앱에서 바로 이미지 생성 및 오디오 전사와 관련된 워크플로를 자동화합니다.

ChatGPT는 어떻게 작동하나요?

ChatGPT가 무엇인가요?

ChatGPT는 어떻게 작동하나요?

지식이 아니라 말을 뱉어

ChatGPT API란 무엇인가요?

관련 기사