OpenAI의 ChatGPT가 답변하는 동안 실패하는 현상

OpenAIs-ChatGPT.jpg

이제 거의 6개월이 지났습니다. OpenAI의 ChatGPT이 출시되었습니다. 사실, 회사는 최근에 ChatGPT 4를 발표했습니다. 이 기술은 세계를 새로운 차원으로 이끌었습니다.

ChatGPT는 인공지능으로 구동되는 언어 모델로, 다양한 활동을 수행할 수 있도록 훈련되었습니다. 이 활동에는 언어 번역, 정보 요약, 그리고 질문에 대한 답변이 포함됩니다. 이 모델의 우수한 능력은 충분한 주목을 받고 있으며, 이로 인해 많은 사람들이 취업 전망에 대해 의문을 품게 되었습니다.

GPT-4 언어 처리 모델은 대량의 데이터를 분석한 후, 분석 결과에 기반하여 콘텐츠를 생성하는 데에 사용될 수 있습니다. 또한 이 새로운 기술은 많은 양의 텍스트를 분석하여 특정 데이터 포인트에 대한 정보를 소비자에게 제공할 수 있습니다.

기술이 계속해서 존재할 것이라는 것은 의심할 여지가 없습니다. 물론, 그것은 사용자들에게 다양한 방식으로 도움을 줍니다. 수많은 경우에, 그것은 스크립트 작성부터 가장 어려운 문제지 해결까지 모든 것을 수행할 수 있는 능력을 보여주었습니다. ChatGPT가 성취할 수 없는 것은 없습니다. 그러나, ChatGPT에게 어려운 것들도 있습니다.

1. 인공지능 기반의 ChatGPT는 인도에서 주목받는 Joint Entrance Examination (JEE)에서 성공하지 못하며 역경을 겪었습니다. Joint Entrance Examination은 어려움으로 유명하며 매년 수천 명의 학생들이 인도에서 가장 명문 공학 학교에 입학하기를 희망합니다. 이는 복잡한 다이어그램과 숫자가 포함된 어려운 양적 시험 중 하나입니다.

공부에 관심있는 학생들은 IITs와 NITs와 같은 명문 교육 기관에 입학하고자 한다면 먼저 합격해야 하는 것은 공동 입학 시험(Joint Entrance Test)입니다. 보고에 따르면, ChatGPT는 JEE Advanced 시험에서 좋은 성적을 내지 못했다고 합니다.

테스트에서 ChatGPT의 성능은 만족스럽지 않았습니다. 이는 종이의 총 문제 수 중 11문제만 해결할 수 있었기 때문입니다.

2. ChatGPT는 지난 과거에 크게 어려웠던 여러 다른 테스트에서 성공을 거뒀습니다. 놀랍게도, ChatGPT는 의료 대학 입시를 위한 국가 자격 및 입학 시험(NEET)에서 모든 200개의 문제를 시도하고 성공적으로 대답했습니다. NEET는 총 200개의 문제 중 180개를 정답해야 하는 시험입니다.

이에도 불구하고, ChatGPT는 모든 200개의 질문을 시도하였으며, 그 성능 결과는 800점 중 359점이었습니다. 특히, ChatGPT는 NEET 시험의 생물학 부문에서 탁월한 성과를 거두어 해당 섹션의 질문에 대한 정확성이 더욱 높았습니다. ChatGPT의 NEET 시험 성적은 JEE Advanced 시험에 합격하지 못했음에도 불구하고 다른 영역에서 뛰어난 역량을 갖고 있다는 것을 시사합니다.

ChatGPT가 JEE 고급 시험에서 경험한 패배는 가장 고도로 발전한 AI 모델에서도 존재하는 한계를 보여줍니다. 인공지능은 다양한 산업을 혁신할 잠재력이 있지만, 아직은 어려운 과제에서 인간지능과 경쟁할 수 있을 만큼 충분히 발전하지 못했습니다.

오픈AI의 챗봇 ChatGPT가 또 다른 경쟁 시험에서 성공하지 못했습니다.

3. ChatGPT는 Analytics India Magazine (AIM)의 요청으로 인도 공공 서비스 위원회 (UPSC) 시험을 치뤘습니다. UPSC 시험은 세계에서 가장 어려운 경쟁 시험 중 하나로 알려져 있습니다. 매년 10 라크 이상의 지원자가 UPSC 시험에 응시하지만 그 중 5%만이 합격할 수 있습니다.

AIM은 UPSC Prelims 2022에서 ChatGPT에게 100개의 질문을 제공했습니다.

챗봇은 UPSC 2022년도 예비시험에서 좋지 못한 결과를 보였습니다. 1번 문제지 (A 세트)에서 단지 54점을 받았는데, 필요한 점수는 87.54점이었습니다. 이는 ChatGPT가 UPSC 시험을 통과하지 못했다는 것을 의미합니다.

질문은 인도의 일반 과학, 역사, 지리, 경제, 생태학 및 최신 이벤트 주제를 기반으로 했습니다. 이 챗봇은 위치와 경제에 관한 질문에는 잘 대응하지만, 2021년 이전에 발생한 역사적 사건에 대한 질문에는 엉망진창으로 실패했습니다.

ChatGPT의 데이터 세트가 2021년까지만 확보되어 있기 때문에, AI 봇이 시험의 모든 질문에 올바르게 답변하지 못하는 결정적인 요인일 것입니다.

4. 그 외에도 ChatGPT의 CLAT 시험 결과는 평균 이상이었습니다. CLAT UG 시험 동안 이 인공지능 도구는 질문의 50.83%를 정확하게 해결하는 데에 성공했습니다. ChatGPT는 논리와 양적 질문 카테고리에서는 성공하지 못했습니다. 그러나 영어와 시사 카테고리에서는 탁월했습니다. 이 도구는 개념에 기반한 질문에 대해서는 큰 어려움을 겪었습니다.

2022년 11월에 출시된 ChatGPT는 미국에서 꽤 잘 되고 있습니다. 이 인공지능 기술은 미국 의학 면허 시험 (USMLE)과 다양한 MBA 시험에서 성공을 거두었습니다. 또한, 레벨 3 엔지니어들을 대상으로 하는 Google 코딩 인터뷰에서도 성공하였습니다.

수의사들은 최근에 ChatGPT가 개의 질환을 올바르게 진단하고 동물의 생명을 구한 사례에 놀라워했습니다.

그러나 많은 나라는 현재 ChatGPT에 대해 대조적인 견해를 가지고 있으며 이러한 새로운 혁신에 대해 강력한 조치를 취할 준비가 되어 있습니다. 최근에는 독일이탈리아를 포함한 두 개의 주요 국가에서 이 기술이 금지되었습니다. 이러한 국가들은 오픈AI의 ChatGPT가 미성년자들이 노출되는 공격적인 자료에 대비하기 위한 보호장치가 부족하다고 주장하고 있으며, 나이 확인 시스템과 같은 시스템이 없다고 말하고 있습니다.

울리히 켈베르, 독일 정보 보호 관리자는 독일에서도 이탈리아와 유사한 이유로 사용자 데이터의 보안과 관련된 우려로 인해 Chat-GPT가 잠재적인 금지 대상이 될 수 있다고 경고했습니다.

음, 미래에 인공지능 기반 기술이 어떻게 동작할지 살펴보죠.

읽어 주셔서 감사합니다! 더 많은 유익한 기사를 기다려주세요!

관련 기사

더 보기 >>

HIX.AI로 AI의 힘을 발휘해보세요!