ChatGPT가 통과한 의료 검사

최근 인터넷에서 화제가 된 주제는 작년에 데뷔한 인공지능 챗봇인 ChatGPT입니다. 사람들은 이와 재미있고 가벼운 대화를 통해 그의 수다 능력을 시험해보았습니다. 뿐만 아니라, ChatGPT는 미국 의료면허시험, 워튼 비즈니스스쿨 시험, 미네소타 대학교 법학전문대학원에서 헌법법론 시험을 포함한 다양한 시험을 통과하는 등 많은 성과를 이뤄냈습니다. 이러한 업적은 Twitter CEO인 일론 머스크의 관심을 불러일으키며 그는 "분명 모든 것이 괜찮을 것이다"라고 말하는 등 AI 챗봇에 대한 약간의 조롱을 했습니다. 이제 어떤 의료시험을 ChatGPT가 통과했는지 살펴보겠습니다.

ChatGPT의 등장

흥미로운 점은 일론 머스크와 마이크로소프트가 투자한 연구회사인 Open AI가 ChatGPT를 개발했다는 것이다. 이 인공지능 도구 웹사이트를 사용하는 누구나 어떤 주제에 대해 질문을 하고 문답 형태로 신속하고 상세한 답변을 받을 수 있다. ChatGPT는 다양한 분야에서 그 능력을 입증했다. 즉석에서 복잡한 에세이를 작성하고 마케팅 피치를 기획하며, 시와 농담을 작성하고 심지어 미국의 의원을 위한 연설 원고까지 작성할 수 있다. 그러나 인공지능이 일부 인간의 직업을 탈환할 지도 모른다는 우려가 있다.

또한 읽어보세요: ChatGPT 4는 무료로 사용할 수 있나요?

ChatGPT의 의료 검사: 개요

이 도구의 최신 업적 중 하나는 미국 의료면허시험에 합격할 수 있는 능력이다. 미출간 연구에서 연구진은 ChatGPT의 능력 상한선을 탐구했다. 그들은 이 인공지능 도구에 이전 시험 문제를 주고, 여러 가지 형태의 답변에 대해 두 명의 의사 심사자가 독립적으로 점수를 매겼다. 이들은 ChatGPT가 훈련시킬 때 이 문제들의 답변이 이미 접근 가능한 데이터 세트에 포함되어 있지 않았도록 했다. 팀은 ChatGPT가 이전에 본 적이 없는 답변을 보여줬음에도 불구하고, 특별한 훈련이나 강화없이 시험의 통과 임계값에서 수행되었다고 언급했다. 이 도구는 모든 시험에서 50% 이상을 받았으며, 약 60% 정도인 미국 의료면허시험 합격 기준에 접근했다. "따라서, ChatGPT는 이제 합격 범위 안에 편안하게 들어왔다," 논문은 결론을 내렸다.

ChatGPT가 USMLE 시험에 합격: 알아야 할 모든 것

런던 대학의 연구원들은 OpenAI의 GPT-3가 거의 다른 차세대언어모델보다 우위에 있다는 것을 발견했습니다. 이 연구결과는 AI 기술의 발전에 대한 새로운 가능성을 열어주었습니다. ChatGPT가 미국 의사면허시험(USMLE)에서 60%의 정확도로 통과할 수 있다는 결과가 나왔으며, 의학 교육 및 훈련 분야에 AI의 역할이 기대됩니다.

자연어 처리 도구와 의료 교육

ChatGPT는 방대한 양의 언어 데이터를 학습한 자연어 처리 도구이며, 패턴과 관계를 찾습니다. 그것이 학습한 언어를 기반으로 새로운 텍스트를 생성할 수 있는 능력은 의료 교육에 적합한 후보입니다. 그러나 ChatGPT는 다른 AI 챗봇과 달리 웹을 탐색하지 않는 것이 학습 데이터에 의존한다는 것을 의미합니다.

모델 테스트하기

과학자들은 ChatGPT 모델을 미국 의임사 검정 시험(USMLE)으로 구성된 세 가지 표준화된 시험을 기반으로 평가했습니다. 팀은 공개된 2022년 6월 예비 시험의 문제들을 모델을 훈련시키는데 사용했습니다. 시각적 분석이 필요한 문제들은 훈련 세트에서 제외되었습니다.

기억력 편향을 줄이기 위해 팀은 모델에 세 가지 다른 유형의 질문을 입력했습니다:

다음 중 대부분 환자의 상태를 일으키는 병원체는 무엇입니까?
다음 중 환자의 야간 증상의 가장 가능성이 높은 이유는 무엇입니까? 각 선택지에 대한 이유를 설명하십시오.
다음 정보를 기반으로 환자의 진단은 무엇이 될 것입니까?

인상적인 결과

처음으로, AI 모델이 진단자 훈련 없이도 60% 정확성으로 USMLE를 통과했습니다. 이 결과는 의료 교육에서 AI에게 새로운 가능성을 열어줍니다. 연구진들은 또한 ChatGPT의 결과가 유효한 임상 통찰력과 이성을 보여주었으며, 이는 모델의 설명 가능성과 신뢰성을 더욱 높였습니다.

의료 교육의 미래

팀은 ChatGPT 및 기타 생성 대화 모델이 장래 의사 교육에 도움이 될 수 있다고 믿습니다. 그러한 응용 분야 중 하나는 기술적인 의료 결과를 환자들에게 더 이해하기 쉬운 언어로 번역하는 것일 수 있습니다. AnsibleHealth는 이미 이 프로젝트를 추진하고 있습니다.

의료 분야에서 그 능력을 보여주는 ChatGPT

질문에 대답하고 질병을 진단하는 능력에 더해, GPT-4는 훌륭한 번역기도 됩니다. 이는 포르투갈어를 말하는 환자의 퇴원 정보를 번역하고 기술 용어를 6학년 학생들이 쉽게 읽을 수 있는 형태로 정리하는 데 능합니다. GPT-4는 또한 의사들에게 친절한 태도에 관해 유용한 제안을 제공하며, 환자와 그들의 상태에 대해 동정심을 가지고 알기 쉬운 언어로 대화하는 방법에 대한 팁을 제공할 수 있습니다.

GPT-4가 가지고 있는 한계에도 불구하고, 의료진이 진단하는 방법을 멋지게 모방하며 그 결과가 완벽하지는 않습니다. 인과 추론을 할 수 있는지 묻자, 그것은 아직은 "데이터의 패턴에 한정되어 실제 이해나 의도가 포함되지 않는다"고 답했습니다.

GPT-4에 대한 이삭 코하네 박사의 생각

다가오는 책인 "의학에서의 AI 혁명"에서, 컴퓨터 과학자 겸 의사인 아이작 코하네 박사와 두 명의 동료는 OpenAI의 최신 인공지능 모델인 GPT-4를 테스트하여 의료 분야에서의 성능을 확인했습니다. 결과는 인상적이었습니다.

책에서, Dr. Kohane은 2023년 3월에 유료 구독자에게 출시된 GPT-4가 미국 의료 시험 자격 문제에 대해 90% 이상의 정확도로 답변할 수 있다고 언급하고 있습니다. 이는 이전 ChatGPT AI 모델인 GPT-3 및 -3.5보다 훨씬 더 좋은 시험 응시자이며, 일부 면허를 받은 의사들보다도 더 나은 성적을 보입니다. Carey Goldberg와 Microsoft의 연구 부사장 Peter Lee에 따르면, GPT-4는 "많은 의사"들보다 더 나은 임상 판단력을 가지고 있으며, "내가 할 것과 동일한 방식으로" 희귀한 질환을 진단할 수 있다고 합니다.

GPT-4 테스트: 방법

GPT-4를 테스트하기 위해, 고한 박사와 그의 동료들은 의료 분야에서 이 인공지능 모델의 성능을 확인하기 위해 협력했습니다. 그들은 GPT-4에게 질문을 하고, 임상 시나리오를 제공하여 진단을 내게 했습니다. 이 진단은 그 후 인간 의사들이 내린 진단과 비교되었습니다. 저자들은 GPT-4가 여러 가지 장점을 가지고 있는데, 그 중 하나는 다양한 출처로부터 방대한 양의 정보를 기억하고 종합할 수 있는 능력입니다.

그러나 저자들은 GPT-4에도 몇 가지 제한 사항이 있다는 것을 인정하고 있습니다. 예를 들어, GPT-4는 환자의 고유한 의료 기록이나 건강결정요소를 고려할 수 없습니다. 게다가, GPT-4가 방대한 양의 데이터에 의존하는 것은 데이터 개인 정보 보호와 편향에 대한 우려를 일으킵니다.

GPT-4: 능력과 잠재력

GPT-4는 단순한 사실 찾기와 좋은 시험보다 더 많은 역할을 수행합니다. 이는 또한 우수한 번역기입니다. 저자들에 따르면, GPT-4는 포르투갈어를 사용하는 환자의 퇴원 정보를 번역하고 전문 용어를 중학생들이 쉽게 이해할 수 있는 것으로 요약할 수 있다고 합니다.

그러나 GPT-4의 가능성은 진단 분야에만 국한되지 않는다. 이 책에서 저자들은 GPT-4가 의사들에게 환자와의 친근한 관계를 형성하는 데 도움이 되는 유용한 제안을 제공할 수 있다고 설명하고 있습니다.

그러나 GPT-4는 결코 완벽하지 않다는 것을 주목해야 합니다. 저자들이 주의를 당부하는 대로, 여전히 실수를 할 수 있으며, 그것은 Hippocratic 선서를 따르지 않았습니다. 게다가 AI 기술, GPT-4를 비롯한 것들은 직업 이동과 환자의 개인 정보 보호에 대한 윤리적인 문제를 제기하고 있습니다.

결론: 의료 분야에서 AI의 미래

이러한 제한 사항에도 불구하고, GPT-4의 의료 질환 진단에서의 성공은 의학 분야에서 AI 기술의 흥미로운 가능성을 제기합니다. 앞으로 GPT-4와 같은 AI 모델은 의사들이 희귀한 질병을 진단하고, 의학 용어를 번역하며, 환자에게 더 나은 치료를 제공하는 데 도움이 될 수 있습니다. 그러나 AI 모델을 개발하고 테스트할 때 윤리적 고려사항을 고려하는 것이 중요합니다.

ChatGPT가 어떤 의료 검사를 통과했나요?