![istock.jpg](../../../../cms/istock_82e64077cc.jpg)
펜실베이니아 대학교 와튼(Wharton)의 한 교수는 일반적인 MBA 과정의 기말 시험에서 생성된 답을 채점한 후 ChatGPT에 이론상 B등급 패스를 부여했습니다.
Wharton의 운영 관리 교수인 Christian Terwiesch는 ChatGPT가 "기본 운영 관리 및 프로세스 분석 질문에서 놀라운 일을 한다"고 말했습니다.
"답이 정확할 뿐만 아니라 설명도 훌륭합니다."라고 그는 새로운 백서에 썼습니다.
그러나 그는 챗봇이 "초등학교 6학년 수학 수준의 비교적 간단한 계산에서 놀라운 실수"를 하며 현재 더 고급 프로세스 분석 질문을 처리할 수 없다고 덧붙였다. 반면 현재 버전의 ChatGPT는 사람의 힌트에 따라 답변을 수정하여 올바른 솔루션에 도달할 수 있습니다.
"이 성능을 고려할 때 Chat GPT3는 시험에서 B에서 B등급을 받았을 것입니다."라고 Terwiesch는 기록합니다.
Terwiesch의 몇 가지 질문은 ChatGPT가 처리 용량이 다른 여러 대의 컴퓨터에서 처리 작업의 병목 현상을 식별할 수 있는지 여부를 테스트하는 것을 목표로 했습니다.
그러나 ChatGPT는 중간 수준의 산술로 계산할 때 "엄청난 크기의 중대한 실수"를 저질렀습니다.
흥미롭게도 ChatGPT는 처음에 대기열 분석에 관한 Terwiesch의 질문 중 하나에 잘못 대답했습니다. 그는 더 나은 답변에 대한 힌트를 제공했고 ChatGPT는 답변을 개선했습니다. 다음날 교수는 힌트 없이 동일한 초기 대기열 질문을 했고 ChatGPT는 첫 번째 시도에서 올바르게 대답했습니다.
"과거의 피드백을 통해 학습할 수 있거나 운이 좋았거나 둘 중 하나입니다."라고 그는 대답의 품질에 임의성이 있는 것 같다고 덧붙였습니다.
Terwiesch는 또한 ChatGPT가 향후 시험에서 사용할 수 있는 영리하고 유머러스한 질문을 공식화할 수 있음을 발견했습니다. 그러나 챗봇은 일부 질문에 답변을 불가능하게 만드는 미묘한 결함도 도입했습니다.
또한: ChatGPT는 '깊이와 통찰력이 부족하다'고 저명한 과학 저널 편집자들이 말합니다.
Terwiesch는 다른 사람들에게 ChatGPT의 기능과 한계를 염두에 두라고 경고합니다. 그는 첫 번째 질문에 대한 답변을 읽은 후 ChatGPT와 "사랑에 빠졌다"고 말했지만 "상당히 단순한 상황에서 중대한 실수를 저질렀다"고 경고했습니다.
"우리는 여전히 복잡한 문제에 대한 A+와는 거리가 멀고 여전히 인간이 필요합니다."라고 그는 썼습니다.
"제 생각에는 계산기가 50년 이상 널리 사용되었고 학생들이 Google Wikipedia를 사용하여 답을 찾을 수 있지만 초등학생은 여전히 7 x 7 = 49와 펜실베니아의 수도가 Harrisburg라는 것을 배워야 합니다. 대부분의 사실적인 질문에 대한 것입니다. 고급 주제를 이해하는 데 필요한 기본 기술의 특성입니다."
Terwiesch는 K-12 학생들이 ChatGPT를 사용하여 과제 및 시험에서 부정 행위를 할 수 있다는 점을 교육자들이 염려해야 한다는 데 동의합니다. 예를 들어, 뉴욕시 교육부는 최근 교육에서 신뢰할 수 있는 테스트가 중요하고 새로운 기술로 인해 기술 인증이 손상되어서는 안 되기 때문에 챗봇을 금지했습니다. ChatGPT를 사용하는 학생은 "평균 학업 능력"을 가진 친구에게 전화를 걸어 시험을 완료하는 것과 같다고 그는 말합니다.
그러나 그는 또한 ChatGPT 및 유사 기술이 "스마트 컨설턴트"의 역할을 할 수 있다고 주장합니다. 즉, 우아하지만 종종 잘못된 답변을 제공하는 사람은 필요한 MBA 학생들의 기술 개발을 위한 "완벽한 훈련장"이라고 생각합니다. 제안된 대안을 비판적으로 평가합니다.