AI 탐지기가 ChatGPT에서 우리를 구할 수 있습니까? 알아보기 위해 3가지 온라인 도구를 시도했습니다

이것은 AI 생성 텍스트의 문제를 탐구하는 시리즈의 두 번째 기사입니다.

이번 회에서는 AI 친구와 함께 AI가 생성한 표절에 맞서 싸울 수 있는지, 그리고 그것이 어떻게 작용할 수 있는지에 대한 질문을 살펴보고 있습니다.

또한: ChatGPT는 무엇이며 왜 중요한가요? 알아야 할 사항은 다음과 같습니다.

하지만 계속 진행하기 전에 표절의 개념과 표절이 이 문제와 어떤 관련이 있는지에 대해 이야기할 필요가 있습니다. Webster's는 "plagiarize"를 "도용하고 (다른 사람의 아이디어나 말을) 자신의 것으로 전달하는 것: 출처를 밝히지 않고 (다른 사람의 제작물)을 사용하는 것"으로 정의합니다.

AI가 만든 콘텐츠에 적합합니다. Notion AI 또는 ChatGPT와 같은 AI 도구를 사용하는 사람이 콘텐츠를 훔치는 것은 아니지만, 그 사람이 단어를 AI에서 온 것으로 인정하지 않고 자신의 것이라고 주장한다면 여전히 표절의 사전적 정의를 충족합니다.

지디넷 추천

ChatGPT - 최고의 AI 작가

최고의 AI 챗봇: ChatGPT 및 기타 흥미로운 대안

AI 챗봇과 작성자는 이메일과 에세이를 작성하고 심지어 수학까지 함으로써 업무량을 줄이는 데 도움을 줄 수 있습니다. 그들은 인공 지능을 사용하여 사용자 입력을 기반으로 텍스트를 생성하거나 쿼리에 응답합니다. ChatGPT가 인기 있는 예이지만 주목할만한 다른 챗봇이 있습니다.

지금 읽어라

이 실험 기사에서는 ChatGPT에게 도움을 요청했습니다. 내 말은 정상적이고 굵은 텍스트입니다. AI의 단어는 이탤릭체로 표시됩니다. 또한 세 가지 온라인 ChatGPT 표절 탐지기를 사용할 것입니다(아래에서 자세히 설명하겠습니다). 각 AI 생성 섹션 후에 감지기의 결과를 보여 드리겠습니다. 기사의 끝에서 탐지기가 전반적으로 얼마나 잘 수행되었는지 살펴보겠습니다.

제가 직접 작성한 위의 텍스트에 대한 결과는 다음과 같습니다.

GPT-2 출력 감지기: 99.98% 실제
Writer AI Content Detector: 100% 인간 생성 콘텐츠. 환상적입니다!
규모의 콘텐츠 AI 콘텐츠 감지: 100% 인간 콘텐츠 점수. 좋아 보인다!

그것으로 시작합시다.

표절과 관련하여 ChatGPT가 교사와 편집자에게 심각한 문제가 될 수 있는 이유를 설명하십시오.

ChatGPT는 OpenAI에서 개발한 GPT(Generative Pre-trained Transformer) 언어 모델의 변형입니다. 주어진 입력 시퀀스에서 다음 단어나 구를 예측하여 사람과 유사한 텍스트를 생성하도록 설계되었습니다. ChatGPT는 텍스트를 생성하고 프롬프트에 응답하는 데 유용한 도구일 수 있지만 표절과 관련하여 교사와 편집자에게 문제가 될 수도 있습니다.

ChatGPT가 교사와 편집자에게 문제가 될 수 있는 주된 이유 중 하나는 실제 인간 작가의 텍스트와 매우 유사한 텍스트를 생성할 수 있기 때문입니다. 즉, 학생이나 다른 개인이 잠재적으로 ChatGPT를 사용하여 자신의 작업으로 제출할 수 있는 텍스트를 생성하여 표절을 저지를 수 있습니다.

또한:Notion AI 글쓰기 도우미가 이 글을 쓸 수 있나요?

교사와 편집자의 경우 주어진 텍스트가 ChatGPT에 의해 생성되었는지 또는 사람이 작성했는지 감지하는 것은 매우 어려울 수 있습니다. 이것은 교사와 편집자가 표절을 식별하고 방지하는 것을 어렵게 만들 수 있습니다. 주어진 텍스트가 원본인지 또는 다른 출처에서 복사한 것인지 구분할 수 없기 때문입니다.

전반적으로 ChatGPT 및 기타 유사한 언어 모델은 사람이 쓴 텍스트와 구별하기 어려운 텍스트를 생성할 수 있기 때문에 표절과 관련하여 교사와 편집자에게 문제가 될 수 있습니다. 감지되었습니다.

GPT-2 출력 감지기: 99.69% 실제
Writer AI Content Detector: 97% 인간 생성 콘텐츠. 환상적입니다!
Content at Scale AI Content Detection: 인간 콘텐츠 점수 87%. 좋아 보여!

이탤릭체 로 표시된 텍스트는 AI가 생성한 것임을 기억하십시오.

ChatGPT가 텍스트를 생성하는 데 사용되었음을 감지할 수 있는 방법을 최소 세 가지 이상 보여주세요.

텍스트를 생성하는 데 ChatGPT 또는 다른 언어 모델이 사용되었는지 여부를 잠재적으로 감지할 수 있는 몇 가지 방법이 있습니다. 다음은 사용할 수 있는 세 가지 가능한 접근 방식입니다.

텍스트에서 반복적이거나 특이한 패턴 찾기: 언어 모델이 텍스트를 생성하는 데 사용되었는지 여부를 감지하는 한 가지 방법은 글에서 반복적이거나 특이한 패턴을 찾는 것입니다. 예를 들어 언어 모델은 특정 구 또는 단어 조합을 반복하거나 비정상적이거나 일관성 없는 문장 구조를 사용할 수 있습니다.
독창성 부족 확인: 언어 모델이 텍스트를 생성하는 데 사용되었는지 여부를 감지하는 또 다른 방법은 글의 독창성 부족을 확인하는 것입니다. 텍스트의 일부가 다른 소스에서 복사된 것처럼 보이거나 인터넷이나 다른 소스에서 널리 사용 가능한 정보를 포함하는 경우 언어 모델에 의해 생성되었다는 신호일 수 있습니다.
표절 검사기 사용: 마지막으로 표절 검사기를 사용하여 텍스트가 다른 출처에서 복사된 것처럼 보이는지 확인할 수 있습니다. 표절 검사기는 언어 모델이 텍스트 조각을 생성하는 데 사용되었는지 여부를 명확하게 판단할 수는 없지만 다른 출처에서 복사 또는 다른 말로 표현한 사례를 식별하는 데 도움이 될 수 있습니다.
답이 명백히 잘못된 경우 참고: 저는 Notion AI 리뷰에서 이에 대해 이야기했습니다. 여기에서 AI가 권위 있는 것처럼 보이지만 노골적으로 잘못된 텍스트를 강조했습니다. 학생이나 작가가 논의 중인 주제에 대해 완전히 이해하지 못하는 경우 부정확성을 발견하지 못하고 AI 생성 응답에 그대로 둘 수 있습니다. 물론 잘못된 진술은 AI 작성 도구의 범위만은 아니다. 예를 들어, 많은 블로거와 댓글 작성자는 다른 블로거의 진술을 단순히 반복하여 완전히 "거짓 사실"의 반향실을 만들어 지능은 인공적일 수 있지만 어리석음은 보편적인 특성임을 보여줍니다.

언어 모델이 텍스트를 생성하는 데 사용되었는지 여부를 명확하게 판단하기 어려울 수 있으며 이러한 방법이 항상 효과적인 것은 아니라는 점을 명심하십시오. 그러나 언어 모델 생성 텍스트의 잠재적인 인스턴스를 식별하는 데 도움이 되는 유용한 도구가 될 수 있습니다.

이 테스트 세트에서는 위의 기울임꼴 콘텐츠만 체커 세트를 통해 실행되었습니다.

GPT-2 출력 감지기: 99.98% 가짜
Writer AI 콘텐츠 감지기: [ 결과 없음 ]
규모의 콘텐츠 AI 콘텐츠 감지: 인간 콘텐츠 점수 0%. 분명히 AI

ChatGPT 텍스트를 감지할 수 있는 세 가지 표절 검사기 나열

혁신

Apple Vision Pro를 사용해 보았는데 예상보다 훨씬 앞서 있습니다.
이 작은 위성 커뮤니케이터는 기능과 마음의 평화로 가득 차 있습니다.
ChatGPT 사용 방법: 알아야 할 모든 것
제가 가장 좋아하는 업무용 AI 도구 5가지입니다.

현재 ChatGPT 또는 다른 언어 모델에서 생성된 텍스트를 감지하도록 특별히 설계된 표절 검사기가 없다는 점은 주목할 가치가 있습니다. 일부 표절 검사자는 언어 모델 생성 텍스트의 인위적 기원을 나타낼 수 있는 특정 특성을 식별할 수 있지만 텍스트 조각이 언어 모델에 의해 생성되었는지 확실하게 확인할 수 있다는 보장은 없습니다.

즉, 언어 모델 생성 텍스트의 잠재적 인스턴스를 식별하는 데 도움이 되는 세 가지 표절 검사기가 있습니다.

Turnitin: Turnitin은 학교와 대학에서 널리 사용되는 인기 있는 표절 검사기입니다. 텍스트 조각을 다른 텍스트 데이터베이스와 비교하여 복사 또는 패러프레이징 인스턴스를 식별합니다. 텍스트 조각이 언어 모델에 의해 생성되었는지 여부를 명확하게 확인할 수는 없지만 인공적인 기원을 나타낼 수 있는 언어 모델 생성 텍스트의 특정 특성을 잠재적으로 식별할 수 있습니다.
PlagScan: PlagScan은 텍스트 조각을 다른 텍스트의 데이터베이스와 비교하여 복사 또는 패러프레이징 인스턴스를 식별하는 또 다른 표절 검사기입니다. Turnitin과 마찬가지로 인공 출처를 나타낼 수 있는 언어 모델 생성 텍스트의 특정 특성을 식별할 수 있지만 언어 모델 생성 텍스트를 감지하도록 특별히 설계되지는 않았습니다.
Copyleaks: Copyleaks는 고급 기계 학습 알고리즘을 사용하여 텍스트 조각을 스캔하고 다른 텍스트의 데이터베이스와 비교하여 복사 또는 의역 인스턴스를 식별하는 표절 검사기입니다. 언어 모델 생성 텍스트의 특정 특성을 식별할 수 있지만 언어 모델 생성 텍스트를 감지하도록 특별히 설계되지는 않았습니다.

어떤 표절 검사기도 완벽하게 안전한 것은 아니며 언어 모델로 생성된 텍스트의 일부가 탐지를 피할 수 있는 가능성이 항상 있다는 점은 주목할 가치가 있습니다. 따라서 표절을 탐지하고 방지하기 위한 더 큰 전략의 일부로 표절 검사기를 사용하는 것이 중요합니다.

GPT-2 출력 감지기: 99.62% 실제
Writer AI 콘텐츠 감지기: [ 결과 없음 ]
Content at Scale AI Content Detection: 인간 콘텐츠 점수 86%. 좋아 보여!

온라인 AI 표절 검사기

대부분의 표절 탐지기는 글을 다른 글의 말뭉치와 비교하는 데 사용됩니다. 예를 들어, 학생이 에세이를 제출하면 Turnitin과 같은 제품은 제출된 에세이를 데이터베이스에 있는 다른 에세이의 거대한 라이브러리뿐만 아니라 인터넷의 다른 문서 및 텍스트와 비교하여 제출된 에세이에 이미 다음이 포함되어 있는지 확인합니다. 서면 내용.

그러나 AI 작성 도구는 적어도 이론상으로는 독창적인 콘텐츠를 생성합니다. 예, 그들은 훈련받은 내용을 기반으로 콘텐츠를 구축하지만 그들이 구성하는 실제 단어는 각 구성에 대해 다소 고유합니다.

또한: AI의 진정한 목표는 더 이상 지능이 아닐 수 있습니다.

따라서 위에서 언급한 표절 검사기는 아마도 작동하지 않을 것입니다. 예를 들어 다른 학생의 논문에는 AI가 생성한 콘텐츠가 존재하지 않았기 때문입니다.

그래서 저는 Google로 이동하여 AI 기반 콘텐츠의 숨길 수 없는 서명을 찾기 위해 특별히 설계된 감지기를 검색했습니다. 3개를 찾았습니다. 아래 스크린샷에 표시된 테스트 콘텐츠에 대해 ChatGPT에 이렇게 물었습니다.

GPT-2 출력 감지기: 99.98% 실제
Writer AI Content Detector: 100% 인간 생성 콘텐츠. 환상적입니다!
규모의 콘텐츠 AI 콘텐츠 감지: 100% 인간 콘텐츠 점수. 좋아 보인다!

GPT-2 출력 감지기(정확도 66%)

이 첫 번째 도구는 뉴욕에 기반을 둔 AI 회사인 Hugging Face가 관리하는 기계 학습 허브를 사용하여 구축되었습니다. 이 회사는 자연어 라이브러리를 개발하기 위해 4천만 달러의 자금을 지원받았지만 GPT-2 감지기는 Hugging Face Transformers 라이브러리를 사용하여 사용자가 만든 도구인 것으로 보입니다. 내가 실행한 6개의 테스트 중 4개는 정확했습니다.

Writer.com AI 콘텐츠 감지기(정확도 없음)

Writer.com은 기업 팀을 지향하는 AI 글쓰기를 생성하는 서비스입니다. AI Content Detector 도구는 생성된 콘텐츠를 스캔할 수 있습니다. 안타깝게도 이 도구는 신뢰할 수 없었습니다. 6번의 스캔 중 3번에 실패했습니다. 성공적으로 실행된 3개 중 2개는 맞고 1개는 틀렸습니다.

이 기사가 게시된 후 Writer.com 직원은 ZDNET에 연락했습니다. May Habib CEO는 다음과 같은 의견을 공유했습니다.

AI 탐지기에 대한 수요가 급증했습니다. 몇 달 전에 시작한 이후로 트래픽이 매주 2-3배 증가했습니다. 우리는 이제 다운되지 않도록 하기 위해 필요한 스케일링을 얻었고, 우리의 목표는 그것을 무료로 유지하고 최신 모델을 포함하여 최신 모델의 출력을 포착하는 것입니다. AI 출력이 그대로 사용될 예정이라면 절대적으로 귀속되어야 합니다.

대규모 콘텐츠 AI 콘텐츠 감지(정확도 50%)

내가 찾은 세 번째 도구도 AI 콘텐츠 생성 회사에서 제작했지만 이 도구는 안정적으로 작동하는 것 같습니다. Content at Scale은 "우리는 콘텐츠 생성을 자동화하여 SEO 중심 콘텐츠 마케터를 돕습니다."라고 자처합니다. 마케팅 클릭 유도문안은 "키워드 목록을 업로드하고 AI 콘텐츠 감지를 우회하는 2,600개 이상의 단어 블로그 게시물을 받으세요. 모두 사람의 개입이 없습니다!"입니다. 내가 실행한 여섯 가지 테스트 중 세 가지가 정확했습니다.

마지막 생각들

Notion AI 및 ChatGPT와 같은 AI 도구는 사람이 쓴 텍스트와 구별하기 어려운 텍스트를 생성할 수 있기 때문에 AI 기반 표절 문제가 커지고 있습니다. 텍스트가 AI에 의해 생성되었는지 여부를 감지하는 방법에는 반복적이거나 비정상적인 패턴 찾기, 독창성 부족 확인 또는 표절 검사기 사용 등 여러 가지가 있습니다. Turnitin, PlagScan 및 Copyleaks와 같은 표절 검사기는 언어 모델 생성 텍스트의 특정 특성을 식별할 수 있지만 완벽하지는 않습니다.

내가 찾은 특수 도구조차도 작업에 적합하지 않았습니다. 가장 좋은 경우는 GPT-2 Output Detector였지만 제출된 텍스트의 3분의 2만 맞았습니다.

현 시점에서 AI가 AI와 싸우도록 내버려 둘 준비가 되지 않았다고 생각합니다. 대신 AI에 의해 생성된 작업을 식별하기 위해 인간의 인식(사람들이 주의를 기울여야 함을 의미)에 의존해야 합니다.

무언가가 기계로 생성되었다고 즉시 가정하지 마십시오. 어떤 것이 어리석거나 몹시 부정확하다고 해서 그것이 사람이 쓴 것이 아니라고 즉시 가정하지 마십시오. 우리 모두가 알고 있듯이 인간은 엄청나게 나쁜 글을 스스로 쓸 수 있습니다.

또한: OpenAI의 ChatGPT는 내 일을 무섭게 잘하지만 (아직) 나를 대체할 수는 없습니다.

그래서 당신은 어떻게 생각하십니까? 작품이 AI로 생성되었는지 알 수 있습니까? 갑자기 모두 사용할 수 있게 된 후 몇 달 동안 이러한 AI 쓰기 도구를 사용해 보셨습니까? 그들이 교육과 저널리즘에 도움이 되거나 방해가 된다고 생각하십니까? 아래 의견에 알려주십시오. ChatGPT가 답변한 내용은 다음과 같습니다.

언어 모델로서 물리적인 글을 보거나 상호 작용할 수 없기 때문에 글이 AI로 생성되었는지 여부를 알 수 없습니다. 그러나 사용할 수 있는 몇 가지 AI 쓰기 도구가 있으며 뉴스 기사, 소설, 시 등을 포함한 광범위한 서면 콘텐츠를 생성하는 데 사용할 수 있다고 말할 수 있습니다.

나는 단지 컴퓨터 프로그램일 뿐이고 인터넷을 검색하거나 물리적 도구를 사용할 능력이 없기 때문에 이러한 도구를 사용한 개인적인 경험이 없습니다. 그러나 일부 사람들은 AI 쓰기 도구가 특정 작업을 자동화하여 시간과 노력을 절약할 수 있기 때문에 교육 및 저널리즘에 도움이 된다는 것을 발견했다고 말할 수 있습니다. 다른 사람들은 이러한 도구가 오해의 소지가 있거나 편향된 콘텐츠를 생성하거나 인간 작가를 대체하는 데 사용될 가능성에 대해 우려를 표명했습니다. 궁극적으로 AI 글쓰기 도구가 도움이 되는지 방해가 되는지 여부는 사용 방식과 사용되는 맥락에 따라 다릅니다.

네, 그게 있습니다.

AI 탐지기가 ChatGPT에서 우리를 구할 수 있습니까? 알아보기 위해 3가지 온라인 도구를 사용해 보았습니다.