본문 바로가기
IT, 인터넷 정보/IT, 컴퓨터

chatGPT, 노션 Ai 글쓰기, 과연 평가 할 수 있을까?

by 다알랴ZOOM 2023. 3. 4.
반응형

안녕하세요 건물주박씨입니다.

 

요즘 ai로 글쓰기에 대한 이슈가 너무나도 대단합니다.

대학에서는 논문등이 chatGPT, 노션 Ai에 의해 작성되고 있고 실제 대거 0점 처리가 되는 일이 실제 발생했습니다.

이에 대해 예방법은 없는지 말씀드리도록 하겠습니다.

 

ai

 

네이버블로그, 티스토리 등의 글작성 편집기 차원에서  붙여넣기 등에 대해 무언가 방지를 하거나 판단/평가를 하면 되지 않을까요?

작성자가 글을 붙여넣기하는지를 서버에서 감지할 수 있는 기술은 있지만, 일반적으로 이러한 감지 기술은 사용되지 않습니다.

대부분의 글작성 편집기는 웹 브라우저에서 동작하며, 이러한 편집기가 클라이언트 측에서 실행됩니다. 즉, 서버에서는 클라이언트에서 전송된 데이터만을 받아서 처리하며, 클라이언트에서 이용되는 편집기의 동작에 대한 정보를 직접적으로 파악할 수 없습니다.

따라서, 일반적으로 글작성 편집기에서 붙여넣기를 하는지를 감지하기 위해서는 클라이언트 측에서 JavaScript와 같은 스크립트를 이용하여 붙여넣기 이벤트를 감지하고 서버로 전송하는 방식을 사용합니다. 하지만, 이러한 방식으로 감지하는 것은 클라이언트 측에서의 처리가 필요하며, 이는 감지하기 어려울 수 있습니다.

따라서, 보통은 붙여넣기를 하는 것이 불법적인 행위가 아니라면 감지하지 않으며, 사용자가 자유롭게 글을 작성할 수 있도록 하는 것이 일반적인 방식입니다.


요즘 ai를 이용하여 글을 작성한 뒤 붙여넣는 일이 점점 늘어나고 있습니다. 사회적으로 큰 골칫거리가 되고 있고. 대학에서는 거의 비상사태가 벌어진 상태고요. 
이런 문제를 조금이나마 방지하는 방법이 있을까? 생각해보지 않을 수 없습니다. 
AI를 이용하여 글을 작성한 뒤 붙여넣는 행위가 늘어나면서, 이를 방지하기 위한 기술적인 대응 방안이 필요해졌습니다.

현재까지 이를 방지하기 위한 다양한 기술들이 개발되어 있습니다.

 

 

웹 문서에서 글 복제를 판단하기 위한 기술


1. 자연어 처리(NLP) 기술을 이용한 분석: chatGPT, 노션 Ai를 이용한 글 작성은 기존의 글과 비교하여 문체나 문맥, 어휘 등에서 차이가 있을 수 있습니다. 이를 분석하여 유사한 패턴을 가진 글을 감지하는 방식으로 대응할 수 있습니다.

 

2. 지능형 CAPTCHA: 이미지나 오디오 형태의 CAPTCHA를 이용하여 인간의 판단을 요구하면서 자동화된 프로그램이 글 작성을 하기 어렵게 만들 수 있습니다.

3. 특수한 폰트를 이용한 방지: 인간이 쉽게 읽을 수 있는 폰트를 이용하여 작성한 글에는 보안문자나 숨겨진 마크업 정보 등이 추가되어 있을 수 있습니다. 이를 이용하여 자동화된 프로그램이 인식하기 어렵게 만들 수 있습니다.

4. 사용자 패턴 분석: 글 작성 시 사용자의 패턴을 분석하여 비정상적인 행동을 감지하는 방식으로 대응할 수 있습니다.

5. 인간 검증: 가장 확실한 대응 방안은 사람이 직접 검증하는 것입니다. 인간 검증을 통해 자동화된 프로그램의 글 작성을 방지할 수 있습니다.

이러한 방식을 종합적으로 사용하여 글 작성에 대한 보안을 강화할 수 있습니다. 그러나, 기술적인 대응만으로는 완벽한 방지는 어려울 수 있으며, 사회적 문제를 해결하기 위해서는 법적 제재나 교육 등의 다양한 대응이 필요할 수 있습니다.


 

ai와 인간의 협업

 

지능형 CAPTCHA란, 

자동화된 프로그램이 아닌 인간만이 해결할 수 있는 문제를 제시하여 인증하는 방식입니다. 이는 자동화된 프로그램이 글 작성을 하는 것을 방지하는 데 효과적입니다.

예를 들어, 지능형 CAPTCHA를 이용한 인증 과정에서는 이미지나 오디오 형태의 문제를 제시합니다. 예를 들어, "다음 중 사과 사진을 선택하세요."와 같은 문제를 제시할 수 있습니다. 이러한 문제는 사람이 쉽게 해결할 수 있지만, 자동화된 프로그램은 사과 사진을 선택하는 것이 어렵기 때문에, 자동화된 프로그램이 글 작성을 하는 것을 방지할 수 있습니다.

더욱 발전된 형태로는 지능형 CAPTCHA를 이용하여 인간의 지능적 능력을 평가하는 용도로 사용되기도 합니다. 예를 들어, "다음 수식의 답을 입력하세요."와 같은 문제를 제시하여, 인간의 수리 능력을 측정할 수 있습니다.

지능형 CAPTCHA는 매우 효과적인 방식이지만, 너무 복잡하거나 어려운 문제를 제시할 경우, 사용자들의 불만이 생길 수 있습니다. 또한, 이미지나 오디오 형태의 문제를 해결하는 데 시간이 오래 걸릴 경우, 사용자들의 불편을 초래할 수 있으므로, 적절한 문제를 제시하는 것이 중요합니다.



특수한 폰트를 이용한 방지는

 글 작성 시에 인간이 쉽게 읽을 수 있는 폰트를 이용하여 작성한 글에 보안문자나 숨겨진 마크업 정보 등을 추가하여 자동화된 프로그램이 글을 인식하기 어렵게 만드는 방식입니다.

특수한 폰트를 이용한 방지의 예시로는, 글 작성 시 특별한 폰트를 사용하여 글자를 작성한 뒤, 이에 보안문자나 숨겨진 마크업 정보 등을 추가하는 방식이 있습니다. 이렇게 작성된 글자는 사람이 쉽게 읽을 수 있지만, 자동화된 프로그램이 글을 인식하기 어렵습니다.

예를 들어, 글 작성 시에는 글자가 아니라 그림이나 기호 등을 이용하여 글을 작성할 수도 있습니다. 이때, 사람은 이러한 그림이나 기호를 인식하면서 글을 작성하지만, 자동화된 프로그램은 이를 인식하기 어렵습니다. 또한, 이러한 그림이나 기호에는 보안문자나 숨겨진 마크업 정보 등이 추가될 수 있습니다.

이러한 방식을 이용하여 자동화된 프로그램이 글 작성을 하기 어렵게 만들 수 있습니다. 그러나, 이 방식 역시도 사용자들이 불편을 느끼는 경우가 있을 수 있으므로, 적절한 보안 수준을 유지하면서 사용자들의 편의성을 고려하는 것이 중요합니다.

 

 

웹 에디터(편집기)에서 붙여넣기를 판단할 수 있을까?


웹에서 글을 입력하고 편집하는 에디터에서 붙여넣기에 대한 데이터는 서버로 전송할 수 있습니다.

웹 에디터는 일반적으로 HTML, CSS, JavaScript 등의 웹 기술을 이용하여 만들어집니다. 붙여넣기를 하는 경우, 웹 브라우저에서 클립보드에 저장된 데이터를 읽어와서, 해당 데이터를 에디터 내의 텍스트 영역에 붙여넣기합니다. 이때, 붙여넣은 데이터는 일반적으로 텍스트 형태로 전송됩니다.

따라서, 에디터에서 붙여넣은 데이터는 일반적으로 HTTP POST 요청을 통해 서버로 전송됩니다. HTTP POST 요청은 사용자가 제출한 데이터를 서버로 보내는 가장 일반적인 방식 중 하나입니다. 이를 이용하여, 사용자가 입력한 데이터와 붙여넣은 데이터를 모두 서버로 전송할 수 있습니다.

그러나, 붙여넣은 데이터에 대한 보안 문제가 발생할 수 있으므로, 보안 상의 이슈를 고려하여 적절한 대응이 필요합니다. 예를 들어, 클라이언트 측에서 자바스크립트를 이용하여 붙여넣기 이벤트를 감지하여, 서버로 전송하기 전에 보안 검증을 수행하는 방식으로 대응할 수 있습니다.

아무래도 사회적 합의가 필요한 사항으로 보여지네요. 

 

 

 

 

 

붙여넣은 데이터와 최종 전송데이터의 비교


에디터 측에서 붙여넣은 데이터와 최종적으로 서버로 전송되는 문서 내용을 비교하고 판단하는 것은 가능합니다.

웹 에디터는 일반적으로 사용자가 입력한 데이터를 JavaScript를 이용하여 처리합니다. 이때, 사용자가 붙여넣기를 할 경우, 에디터에서는 붙여넣은 데이터를 클라이언트 측에서 가공한 뒤, 최종적으로 서버로 전송됩니다.

이 과정에서, 에디터 측에서는 붙여넣은 데이터와 최종적으로 전송되는 문서 내용을 비교하여, 일치하지 않는 부분이 있을 경우, 사용자에게 알릴 수 있습니다. 이를 통해, 붙여넣은 데이터가 원본 데이터와 다른 경우에 대한 대응이 가능합니다.

하지만, 붙여넣은 데이터가 원본 데이터와 다른 경우, 이는 악의적인 목적으로 인해 수정되었을 가능성도 있으므로, 보안 상의 이슈가 발생할 수 있습니다. 따라서, 이러한 경우에 대해서는 보안 검증 등의 추가적인 대응이 필요합니다.


chatGPT, 노션 Ai에 의한 글작성은 분명한 판단은 어려울 수 있지만, 붙여넣은 데이터와 완성된 문서 내용이 동일하거나 유사한 경우, 해당 글이 복제된 글일 가능성이 높아지므로, 서버에서는 이를 판단할 수 있습니다.

서버에서 이를 판단하는 방식은 다양할 수 있습니다. 예를 들어, 특정 키워드나 문구를 포함한 글이 복제된 글일 가능성이 높은 경우, 서버에서는 이를 검출하여 해당 글을 차단할 수 있습니다. 또는, 글 작성자의 IP 주소나 로그인 정보, 작성 시간 등의 정보를 기반으로 판단할 수도 있습니다.

그러나, 글 작성자가 해당 내용을 직접 작성한 경우에도, 비슷한 내용이나 문체가 나타날 수 있으므로, 완벽한 판단은 어렵습니다. 따라서, 글 작성자가 복제하지 않은 글을 작성하더라도, 이러한 판단 기준에 부합하는 글이라면 차단될 가능성이 있으므로, 이에 대한 보완도 필요할 수 있습니다.


분석 기준과 구현 방식에 따라 가능성은 다르겠지만, 문서 편집 시 붙여넣기의 비중이 적거나, 서버로 전송되는 완성된 문서의 내용이 붙여넣은 내용과 유사하지 않은 경우, 해당 문서가 직접 타이핑하여 창작한 것일 가능성이 높아지므로, 이를 서버에서 판단하는 것이 가능합니다.

이러한 판단을 하기 위해서는, 기존에 수집된 데이터나 분석된 패턴 등을 기반으로한 머신러닝 알고리즘을 사용하거나, 특정 기준에 따라 일치도를 측정하는 방식 등을 사용할 수 있습니다.

창작성 점수를 더해주는 방식도 가능합니다. 예를 들어, 서버 측에서는 문서 내용에 대한 유사도를 측정하여, 이를 기반으로 창작성 점수를 산출하고, 이를 사용하여 웹 사이트에서 창작성 점수를 표시하는 방식으로 구현할 수 있습니다.

하지만, 이러한 방식은 완벽한 창작성 점수를 제공하지 않을 수 있으며, 창작성과 관련된 논란이 있을 수도 있습니다. 따라서, 해당 방식을 구현하는 경우에는 창작성 점수를 표시하는 방식을 명확하게 설명하고, 이에 대한 사용자들의 의견을 수렴하는 것이 중요합니다.


종합적으로 말하자면

chatGPT, 노션 Ai로 글 작성시 충분히 편집입력시 붙여넣은 데이터와의 유사성 판단으로 통해 완전히 창작성을 가리기는 힘들지만 어느정도의 평가 점수에 차등은 줄 수 있다고 보여지네요. 

 

chatGPT, 노션 Ai에 대한 글쓰기, 여러분들의 의견은 어떠신가요? 

 

ai에 의한 글쓰기

반응형