본문 바로가기

IT Note/Security

ChatGPT의 시대, 당신이 주의해야 할 점

안녕하세요, 에디터 푸린입니다.

 

 

사실 지금은 한물간 주제일 수 있으나, 올해 화제의 키워드를 하나 뽑으라면 단연 ChatGPT가 상위권을 차지하지 않을까 싶습니다. 내노라하는 국내 대기업들이 OpenAI를 따라 GPT모델을 사용한 서비스를 출시하거나 출시를 앞두고 있습니다. 네이버에서도 한국어 특성을 강점으로 놓은 하이퍼클로바X를 출시하기 위해 고군분투 중이고, 기존에 일반 사용자 대상의 Public ChatGPT형이 아닌 기업들을 대상으로 한 Private ChatGPT도 우후죽순 쏟아지고 있습니다. 

 

이번 아티클은 ChatGPT처럼 GPT모델을 기본으로 하여 채팅을 하는 서비스에 대해서만 다루고자 하며, 이런 서비스를 과연 그냥 쏟아지는 대로 아무 의심없이 사용해도 될지, 어떠한 기본적인 주의사항이 필요한 지 살펴보고자 합니다. 

 

ChatGPT, 지금처럼 편리하다고 막 써도 되는가?

 

ChatGPT가 출시됨과 동시에 그 유용성과 성능의 우수성에 대해 많은 이들이 극찬을 했습니다. 기승전결을 잘 살려 작성해주니 이를 이용해 반성문을 쓴다거나 하는 우스갯거리 소식들이 각종 커뮤니티를 달궜고, 대학교 입학 혹은 취업을 위한 자기소개서 작성, 과제 등 ChatGPT를 이용해 작성된 글들에 대한 이슈가 연일 뉴스를 장식하기도 하였죠. 

 

그리고 곧 그 서비스 안정성 및 보안에 대한 이슈도 대두가 됩니다. 국내의 한 회사에서도 임직원이 회사 기밀정보를 ChatGPT 질문으로 입력하여 유출되는 사고도 있었고요. 이로 인해 이탈리아 등 일부 국가에서는 한동안 적절한 보안 조치를 취하기 전까지는 서비스 접속이 법적으로 제재되는 사건도 있었죠.

 

사용자들이 마법의 키보드 혹은 마블 세계관의 인공지능 비서 '자비스'처럼 이용하던 ChatGPT는 물론 편리하지만 그렇다고 아무런 제한 없이 써도 되는 것은 아닙니다. 그럼 어떤 점을 주의해야 할까요?

 

ChatGPT 사용시 주의사항 3가지

 

기본적으로 가장 중요한 사실은 여러분이 ChatGPT를 이용하여 입력하는 질문의 데이터는 모두 OpenAI의 인공지능이 학습하며 향후 다른 사용자의 질문에 대한 대답으로 활용될 수도 있다는 것입니다. 그렇기에 ChatGPT 서비스 제공자들이 자체적으로 데이터 필터링 등의 노력은 하겠지만 100% 완벽을 보장할 수 없기 때문에 사용자에게도 그 책임을 공유하고 있습니다. 

 

그렇기에 ChatGPT와 그 유사한 서비스를 활용할 때, 주의해야 하는 사항들은 이제 서비스 자체적으로도 안내가 되고 있습니다. 실제 OpenAI의 ChatGPT에서 띄우는 안내 팝업창을 활용하여 보여드릴게요. 

 

1. 편향 데이터 주의

굳이 말하자면, ChatGPT서비스는 전세계 집단지성의 초확대본이라고도 볼 수 있겠죠. 근데 사람들이 공유하거나 AI가 학습하는 데이터가 언제나 정확한 데이터라고 할 수는 없습니다. 전 세계에 흩어져있는 모든 데이터를 학습한다고 한다면, 아무리 편향 데이터를 줄이기 위해 노력할지라도 모두 진실되고 극 중립적인 데이터로만 채워졌다고 확신하기가 더더욱 어렵고요. 특히 악의적인 목적을 갖고 편향 데이터를 지속적으로 입력하는 이가 있다면, 다른 누군가는 그 데이터를 output으로 받을 수도 있다는 뜻이죠. 결국, 우리가 얻는 답변에 대한 정확성은 그 데이터를 사용하는 이가 다시 검증해야 합니다. 

 

2. 개인정보 등 민감정보 및 회사 내부 정보 입력 주의

개인정보 등의 민감한 정보는 아예 입력하지 말아야 합니다. 그리고 업무상 목적으로 활용하시는 분이 있으시다면 회사 정보가 입력되지 않게끔 주의를 기울여주셔야 하고요. 일반적으로 회사 임직원들이 자주 헷갈리거나 망각하는 사실은, 본인이 업무상 다루는 정보는 대외적으로 공개가 허용된 내용이 아니라면 보통은 회사 내부 정보로 분류가 된다는 점입니다. 다양한 보고서나 신상품 준비를 위한 데이터 수집 혹은 관련 질문, 소스코드 관련 질문 등 모두 이에 해당됩니다. 

 

3. 저장되는 채팅 기록의 민감도 및 저장 위치에 주의

 

3번은 2번과 관련이 있으면서도 조금 더 확장된 내용입니다. ChatGPT 자체적으로 채팅 히스토리 및 학습 데이터 활용 기한을 제한두고 있으나, 이는 30일 보관 후 삭제라는 점을 기억하셔야 합니다. 특히나 OpenAI사에서 방대한 데이터를 저장하기 위해 스토리지를 사용할 때, 어떤 리전(region)에 두고 사용하는 지 등에 대해서는 명확한 안내가 되어있지 않기 때문에 데이터 거버넌스가 더 강력한 유럽쪽 관련 데이터를 사용하실 때는 더욱 주의해야 합니다. 

 

 

그리고...?

 

보안에서는 CIA라는 기본 3요소가 있습니다. Confidentiality(기밀성), Integrity(무결성), Availability(가용성)으로 각각 설명을 조금 덧붙이자면 다음과 같습니다.

- 기밀성(Confidentiality): 정보가 인가된 사용자에게만 허가되는 것

- 무결성(Integrity): 특정 정보에 대하여 허가된 사용자에 한해서만 수정 및 삭제 등이 가능한 것

- 가용성(Availability): 허가된 사용자에 대하여 특정 정보 등이 항상 접근 가능한 것

 

ChatGPT를 포함한 생성형AI를 사용할 때는,

- 입력하는 정보가 불특정 다수에게 노출이 될 수 있다는 점,

- 데이터 편향 등 데이터에 대한 무결성이 보장되지 않을 수 있다는 점

위의 2가지 요소에서 보안의 기본 3요소 중 최소 2개 이상의 요소가 기본적으로 준수되고 있지 않는다는 것을 알 수 있겠죠.

CIA 요소를 준수하지 않는 것이 잘못되었다기 보다는, 기본적인 요소가 충족되지 못하고 있기에 데이터를 다루는 사용자들이 더 주의를 기울여야 하고 사용하는 데이터에 대한 책임성을 좀 더 가져야 한다는 의미가 됩니다. 

 

글을 마치며...

 

기술의 발전은 늘 경이롭습니다. 세상을 더 나은 곳으로 만들기 위한 열정과 열망을 가진 선구자들은 그에 따른 존경과 찬사를 받게 되고요. 하지만 우리가 4차 산업혁명이라고 부르는 현대의 세상이 발전하기까지 그 뒤에 많은 것들이 숨어져 있는 것은 이미 너무나 잘 알려진 사실입니다. 이제는 지구온난화(Global Warming)의 시대가 아닌 지구열대화(Global Boiling)시대에 접어들었다고 하는 것 처럼요. 정보화와 초연결 시대가 더욱 발전하며 많은 사람들이 편리한 세상이 오겠지만, 그 뒤에 숨겨진 개인정보 유출, 데이터 편향의 오류 및 일반화, 편향데이터를 이용한 선동 등 우리가 아직 쉬쉬하고 있는 그 모습이 언제 수면화가 될 지 조금은 두렵긴 하네요.

 

얼마 전, 비행기를 타면서 오래전부터 봐야지 미루고만 있던 영화를 드디어 보았습니다. 2014년에 개봉한 <엑스마키나>라는 영화인데 벌써 10년이나 된 영화이지만, 지금의 모습과 크게 동떨어져 있지 않은 듯 하여 신기하기도 하고 소름이 돋기도 했습니다. 시간이 되시는 분들은 한번 봐보면 좋을 듯 하네요. 

 

https://watcha.com/ko-KR/contents/mWpmmYK

참고: 왓챠 영화 소개 

>> 치열한 경쟁 끝에 천재 개발자 네이든의 프로젝트에 참여하게 된 프로그래머 케일럽. 그의 비밀 연구소로 초대받은 케일럽은 네이든이 창조한 인공지능 에이바를 만나게 된다.

 

이상, 에디터 푸린이었습니다!

반응형