특집: 초거대 AI의 미래(3)인공지능과 고전학 연구

특집: 초거대 AI의 미래(3)
인공지능과 고전학 연구

이강재(서울대학교)

이 글은 최근 챗GPT를 비롯한 다양한 AI가 등장하면서 일어난 교육과 연구 현장의 변화, 그리고 직접 여러 AI 프로그램을 사용해본 경험을 고전학 연구자의 입장에서 정리한 것이다. 이를 통해 향후 고전학 연구자가 AI와 동행을 할 때 주의할 점과 향후의 과제 등을 밝히고 있다.

<그림 1> 인공지능과 고전학 연구

챗GPT에서 시작된 AI와의 전면적 대면

2022년 연말에 Openai사의 챗GPT3.5가 공개되면서 모두 놀라움과 두려움을 느꼈다. 2016년 구글 딥마인드(Google DeepMind)가 만든 인공지능 바둑프로그램 알파고(AlphaGo)가 이세돌 9단을 이겼을 때와는 전혀 다른 충격이다. 알파고가 바둑에 국한된 것이기에 우리와는 떨어져 있다고 생각했다면, 이번에는 교육과 연구에 직접 영향을 줄 수 있다. 챗GPT에 앞서 2022년 9월 미국 콜로라도 주립박람회에서 디지털 ART 부분 우승작으로 선정된 작품 “스피이스 오페라 극장”이 미드저니(Midjourney)라는 AI 프로그램으로 만든 것임이 알려지면서 논란이 되었다. 이 프로그램으로 만들어진 작품을 창작품으로 인정할지 논란과 함께 향후 창작의 영역까지 AI가 중요한 역할을 할 수 있다는 점에서 충격은 상당했다. AI의 외국어 번역기는 이미 많은 영역에서 활용되고 있고 관련 논의도 상당히 진척되었다. 따라서 현재 드러나는 AI의 모습은 이미 예견된 것이라고 할 수 있다.

챗GPT가 일반인의 관심을 끈 이후 관련 업계에서는 구글의 ‘Bard’, 아마존의 ‘Bedrock’, 중국 바이두의 ‘文心一言’이나 알리바바의 ‘通義千問’을 포함하여 각종 AI 관련 프로그램이 경쟁적으로 쏟아져 나오고 있다. 생성형 AI에 대한 설명이나 동영상도 계속 새롭게 등장하고 있다. 개론적인 설명부터 복잡한 사용법, 미래 사회의 변화 가능성, 한계와 문제점 등 다양한 논의가 나왔다. 대학에서 권장하는 곳과 금지하는 곳, 그리고 활용 가이드라인을 제정한 곳도 있다. 지금의 속도로 AI가 발전하는 것에 대한 두려움과 경계로 일정 기간 지금보다 더 발전된 AI의 개발을 중지하자는 제안도 나왔다. 개발 자체를 중지하자는 제안은 낭만적으로 보이는데, 일부 경쟁 업체는 좋아할 수 있지만 지금의 신기술 개발 전쟁에서 받아들여질 가능성은 거의 없다.

이제 AI의 등장을 두려워하거나 걱정만 할 것은 아니며 인간을 도와주는 유용한 도구로 활용하는 것을 적극적으로 모색해야 한다. 즉, 본격적으로 인간과 AI의 동행의 시대가 되었다. 세상의 흐름은 AI의 사용을 당연한 것으로 받아들이고 있고 이를 경계한다고 해서 없어지는 것이 아니다. 적극적으로 AI의 장단점을 파악하고 이와 동행하여 미래 지향적인 우리의 학술연구와 교육에 유용한 도구가 되도록 해야 한다.

고전 한문의 번역에서 만난 AI 번역기

AI와 관련하여 나의 관심사는 향후 우리의 연구와 교육에서 어떻게 활용한 것인가이다. 특히 고전 한문의 우리말 번역에 이용 가능한지에 대한 것이다. 이미 중국에서 개발된 광학식 문자판독기(OCR, Optical Character Reader)나 자료화된 텍스트의 처리에 대한 다양한 프로그램이 상당한 수준까지 개발된 상태이다. 고전 한문의 번역에 이용할 수 있는 AI 프로그램은 챗GPT, DeepL, baidu번역기, 구글번역기, 파파고번역기 등이 있다. 기본적으로 인공신경망의 딥 러닝(Deep Learning)을 이용한 것들인데, 채팅 기반의 생성형 AI인 챗GPT 역시 번역 기능이 포함되어 있다. 영어을 비롯한 주요 외국어는 AI 번역에서 상당한 정확성을 갖고 있고, 현대중국어의 우리말 번역 역시 이미 상당 수준까지 발전하였다. 고전 한문의 우리말 번역 정확도가 높다면 학문의 발전에 획기적인 전환점이 될 수 있다.

나는 고전 한문 번역기를 이용할 때 먼저 원문에 표점을 해주는 프로그램인 古詩文斷句(https://seg.shenshen.wiki/)라는 프로그램을 이용한다. 한자로 쓰인 고전 한문을 중국어의 하나로 인식할 것이기에 중국의 표준적인 표점에 근거하여 번역할 문장을 제시하는 것이다. “한문 원문 → 한국어”, “한문 원문 → 영어 → 한국어”, “한문 원문 → 현대중국어 → 영어 → 한국어” 번역의 방법을 썼을 때를 비교해보았는데, 아직 큰 차이를 발견하지 못했다.

AI 번역기의 번역 품질에 대한 기존의 논문에서는 ‘단어’, ‘구’, ‘문장’ 단위의 오류를 나누어 분석하는 경우가 많았다. 가령 번역기에서 귀족계급을 뜻하는 ‘大夫’를 ‘의사’라고 번역한 것이 보이는데, 이는 현대중국어 ‘大夫’가 ‘의사’를 뜻하기에 생긴 단어 번역의 오류이다. 이는 아주 오랜 시간이 걸리지 않고 쉽게 개선될 것이다. 『맹자』에 나오는 “上下交征利”라는 구절은 번역기에서 정확한 번역이 되지 않는데, 이는 전후 문맥에 의한 논리가 개입되어 있어서 앞으로도 많은 자료의 학습이 이루어져야만 가능할 것이다. 한문의 번역 단위가 커질수록 전체의 논리를 이해하기 어려워 번역상 오류가 적지 않다. 또 우리말 번역문을 제시하지 않고 원문을 그대로 쓰는 ‘복사모델(Copy Model)’도 자주 보인다. 복사모델은 빈도수가 낮거나 코퍼스에 등장하지 않은 단어가 처리하기 어려워 해석이 되지 않는 단어가 나올 때 그냥 원래의 입력 언어를 그대로 출력하는 방법을 가리킨다. 복사모델이 자주 나온다는 것은 아직 학습한 데이터가 부족하다는 것을 의미한다. 또 기존의 번역서와 다른 번역어가 간혹 보이는데, 이는 습관적으로 해오던 번역과 다른 좀 더 친근한 번역어를 찾을 때 도움이 될 수 있을 것으로 보인다. 결론적으로 고전 한문의 번역에서 AI 번역기는 오류가 적지 않아서 아직 초보적인 수준으로 보인다. 경제적인 효과 때문에 이 부분에 대한 투자가 상대적으로 적었기 때문이라고 생각되지만, 이 또한 시간의 문제일 뿐이다.

멀티모달 AI의 등장과 활용

‘멀티모달’은 ‘멀티 모달리티(multi modality)’의 약자이다. ‘모달리티’는 ‘mode’와 같이 ‘양식’, ‘방식’을 뜻한다. ‘멀티 모달’은 시각, 청각을 비롯한 여러 인터페이스를 통해 정보를 주고받는 것을 말하는 개념이다. 내가 멀티모달 AI 중 그림을 그려주는 것에 관심이 있는 것은, 논문이나 저서를 쓸 때 필요한 삽화나 그림에 대한 기대 때문이다. 미드저니, 스테이블 AI, Dall-E2 등에 이 기능이 있다. 채팅으로 그림을 요청하고 AI가 적당한 이미지를 그려주면 사용자가 이를 다시 수정해달라고 명령어를 내려 점차 필요에 맞추어 간다.

가령, 아래는 Dall-E2를 이용하여 공자가 그의 논어책을 가지고 책상에 앉아 있는 그림을 그려달라고 요청을 한 후 수정 과정을 거쳐 얻어낸 결과물이다.

<그림2> Dall-E2의 공자 그림

나는 아직 이 프로그램의 이용법에 대해 초보자 수준이다. 그렇지만 향후 이미지를 그려주는 AI가 더 발달하고 이를 잘 활용하면 저술에 필요한 삽화를 얻을 수 있을 것이라는 믿음을 확인할 수 있었다. 음악을 만들어주는 AI까지 활용 가능하다면, 문헌 관련 연구나 저술의 내용을 일반인 대상 동영상으로 제작하는 것도 충분히 가능할 것으로 보인다. 이렇게 만들어진 이미지나 동영상이 저작권이 없이 공개되므로 사용상의 제약이 없다는 점도 장점일 수 있다.

챗GPT와 대화하기

챗GPT는 대화형, 생성형 AI이다. 과거의 검색프로그램은 관련 내용이 들어있는 사이트를 알려주는 것이라면 챗GPT는 관련 내용을 스스로 조합해서 문장으로 만들어준다. 이 때문에 보고서를 써주거나 문장을 요약하는 것 등에서 상당한 강점이 있다. 최근에는 excel이나 ppt까지 만들어주기 때문에 사무실의 근무 인원을 대폭 줄여줄 수 있을 것이라는 기대도 있다. 인간의 일이 없어진다는 점에서 부정적이지만, 개인의 비서가 한 명 생겼다고 생각하면 긍정적이다.

현재로써 챗GPT가 문헌 연구에 직접적으로 유용한 도움을 줄 것이라고 기대하기 어렵다. 다만 몇 가지 영역에서는 상당히 유용한 도움을 준다. 가령, “학부생 수준의 맹자 강의를 위한 15주 강의계획서”와 “현대 사회에서 공자 사상이 갖는 장단점에 대한 보고서”를 요구했을 때 짧은 시간에 상당한 수준의 결과물을 받아볼 수 있었다. 물론 생성형 AI의 특성상 사용자가 요구한 질문에 답변하기 때문에 전혀 현실에 없는 문제를 던졌을 때 사실이 아닌 답변을 내놓은 경우가 있다. 이는 우리가 챗GPT를 적절하게 사용하고 검증 가능해야 함을 알려준다. 즉, 답변 내용을 맹목적으로 믿으면 차후에 오히려 곤란해지는 경우가 발생한다는 것이다.

가령, 실제 챗GPT와 가진 유교 경전 연구의 미래 가치에 대해 행한 대화에서, 챗GPT는 처음 “윤리적 지침, 문화적 이해, 교육적 가치, 사회적 조화” 등의 항목을 나누어 잘 설명해주었다. 하지만 대화를 이어가면서 조선 시대 경학 중 여성 경학에 대한 연구가 중요해질 것이라는 대목에서 잘못된 정보를 제시하기 시작했다. 역사에 없는 사람의 이름을 들먹이면서 그들이 어떤 사람이고 왜 중요한 지 등을 언급하기까지 하였다. 마지막에 이에 대해 지적하자 “저의 부적절한 대답으로 인해 혼란을 드려 대단히 죄송합니다.”라는 사과를 했다. 질문자가 답변을 들은 후 스스로 답변의 옳고 그름을 파악할 수 없다면 챗GPT의 답변은 잘못된 정보를 주는 부정적 역할을 하게 되어 사용자를 곤란에 빠뜨릴 위험이 있다. 사용자는 ‘환각’, ‘개소리’ 등으로 부르는 이런 답변이 적지 않게 나온다는 사실을 잊어서는 안 된다. 따라서 챗GPT 활용에 있어서는 반드시 다음의 전제가 필요하다. 첫째는 사용자가 올바른 질문을 할 수 있느냐이고, 둘째는 답변의 타당성을 스스로 사유하고 재질문할 수 있느냐이다. 이것이 전제되지 않는다면 챗GPT는 악영향을 미칠 가능성이 크다. 또한 앞으로 교육에 있어서 정확하게 질문하는 능력, 문제를 찾아내는 능력에 주안점을 두는 것이 중요하다는 점을 생각하게 한다.

교육 현장에서 AI 활용하기

챗GPT 등장은 글쓰기 중요성을 강조해온 인문학 분야의 교육에 큰 고민을 던져주었다. 학생들이 챗GPT를 사용하여 보고서를 썼을 경우 이를 확인할 마땅한 장치가 없는 상태에서 자칫 학생들이 스스로 사유해서 써내야 할 보고서를 챗GPT에 의존하면 원래의 교육 목적을 달성하기 어려워질 것에 대한 우려에서 나온 것이다. 이 때문에 대학 차원에서 챗GPT 사용 자체를 금지하는 곳이 있고 교수들 역시 이에 동참하였다. 또 AI 도움을 받을 수 없도록 수업 중 보고서 부과 자체를 없애고 교실 현장에서 직접 논술형 시험을 보는 방법을 취하자는 의견도 있다. 반면에 적극적으로 챗GPT 사용을 권장하거나 챗GPT 사용에 대한 가이드라인을 제정하는 대학과 교수들도 있다.

챗GPT로 인한 고민에서 나 역시 자유롭지 않다. 나는 AI와의 적극적인 동행을 강조한다. 2023년 1학기 수업에서 챗GPT를 비롯한 다양한 AI의 적극적 사용을 권장하면서 다음과 같이 제시하였다. “수강생 발표문 및 보고서 작성 중에 챗GPT나 DeepL 등의 번역기를 비롯한 일체의 AI 사용 허용. 단 활용 여부를 밝히되 AI의 오류를 극복할 수 있는 수준이어야 할 것임.” 아직 중간보고서 및 수강생 발표가 이루어지지 않아서 결과를 알 수 없다. 하지만 수강생을 불신한 전제에서 윤리서약서를 받거나 AI 사용 금지를 하는 것보다 학생들의 반응이 좋은 것으로 판단하고 있다. 또 『맹자』 텍스트의 강독을 하는 교과목에서는 개강 첫 시간 수업 중에 앞서 언급한 5종 AI 번역기의 맹자 구절 번역 결과를 학생들과 토론해보았다. 시험 문항 중에 고전 한문 원문에 대한 AI 번역기의 번역문을 보여주고 어떤 부분이 왜 틀렸는지를 설명하는 문항을 출제하기로 하였다. AI 번역기의 발전 속도를 볼 때 현대중국어에 비하여 고전 한문은 상대적으로 AI 번역의 오류가 없어질 때까지 아직 더 많은 시간이 소요될 것으로 보이지만, 이 또한 시간의 문제일 뿐이다. 또한 갈수록 고전 한문에 대한 관심이 줄어들고 있는 젊은 세대의 특성을 고려하여 고전 한문을 AI와 연계시켜 강의에 활용하는 것이 수강생의 관심을 끌기에 효과적일 수 있다는 판단도 든다.

AI와의 동행에서 주의할 점

앞에서 고전 연구자로서 AI와 어떻게 동행을 꾀하고 있는지에 대해 언급하였다. 이미 시작된 디지털 대전환 시대를 피할 수 없다면, 적극적으로 활용하여 우리의 학문 연구와 교육에 도움이 되도록 만들어야 한다. 이때 아래의 몇 가지 점에 대해서는 깊은 생각이 필요하다.

첫째, 챗GPT를 우리의 생산성을 높이는 도구로써 활용하려면 우리가 챗GPT보다 더 똑똑해야 한다. AI는 인터넷으로 학습한 자료에 근거하기 때문에 인터넷에 있는 자료만큼의 편향성이 있으며 객관적으로 증명될 수 없는 내용이 다수 포함된다. 따라서 사용자가 스스로 검증하는 것은 필수적이다. 잘 모르는 분야에 이용할 때의 위험성을 고려한다면 자신이 잘 아는 분야에 활용해서 자신의 시간을 덜어주는 역할을 하도록 해야 한다.

둘째, 교육 현장에서 챗GPT 등 AI 사용을 금지하기보다 교육 방법을 혁신하는 노력이 필요하다. 인문학은 비판력, 상상력, 창의력을 길러주는 학문인데, 지금까지 대부분의 교육은 문헌 해독 중심이었다. 인터넷의 등장 이후에도 문헌의 해독을 통해 과거 지식을 탐구하는 방식이 갖는 장점은 여전히 유효하다. 이제 여기에 더해 스스로 학습한 지식에 근거하여 새로운 정보가 믿을만한지 검증해볼 수 있는 능력, 정보를 비판하고 더 나아가 새롭게 사유할 수 있는 능력을 배양해야 한다. 학생들이 챗GPT를 사용하여 표절할 것이라는 염려는 결국 표절이 가능한 과제의 부여 방식에도 기인한다는 비판을 겸허하게 받아들여야 한다. 더구나 앞으로 현재의 표절 개념 자체에 변화가 올 가능성도 크다. AI의 등장은 앞으로 자신이 쓰는 글에 들어갈 정보 하나하나에 모두 주석을 달아야 하는 방식에 변화가 불가피하다. 그래서 이제 정보 자체가 아니라 그 정보를 어떻게 받아들이고 어떻게 새롭게 재해석할 것인지를 교육하고 연구해야 한다는 것이다.

셋째, 자신의 전공 영역의 학습과 연구를 제대로 하는 것이 중요하다. 연구와 교육 모든 면에서 진정으로 진검승부의 시대가 왔다. 과거에는 재주가 없음에도 있는 것처럼 속여도 살아남을 수 있었던 ‘남우충수(藍芋充數)’가 가능했다면, 이제는 진정으로 자신만의 실력이 없으면 살아남을 수 없게 되었다. 가까이에 있는 연구자와 경쟁을 하던 것에서 이제는 전 세계의 모든 지식 세계와 경쟁을 하는 시대가 되었다. 연구뿐만 아니라 교육에서도 학생들의 수준을 정확하게 파악하고 그에 맞는 교육 방식을 찾아야 하며, AI에 의존한 학생들의 보고서 등에 대해 명확하게 그 한계를 인식하고 지도해야 한다. 이것은 우리의 학문에 대한 도전이면서 동시에 기회라고 볼 수 있다.

넷째, 고전 연구자의 역할에 대한 적극적인 모색과 참여가 필요하다. 번역기를 비롯한 각종 AI 프로그램이 고전 한문을 대상으로 연구하는 학문 영역에 대해 아직 미진한 면이 있는 것이 사실이다. 그렇지만 AI의 지식 범주가 고전 한문까지 넓어지는 것은 이미 시작되었다. 따라서 급속하게 발전하는 AI의 올바른 활용과 함께 미래 AI 발전에 고전 연구자는 공헌할 것이 무엇인지를 생각해야 한다. 번역 프로그램의 경우에도 고전 문헌에 특화된 프로그램 개발에 일정 정도 역할을 하는 것이 가능할 것이다.

다섯째, 향후 다가올 정보와 언어의 비대칭에 주의해야 한다. AI 번역기의 발달은 외국어 학습의 부담을 줄여줄 것이라는 기대를 하고 있지만, 그와 다른 측면에서 챗GPT의 공개 이후 영어의 중요성은 더욱 커지고 있다. 이는 전 세계적으로 정보를 담고 있는 언어의 비대칭에서 생기는 현상인데 딥러닝의 특색에 의해 더 많은 검색이 다시 정보로 축적됨에 따라 비대칭은 시간이 지날수록 더욱 가속화될 것이다. 이는 학문 영역에서 영어에 대한 종속의 심화를 말하는 것이며 궁극적으로 우리말로 학문하기에 대한 도전이기도 하다. 그러므로 자칫 세계 보편의 학문이라는 명분 속에서 우리의 독자적 학문 영역의 축소에 이르지 않도록 다방면의 노력이 필요하다고 할 것이다.

* 이 글의 내용은 아시아연구소나 서울대의 견해와 다를 수 있습니다.

3권 23호 (2023년 5월 1일)

PDF Download

Tag: 인공지능(AI),고전연구,ChatGPT,DeepL,멀티모달

이 글과 관련된 최신 자료

이강재(2023). “경학 연구자의 AI와의 동행기”, 2023년 한국경학학회 춘계학술대회 기조강연, (4월 15일).
이강재(2023). “고등교육과 AI의 동행, 이제 시작이다”. 『교수신문』 대학정론 (2월 27일).
https://www.kyosu.net/

허철(2023). “중국의 디지털 경학 연구의 방향과 시사”. 2023년 한국경학학회 춘계학술대회 발표문, (4월 15일).
배은한 외(2022). 『한문고전 기계번역의 이해』. 문예원.
강병규·이지은(2018). “신경망 기계번역의 작동 원리와 번역의 정확률 – 중한 번역을 실례로”. 『중어중문학』 (73).

저자소개

이강재(likangqi@snu.ac.kr)

현) 서울대학교 중어중문학과 교수
전) 서울대학교 인문학연구원장, 한국경학학회 회장, 한국연구재단 인문사회연구본부장

주요 저서와 논문

『논어처럼 이끌어라』 (21세기북스, 2023)
『인문사회 학술지원의 현황과 과제』 (한국교육개발원 교육현안보고서 (6), 2021)
『학술진흥 정책 수립체계 재정립 및 학술진흥방안 연구』(공저) (한국연구재단 정책연구보고서, 2019)
“논어정의에 나타난 노론(魯論)”, 『인문논총』 ,공저, 서울대 75(2), 2018
“경학사의 관점에서 살펴본 조선 전기의 논어”, 『중국문학』 (91), 2017

2023년 5월 1일 | 아시아 브리프 | Tags: ChatGPT, DeepL, 고전연구, 멀티모달, 인공지능(AI)

특집: 초거대 AI의 미래(3)
인공지능과 고전학 연구