신년 기획(1): 2022 아시아 10대 이슈에 관한 빅데이터 분석
빅데이터로 분석한 동북아 주요 관계국의 안보 프레임 변동
서울대학교 아시아연구소 <아시아 브리프>는 2020년 초 코로나 이후 한국, 미국, 일본, 중국 간의 핵심 이익과 공통 관심사가 어떻게 변모해 왔는지를 이해하기 위해 4개국 언론 기사에 대한 빅데이터 분석을 수행하였다. 기존 외교×안보 연구는 학제적으로 정립된 분석틀에 기초해 전략보고서나 핵심관계자의 발언에 대한 해석에 집중하는 경향이 있다. 이에 비해, 빅데이터(텍스트) 분석은 구조적인 패턴의 변동을 정량 지표를 통해 객관화하고 직관적으로 탐색하는 의의가 있다. 본 연구의 목적은 각국의 언론 텍스트에 대한 심화된 패턴 분석을 통해 한국, 미국, 일본, 중국 각국의 주요 공통 관심사가 무엇이고, 코로나 발발 이전(2017)에 비해 최근(2022) 안보 관련 프레임이 어떻게 변모하고 있으며, 그 전략적 시사점이 무엇인지를 탐색하는 것이다.
주요국 영자지 기사의 아시아 관심사 분석
2020년 초 코로나 이후 한국, 미국, 일본, 중국 간의 핵심 이익과 공통 관심사가 어떻게 변모해 왔는지를 분석하기 위해 수집된 기본 데이터는 2020년 1월 1일부터 2022년 9월 30일까지의 기간 동안 한국, 미국, 중국, 일본의 4개국 언론사의 영문 기사이다. 총 기사 량은 5,502,266건이고, 분석에 포함된 각국 언론사의 총합은 824개이다. 영문 기사의 특성상 미국의 언론사와 기사 량이 압도적으로 많았다. 이러한 데이터 편중(bias)의 문제를 해결하기 위해, 검색 주제와의 연관도가 높은 샘플을 별도 추출(<표 1> 참고)하여 분석에 활용했다.
<표 1> 국가별 기사 량 및 데이터 샘플 수
국가 |
언론사 수 | 기사량 | 활용 샘플수 |
한국 |
38 | 59,382 |
46,036 |
미국 |
556 | 4,796,149 |
94,521 |
일본 |
44 | 113,165 |
44,298 |
중국 | 186 | 533,570 |
76,171 |
데이터 분석에 활용된 주된 방법은 토픽 모델링 및 트렌드 분석, 텍스트 유사도 분석, 의미망 분석이다. 토픽 모델링은 빅데이터 텍스트의 키워드 군집을 머신 러닝을 통해 판별하고, 같은 군집에 포함된 키워드들을 통해 메타 주제를 찾는 방법이다. 해당 토픽의 관심도를 국가별로 비교한 후, 통합적인 트렌드를 기사 평균 빈도수 및 가속도 지표를 통해 조망하고 이후 변동상을 예측하였다.
다음으로 토픽을 안보, 무역, 기술, 밸류체인의 4개 카테고리의 주제로 압축하고, 해당 주제의 텍스트 유사도 분석을 통해 관련 토픽들이 시기별로 서로 어떠한 중첩이 일어나고 있는지를 살펴보았다. 예를 들어, 2017년에는 안보 주제와 관련하여 기술 관련 이슈들이 많이 중첩적으로 논의된 반면, 2022년에는 글로벌 밸류체인(value chain) 이슈의 텍스트 유사도가 더 높아지면서 국가 안보와 중첩되는 정도가 증가하는 경향을 확인할 수 있다.
마지막으로, 의미망 분석은 한, 미, 일, 중 4개국의 언론 기사의 핵심적인 키워드를 중심으로 국가별로 공통되거나 고유한 관심사, 혹은 핵심이익을 비교하는 방식으로 이루어졌다. 핵심적인 키워드는 빈도수가 아닌, 사이중앙성(betweenness centrality)이 가장 높은 키워드들을 선별했다. 기호학적인 관점에서 사이중앙성이 높은 키워드는 서로 다른 키워드 군집을 연결할 가능성이 높은 위치에 있어, 외교×안보 담론을 구성에 필요 불가결한 접점(obligatory passage point)의 연결어로 이해할 수 있다.
주요 토픽의 국가별 관심도 및 트렌드
전체 문서에 대한 토픽 모델링 결과, 10개의 주요 주제가 도출되었다. 주요 주제는 다음과 같다: COVID19 팬데믹 이후의 뉴노멀, 한류 문화와 관광 (한류드라마, 영화, 관광, 요식업 등), 미×중 갈등과 새 국제 질서 (각국의 아시아태평양 전략, 국익동맹체, QUAD, CPTPP, IPEF, CHIP4 등), 아시아 주요국의 경제 위기 (각국의 주가하락, 외국인 투자, 환율방어, 경제 성장 이슈 등), 러시아-우크라이나 전쟁 (원자재 확보, 물가상승, 군사적 분쟁 등), 양안문제와 안보 위기 (대만해협 긴장, 어업분쟁), 북핵위기 대응 (북한의 도발과 국제 제재), 기후 변화와 에너지 위기 (탄소 중립, 재해, 에너지 자원), 아시아 각국의 이민/이주/다문화 부상, 아시아 MZ세대의 SNS와 연계한 여론 주도층 부상 (MZ 세대의 SNS 여론, 시위 등).
한편, 국가별로 한국의 경우 기후 변화와 에너지 위기, 한류 문화와 관광, 아시아 주요국의 경제 위기 순으로 기사 량이 많았다. 미국은 COVID-19 팬데믹 이후 뉴노멀, 아시아 주요국의 경제 위기, 러시아-우크라이나 전쟁 순으로 관심도가 높았다. 일본은 아시아 주요국의 경제 위기, 기후 변화와 에너지 위기, 러시아-우크라이나 전쟁 순이었다. 중국 역시 기후 변화와 에너지 위기, 아시아 주요국의 경제 위기, 코로나 팬데믹 이후 뉴노멀 순으로 관련 기사가 가장 많이 다루어졌다. 4개국의 수위권에 있는 관심 주제들이 대체로 공통적이었으나, 한국과 일본 사이에선 북핵 위기 대응(5위), 미국과 일본의 경우 러시아-우크라이나 전쟁(4위)이 공통 관심도가 높았다. 중국은 별도로 양안문제와 안보 위기에 대한 기사(4위)가 타국과의 공통 관심사 외에 가장 많이 다루어졌다.
<표 2> 국가별 주요 토픽 순위
순위 |
한국 | 미국 | 일본 |
중국 |
1 |
기후 변화와 에너지 위기 | COVID-19 팬데믹 이후의 뉴노멀 | 아시아 주요국의 경제 위기 |
기후 변화와 에너지 위기 |
2 |
한류 문화와 관광 | 아시아 주요국의 경제 위기 | 기후 변화 및 에너지 위기 |
아시아 주요국의 경제 위기 |
3 |
아시아 주요국의 경제 위기 | 러시아-우크라이나 전쟁 | 러시아-우크라이나 전쟁 |
COVID-19 팬데믹 이후의 뉴노멀 |
4 |
COVID-19 팬데믹 이후의 뉴노멀 | 기후 변화와 에너지 위기 | 한류 문화와 관광 |
양안문제와 안보 위기 |
5 |
북핵위기 대응 | 한류 문화와 관광 | 북핵위기 대응 |
러시아-우크라이나 전쟁 |
6 |
러시아-우크라이나 전쟁 | 미중 갈등과 새 국제 질서 | COVID-19 팬데믹 이후의 뉴노멀 |
한류 문화와 관광 |
7 |
양안문제와 안보 위기 | 양안문제와 안보 위기 | 양안문제와 안보 위기 |
미중 갈등과 새 국제 질서 |
8 |
아시아 MZ세대의 SNS 여론 부상 | 아시아 이민, 이주, 다문화 부상 | 아시아 MZ세대의 SNS 여론 부상 |
아시아 이민, 이주, 다문화 부상 |
9 |
아시아 이민, 이주, 다문화 부상 | 아시아 MZ세대의 SNS 여론 부상 | 아시아 이민, 이주, 다문화 부상 |
북핵위기 대응 |
10 |
미중 갈등과 새 국제 질서 | 북핵위기 대응 | 미중 갈등과 새 국제 질서 |
아시아MZ세대의 SNS여론 부상 |
[그림 1]은 10개 토픽의 트렌드를 분기별 기사 변화량을 통해 조망한 것이다. COVID-19 팬데믹 이후 뉴노멀은 기사 량(1위)이 분기별 평균 21만 4천여건으로 압도적으로 많았으나, 상대 가속도가 가장 낮은 음수 값으로 나타나 향후 관심사가 소멸할 가능성이 높은 것으로 보인다. 이에 비해 아시아 주요국의 경제위기가 분기별 평균 기사 빈도수(1위)와 가속도(2위) 면에서 모두 매우 높게 나타나, 해당 이슈가 근미래에도 상존하는 위협이 될 것으로 전망된다. 러시아-우크라이나 전쟁이 세번째로 평균 빈도수가 높고 가장 가속도가 높아, 2023년 국제질서의 향배를 결정할 가장 영향력 높은 동인이 될 것으로 해석된다. 기후변화(재해)와 에너지 위기 역시 두번째로 기사 평균 빈도수가 높아 언론에서 지속적으로 다루어질 이슈로 평가된다. 가속도 측면에선 한류문화와 관광(3위) 다음으로 양안문제와 안보위기(4위)가 높게 나타나, 향후 급속히 부상할 가능성이 있다.
토픽 |
가속도 |
평균 기사량 |
COVID-19 팬데믹 이후의 뉴노멀 |
-3751.17 |
214165.36 |
기후 변화와 에너지 위기 및 재해 |
305.05 |
52242.27 |
러시아-우크라이나 전쟁 |
3001.56 |
50954.27 |
미×중 갈등과 새 국제 질서 |
-22.73 |
10087.64 |
북핵위기 대응 |
10.93 |
1232.45 |
아시아 MZ세대의 SNS 연계, 여론 주도층 부상 |
-1.78 |
528.09 |
아시아 각국의 이민, 이주, 다문화 부상 |
61.55 |
5709.91 |
아시아 주요국의 경제 위기 |
2735.57 |
130030.55 |
<표 3> 토픽 별 가속도 및 평균 기사 량
안보 관련 트렌드 변화 및 4개국의 핵심 이해관계
수집한 기사 데이터를 통합하여 4개국별로 안보, 무역, 기술, 밸류체인의 4개 카테고리의 주제로 대별하였다. 해당 주제들로 텍스트 데이터를 재분류한 이유는, 작금의 안보 이슈(리스크)가 무역, 기술, 글로벌 공급망을 포함한 밸류체인의 영역들과 긴밀하게 상호작용하고 있다는 판단에서다. 특히 미×중 갈등과 코로나 팬데믹이 본격화되기 이전 시기(2017년)와 현재(2022년)의 시기를 비교해서, 안보가 어떠한 영역들과 주로 상호작용하고 있고, 그 변동상의 의미가 어떠한 지를 조망하고자 한다.
이를 위해 해당 주제를 포함한 기사 텍스트의 유사도 분석을 통해 관련 토픽들이 시기별로 서로 어떠한 중첩이 일어나고 있는지를 살펴보았다. <그림 2>는 주제 영역별 텍스트 유사도 분석 결과를 도해화 한 것으로, 퍼센트는 각 텍스트가 내용적으로 중첩되는 비율이다. 중첩도가 높을수록 두 주제가 같은 문제를 다룬 경향성이 높다고 해석할 수 있다. 2017년의 경우 안보(security)와 기술(tech)의 유사도가 37%로, 가장 유의미한 내용적 중첩이 이루어졌다. 기술(tech)과 밸류체인(value chain) 역시 34%로 매우 높은 상호 연관성을 가졌다.
2022년에는 밸류체인을 중심으로 한 안보 컨버전스(convergence)의 경향이 뚜렷하게 나타난다. 밸류체인과 안보가 52%로 가장 높은 유사도를 보였고, 밸류체인-기술(47%), 밸류체인-무역(46%), 기술-무역(45%)이 그 뒤를 이었다. 2017년이 기술을 중심으로 안보와 밸류체인이 각각 연결되어 글로벌 공급망을 전제로 한 미×중 간 기술-안보 경쟁의 면모를 보였다면, 2022년에는 밸류체인을 중심으로 안보, 기술, 무역이 연결되고, 기술과 무역이 별도로 이어지는 변모상이 나타난다. 이는 지정학적 디커플링(decoupling)이 진행되면서 종래의 안보-기술 경쟁력을 담보하는 핵심 축이 밸류체인의 확보 경쟁으로 전화되고 있는 트렌드로 해석된다.
이러한 글로벌 트렌드 속에서 한, 미, 일, 중 4개국은 서로 어떠한 공통 관심사와 고유의 핵심 이해관계, 혹은 도전과제를 담보하고 있는지, 각국의 기사 텍스트에 대한 의미망 분석 후 미-중의 양대 구도를 중심으로 데이터 분석 결과를 재구성해 보았다. <그림 3>은 4개국의 데이터를 통합 분석(상단)한 후, 사이중앙성(betweenness centrality) 값이 높은 키워드를 중심으로 각국의 핵심 관심사와 이익을 재구성(하단)한 결과이다. <그림 3> 상단의 노드 크기는 키워드 빈도수를 반영한 것으로, 경제성장의 엔진(‘engine’), 코로나 대응 전략(‘covid strategy’), 에너지 공급(‘energy supply’), 기술(‘technology), 크루즈 미사일(‘cruise missile’), 주가(‘stock price’) 등이 가장 큰 공통 관심사로 나타난다.
<그림 3> 하단은 보다 내밀한 국가별 핵심 이익을 사이중앙성(betweenness centrality) 값이 가장 높은 키워드를 통해 포착한 것이다. 그림의 중앙부에 표현되듯 4개국 모두 에너지(‘energy’)의 수급이 가장 핵심적인 공통 이해관계임을 알 수 있다. 미-중 간에는 코로나(‘covid-19’)와 기후변화(‘climate change’)가 공통적인 키워드로 나타난다. 미국 내에선 환경 문제(‘environment’), 지역(‘region’), 밸류체인(‘value chain’)이 고유 이슈로 나타나는데, 여기서 ‘지역’은 미국 국내가 아닌 세계 지역에 대한 전략적 관점과 모니터링을 의미한다. 미국과 일본 사이에는 기후변화 이슈 외에 (북한)미사일(‘missile’)과 정보의 교환 및 공유(‘information’) 이슈가 공통적인 핵심 관심사로 드러난다. 일본 내에선 경제(‘economy’), 공급망(‘supply chain’), 자국 방위(‘defense’)가 고유 이슈로 나타난다.
한-일 간에는 인플레이션 등 물가 상승(‘price’)과 (북한)미사일이 공통 이슈로 부각된다. 한-중 간에도 코로나19 외에 물가가 공통 키워드로 도출되어, 인플레이션에 대한 우려가 한-중-일 3국이 공통적으로 우려하는 이슈임을 알 수 있다. 이는 앞서 살펴본 글로벌 트렌드 분석에서 아시아 주요국의 경제위기에 대한 기사가 높은 주목도를 갖는 것과 일맥상통하는 결과이다. 반면, 한-미 간에는 에너지, 코로나, (북한)미사일 외에 주목할 만한 공통 키워드가 도출되지 않았다. 이는 정보(‘information’)와 같은 한-미간의 공통 키워드들이 한국 언론 데이터의 사이중앙성 값에서는 중요도가 상대적으로 낮았기 때문이다.
중국 관점에선 종래의 무역(‘trade’), 안보(‘security’), 경제 발전(‘development’) 외에 자국민의 건강(‘health’)에 대한 도전과제를 안고 있다. 미국의 선제적인 지역 재편 전략에 수세적으로 맞서는 상황에서, 기술 봉쇄를 극복하고 코로나로 촉발된 자국민의 방역 문제를 해결해야 안정적인 통치성(governmentality)을 담보할 수 있다. 그런 면에서 대외적인 협력 파트너를 찾는 것이 중요하며, 경제발전과 방역 등 내부 과제 해결이 어려워질 경우 잠재하고 있는 양안문제가 통치력의 재고와 국민 단합을 위해서 보다 본격적으로 이슈화될 개연성이 있다.
이러한 구도 속에 한국의 관점에서 특히 주목해야 할 면모는 데이터 분석 결과에서 표현된 한-미, 한-일의 공통 이익 외에 중국과의 양가적인 관계와 한국 내부의 도전과제에 대한 심층적인 이해이다. 한국과 중국 간에는 코로나, 물가 등의 공통 이슈 외에 관광(‘tourism’)과 기술(‘technology’)이라는 공통적인 이해관계가 별도로 작용하고 있다. 이는 기후변화나 코로나 대응보다 직접적인 교류 대상으로 경제, 안보, 인적 교류, 외교 등 다양한 차원의 매개체 역할을 한다. 따라서, 중국과의 관광을 단순한 경제적 이익 차원으로 이해하거나, 기술을 무역관계 혹은 국제 안보 차원에서의 독트린을 추종하는 단선적인 방식으로 접근할 수 없다. 관광과 기술의 층위를 대외 환경 변화에 따라 사안과 부문별로 나누어 경제, 안보, 인적 교류, 외교 등에서 국가의 핵심이익을 달성하기 위한 미래 시나리오와 분화된 전략이 필요하다. 한국 고유의 핵심 키워드로 도출된 배터리(‘battery’)와 문화(‘culture’)는 미래 기술 경쟁력과 급성장한 소프트파워를 지정학적 관계 속에서 어떻게 포지셔닝하고 활용할 것인지에 대한 과제를 던진다. 한국 정부(‘government’)의 융합적인 외교×안보 역량이 데이터 분석에서 핵심적인 숙제로 드러난다.
빅데이터 분석의 시사점
빅데이터 분석 결과는 포스트 코로나 국면에서 지정학적 변동이 야기할 수 있는 복합적인 안보 리스크를 여실히 보여준다. 러시아-우크라이나 등 군사적 충돌의 확대 가능성이 상존하는 가운데, 안보의 개념이 기후×환경 위기 및 보건 대응, 밸류체인의 확보 및 기술 경쟁력의 보호, 무역과 경제의 원활한 통제를 포괄하는 것으로 확장되고 융합되고 있는 면모를 확인할 수 있다. 최근에는 밸류체인의 확보 및 수호가 국가의 대외 역량을 가늠하는 시험대가 되고 있다. 특히 에너지의 안정적인 수급은 근미래에 각국이 공통적으로 추구할 핵심이익으로 발견된다.
한국, 미국, 일본, 중국 간의 이해관계를 조망했을 때, 한국은 불안정하고 양가적인 위치에 놓여 있다. 한-미 동맹만을 강조하기에는 미국과 일본의 공통 이익과 안보 관심사가 보다 공고한 구조임이 확인된다. 즉, 무조건적인 편승(band wagoning) 전략은 한국을 일본의 하위파트너로 위치지우면서 그 입지를 약화시킬 개연성이 있고, 일본 고유의 핵심이익인 자국 방위(‘defense’)의 방향성과도 추후에 충돌할 여지가 있다. 정량적인 분석 결과에서 북핵 문제가 갖는 현재의 중요성(가속도)이 양안문제의 1/30 수준인 점은, 북한의 위협과 대결구도에 대한 한국의 집착이 미국 중심의 지역(세계) 관할 전략의 틀 속에서 핵심적인 독립변수로 작용하지 않을 가능성을 함축한다.
따라서, 한국의 입장에선 장기간 변화를 겪을 세계질서 속에 미국과 중국 두 강대국에 대해 헤징(hedging)과 균형(balancing)을 동시에 추구하는 다차원적인 전략이 요구된다. 이를 위해 지정학적으로 가까운 중국에 대해 보다 유연하고 분화된 관계를 견지하고, 이를 통해 미국과 일본에 대해 한국만이 갖는 고유한 매개자로서 외교×안보 역할을 어필하고 자국의 경제×기술적 이익을 수호할 필요가 있다. 데이터에서 드러난 바, 한국 ‘정부’의 역량과 역할이 어느 때보다도 긴요한 국면에 놓여 있다.
Tag:
아시아이슈,빅데이터,동북아,안보프레임,의미망분석,벨류체인
저자소개
이명무(leemm@snu.ac.kr)
현) 서울대학교 아시아연구소 HK연구교수, <아시아 브리프> 편집위원
전) 홍익대학교 스마트도시과학경영대학원 교수, 한양사이버대학교 ITMBA 교수
김도훈(leo_kim@arspraxia.com )
현) 아르스프락시아 대표이사