Speakers
심우진 박사
아시아연구소 HK연구교수 / HK⁺데이터스토리텔링클러스터Start
2026년 1월 19일 - 11:45 am
End
2026년 1월 19일 - 1:15 pm
Address
서울대학교 아시아연구소 304호
Photos
Review
서울대학교 아시아연구소 HK+ 메가아시아연구사업단은 「비교지역연구의 계량방법론: 다층 분석을 통한 ‘지역색’의 발견」을 주제로 제10회 SNUAC 비교지역연구 콜로키움을 진행하였다.
심우진 연구교수는 비교지역연구에서 ‘지역 간 차이’를 계량적으로 설명하려 할 때 기존의 국가 단위 평균 중심 비교가 개인–국가–지역으로 이어지는 위계적 구조를 충분히 반영하지 못해 지역 효과와 국가 효과, 개인 수준 요인을 혼동할 위험이 크다고 지적하였다. ANOVA 등 평균 비교는 집단 내 상호의존성 때문에 차이의 근원을 분해해 보여주기 어렵고, 결과적으로 ‘없는데 있다고 판단하는’ 통계적 오류 가능성도 커질 수 있다. 이에 대한 대안적 접근인 혼합효과모형(mixed effects model)은 개인의 응답을 종속변수로 두고 지역 수준의 평균 차이(고정효과), 같은 지역 내 국가별 차이(랜덤효과), 개인 수준 잔차를 분리하여 이 차이가 주로 지역에서 비롯되는지, 특정 국가가 주도하는지, 혹은 개인 수준에서 설명되는지를 선별하는 도구로 활용할 수 있다. 다만 기본 혼합효과모형이 ‘기준 집단 대 나머지’ 방식으로 비교를 설정하는 경우 실제 데이터에서 나타나는 지역 간 유사군(예: 특정 두 지역이 서로 비슷하게 움직이는 구조)을 충분히 포착하지 못할 수 있으므로 실질적으로는 지역 쌍별로 다수의 비교를 수행하는 등 설계가 필요하다. 또한 지역 구획 자체는 절대적 기준이 아니라 분석을 가능하게 하는 조작적 정의이며, 이번 분석에서는 실용적 목적에서 UN의 지역 구획을 바탕으로 지역을 설정했다.
발표의 후반부에서는 ‘다층’의 의미를 수직적 위계(개인–국가–지역)로만 한정하지 않고, 지역이 단일 경계로 고정된 실체라기보다 여러 기준과 담론에 의해 구성되는 대상이라는 문제의식을 수평적 다층성으로 확장하였다. 동남아시아 사례를 통해 환경의식 데이터를 활용하면서 국가 경계만으로 지역을 평균화하면 내부의 다양한 분포가 지워지고 ‘동남아’가 하나의 점으로 환원되는 한계가 발생한다. 이에 따라 분석의 렌즈를 국가 기준에만 두지 않고 사회 기준(도농, 정주지 유형, 정주지 규모 등)과 지리 기준(해안 접근성/거리 등)으로 교차 적용하여 같은 자료에서도 서로 다른 ‘지역상’이 만들어지는 과정을 보여주었다. 그 과정에서 동남아시아 전체를 놓고 보면 농촌이 도시보다 환경 가치·참여가 높게 나타나는 거시적 패턴이 관찰되지만, 국가 수준으로 내려가면 일부 국가는 농촌 우위가 유지되는 반면 일부 국가는 도시 우위 또는 차이가 거의 없는 양상으로 분기되며 지역 단위의 단순 합산이나 단순 평균이 ‘지역의 보편적 특징’을 대표한다고 단정하기 어렵다. 특히 이러한 거시 패턴이 특정 국가의 표본 비중과 분포에 의해 과도하게 좌우될 수 있으므로 표본 편향과 가중치 문제를 지역 연구자가 반드시 점검해야 할 함정이라고 할 수 있다. 결국 ‘지역색’을 1~2개의 점수로 정답처럼 뽑아내는 것이 아니라 비교가능한 여러 변수를 구성한 뒤 렌즈를 바꿔가며 데이터를 굴려보고 거시 패턴과 미시 패턴이 어떻게 어긋나거나 유지되는지 탐색하는 과정 자체를 통해 지역의 구조적 특징을 발견해야 한다.
질의응답에서 언급된 데이터 가중치의 정당성 및 적용 방식과 관련해 발표자는 방법론 원고의 성격상 로우데이터를 그대로 활용하여 위험과 한계를 드러내는 편을 택했으며 가중치를 부여해 결론을 재구성하는 방식은 해석 책임이 커지는 만큼 신중해야한다고 답했다. 또한 세속화와 같은 지표는 권위 불신·저항, 상대주의·회의주의 등으로 구성된 설문 기반 지수라는 점을 설명하면서도 개념이 놓인 문화적 맥락과 번역·측정의 차이를 데이터 구축 설명(description) 등에서 충분히 다뤄야 한다는 의견이 공유되었다. 아울러 환경의식과 같은 개인 수준 종속변수에서 개인 속성 변수가 빠진 이유와 그 한계를 지적하는 질문이 제기되었고, 발표의 목적이 지역 ‘명명’이 아니라 지역 비교에서 발생하는 함정과 설계 원리를 보여주는 데 있다면 개인 변수 누락과 이론 없는 데이터 마이닝의 위험을 명시적 한계로 적시하는 방식이 적절하다는 방향으로 토론이 수렴되었다. 시간 변동의 경우 이번 분석에서는 WVS 7차 웨이브를 사용해 시간축을 포함하지 못했으나, 다른 웨이브를 결합하면 변화 추적이 가능하다는 점이 언급되었다.





