
산사태, 예측불가한 하나의 정답이 없는 문제
기후변화가 몰고 온 기록적인 폭우.
해마다 여름이면 우리는 '산사태'라는 안타까운 소식을 뉴스로 접하게 됩니다. 지난 15년간 경기도에서만 821건의 산사태가 발생했고, 그 피해액은 1,333억 원을 넘어섰습니다.
이러한 피해는 산사태가 예측과 대응이 매우 어려운 문제이기 때문입니다.
산사태는 어느 하나의 원인이 아닌, 땅의 경사, 숲의 종류, 흙과 암석의 성질, 그리고 보이지 않는 물의 흐름까지 여러 조건이 복잡하게 얽혀 발생하는 현상이기 때문입니다.
이 다양한 조건들의 '위험한 조합'을 이해하는 것이, 산사태 예측과 대응의 출발입니다.

경기도 특성을 반영한 AI 학습데이터
수많은 조건들이 상호작용하는 복잡한 문제일수록, 방대한 데이터 속에 인간의 눈으로는 찾기 힘든 패턴을 읽어내는 인공지능(AI)의 역할이 중요하게 됩니다.
AI 분석의 성패는 학습 데이터의 ‘질’과 ‘적합성’에 달려있습니다. AI는 우리가 제공하는 데이터를 기반으로 현황을 이해하고 예측하는 법을 만들기 때문입니다.
기존의 전국 산사태위험등급 지도는 전국 각지에서 발생한 산사태 사례들을 모아 만든, 매우 가치 있는 표준 데이터로 부터 산사태를 예측합니다.
그러나 ‘전국’을 대상으로 한 표준 데이터가 ‘경기도’라는 특정 지역의 현황을 이해하는데 최선의 데이터는 아닐 수 있습니다.
특정 지역의 위험을 더 깊이 이해하기 위해서는 그 지역만의 특성이 담긴 지역 데이터가 필요합니다.
즉, 경기도의 산사태 위험을 가장 잘 예측할 수 있는 데이터는 바로 경기도 지역에서 발생한 실제 산사태 데이터인 것입니다.
경기도 산사태 발생 지점 DB 구축
- 2018~2024년까지 경기도 산사태 재해대장을 기반으로 1,340개 산사태 발생 지점 정보 구축
- 산사태 발생 지점에서 2km 이상 떨어지고, 최소 250m 이상 간격을 갖는 2,012개 비산사태 발생 지점 정보 구축

경기도 산사태 예측을 위한 최적의 AI 모델 찾기
산사태처럼 원인이 복잡한 재해를 분석하기 위해서는 가장 적합한 AI 방법론을 선택하는 과정이 무엇보다 중요합니다.
사용하는 모델에 따라 예측의 정확도와 결과에 대한 신뢰도가 크게 달라질 수 있기 때문입니다.
경기도에서는 어떤 모델이 가장 잘 맞는지 알아보기 위해 다양한 AI 기법들을 비교하고 검토했습니다.
이 과정에는 간단한 통계 분석 방식부터 서포트 벡터 머신, 랜덤 포레스트, XGBoost 같은 널리 쓰이는 머신러닝과 딥러닝 기술 중 하나인 DNN 모델까지 포함되어 있습니다.

각 모델에 동일한 학습 데이터(경기도의 실제 산사태 발생 데이터와 지형, 지질, 토양, 숲 정보)를 제공하고, '어떤 곳에서 산사태가 발생할 확률이 높을지’ 를 예측하도록 했습니다.
평가는 단순히 정답을 맞추는 '정확도'뿐만 아니라, 위험 지역과 안전 지역을 얼마나 잘 구분해내는지(AUC), 그리고 예측 결과가 얼마나 안정적인지(MAE, Log Loss) 등 여러 지표를 통해 종합적으로 이루어졌습니다.
종합적인 성능 평가 결과, XGBoost가 가장 적합한 방법론으로 채택되었습니다.
XGBoost는 위험 지역과 안전 지역을 구분하는 변별력(AUC 0.7468)과 정확도 등 대부분의 평가 지표에서 가장 균형 잡히고 우수한 성능을 보여주었습니다.

- 하이퍼파이미터 setting: 'colsample_bytree': 0.8, 'learning_rate': 0.1, 'max_depth': 3, 'n_estimators': 100, 'scale_pos_weight': 3, 'subsample': 1.0
- 학습 평가지표: ValidationSet, AUC
경기도 산사태 발생 지점 DB 구축
- SHAP(SHapley Additive exPlanations)는 산사태 발생 예측에 각 지표 얼마나 기여했는지를 수치화
- Mean SHAP value는 해당 지표의 평균 영향력을 의미하며, 값이 클수록 예측에 중요한 변수임을 의미
가장 중요한 변수 '사면곡률’
AI가 산사태 발생에 가장 큰 영향을 미치는 변수로 지목한 1순위 변수는 '경사’ 가 아닌 '사면곡률’ 이었습니다.
지형의 형상을 나타내는 지표로, 지표면이 오목한지 또는 볼록한지를 구분합니다.
SHAP 분석 결과에 따르면, 오목한 지형에서는 물이 집중되고 지반이 약해져 산사태 발생 가능성이 높아지는 반면,
볼록한 지형에서는 물이 흩어져 위험도가 낮아지는 경향을 보였습니다.
경사(Slope)는 여전히 중요한 2순위 변수였지만, 단순히 경사의 크기보다도 지형이 물을 어떻게 모으는 가에 대한 형태적 특성이 더 본질적인 위험 요인으로 작용한다는 사실을 확인할 수 있었습니다.
영향력의 재확인, '숲'과 '흙’
숲의 종류(임상)나 흙의 깊이(토심)가 중요하다는 것은 기존에도 알려진 사실입니다.
이번 분석에서는 이러한 변수들이 경기도의 실제 지형 및 산림 환경을 반영한 데이터 기반으로
정량적으로 검증되었습니다. 예를 들어, 뿌리 깊이가 크고 지반 고정력이 높은 활엽수림이 분포한 지역은
산사태 위험이 감소하는 것으로 나타났습니다.
반면, 토심이 얕은 지역은 지지력이 약해져 산사태 위험이 상승하는 경향이 관찰되었습니다.
이는 기존의 경험적 지식을 AI 기반 예측 모델을 통해 수치적으로 입증한 것입니다.
AI를 이용한 새로운 지도, 무엇이 어떻게 달라졌나?
새롭게 개발된 경기도형 산사태위험등급 지도는 과연 얼마나 더 정확하고 실용적일까요?
기존의 전국 산사태위험등급 지도와 경기도 데이터로 학습한 AI가 분석한 결과를 경기도의 실제 산사태 발생 이력을 기반으로 비교해 보았습니다.
이 비교의 목적은 어느 한 지도의 우열을 가리기 위함이 아닙니다.
경기도의 고유한 특성을 학습한 지역 맞춤형 모델이 도민의 안전을 위해 얼마나 더 정밀하고 유용한 정보를 제공할 수 있는지 그 가능성을 확인하는 과정입니다.
가장 확실한 검증 방법은, 과거의 정답, 즉 경기도에서 실제로 산사태가 발생했던 1,628곳의 위치와 각 지도의 예측 결과를 직접 비교하는 것입니다.
가장 위험한 1~2등급 지역에서 경기도 특화 모델은 실제 산사태의 약 37%가 일어난 것으로 분석되었으며,
이는 전국형 산사태위험등급지도(약 24%)보다 높은 상당이 높은 정확성을 보여 주었습니다
'안전' 등급(5등급)의 신뢰도 역시 크게 향상되었습니다.
전국 지도에서 17.6%의 산사태가 발생한 5등급 지역과 달리, 경기도 모델의 5등급 지역에서는 단 5.5%만 발생해 안전 신호의 오류를 상당히 줄어든 것을 확인했습니다.
두 지도 모두 가평, 양평 등 동북부 산악 지역을 고위험 지역으로 평가했지만, 경기도 모델은 기존에 상대적으로 덜 부각되었던
안성, 이천 등 중남부 내륙 지역의 잠재적 위험성까지 일부 제시했습니다.
이는 전국 평균 데이터에서는 드러나지 않았던 경기도만의 국지적인 위험 패턴을 AI가 학습하여 찾아냈다는 점에서 큰 의미가 있습니다.

이제 시작인 경기도 산사태위험지도
이번에 작성된 경기도형 산사태 위험지도는 충분히 의미 있는, 완성도 높은 결과물입니다.
하지만 더 나은 데이터가 확보된다면, 더욱 정밀하고 가치 있는 정보로 진화할 것입니다.
이번 분석의 기반이 된 '재해대장’ 의 산사태 기록은 매우 소중한 자료였지만, AI 학습을 목적으로 만들어진 데이터가 아니었기에 정보의 깊이에는 일부 한계가 있었습니다.
이제 경기도는 앞으로 발생하는 모든 산사태에 대해, AI 예측 모델의 성능을 높이는 것을 고려하여 더 면밀하고 체계적인 현장 조사를 수행하고 데이터를 축적해 나갈 것입니다.
경기도는 기후위성을 통해 재난 감시의 패러다임을 바꿀 강력한 도구를 갖게 됩니다.
2025년 11월, 경기도는 자체 기후위성을 발사하여 운용을 시작합니다.
높은 시간 해상도로 경기도 전역을 주기적으로 촬영하는 광학위성이 우리의 ‘하늘의 눈’이 되어줄 것입니다.
위성영상을 활용한 변화 탐지를 통해, 그동안 사람의 눈에 띄지 않아 기록되지 않았던 소규모 산사태까지 빠짐없이 데이터로 구축할 수 있게 되는 것입니다.
이렇게 확보된 새로운 데이터는 경기도가 이미 보유한 세계 최고 수준의 기반 정보와 결합하여 엄청난 시너지를 낼 것입니다.
기후플랫폼의 0.5m급 DEM을 통해 발생한 산사태의 피해가 정량적으로 분석이 가능하며, 도시생태현황지도의 상세한 식생 정보를 활용하여
기존의 '활엽수, 침엽수' 수준을 넘어 나무의 '종' 수준의 정보로 예측의 정확성을 한 차원 높일 수 있습니다.
개인정보처리방침
개인정보처리방침
RE100 플랫폼 서비스(이하 “서비스”)는 이용자의 개인정보를 매우 중요하게 생각하며, 『개인정보 보호법』 등 관련 법령에 따라 이용자의 개인정보를 안전하게 관리하고 보호하기 위해 다음과 같은 개인정보처리방침을 수립·공개합니다.
1. 수집하는 개인정보 항목 및 수집 방법
• 수집 항목: 이메일 주소
• 수집 방법: 서비스 가입, 이벤트 응모, 문의사항 등록 등 이용자가 자발적으로 정보를 입력하는 경우에 한해 수집합니다
2. 개인정보 수집 및 이용 목적
수집한 이메일 주소는 다음의 목적에 한해 이용됩니다.
• 서비스 관련 공지사항 전달
• 사용자 문의에 대한 응대
• 서비스 개선 및 사용자 만족도 조사
• 뉴스레터 및 마케팅 정보 제공 (사전 동의한 경우에 한함)
3. 개인정보 보유 및 이용 기간
이용자의 개인정보는 수집 및 이용 목적이 달성된 후에는 지체 없이 파기합니다. 단, 관련 법령에 따라 일정 기간 보존이 필요한 경우는 해당 법령에서 정한 기간 동안 보관됩니다.
• 이메일 주소 보유 기간: 회원 탈퇴 시까지 또는 수집 목적 달성 시까지
• 전자상거래 등에서의 소비자 보호에 관한 법률 등 관계법령에 따라 보존이 필요한 경우: 최대 5년
4. 개인정보의 제3자 제공
서비스는 이용자의 개인정보를 외부에 제공하지 않습니다. 다만, 다음의 경우에는 예외로 합니다.
• 이용자가 사전에 동의한 경우
• 법령에 따라 제공이 요구되는 경우
5. 개인정보의 위탁 처리
현재 서비스는 개인정보 처리를 외부에 위탁하지 않고 있습니다.
향후 위탁이 필요한 경우 사전에 이용자에게 고지하고 동의를 받겠습니다.
6. 이용자의 권리와 행사 방법
이용자는 언제든지 본인의 개인정보에 대해 다음의 권리를 행사할 수 있습니다.
• 개인정보 열람, 정정, 삭제 요청
• 수신 거부 및 마케팅 정보 수신 동의 철회
이러한 요청은 이메일 또는 고객센터를 통해 접수하실 수 있습니다.
7. 개인정보의 안전성 확보 조치
서비스는 이용자의 개인정보를 안전하게 관리하기 위해 다음과 같은 조치를 취하고 있습니다.
• 개인정보에 대한 접근 제한
• 암호화된 통신구간을 통한 정보 전송
• 해킹 및 보안 위협 방지를 위한 기술적/관리적 보호조치
8. 개인정보 보호책임자
서비스는 개인정보 보호와 관련한 이용자의 문의를 신속하게 처리하기 위해 개인정보 보호책임자를 지정하고 있습니다.
• 책임자 성명: [이름 기재]
• 이메일: [이메일 주소 기재]
• 문의처: [연락처 또는 고객센터 기재]
9. 개인정보처리방침 변경
본 개인정보처리방침은 법령 및 서비스 운영 정책에 따라 변경될 수 있으며, 변경 시에는 사전에 웹사이트 또는 이메일을 통해 고지합니다.
• 공고일자: [YYYY-MM-DD]
• 시행일자: [YYYY-MM-DD]