행정안전부 국가정보자원관리원이 UN 글로벌 펄스 자카르타 연구소와 업무협력을 체결하고 동북아 지역의 미세먼지 예측 및 주요 요인을 데이터에 기반해 분석했다.
국내외 요인을 정확히 파악하기 위해 서해안의 인구 밀집지역인 인천지역을 분석대상으로 선정했으며 기존 수치예측모델과 달리 머신러닝을 활용해 내일의 미세먼지 예측모델을 개발하고 미세먼지에 영향을 주는 주요 요인을 파악한 것.
이번 분석에는 지난 2015년 1월부터 2018년 3월까지의 인천 지역 미세먼지 및 대기 오염 데이터, 미국항공우주국이 제공한 동북아 지역의 위성 센서 데이터 그리고 에어로넷의 지상 관측 센서 데이터가 활용됐다.
그래디언트 부스팅 기반의 예측 모델을 구현해 조사할 결과 미세먼지가 ‘나쁨’을 가리키면 서풍이 불었으며 산둥성, 산시성, 베이징 및 허베이성 등의 중국 지역 에어로졸 농도가 매우 높다는 것을 확인할 수 있었다.
또한 데이터에서 국외 요인을 제거하면 지난해 1분기 예측 결과 ‘좋음’ 등급은 20일에서 30일로 50%까지 증가하는 것으로 나타났다.
향후 국가정보자원관리원은 보다 정확한 예측을 위해 에어로졸 분석 성능이 뛰어난 국내 정지 위성 데이터를 추가 확보하고 다른 분석 모델과의 결합을 통해 예측 정확도를 높인다는 계획이다.
김명희 행안부 국가정보자원관리원장은 "이번 분석은 국민의 생존권과 직결되는 미세먼지 문제를 빅데이터로 접근한 아주 의미 있는 사례"라면서 "미세먼지 예보에 기계학습 예측 모델이 적극적으로 활용되기를 기대한다"고 말했다.
김경림 키즈맘 기자 limkim@kizmom.com