대기경계층 연구실에서는 무엇을 연구하는가?
미세먼지 예보 그리고 대기질 자료동화 (Data Assimilation)
자료동화(Data Assimilation)란 현재의 대기질 상황을 설명하기 위해서 유용한 관측자료를 사용하여 대기질 모델 역학에 반영하여 최적의 대기질 수치모델을 생성하는 과정을 말한다. 종합 대기질 모형을 이용한 미세먼지 예보의 정확도는 수치해석방법의 오차는 물론이고 대기오염물질 배출량과 초기 및 경계조건의 불확도에 큰 영향을 받는다. 예를 들어 WRF-CMAQ을 포함한 여러 대기질 예보 모형의 예보결과는 기상예보의 정확도뿐만 아니라 배출량의 정확도에도 영향을 받는 것으로 나타났다. 현재 중국의 대기오염배출량은 다양한 주목을 받으면서, ACEAsia, INTEX-B, MICS-Asia 등 국제공동연구 등을 통해 중국 내부 배출량을 산정하였고, 이렇게 정확한 미세먼지 예보를 위한 배출량 연구등의 노력에도 불구하고, 모델의 불확도는 적지 않다.
따라서 우리나라 미세먼지 예보에서 중국 배출량을 포함한 여러 불확도를 극복하는 방안으로 대기질의 자료동화(Air Quality Data Assimilation)가 유용하다. 대기질 자료동화에 사용되는 대기오염물질 농도의 관측치는 인공위성 관측치와 지상 측정치가 있으며, 지상 측정치를 이용하면 측정자료의 불확도는 작지만 측정자료가 도시지역에만 집중되어 있는 문제가 있고, 인공위성 관측치를 이용하면 대상지역에 고르게 측정자료를 얻을 수 있지만 측정자료의 불확도가 높다는 단점이 있다.
현재 자료동화 기법를 이용한 미세먼지 예보율 향상시키기 위하여 선진 연구기관에서는 변분법(Variational method) 혹은 앙상블 칼만 필터(Ensemble Kalman Filter, EnKF) 등을 개발하여 사용하고 있으며, 특히 3차원 변분법(3 Dimensional VARiational, 3DVAR) 혹은 4차원 변분법(4 Dimensional VARiational, 4DVAR)의 경우 위성과 지상에서 관측한 다양한 형태의 자료를 수치모델의 변수 간 정합성을 고려하여 한 번에 동화함으로써 예보 개선의 효과가 뚜렷하게 증가하여 나타나는 것으로 알려져 있으며(Saide et al., 2013), 자료 동화과정의 연산자는 아래와 같이 요약된다.
근본적으로 자료 동화 기법을 적용함에 있어서 관측자료는 여러 요인에 의하여 참값과 다를 수 있으며, 그 오차를 몇가지로 구분한다. 먼저 관측기기에 내재된 오류 및 기기 설정 방식에 의한 오류 (측정 오차; Measurement Error), 실제 관측과 모델 간의 자료 비교 시 관측과 모델의 해상도 및 규모 차이에 의하여 발생하는 대표성에 따른 오차 (대표 오차; Representative Error), 관측과 모델 간 데이터 비교 시 완벽하지 못한 관측 연산자에 의한 변수의 변환 과정에서 발생하는 오차 (관측연산자 오차; Observation Operator Error), 그리고 관측 데이터의 생산 시 QA (Quality Assuarance) 과정에서 완전히 제거되지 못한 구름 등에 의한 오차 (품질 조정 오차; Quality Control Error) 등이 발생한다. 관측 오차의 공분산은 여러 요인에 따른 관측 오차의 합으로 표현되며, 현재 대다수의 자료동화 시스템은 관측오차를 Diagonal Matrix로 가정하며. 자료동화에 적용하는 관측오차는 관측 시 일정한 파라미터를 가지고 관측값 및 토지피복과 같은 지면 상태 등에 의하여 최종 관측오차가 계산된다. 예를 들어 위성에서 산출되는 GOCI AOD의 관측오차를 산정하며, 오차의 기댓값은 바다 및 육지에 대해 아래와 같이 각각 산정된다.
이러한 오차를 계산하게 되면 실제 지상에서 측정한 미세먼지 자료를 미세먼지 예보 모델에 동화할 수 있게 되며, 하게 된다. 지상 측정자료의 관측오차(E)는 측정 오차(EM)와 대표 오차(ER)의 합으로 나타나며, GSI 자료동화 시스템 내부에서 오차는 예를 들어 다음과 같이 계산할 수 있다.
위 식에서 모델 격자는 모델의 공간해상도를 나타내고, Emax, Emin, ET, 및 SLu는 각각 최대, 최소, 조정 가능 오차 및 토지피복에 따른 비율로서 자료동화 시 미리 정해지는 경험적 파라미터들로 본 연구에서는 파라미터들의 최적값을 산정할 수 있다.
관측 오차 분석은 장기간(1년 이상)을 대상으로 한 최적의 위성 및 지상 자료 관측오차 공분산 산정을 산정할 수 있으며, 관측 오차의 경우 모델과는 달리 관측 기기 및 데이터 변환에 대한 오차가 대부분이므로 관측자료가 풍부할 수 록 평균적인 관측 오차를 산출하기 용이하다. 마지막으로 모델에 들어가는 입력자료인 배출량 목록과 자료동화 간 필요한 관측자료인 위성 및 지상 관측자료에 대하여, 전체 자료동화 및 각각의 자료를 제외한 자료동화와의 비교를 통한 여러 가지 민감도 실험을 실시하여, 분석장 (Analysis)과 모델 배경장 (Model Background)의 차이인 증분 (Increment)을 분석하게 되면 모델의 배출량 불확실성을 분석하고, 보다 나은 모델 입력 자료를 구축할 수 있다.
자료동화는 인공위성 등 관측자료를 대기질 모델에 적용하여 자료동화 한 3차원 농도장을 이용하여 우리나라 미세먼지 예보 모형의 초기조건을 양질의 조건으로 생성시킬 수 있음은 분명하다. 요즈음 중국에서는 대기오염에 대한 중국 국민의 높은 관심에 부응하여 대기오염 측정소를 대폭 확충하고 대기오염 측정자료를 실시간으로 공개하고 있다. 따라서, 중국 대기 측정소에 측정소의 대표성, 측정자료의 불확도 등의 세부자료가 확보되면 중국 측정망을 이용한 우리나라 대기질 예보의 초기조건 생성도 가까운 시일에 가능할 것이다. 위성 및 지상관측으로부터 얻어지는 다양한 관측 자료를 실시간으로 처리하여 예측모델의 초기값으로 너징(Nudging)하여 적용할 수 있는 대기질 자료동화 시스템의 개발 연구 또한 더 늦출 수 없는 대단히 중요한 연구이다. 특히 우리나라의 최근 미세먼지 예보율을 고려해 볼 때, 2017년부터 환경부가 다부처 사업으로 수행 중인 미세먼지 연구단에서 한국형 대기질 모델 개발을 완료하는 2023년까지 우리나라 현업 예보에 사용할 수 있는 선진화된 자료동화 시스템 개발이 시급하다.