ImageLab News 

이미지랩소식

ImageLab News

이미지랩소식

농생명사이언스 논문나지 수분 추정을 위해 초분광영상을 이용한 Sentinel-2 데이터의 시뮬레이션

농업에서 토양 수분은 정밀관개관리, 가뭄 평가 등에 활용되는 중요한 변수 중 하나입니다.

시공간적 데이터를 수집하여 토양 수분을 추정하고 모니터링하는 방법으로는 

1. 실내 실험 기반 방법 2. 센서 기반 방법 3. 원격탐사 기반 방법

등 많은 방법들이 존재합니다.


허나 실내 실험 기반 방법은 획득한 토양 샘플을 실험실 내 장비를 이용해 파괴하는 과정을  기초로 하기 때문에 시간이 많이 소요되고 재시험할 수 없습니다.

센서 기반 방법은 다양한 센서를 이용하여 토양 수분을  점 기반 측정으로 좁은 범위를 측정하기 때문에 

지역 척도 연구의 지표로 사용할 수 없습니다.

원격탐사 기반 방법은 광학(Multispectral / Hyperspectral) 스펙트럼의 열 영역을 사용하여 

지역 단위의 토양 수분 추정을 위한 방법을 제공하지만

고해상도의 대용량 데이터 획득과 처리의 과정이 필요하여 현장에서의 적용이 제한적이고 

센서와 관련된 고비용 문제가 있습니다.


그럼에도 초분광영상 원격탐사는 풍부한 스펙트럼 정보를 가지고 있기에 

토양 수분 추정을 포함한 다양한 용도에 광범위하게 사용되고 있습니다.


따라서 보다 효율적으로 영상을 획득하고 토양 수분 추정을 하기위해 초분광영상 데이터를 

Sentinel-2 위성영상 대역으로 시뮬레이션을 시도한 연구가 진행되어 소개합니다.

이번 WHISPER, 2021 학회에서 발표된 

'Simulation of Sentinel-2 Data Using Hyperspectral Data For Bare Surface Soil Moisture Estimation' 

입니다.


본 연구는 1) 기존 획득 데이터 활용 2) 초분광영상 획득 3) 검증 의 단계로 진행되었습니다.

기존에 획득된 데이터는 독일 Waldbronn인근의 나지 표본으로 1991년 6월 획득된 토양 수분 데이터세트입니다.

GNU General Public License Version 2에 배포되어 2 ~ 18cm 깊이에 다양하게 배치된 센서로 

획득된 여러 데이터가 있지만 토양 습도를 나타내면서 무료로 사용할 수 있는 2cm의 데이터를 

이용하였습니다.


그림 1. 연구 지역

초분광영상은 Cubert UHD285 Hyperspectral snapshot camera를 이용하여 획득하였고,

450 ~ 950nm 범위에서 125개 대역(4nm 간격, 50X50 pixels)으로

총 679개의 데이터를 획득하였습니다.

그림 2. 초분광영상 자료 획득 장비

이렇게 획득된 데이터를 활용하여 시뮬레이션된 결과는 

인도의 Pune에 위치한 데모 팜(Demo Farm)에서 검증이 진행되었습니다.

데모 팜에는 KDS-042센서를 이용하여 현장 토양 수분 측정 및 모니터링이 실시되었습니다.


그림 3. 연구 결과 검증 지역(Demo Farm, Pune, India)

본 연구는 그림 4와 같이 진행되었습니다.

토양 샘플의 초분광 데이터와 Sentinel-2의 스펙트럼 감도로 시뮬레이션된 데이터의 회귀 모델을 개발을 위해 랜덤 포레스트 회귀(RFR)를 사용하였고 변수 선택 및 검증을 시도하였습니다.

마지막으로 데모 팜에서 시뮬레이션된 Sentinel-2 데이터를 사용하여 최상의 모델 평가를 진행하였습니다.


그림 4. 연구 진행 프레임워크

초분광 데이터는 Sentinel-2의 8개 대역을 포함하는 450 ~ 950nm의 범위에서 Spectral Resampling 하여 125개 대역을 8개 대역으로 시뮬레이션 하였습니다.


RFR을 실시하는 과정에서 2개의 변수를 고정하였습니다.

1. ntree 

2. mtry  

ntree는 RFR 과정에서 실시되는 반복 횟수로 50부터 300까지 50의 간격으로 실시하였고

mtry는 Sentinel-2 위성의 8개 밴드 대역을 나타내어

 RFR 분석을 위한 mtry는 7개로 1부터 7까지 1 간격으로 실시되었습니다.

연구를 위해 획득된 총 679개의 데이터세트 중

모델 트레이닝에 544개, 테스트에 135개의 데이터가 이용되었습니다.

그림 5. 3-Fold Cross Validation 결과 데이터

그림 5는 각 ntree와 mtry의 조합에 대해 3-Fold Cross Validation(교차 검증)을 사용하여 얻은 RMSE 값

을 보여줍니다.

ntree = 200, mtry = 5 일 때, 최저 RMSE(1.0396) 값을 가지며 가장 좋은 결과 모델로 볼 수 있습니다.

그림 6. 시험 데이터와 예측 데이터 비교

그림 6은 실제 토양 수분 데이터(시험 데이터)와 예측 토양 수분 사이의 값을 비교한 자료로

두 데이터간의 RMSE는 1.0180, 결정계수인 R2는 0.9131의 값을 보입니다.

즉, 91%의 정확도로 일치하는 데이터로 볼 수 있습니다.


%IncMSE(중요도 지수)는 RF에서 주어진 변수의 중요도를 평가하기 위해 사용됩니다.

모든 변수에서 중요 변수 선택을 위한 과정은 다음과 같은 과정으로 진행합니다.

1) 최대 %IncMSE 값을 2로 나눔

2) 최대 %IncMSE를 2 값을 2로 나눈 것보다 큰 변수는 

중요한 것으로 간주하여 추가 분석에 사용됨

그림 7. %IncMSE(중요도 지수)로 선택된 대역

위 과정에 의해 그림 7과 같이 B2, B4, B5, B7 대역이 중요한 것으로 간주되었고 

토양 수분 추정을 위한 중요 밴드로 선택하여 추가 분석을 실시하였습니다.


추가 분석 결과는 그림 8과 같습니다.

그림 8. 중요도 지수에 의해 도출된 결과

그림 9. 시험데이터와 예측데이터의 비교(중요밴드)

밴드의 수가 줄어들면서 모델 트레이닝에 필요한 시간은 줄어들었고,

RMSE = 0.9661, R2 = 0.9357 로 더 우수한 수치를 보였습니다.


본 연구는 시뮬레이션 된 Sentinel-2 데이터를 이용하여 효율적인 수분 추정을 할 수 있음을 보여주고 있습니다.

Sentinel-2 의 8개 대역을 가진 모델도 91% 라는 우수한 수치를 보였으나

중요도 지수에 의해 선택된 4개 대역으로 모델을 개발할 경우, 93%의 더 높은 정확도를 보이면서 모델 트레이닝에 더 적은 시간이 소요되었음을 확인하였습니다.

모델의 정량적 평가는 인도의 데모 팜에서 실시되어 실제 토양 수분과 추정 토양 수분 간 -2.18%의 차이를 보여준다고 합니다.

이는 Sentinel-2 위성 대역의 시뮬레이션 데이터를 이용하여 토양 수분량을 높은 정확도로 추정할 수 있음을 시사하고 있습니다.


본 연구의 결과를 응용하여 "이미지랩"에서는 고해상도 위성 영상으로 데이터세트를 획득하고 

중요도 지수로 선택된 대역을 활용하여 작목 분류 모델 개발에 응용하고자 합니다.

분광해상도와 공간해상도가 모두 높은 영상 데이터를 이용하는 것은 

고비용에 현장에서 이용하기에 제한적인 단점이 있으나 

분류하고자 하는 대상의 분광 특성에 적합한 대역을 적용한 모델 개발을 하여

효율적으로 작목을 분류하고 최종적으로 분류도 제작을 목표로 하고 있습니다.


※ 참고 문헌

Simulation of Sentinel-2 Data Using Hyperspectral Data For Bare Surface Soil Moisture Estimation, Mohite et al., IEEE Whisper 2021


Image Lab 이미지랩

본사 경기도 과천시 과천대로7길 33, A동 7층 710호

(갈현동, 디테크타워 과천)

연구소 경기도 성남시 수정구 창업로 43,

판교글로벌비즈센터 B1013호

Tel. 031-757-9472 Fax. 031-759-1489

Image Lab 이미지랩

본사 경기도 과천시 과천대로7길 33, A동 7층 710호(갈현동, 디테크타워 과천)

연구소 경기도 성남시 수정구 창업로 43, 판교글로벌비즈센터 B1013호

Tel. 031-757-9472 Fax. 031-759-1489  E-mail. imagelabinc@gmail.com