화학적산소요구량의 총유기탄소 변환을 위한 이상자료의 탐지와 처리 KCI

Title
화학적산소요구량의 총유기탄소 변환을 위한 이상자료의 탐지와 처리
Alternative Title
Outlier Detection and Treatment for the Conversion of Chemical Oxygen Demand to Total Organic Carbon
Author(s)
조범준; 조홍연; 김성
KIOST Author(s)
Cho, Hong Yeon(조홍연)Kim, Sung(김성)
Publication Year
2014-08
Abstract
총유기탄소(TOC)는 해양의 탄소순환 연구분야에서 직접적인 생물학적 지표로 이용되는 중요한 인자다. 가용한 TOC 자료가 상대적으로 화학적산소요구량(COD) 자료 보다 부족하기 때문에 COD 자료를 활용하여 TOC 자료를 추정할 수 있다. COD를 TOC 로의 변환 시 TOC 추정에 직접적으로 영향을 미치는 COD 관측자료에 포함된 이상자료의 탐지와 적절한 처리는 합리적이고 객관적으로 수행되어야 한다. 본 연구에서는 국내 연안해역에서 관측된 염분, COD 및 TOC 자료에 대한 최적회귀모형을 제시하였다. 최적회귀모형은 이상자료와 영향자료를 여러 가지 탐색방법으로 진단하여 제거 전 후의 자료 개수 변화, 변동계수 및 RMS 오차를 비교 및 분석하여 선택하였다. 연구수행 결과, Cook의 진단방법과 SIQR의 boxplot 방법을 조합한 방법이 가장 적절한 것으로 파악되었다. 최적 회귀 함수는 TOC(mg/L) = 0.44⋅COD(mg/L)+1.53 이고, 결정계수는 0.47 정도로 나타났으며, RMS 오차는 0.85 mg/L이다. RMS 오차와 지레계수(leverage values)의 변동계수는 이상자료 제거 전에 비하여 각각 31%, 80%로 크게 감소되었다. 본 연구에서 제시된 방법을 통해 COD와 TOC 관측자료에 포함된 이상자료와 영향자료의 과도한 영향을 진단 및 제거하였기 때문에 보다 적절한 회귀곡선식을 제시할 수 있었다.



Total organic carbon (TOC) is an important indicator used as an direct biological index in the research field of the marine carbon cycle. It is possible to produce the sufficient TOC estimation data by using the Chemical Oxygen Demand(COD) data because the available TOC data is relatively poor than the COD data. The outlier detection and treatment (removal) should be carried out reasonably and objectively because the equation for a COD-TOC conversion is directly affected the TOC estimation. In this study, it aims to suggest the optimal regression model using the available salinity, COD, and TOC data observed in the Korean coastal zone. The optimal regression model is selected by the comparison and analysis on the changes of data numbers before and after removal, variation coefficients and root mean square (RMS) error of the diverse detection methods of the outlier and influential observations. According to research result, it is shown that a diagnostic case combining SIQR (Semi - Inter-Quartile Range) boxplot and Cook's distance method is most suitable for the outlier detection. The optimal regression function is estimated as the TOC(mg/L) = 0.44⋅COD(mg/L)+1.53 , then determination coefficient is showed a value of 0.47 and RMS error is 0.85 mg/L. The RMS error and the variation coefficients of the leverage values are greatly reduced to the 31% and 80% of the value before the outlier removal condition. The method suggested in this study can provide more appropriate regression curve because the excessive impacts of the outlier frequently included in the COD and TOC monitoring data is removed.
ISSN
1976-8192
URI
https://sciwatch.kiost.ac.kr/handle/2020.kiost/2756
DOI
10.9765/KSCOE.2014.26.4.207
Bibliographic Citation
한국해안·해양공학회논문집, v.26, no.4, pp.207 - 216, 2014
Publisher
한국해안,해양공학회
Keywords
outlier; optimal regression model; RMS error; determination coefficient; SIQR boxplot and Cook’s distance; 이상자료; 최적회귀모형; RMS 오차; 결정계수; SIQR boxplot과 Cook’s 계수
Type
Article
Language
Korean
Publisher
한국해안,해양공학회
Related Researcher
Research Interests

Spawning ecology of fishes,Marine Environmental DNA Biomonitoring,어류산란생태,해양 eDNA 분석

Files in This Item:
There are no files associated with this item.

qrcode

Items in ScienceWatch@KIOST are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse