초록 |
본 연구에서는 생물학적 막분리 공정(MBR)의 유출 수질, 폭기 에너지, 그리고 막 오염 정도를 고려한 강화학습 기반 최적 운전 조건을 제시하고자 한다. 강화학습은 학습의 주체인 agent가 environment와 상호작용을 하여 얻는 보상을 최대로 하는 정책을 구하는 방법으로써, 본 연구에서는 Actor-Critic 방법 및 딥러닝을 강화학습에 접목한 DQN-RL 알고리즘을 이용하여 데이터 기반 학습을 수행하였다. 강화학습 기반의 최적 공정 운용 시스템은 호기조와 막분리조의 산소 농도와 막분리조의 운최 운영 방법을 제시하고, 국내 M-MBR 공정 데이타 적용 결과와 다양한 환경시스템의 Smart O&M의 원천기술로서의 친환경적이며 경제적인 운전 가능성을 타진하였다. 딥러닝-강화학습기반 자율최적운전방법은 MBR의 막 오염 감소와 공정 운전 비용이 각각 가능한 것을 보여주었다. Acknowledgements: This work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korea government(MSIT). (No. NRF-2017R1E1A1A03070713). |