First Principles 모델의 한계를 넘어: AI와 하이브리드 모델링으로 실현한 폴리머 색도(Color Index) 예측
실시간 폴리머 색도(Color Index) 예측은 품질 관리의 핵심이지만, first-principles 기반 시뮬레이션으로는 해결하기 어려운 난제였습니다.폴리머 산업의 많은 기업은 20여 년 전 개발된 공정 시뮬레이션 모델을 큰 변화와 혁신 없이 사용하고 있습니다. 당시의 엔지니어링 기술로 구축된 모델은 오랫동안 공정 최적화의 핵심 도구였지만, 이제는 다음 세 가지 문제에 직면했습니다.① 기술적 고립First-principles 모델이 과거 시뮬레이션 환경에서 개발되어 최신 모델링 환경과 호환되지 않습니다. 새로운 기능 추가나 개선이 사실상 불가능하며, AI 등 최신 기술로부터 점점 고립된 시스템이 되어가고 있습니다.② 예측 능력의 한계First-principles 모델은 현대 폴리머 산업이 요구하는 색상, MI(용융지수) 등 폴리머 물성에 대한 정밀한 품질 관리에 활용이 어렵습니다. 실시간 측정이 어렵거나 복잡한 화학적 메커니즘으로 결정되는 제품 물성 예측은 first-principles 모델만으로 한계가 있습니다.③ 비즈니스 리스크이러한 한계로 인해 많은 생산 현장에서는 first-principles 모델을 운전에 적극 활용하지 못하고 있습니다. 제품 품질을 사후 분석으로만 확인하고 있으며, 규격 외 제품 발생 시 원인을 신속하게 파악하기 어렵고, 공정 최적화는 경험에 의존합니다. 새로운 제품 개발이나 운전 조건 변경 시 리스크가 증가합니다. First-principles 모델을 최신 기술로 강화하지 못하면 결국 경쟁력 상실로 직결됩니다.디지털 전환이 가속화되는 지금, 폴리머 기업들은 선택의 기로에 있습니다. First-principles 모델을 유지할 것인가, 모더나이제이션을 통해 새로운 예측 능력을 확보할 것인가. Company Z (Germany)는 후자를 선택했고, 시마크로와의 협업으로 하이브리드 모델링을 통해 이 과제를 해결했습니다.
폴리머 색도 예측: 기존 모델의 한계를 넘어서
Company Z (Germany)는 폴리에스터 수지를 생산하는 독일 폴리머 공정 기술 기업입니다. 이 기업이 직면한 과제는 폴리머 업계에서 흔히 발생하는 문제였습니다. 수년간 사용한 공정 시뮬레이션 모델이 구버전 시뮬레이션 소프트웨어로 개발되어, 최신 버전 마이그레이션과 전반적 점검이 필요했습니다.그러나 더 중요한 과제가 있었습니다. 바로 폴리머의 색상(color) 관련 지표의 예측이었습니다.폴리머 색상과 투명도에 관련된 지표는 폴리머 제품의 기능적 특성(광학용, 포장용 등)과 직결되는, 매우 중요한 핵심 지표입니다. 폴리머 색좌표는 L*a*b* (L*은 명도, a*는 Red와 Green의 정도, b*는 Yellow와 Blue의 정도를 나타내는 수치)는 각종 첨가제, 잔류 촉매 등 여러 복잡한 요인으로 결정되며, 폴리머 미세구조의 미묘한 변화가 영향을 미칩니다 — first-principles 모델링만으로는 포착하기 극히 어려운 복잡한 현상입니다.Company Z (Germany)는 보다 최적화된 폴리머 품질관리를 위해, 실시간 색좌표를 예측할 수 있는 AI 기반 모델을 개발하길 원하였습니다.기존 first-principles 모델은 온도, 압력, 유량, molecular weight distribution (MWD) 같은 공정 변수는 예측할 수 있었지만, 폴리머 색상 L*a*b* 색좌표는 예측할 수 없었습니다. 색상은 폴리머 내부의 화학적 구조와 잔류 성분 등으로 결정되는데, first-principles 방법론만으로 예측하는 것은 현실적으로 불가능했습니다.시마크로는 modeling specialist로 참여하여 프로젝트의 핵심 과제를 다음과 같이 설정했습니다:① 공정 시뮬레이션 모델 업그레이드구버전 시뮬레이션 모델을 최신 버전으로 마이그레이션하고, 모델 구조와 파라미터를 점검하여 정확도를 향상하는 것② 2년치 운전 데이터에서 안정화 구간 추출약 2년치 공장 운전 데이터 중 모델 보정에 사용할 수 있는 안정화 상태 데이터를 식별하고 추출하는 것③ First-principles 모델의 예측 한계 극복First-principles 모델로는 예측할 수 없는 제품 물성, 특히 폴리머 색좌표 L*a*b*에 대한 예측 기능을 하이브리드 모델링으로 실현하는 것
첫 번째 과제: 방대한 데이터에서 안정화 구간 찾기
공정 시뮬레이션 모델을 정확하게 보정하려면 특정 제품을 생산하는 운전 구간에서 정상상태 조건의 오염되지 않은 데이터가 필수적입니다. Company Z (Germany)는 약 2년치 공장 운전 데이터를 제공했지만, 모든 데이터를 모델링에 사용할 수는 없었습니다.폴리머 공장은 하나의 라인에서 다양한 그레이드 제품을 생산하며, 시장 상황에 따라 제품의 종류와 생산량을 조절합니다. 제품 변경 중 공정은 전환 단계(transition phase)를 거치며, 온도, 압력, 유량 등 여러 운전 변수가 흔들리며, 규격 외 제품을 생산하게 됩니다. 총 40여 제품 이상을 생산하는 대상 공정에서 각 제품(Grade)별로 정상상태 모델링을 위한 안정적인 운전 구간을 정확하게 식별하는 것, 이것이 해당 프로젝트의 첫 번째 과제였습니다.전체 운전 데이터 중 안정화 상태(steady state) 구간만을 정확하게 식별하고 추출했을 때, 전체 794일의 운전 데이터 중에서, 약 224일(약 28%)이 안정화 상태로 식별되었습니다.
전체 794일의 운전 데이터 중 정의된 기준을 충족하는 224일(약 28%)이 안정화 상태로 식별되었습니다. 이 중 Dataset A는 파라미터 보정 및 AI 학습에, Dataset B는 추가 학습에, Dataset C는 모델 검증에 사용되었습니다.
시마크로는 공정 특성에 대한 이해를 바탕으로, 변동 계수(coefficient of variation)와 절대 편차(absolute deviation)를 적용하여, 안정화 구간을 판별하였습니다. 안정화 구간에서 추출된 데이터는 반응 모델의 파라미터 튜닝에 사용되었으며, 결과적으로 모든 제품(Grade)에 대해 운전 조건을 입력하였을 때, 최종 제품의 MWD 및 점도를 보다 정확하게 예측할 수 있는 공정 시뮬레이션 모델을 개발하게 되었습니다.수작업 기반의 데이터 분석은 수개월의 시간이 소요될 수 있지만, PMV™의 Python Editor를 활용한 자동화를 통해 몇 주 만에 완료할 수 있었습니다. 데이터 클렌징의 효율성은 전체 프로젝트 일정과 비용에 직접적인 영향을 미치므로, 자동화 도구의 전략적 활용이 프로젝트 성공의 핵심 요소였습니다.
두 번째 과제: First-Principles 모델을 현대화하다
데이터 클렌징으로 확보한 유효 데이터를 기반으로 first-principles 모델의 모더나이제이션이 진행되었습니다. 모더나이제이션은 단순한 소프트웨어 버전 업그레이드가 아닙니다. 모델의 구조와 파라미터를 전반적으로 점검하고, 현재 공장 운전에 맞게 개선하는 과정입니다.20년 전 모델 개발 시점의 상황과 현재 운전 조건과 맞지 않는 경우가 발생하였습니다. 원료 조성이 달라졌고, 운전 절차가 변경되었으며, 일부 설비는 교체되었습니다. 기존 공정에서 불필요한 부분을 제거하고, 현재 공장 운전에 필수적인 요소를 강화했습니다.폴리머 공정의 특성상 반응속도 상수, 열전달 계수, 물질전달 계수 등 수많은 파라미터가 최종 제품 물성에 영향을 미칩니다. 이러한 파라미터를 안정화 데이터에 맞춰 정밀하게 조정하는 것이 모델 정확도 향상의 핵심이었습니다.파라미터가 조정된 모델은 다양한 운전 조건에서 검증되었고, 예측 결과와 실제 플랜트 데이터를 비교하며 반복적으로 개선되었습니다. 이 과정을 거쳐 모더나이제이션된 모델은 현재 공장 운전을 정확하게 미러링할 수 있는 수준에 도달했습니다.
세 번째 과제: 하이브리드 모델링으로 실현한 실시간 폴리머 색도 예측
모델 모더나이제이션을 통해 first-principles 모델을 현대화했지만, first-principles 방법론에는 두 가지 근본적인 한계가 있습니다.
First-Principles 모델의 한계
첫째, first-principles 모델의 경우, 모든 상세 현상을 반영한 엄밀한 모델을 작성하는 것이 어려울 수 있습니다. 많은 경우, 엄밀성과 유연성, 정확성과 계산 성능 사이에서 수용 가능한 접점을 찾기 마련입니다. 폴리머 생산 공정은 수많은 화학 반응과 물리적 현상이 복잡하게 얽혀 있습니다. 이를 모두 정확하게 모델링하면 계산이 너무 복잡해지고 수치해석적 불안정을 가져올 수 있습니다. 본 프로젝트에서 업데이트한 시뮬레이션 모델에서도 총 24개 주 반응만 포함하였고, 미량 부반응은 포함되지 않았습니다. 그 결과, 모델 예측값과 실제 공장 데이터 사이에 높은 수준의 경향성을 재현하는 데 성공하였습니다. 하지만 보다 더 높은 정확도를 구현하는 데에는 한계가 존재하였습니다.둘째, 복잡한 물성 예측의 불가능성입니다. 폴리머 색상처럼 미세한 화학적 구조와 불순물 함량으로 결정되는 폴리머 물성은 first-principles 프레임워크 내에서 직접 계산할 수 없습니다. 미량 촉매, 반응 조건 등 여러 복잡한 요인이 L*a*b* 색좌표에 영향을 미치지만, 이러한 관계를 물리화학 원리만으로 표현하는 것은 현실적이지 못합니다.결과적으로, first-principles 방법론은 이러한 물성을 계산할 모델 자체가 없습니다.하이브리드 모델링은 first-principles 모델과 AI 모델을 통합하여, 각각의 장점을 살리고 한계를 보완합니다.
하이브리드 모델의 두 가지 역할
이 프로젝트에서 하이브리드 모델은 두 가지 방식으로 first-principles 모델의 한계를 극복했습니다.① 오차 보정 (Error Correction)First-principles 모델은 전반적인 공정 거동은 잘 예측하지만, 촉매 캐리어의 미량 부반응식의 부재로 인해 모델 예측값과 실제 측정값 사이에 어느 정도 오차가 존재합니다. 하이브리드 모델의 첫 번째 역할은 이러한 오차를 학습하여 보다 높은 정확도를 갖도록 보정하는 것입니다.
First-principles 모델의 예측값에 대해, AI 모델이 오차 패턴을 학습하여 보정(Output correction)하는 구조. 이를 통해 물리적 모델의 견고함을 유지하면서 예측 정확도를 향상할 수 있습니다.
AI 모델은 first-principles 모델의 예측값과 실제 측정값의 차이 패턴을 학습합니다. 새로운 운전 조건에서 first-principles 모델이 예측을 수행하면, AI 모델이 예상되는 오차를 계산하여 최종 예측값을 보정합니다. 이를 통해 first-principles 모델의 물리적 견고함을 유지하면서도 예측 정확도를 향상할 수 있습니다.② L*a*b* 색좌표 예측 (Color Index Prediction)하이브리드 모델의 두 번째 역할은 first-principles 모델이 직접 계산할 수 없는 물성을 예측하는 것입니다. 폴리머 L*a*b* 색좌표 예측이 대표적인 사례입니다.핵심 아이디어는 soft sensing입니다. 공장에서 직접 측정 가능한 운전 데이터(온도, 압력, 유량 등)만으로는 이러한 색좌표를 예측할 수 없습니다. 하지만 정밀하게 보정된 first-principles 모델에서 제공하는 정보를 사용하면 폴리머 물성에 대한 AI 모델을 작성할 수 있습니다.
공정 센서 데이터(Physical data)와 모델이 생성한 soft-sensing 데이터를 통합해, AI 모델이 폴리머 품질 지표(예: 색 인덱스)를 예측하는 구조. First-principles 모델이 직접 계산할 수 없는 물성을 데이터 기반으로 보완합니다.
예를 들어, 폴리머에 대한 MWD, 점도, degradation index number (DIN) 등은 실시간 분석이 어렵습니다. 하지만 first-principles 모델은 모노머 원료 조성, 반응 조건, 온도 프로파일 등을 입력받아 폴리머의 MWD, DIN 및 미량성분 함량을 계산할 수 있습니다. 이렇게 first-principles 모델이 제공하는 정보가 soft-sensing 데이터입니다.
합성 데이터: 두 세계를 연결하다
시마크로는 공장 운전 데이터와 first-principles 모델이 생성한 soft-sensing 데이터를 통합하여 합성 데이터(synthetic data)를 생성했습니다. 이 합성 데이터에는 실제로 측정된 L*a*b* 색좌표 수치도 포함되어 있습니다.이제 남은 과제는 운전 조건과 soft-sensor 값을 입력 변수로 활용하여 3가지 색좌표값을 예측하는 모델을 구축하는 것입니다. 이러한 복잡한 비선형 관계는 머신러닝 기반 AI 모델이 효과적으로 학습할 수 있는 영역입니다.
하이브리드 모델의 통합 구조
합성 데이터를 학습 데이터로 활용하여 머신러닝 모델을 개발했습니다. 최종 구축된 하이브리드 모델은 다음과 같이 작동합니다:① 공장 운전 데이터가 입력됩니다.② First-principles 모델이 공정 변수와 soft-sensing 데이터를 생성합니다.③ First-principles 모델의 예측값에 대해 AI 모델이 오차를 보정합니다.④ 운전 데이터와 soft-sensing 데이터를 활용하여 AI 모델이 3가지 색좌표값을 예측합니다.이를 통해 기존 first-principles 모델의 한계를 넘는 두 가지 혁신이 가능해졌습니다. 첫째, first-principles 모델의 엄밀성과 유연성 사이에서 일정 부분 타협하였던 예측 정확도를 향상할 수 있었습니다. 둘째, 폴리머 색좌표라는 이전에는 예측할 수 없었던 품질 지표를 실시간으로 예측할 수 있게 되었습니다. 공장 운전자들은 이제 실시간으로 제품 품질을 모니터링하고, 색상 규격을 벗어날 위험이 있을 때 운전 조건을 사전에 조정할 수 있습니다.
PMV™: 하이브리드 모델링을 하나의 플랫폼에서
이 프로젝트의 복잡성은 단순히 AI 모델을 개발하는 것이 아니라, 데이터 클렌징부터 first-principles 모델을 통한 soft sensing, AI 모델 개발까지 전체 워크플로우를 효율적으로 연결하는 것이었습니다.PMV™는 이러한 통합 워크플로우를 하나의 플랫폼에서 구현할 수 있게 했습니다. PMV™의 Python Editor가 지원한 핵심 기능은 다음과 같습니다:① 데이터 클렌징 자동화방대한 2년치 운전 데이터에서 안정화 상태 구간을 식별하고 추출하는 작업을 자동화했습니다. 수작업 기반 분석 대비 프로젝트 기간을 크게 단축했습니다.② 데이터 통합과 합성 데이터 생성공장 운전 데이터와 first-principles 모델이 생성한 soft-sensing 데이터를 효율적으로 통합했습니다. PMV™는 시뮬레이션 결과를 즉시 데이터로 활용할 수 있는 구조를 갖추고 있어, 실측 데이터와 모델 결과를 seamlessly 결합할 수 있었습니다.③ 머신러닝 모델 개발 및 검증통합된 데이터를 기반으로 L*a*b* 색좌표 예측을 위한 머신러닝 모델을 개발하고, 검증하고, 튜닝하는 전 과정을 PMV™내에서 수행했습니다. Python 생태계의 다양한 머신러닝 라이브러리를 활용하면서도 PMV™의 프로세스 모델과 긴밀하게 연동되어 효율적인 개발이 가능했습니다.④ PMV™ 캔버스의 멀티 모델 관리개발된 AI 모델을 PMV™의 캔버스에서 first-principles 모델과 연결하여, 하나의 통합 레이아웃을 구성하며 작동하도록 구현했습니다. 사용자는 운전 조건만 입력하면, 내부적으로 first-principles 계산과 AI 예측이 연속적으로 수행되어 최종 결과를 제공받습니다.이것이 하이브리드 모델링의 진정한 가치입니다. First-principles 모델은 물리화학적 원리를 기반으로 견고하고 해석 가능한 예측을 제공합니다. AI 모델은 복잡한 관계를 학습하여 이전에는 불가능했던 예측을 가능하게 합니다. 두 접근법의 장점을 결합함으로써 각각의 한계를 극복하고 새로운 가능성을 열 수 있습니다.
새로운 가능성을 향하여
폴리머뿐 아니라 화학, 바이오, 에너지 등 모든 공정 산업이 지금 유사한 기로에 있습니다. 수십 년간 사용한 first-principles 도구 앞에서 기업들은 두 가지 길 중 하나를 선택해야 합니다. 단순히 현 상황을 유지하며 점진적 약화를 받아들이거나, 모더나이제이션을 통해 새로운 예측 능력과 경쟁력을 확보하거나.이 선택은 단순한 기술 결정이 아닙니다. 디지털 전환이 가속화되는 현재, first-principles 한계를 극복하지 못하는 기업은 실시간 품질 관리와 실시간 공정 최적화에서 뒤쳐지게 됩니다.반면 하이브리드 모델링을 채택한 기업은 이전에는 불가능했던 통찰과 최적화를 실현할 수 있습니다.First-principles와 하이브리드 모델링은 이제 선택이 아닌 필수입니다. 공정 산업의 디지털 전환에서, 과거의 자산을 현대화하고 새로운 예측 능력을 확보하려는 중단 없는 노력이 기업의 지속가능한 경쟁력을 결정합니다.
관련 아티클
Garbage In Garbage Out: 데이터 무결성에서 답을 찾다폴리머 OTS: 반응기 모델링의 한계를 넘다SIMACRO Marketing Teammedia@simacro.com