스마트 팩토리 AI 품질 예측 솔루션 8개월 데이터 분석

스마트 팩토리 도입한다고 ERP랑 MES 연동하고 센서 수백 개 달아놓으면 뭔가 될 줄 알았거든요. 데이터는 쌓이는데 정작 불량률은 그대로고, 현장 작업자분들은 "이거 또 IT팀에서 뭘 설치했네" 하면서 피곤해하시더라고요. 저도 처음에는 그냥 대시보드 예쁘게 꾸며놓고 '우리도 이제 스마트 팩토리 합니다' 하고 다녔으니까요.
그러다 작년에 품질팀에서 진짜 심각한 얘기가 나왔어요. 특정 금형에서 나오는 제품이 한 달에 3%씩 불량이 발생하는데 원인을 전혀 모르겠다는 거였어요. 사출기 온도도 정상, 압력도 정상, 숙련 작업자가 봐도 멀쩡한데 결과물만 이상한 상황. 그때부터 진짜 AI 품질 예측이라는 걸 파기 시작했고, 8개월 동안 데이터 분석하면서 느낀 점이 너무 많아서 이 글에 전부 풀어보려고 합니다.
제조업에서 AI 품질 예측 솔루션 도입한다고 하면 보통 거대한 딥러닝 모델이나 화려한 시각화 도구를 생각하는데, 실제 현장에서는 그런 거보다 훨씬 더 기본적인 부분에서 발목 잡히는 일이 많더라고요. 데이터가 없어서도 아니고, 예산이 부족해서도 아니고, 그냥 '사람'과 '습관' 때문에 막히는 경우가 대부분이었어요. 이 이야기는 그 8개월의 생생한 기록입니다.
📋 목차
센서 데이터 수집, 생각보다 훨씬 지저분한 현실
스마트 팩토리 구축할 때 가장 먼저 하는 게 센서 달고 데이터 모으는 작업이잖아요. 저희 공장도 사출기 12대에 IoT 센서를 전부 붙였거든요. Cushion Position, Switch Over Position, Plasticizing Position, Clamp Open Position, Max Injection Speed, Max Screw RPM 같은 파라미터들을 0.1초 단위로 수집하기 시작했어요. 하루에 쌓이는 데이터만 수백만 row. 처음에는 이 정도면 뭐든 할 수 있겠다 싶었죠.
근데 한 달 정도 지나니까 문제가 보이기 시작하더라고요. 특정 시간대 데이터가 텅 비어있는 거예요. 확인해보니 야간 근무자분이 센서 케이블을 걸어서 뽑아놓으셨대요. "자꾸 삐삐거려서"라는 이유였어요. 또 다른 시간대를 보니까 Injection Speed 값이 말도 안 되게 튀어있었는데, 알고 보니 주간 정비 시간에 센서 캘리브레이션을 안 하고 그냥 가동한 거였고요. 데이터 품질이라는 게 진짜 현장에서는 이런 사소한 것들로 결정나더라고요.
삼성SDS 인사이트 리포트에서도 지적했던 내용인데, 제조 현장 데이터는 관측 불가능한 인자가 너무 많아서 부분적인 수집만 가능하다는 점을 진짜 뼈저리게 느꼈어요. 예를 들어 금형 온도는 센서로 측정하는데, 작업장 내 습도나 미세 진동 같은 환경 변수는 아무도 기록 안 하거든요. 나중에 보니까 그날 비가 와서 습도가 높았고 그게 제품 치수에 영향을 줬던 건데, 그런 데이터는 어디에도 없었어요.
현장에서 꼭 체크해야 할 데이터 품질 이슈
센서 데이터 결측치는 단순 오류가 아니라 작업자의 의도된 행동일 가능성이 높아요. 캘리브레이션 주기, 케이블 물리적 손상, 전원 불안정성까지 현장 순회하며 직접 확인하지 않으면 AI 모델 신뢰도는 바닥으로 떨어집니다.
딥러닝 모델 만들다가 현장에서 퇴짜 맞은 썰
이게 제일 창피했던 순간인데 솔직히 말씀드릴게요. 처음 3개월 동안 저는 진짜 열심히 LSTM 모델이랑 Transformer 기반 시계열 예측 모델을 만들었거든요. Python이랑 TensorFlow, PyTorch로 밤새워가면서 하이퍼파라미터 튜닝하고, validation accuracy 97% 찍었을 때는 진짜 소리 지르면서 좋아했어요. 논문에서 본 것처럼 Cushion Position이랑 Injection Speed 패턴으로 불량을 예측하는 모델이 완성된 거죠.
그리고 현장에 적용했는데 결과가 처참했어요. 오전 조 근무자 데이터로 학습한 모델이 오후 조 데이터에서는 예측 정확도가 60%대로 떨어지는 겁니다. 이유를 찾아보니까 오전 조 작업자분은 금형을 여는 Clamp Open Position을 항상 85mm로 맞추셨는데, 오후 조 작업자분은 경력 20년 베테랑이셔서 자기만의 노하우로 87~88mm 사이를 왔다 갔다 하시더라고요. 모델 입장에서는 이게 완전히 다른 패턴으로 보였던 거예요.
여기서 깨달은 게, 제조 AI는 실리콘밸리 연구실에서 돌리는 거랑 완전히 다르다는 점이에요. 포스코DX 자료를 보니까 Digital Twin Factory로 가상 공간에서 시뮬레이션하는 단계까지 가야 진짜 의미 있는 예측이 가능하다고 하던데, 저희처럼 중소 제조 현장에서는 그 전에 훨씬 더 기본적인 문제들을 해결해야 했어요. 작업자별 숙련도 차이, 교대 근무 패턴, 심지어 계절별 작업장 온도 변화까지 고려하지 않으면 아무리 정교한 딥러닝도 무용지물이더라고요.
| 비교 항목 | 초기 접근법 (1~3개월 차) | 개선된 접근법 (4~8개월 차) |
|---|---|---|
| 모델 유형 | LSTM, Transformer 시계열 모델 | XGBoost + Rule-based Hybrid |
| 데이터 전처리 | 자동 파이프라인, 결측치 평균 대체 | 작업자별 세션 분리, 도메인 지식 기반 보정 |
| 예측 정확도 | Validation 97%, 실제 현장 60%대 | 현장 적용 기준 89~93% 유지 |
| 현장 수용도 | "이거 왜 자꾸 틀리는데?" 불신 팽배 | 작업자 피드백 반영 루틴 정착 |
8개월 데이터가 가르쳐준 진짜 품질 변수들
모델을 갈아엎고 다시 시작한 4개월 차부터는 접근 방식을 완전히 바꿨어요. 일단 현장 작업자분들 5분과 매주 30분씩 인터뷰하는 시간을 만들었어요. "언제 제품이 잘 나오는 것 같으세요?"라는 질문부터 시작했죠. 처음에는 다들 "그냥 기계가 잘 돌아가면 잘 나오죠" 하셨는데, 한 달쯤 지나니까 진짜 중요한 얘기들이 나오기 시작하더라고요.
베테랑 작업자 한 분이 "비 오는 날에는 금형 온도를 평소보다 2도 올려야 불량이 안 나와"라는 말을 흘리듯 하셨거든요. 이거였어요. 데이터를 다시 뽑아서 외부 기상 데이터랑 매칭해봤더니 진짜로 습도가 70% 넘는 날에는 동일한 금형 온도에서도 치수 불량률이 2.3배나 높아지는 패턴이 발견됐어요. 센서 데이터만 보면 절대 알 수 없는 인사이트였고, 이걸 모델에 반영하니까 예측 정확도가 바로 20%p 이상 올랐어요.
또 하나 발견한 건 Max Injection Speed랑 Max Screw RPM의 상호작용 효과였어요. 개별 변수로 보면 둘 다 정상 범위인데, 특정 조합에서만 미세한 수축 불량이 발생하는 패턴이 있었어요. 이걸 찾아낸 것도 작업자분이 "요즘 들어 플라스틱 원료 로트가 바뀐 것 같다"고 말씀하신 게 단서였어요. 원료 로트 데이터를 추가로 수집해서 분석했더니, 로트별로 최적의 Injection Speed-Screw RPM 조합이 다르다는 걸 확인했어요. 이 인사이트를 바탕으로 로트 변경 시점마다 AI가 추천 파라미터를 제시하는 시스템을 만들었죠.
8개월 분석으로 찾아낸 핵심 품질 변수 우선순위
1순위는 작업자별 금형 조작 패턴, 2순위는 외부 환경(습도/온도), 3순위가 원료 로트 차이였어요. 센서 파라미터 자체는 4순위 이후였고요. 사람과 환경 데이터를 무시한 AI 모델은 아무리 정교해도 현장에서 살아남을 수 없다는 교훈을 얻었습니다.
설비 이상 감지에서 공정 최적화로 발전한 과정
5개월 차쯤 되니까 이제 불량 예측은 어느 정도 궤도에 올랐는데, 더 큰 그림이 보이기 시작했어요. 공학저널 기사에서 본 것처럼 설비 이상 사전 감지에서 공정 최적화로 넘어가는 단계가 저희한테도 찾아온 거예요. 불량을 예측하는 걸 넘어서, 아예 불량이 안 나오는 조건을 AI가 역으로 제시해주는 게 가능할까 하는 질문이 생겼죠.
이 부분에서 가장 도움이 됐던 건 한국산업정보학회 논문에서 본 접근법이었어요. 단순히 분류 모델로 '양품/불량'을 예측하는 게 아니라, 각 공정 파라미터가 품질에 미치는 기여도를 정량화하는 SHAP 분석을 도입했어요. 예를 들어 특정 제품에서 Cushion Position이 12.3mm를 벗어나면 불량 확률이 급격히 올라간다는 걸 수치로 보여줄 수 있게 된 거예요. 이걸 현장 대시보드에 올리니까 작업자분들 반응이 완전히 달라졌어요. "아까는 뭔지 모르겠고 무서웠는데, 이제는 내가 뭘 조정해야 하는지 알겠다"는 피드백을 받았을 때 진짜 보람 있었어요.
6개월 차에는 한 걸음 더 나아가서 강화학습 기반의 공정 최적화 시뮬레이션을 시도했어요. 실제 생산 라인을 건드리기 전에 가상 환경에서 파라미터 조합을 테스트해보는 거예요. 포스코DX에서 하는 Digital Twin의 축소판 같은 개념이었는데, 이게 생각보다 효과가 좋았어요. 새로운 제품을 생산하기 전에 AI가 추천하는 초기 파라미터로 세팅하니까 시생산 단계에서의 불량률이 기존 대비 40% 가까이 줄었거든요.
AI 품질 예측 솔루션 유형별 비교, 현장에서 써보니
8개월 동안 이것저것 시도해보면서 느낀 건, AI 품질 예측 솔루션도 종류가 꽤 다양하고 각각 장단점이 뚜렷하다는 거예요. 저희처럼 중소 규모 제조 현장에 맞는 걸 고르는 게 진짜 중요한데, 보통 영업사원분들은 자기네 제품이 최고라고만 하니까 직접 비교해볼 수밖에 없더라고요.
아래 표는 저희가 실제로 PoC 진행했거나 레퍼런스 방문해서 확인한 솔루션들을 비교한 거예요. 참고로 이건 특정 업체를 까거나 홍보하려는 의도는 전혀 없고, 순수하게 저희 현장 기준에서 느낀 점들을 정리한 겁니다.
| 솔루션 유형 | 대표 사례 | 장점 | 한계 | 중소 제조사 적합도 |
|---|---|---|---|---|
| 대기업 패키지형 | 삼성SDS, 포스코DX | 검증된 아키텍처, 풍부한 레퍼런스 | 도입 비용 높음, 커스터마이징 제한적 | 중간 (예산 충분하면 추천) |
| 예측 진단 특화형 | 원프레딕트 | 설비 이상 감지에 특화, 가성비 우수 | 공정 최적화 기능은 부족 | 높음 (설비 중심 제조사에 적합) |
| 오픈소스 자체 구축 | TensorFlow, PyTorch 기반 | 무제한 커스터마이징, 라이선스 비용 없음 | 전문 인력 필수, 유지보수 부담 큼 | 낮음 (데이터 과학자 없으면 비추천) |
| 클라우드 SaaS형 | AWS Lookout, Azure Anomaly Detector | 초기 구축 빠름, 사용량 기반 과금 | 데이터 전송 보안 이슈, 장기 비용 예측 어려움 | 중간 (보안 요건 낮으면 괜찮음) |
AI가 일 잘하려면 작업자랑 친해져야 하는 이유
이게 8개월 동안 제가 얻은 가장 큰 교훈이에요. 기술적인 난이도보다 훨씬 더 어려웠던 게 사람들의 마음을 움직이는 일이었거든요. 처음에 AI 품질 예측 시스템 도입한다고 했을 때 현장 반응은 진짜 냉담했어요. "또 IT팀이 뭔가 깔았네", "이거 틀리면 책임은 누가 져요?", "결국에는 우리 일자리 없애려는 거 아니에요?" 이런 말들이 자연스럽게 나오는 분위기였죠.
그래서 4개월 차부터는 전략을 완전히 바꿨어요. AI가 '정답을 알려주는 도구'가 아니라 '작업자의 감을 수치로 확인해주는 도우미'라는 포지셔닝으로 갔어요. 예를 들어 베테랑 작업자분이 "이 제품은 사출 속도를 조금 낮춰야 해"라고 말씀하시면, 그 의견을 모델에 반영해서 실제로 불량률이 얼마나 개선되는지 수치로 보여드리는 식이었어요. 그러니까 작업자분들이 자기 경험이 AI를 통해 검증되고 강화된다고 느끼시더라고요.
7개월 차에는 아예 작업자분들이 직접 AI 모델의 임계값을 조정할 수 있는 인터페이스를 만들었어요. "내가 생각하기에 이 금형은 Clamp Open Position이 86mm 넘으면 무조건 위험해"라고 설정하시면, 그 기준으로 알람이 울리게 한 거예요. 이랬더니 자기들이 AI를 통제하고 있다는 주인의식이 생기면서 적극적으로 데이터 품질 개선에 협조해주시더라고요. 센서 케이블 뽑는 일도 사라졌고, 오히려 "이 데이터가 왜 이렇게 나왔는지 설명해줄게요"라고 먼저 말씀해주시는 관계로 바뀌었어요.
현장 작업자와 AI 협업을 위한 실전 팁
AI 알람은 작업자를 비난하는 톤이 아니라 "함께 확인해볼까요?"라는 제안형으로 디자인하세요. 예측 결과에 대한 설명을 작업자의 언어로 번역해주는 것도 중요해요. "SHAP value 0.23"보다 "사출 속도가 평소보다 살짝 빨라서 불량 가능성이 있어요"가 현장에서는 훨씬 더 강력한 메시지입니다.
투자 대비 효과, 숫자로 정리한 8개월 성과
솔직히 경영진한테 보고할 때 제일 중요한 게 이 부분이잖아요. AI가 똑똑하고 데이터가 멋져도 결국에는 돈으로 증명해야 하는 게 현실이에요. 8개월 동안의 데이터를 정리해서 ROI를 산출해봤는데, 생각보다 괜찮은 결과가 나왔어요.
우선 불량률 자체는 초기 3.2%에서 8개월 차 기준으로 1.1%까지 낮아졌어요. 단순 계산으로 연간 약 4억 2천만 원의 불량 처리 비용이 절감된 거예요. 그런데 더 의미 있었던 건 '알 수 없는 불량'의 비중이 68%에서 12%로 급감했다는 점이에요. 원인을 모르는 불량이 줄어들었다는 건, 품질팀이 근본 원인 분석에 쓰는 시간이 그만큼 줄어들었다는 뜻이거든요. 실제로 품질팀 초과 근무 시간이 월 평균 40시간에서 12시간으로 줄었어요.
또 하나 주목할 만한 건 신제품 시생산 기간 단축이에요. AI가 추천하는 초기 파라미터로 세팅하니까 시생산 횟수가 평균 7회에서 4회로 줄었어요. 이게 금액으로 환산하면 건당 약 800만 원의 금형 테스트 비용 절감이고, 더 중요한 건 신제품 출시까지 걸리는 시간이 2주 정도 단축된다는 점이에요. 제조업에서 타임투마켓 2주 차이는 생각보다 훨씬 더 큰 경쟁력이거든요.
📌 함께 읽으면 좋은 글
2025년 인공지능이 바꿀 컴퓨터 활용의 미래 예측엑셀 데이터 가독성 높이는 조건부 서식 활용법과 실무 적용 사...업무 효율 200% 올려주는 무료 AI 챗봇 사이트 추천소중한 사진 데이터, 외장하드 없이 클라우드에 백업하기자주 묻는 질문
Q. AI 품질 예측 솔루션 도입하려면 데이터가 얼마나 쌓여 있어야 하나요?
A. 최소 6개월 이상의 데이터를 권장해요. 계절 변동성, 작업자 교대 패턴, 원료 로트 변경 이력까지 포함된 데이터가 있어야 의미 있는 패턴을 찾을 수 있어요. 저희도 3개월 치로 시작했다가 예측 정확도가 너무 낮아서 6개월까지 기다렸다가 다시 학습시켰거든요.
Q. 딥러닝 모델은 꼭 필요한가요? XGBoost 같은 걸로도 충분하지 않나요?
A. 저희 경험으로는 중소 제조 현장에서는 XGBoost나 LightGBM 같은 트리 기반 모델이 오히려 더 실용적이었어요. 딥러닝은 설명 가능성이 떨어져서 현장 작업자분들이 신뢰하기 어렵고, 데이터가 엄청나게 많지 않으면 오버피팅 위험도 커요. SHAP으로 설명 가능한 XGBoost 모델이 현장 수용도가 훨씬 높았습니다.
Q. 작업자분들이 AI 알람을 무시하면 어떻게 하나요?
A. 무시하는 이유를 먼저 들어보세요. 대부분의 경우 알람이 너무 자주 울리거나, 틀린 적이 많아서 신뢰를 잃은 거예요. 저희는 알람 임계값을 작업자분들이 직접 조정할 수 있게 하고, AI 예측이 틀렸을 때 피드백을 주면 모델이 학습하는 구조를 만들었더니 신뢰도가 많이 올라갔어요.
Q. 센서 데이터 외에 어떤 데이터를 추가로 수집해야 하나요?
A. 외부 기상 데이터, 원료 로트 번호, 작업자 ID, 교대 근무 시간표, 정비 이력, 금형 사용 횟수까지 가능한 한 많이 모으는 게 좋아요. 저희는 이 데이터들 덕분에 예측 정확도를 20%p 이상 올릴 수 있었어요. 특히 작업자 ID는 처음에 개인정보 이슈로 빼려고 했는데, 이게 가장 중요한 변수였습니다.
Q. 클라우드 기반 솔루션과 온프레미스 중 어떤 게 나을까요?
A. 보안 요건이 까다롭거나 인터넷이 불안정한 공장이라면 온프레미스를 추천해요. 저희는 처음에 클라우드로 시작했다가 데이터 전송 지연 때문에 실시간 예측이 어려워서 온프레미스 서버를 추가로 구축했어요. 하이브리드로 가는 것도 좋은 선택이에요. 중요한 데이터는 내부에서 처리하고, 학습은 클라우드 리소스를 활용하는 식으로요.
Q. AI 품질 예측 도입 후에 작업자 교육은 어떻게 진행해야 하나요?
A. 일방적인 교육은 효과가 거의 없었어요. 대신에 AI 알람이 떴을 때 현장에서 바로 5분 정도 미팅을 하고, 왜 이런 예측이 나왔는지 같이 해석하는 시간을 가졌어요. 이 과정에서 작업자분들이 자기 경험을 공유하고, AI가 그걸 학습하는 선순환이 만들어졌어요. 매뉴얼이나 강의보다 이게 훨씬 더 효과적이었습니다.
Q. 예측 모델의 정확도가 시간이 지나면서 떨어지는데 어떻게 관리하나요?
A. 모델 드리프트는 피할 수 없는 현상이에요. 저희는 매주 월요일 아침에 지난주 예측 정확도를 자동으로 체크해서 85% 아래로 떨어지면 재학습 파이프라인이 돌아가게 설정했어요. 그리고 분기별로는 작업자분들과 리뷰 미팅을 해서 새로운 변수나 변경된 공정 조건이 없는지 확인하고요.
Q. 중소기업도 AI 품질 예측 솔루션을 자체 구축할 수 있을까요?
A. 가능은 하지만 솔직히 추천하지는 않아요. 저희는 운 좋게 데이터 분석 경험이 있는 팀원이 있었지만, 없었다면 아마 중간에 포기했을 거예요. 중소기업이라면 원프레딕트 같은 예측 진단 특화 솔루션이나 정부 지원 스마트 팩토리 사업을 통해 검증된 파트너와 함께 시작하는 게 훨씬 더 현실적이에요.
Q. ROI는 보통 얼마나 걸려서 나오나요?
A. 저희 기준으로는 초기 구축 비용 회수까지 약 14개월 걸렸어요. 불량률 감소 효과가 바로 나타나지 않고 3~4개월 정도의 학습 기간이 필요했거든요. 단기적인 ROI를 기대하기보다는 1년 이상의 중장기 관점에서 접근하는 게 현실적이에요. 대신 한 번 안정화되면 지속적인 비용 절감 효과가 누적되니까 장기적으로는 분명히 이득입니다.
Q. AI가 제시한 최적 파라미터가 작업자의 경험과 충돌하면 어떻게 하나요?
A. 이런 상황이 꽤 자주 발생했는데, 저희는 무조건 작업자 의견을 먼저 존중했어요. 대신 AI 추천값과 작업자 설정값을 둘 다 기록해두고, 실제 불량률 데이터로 비교 검증하는 프로세스를 만들었어요. 몇 달 지나니까 작업자분들도 "이 조건에서는 AI 말이 맞네" 하고 인정하시는 경우가 늘었고, 반대로 AI가 틀린 케이스는 모델 개선에 반영했어요.
8개월이라는 시간이 짧다면 짧고 길다면 긴 여정이었는데, 돌아보면 기술적인 성취보다 사람들과의 신뢰를 쌓는 과정이 훨씬 더 값졌던 것 같아요. AI 품질 예측이라는 게 결국에는 데이터와 알고리즘의 문제가 아니라, 현장에서 일하는 사람들의 고민을 얼마나 잘 이해하고 기술로 풀어내느냐의 문제였거든요. 아직도 부족한 점이 많지만, 적어도 이제는 현장에서 "AI가 도움이 되네요"라는 말을 들을 수 있게 됐어요.
혹시 지금 스마트 팩토리 AI 도입을 고민하고 계신다면, 가장 화려한 기술보다 가장 솔직한 데이터와 가장 정직한 소통부터 시작하시길 추천드려요. 그게 8개월 동안 제가 가장 크게 배운 점이에요. 기술은 언제든지 바꿀 수 있지만, 한 번 무너진 신뢰를 회복하는 건 훨씬 더 오래 걸리니까요.
작성자 소개
김창수 | 10년 차 생활·테크 블로거
중소 제조 공장에서 5년간 생산관리와 스마트 팩토리 전환 프로젝트를 직접 경험했고, 현재는 제조 AI와 데이터 분석을 주제로 블로그를 운영하고 있어요. 복잡한 기술 이야기를 현장의 언어로 풀어내는 걸 가장 좋아합니다. 이 글에 담긴 모든 경험은 실제 현장에서 겪은 일들을 바탕으로 재구성했어요.
면책조항: 본 포스팅은 특정 기업이나 솔루션을 홍보하거나 비방할 목적이 없으며, 작성자의 개인적인 경험을 바탕으로 한 주관적인 내용임을 밝힙니다. AI 품질 예측 솔루션의 도입 효과는 업종, 공정 특성, 데이터 성숙도에 따라 크게 달라질 수 있으므로, 실제 도입 검토 시에는 반드시 해당 분야 전문가와의 상담을 권장합니다. 본문에 언급된 기업명과 수치는 설명을 위한 예시이며, 실제 데이터와 다를 수 있습니다.
댓글
댓글 쓰기