본문 바로가기
SK하이닉스

SK하이닉스의 가상계측, 실시간 AI제어, 딥러닝

by 뷰메모리 2026. 2. 11.

옹스트롬 수준의 정밀도가 요구되는 반도체 제조 공정에서, 최적의 수율과 불량품 발생 여부는 육안으로 확인할 수 없는 미세한 변수에 의해 결정됩니다. SK하이닉스는 이러한 한계를 뛰어넘어, 센서 노이즈를 기반으로 웨이퍼의 물리적 상태를 수학적으로 예측하는 인지 계측(VM) 시스템을 구축했습니다. 이를 통해 물리적 샘플링이라는 병목 현상 없이 100% 검사율이라는 이상적인 목표를 달성했습니다. 이러한 예측적 통찰력은 실시간 AI 제어와 결합해 미세한 환경 변화에 대응하기 위해 공정 매개변수를 밀리초 단위를 동적으로 조정하는 자가 복구 메커니즘을 제공합니다. 마지막으로, 딥러닝 알고리즘은 궁극적인 판단자로서, 인간의 한계를 뛰어넘는 정밀도로 결함 이미지를 분석하여 표준 논리를 초월하는 이상 현상을 분류합니다. 이는 더 이상 단순한 자동화가 아닙니다. 반도체 제조 공장을 위한 자율적인 면역 시스템으로서, '무결점' 추구가 구호가 아닌 수학적 확실성이 되도록 보장합니다.

SK하이닉스의 가상계측, 실시간 AI제어, 딥러닝
SK하이닉스의 가상계측, 실시간 AI제어, 딥러닝

가상계측으로 불량 원인 사전 차단

결함을 사전에 차단하는 핵심 메커니즘은 가상 측정(VM)을 통해 물리적 측정의 "샘플링 사각지대"를 극복하는 데 있습니다. 일반적인 반도체 제조 시설에서 물리적 측정 도구(엘립소미터 또는 CD-SEM 등)는 속도가 느리고 비용이 많이 들어 엔지니어는 웨이퍼 25개 중 1개(샘플링 비율 4%)만 검사할 수 있습니다. 이는 생산품의 96%가 "블랙박스" 상태로 다음 단계로 넘어가며, 잠재적인 결함은 몇 주 후 최종 전기 테스트가 진행될 때까지 발견되지 않는다는 것을 의미합니다. SK 하이닉스는 가우스 랩에서 개발한 파놉테스 VM 플랫폼을 활용하여 "가상 100% 검사" 환경을 구축합니다. 인공지능(AI)은 결함 감지 및 분류(FDC) 데이터 스트림에서 RF 임피던스, 챔버 압력, 가스 질량 유량, 정전기 척 온도 등 수백 가지 변수를 추출하여 물리적 프로세스를 수학적으로 모델링합니다. 이를 통해 모든 웨이퍼에 관한 결과(예: 박막 두께 또는 식각 깊이)를 실시간으로 예측합니다. AI가 챔버 A의 웨이퍼가 "상한 관리 한계(UCL)"에 가까워지고 있다고 예측하면 단순히 경고 표시만 하는 것이 아니라 "장비 중단" 신호를 발생시켜 장비를 즉시 일시 중지합니다. 이는 물리적 결함 발생 과정이 완료되기 전에 불량 웨이퍼 생성을 효과적으로 차단하는 조치입니다. "차단" 기능은 VM 데이터를 고급 공정 제어(APC) 시스템에 긴밀하게 통합함으로써 더 구체화해 폐쇄 루프 "실행 간(R2R)" 제어 메커니즘을 구현합니다. 기존 시스템에서는 APC가 물리적 샘플에서 얻은 단편적인 데이터에 의존했기 때문에 측정된 샘플에서 수정이 트리거 되기까지 공정 편차가 몇 시간 동안 지속될 수 있었습니다. Panoptes VM을 사용하면 APC는 모든 웨이퍼에 대한 피드백 신호를 수신합니다. 이를 통해 "마이크로 피드백 제어"가 가능합니다. 웨이퍼 #1이 규격 범위 내에서 약간 얇을 것으로 예상되는 경우, APC 알고리즘은 웨이퍼 #2가 챔버에 들어가기 전에 즉시 보정 계수(예: 증착 시간 0.5초 증가 또는 RF 소스 전력 2와트 증가)를 계산합니다. 이 "선제적 보정"은 동적 충격 흡수 장치 역할을 하여 장비의 자연적인 변동성을 완화합니다. 또한, 이 시스템은 "피드포워드" 로직을 사용합니다. VM이 증착 단계에서 미세한 두께 변화를 예측하면, 이 데이터가 후속 에칭 장비로 전달되어 에칭 시간이 자동으로 조정되어 들어오는 필름 두께에 맞춰지고, 후속 공정을 통해 잠재적인 결함을 제거합니다. 마지막으로, 최신 가상 측정 엔진 버전에 도입된 "다단계 모델링" 기능을 통해 결함 차단 기술의 정교함이 최고조에 달합니다. 반도체 결함은 단일 공정의 결과인 경우가 드물고, 여러 공정에서 발생하는 미묘한 변동의 누적 효과인 경우가 많습니다. 예를 들어, HBM TSV 공정에서 발생하는 "블라인드 비아" 결함은 이전 단계에서 하드 마스크 밀도가 1% 낮아진 것과 현재 단계에서 식각 선택성이 1% 감소한 것이 복합적으로 작용하여 발생할 수 있습니다. 사람 엔지니어나 단일 단계 모델은 두 매개변수 모두 개별적으로는 규격 범위 내에 있기 때문에 이러한 상관관계를 파악하지 못할 것입니다. 하지만 딥러닝 모델은 "공정 간 공분산"을 분석합니다. 이전 증착 장비와 현재 식각 장비에서 동시에 센서 데이터를 입력받아 최종 비아 프로파일을 예측합니다. 이러한 복잡하고 비선형적인 상호작용을 인식함으로써, 시스템은 부분적으로는 문제가 없어 보이지만 전체적으로 불량이 발생할 가능성이 높은 웨이퍼를 차단할 수 있습니다. 이러한 기능은 "공정 변동성"을 29% 이상 줄여 제품의 분포 곡선을 효과적으로 좁히고 생산 라인에서 "이상치" 결함을 수학적으로 제거합니다.

나노 수준의 오류를 수정하는 실시간 AI 제어

나노 수준에서 발생하는 오차를 실시간으로 수정하는 것은 단순한 피드백 루프가 아니라, 장비의 엣지 서버 내부에 심층 강화 학습(DRL) 에이전트를 직접 배치함으로써 가능합니다. 기존의 PID(비례-적분-미분) 제어기는 오차 신호에 선형적으로 반응하는데, 이는 고밀도 플라즈마 에칭의 혼돈적이고 비선형적인 물리적 특성을 구현하기에는 부적합합니다. SK 하이닉스는 수백만 번의 공정 주기를 통해 훈련된 AI 에이전트를 활용하여 이온의 "확률적 거동"을 이해합니다. 예를 들어, TSV(트랜스퍼 실리콘 밸브)의 핵심 보쉬 에칭 공정에서 플라즈마 챔버의 임피던스는 가스 화학반응이 패시베이션과 에칭 사이에서 전환됨에 따라 크게 변동합니다. 일반적인 컨트롤러는 이러한 전환에 뒤처져 에칭 프로파일이 잘못 테이퍼링 되는 "마이크로 로딩" 현상을 일으킵니다. 하지만 AI 에이전트는 이러한 임피던스 변화가 발생하기 수 밀리초 전에 이를 예측합니다. 에이전트는 RF 매칭 네트워크 커패시터와 주파수 바이어스를 동적으로 조정하고 전력 전달 곡선을 조정하여 완벽하게 안정적인 플라즈마 쉬스를 유지합니다. 이러한 사전 예방적 보정을 통해 측벽의 "스캘럽 크기"가 나노미터 이하의 허용 오차 범위 내에 유지되도록 보장하며, 이온이 구멍을 뚫는 동안에도 구멍의 물리적 모양을 효과적으로 수정합니다. 실시간 보정은 다중 영역 하드웨어와 피드포워드 APC(고급 공정 제어)의 통합을 통해 시간적 제어를 넘어 "공간적 세분성"까지 확장됩니다. 실리콘 웨이퍼는 완벽하게 균일한 경우가 드물며, 증착 공정에서 중심부와 가장자리 사이에 불과 몇 옹스트롬 정도의 두께 차이가 발생하는 "돔형" 또는 "볼형"의 프로파일이 나타나는 경우가 흔합니다. 균일하게 에칭되지 않으면 이러한 편차가 치명적인 결함으로 이어집니다. SK 하이닉스의 AI 제어 시스템은 앞서 설명한 가상 측정 시스템에서 생성된 웨이퍼의 "두께 지도"를 입력받아 해당 웨이퍼에 특화된 공간적으로 변형된 레시피를 생성합니다. 이 시스템은 정전기 척(ESC)에 내장된 독립 히터 영역(종종 10개 이상의 동심원으로 나뉘어짐)을 개별적으로 조작합니다. AI는 정밀한 방사형 온도 구배(예: 가장자리를 중심부보다 0.5°C 높게 가열)를 생성함으로써 화학반응 속도에 운동학적 오프셋을 발생시킵니다. 이러한 "열 마스킹"은 유입되는 두께 변화를 효과적으로 상쇄하여 300mm 표면 전체에 걸쳐 최종 임계 치수(CD) 균일도가 재료 자체의 물리적 변동보다 더 평탄하도록 보장함으로써, 고정된 레시피 설정으로는 수학적으로 불가능한 "공정 범위"를 달성합니다. 마지막으로, 나노 수준에서 오류를 수정하는 기능은 고종횡비(HAR) 기능을 위한 AI 기반 "엔드포인트 검출(EPD)"의 진화에서 구체화했습니다. 메모리 스택이 점점 더 높아짐에 따라(예: 238층 NAND 또는 HBM TSV), 하단 접점까지 에칭하는 작업은 사실상 불가능해집니다. 깊고 좁은 구멍 바닥에서 나오는 신호는 매우 미약하여 연소 플라즈마의 "광학 노이즈"에 묻혀버리는 경우가 많습니다. 기존의 EPD(전기영동 검출) 방식은 단일 파장의 임계값에 의존하는데, 이에 따라 신호 감쇠로 인해 "오류 양성" 또는 "오류 음성"이 발생하여 "언더 에칭"(개방 회로) 또는 "펀치 스루"(단락 회로)로 이어지는 경우가 흔합니다. SK 하이닉스는 전체 광 방출 분광법(OES) 파형을 분석하는 "전체 스펙트럼 분석" 알고리즘을 사용합니다. AI는 플라즈마 광을 복잡한 이미지로 처리하여 확률적 노이즈를 제거하고 "정지층"(예: 질화규소 또는 산화물)의 미세한 화학적 특징을 감지합니다. 특히, AI는 "동적 과식각" 비율을 실시간으로 계산합니다. 고정된 10초의 오버에칭 시간 대신, 시스템은 현재 챔버 상태의 정확한 에칭 속도를 계산하고 정밀한 정지 시간(예: 10.23초)을 지정하여 모든 접촉 구멍이 섬세한 하부층에 손상을 주지 않고 패드에 완벽하게 접촉되도록 함으로써 초점 링과 챔버 벽의 자연적인 마모를 효과적으로 보정합니다.

딥러닝을 활용한 잘못된 패턴의 자기 학습

SK하이닉스의 불량 관리 핵심 혁신은 '지도 분류'에서 '자기지도 이상 탐지'로의 전환입니다. 기존 AI 모델은 특정 불량(예: '긁힘')을 인식하기 위해 수천 장의 레이블이 지정된 이미지가 필요합니다. 만약 화학물질로 인해 발생하는 '잔류물 덩어리'와 같은 새로운 유형의 불량이 발생하면, 기존 모델은 해당 유형에 대한 학습이 이루어지지 않았기 때문에 이를 무시합니다. SK하이닉스는 단일 클래스 분류(OCC)와 DBSCAN과 같은 비지도 클러스터링 알고리즘을 사용하여 이러한 문제를 해결합니다. 이 AI는 주로 "골든 패턴"(완벽한 웨이퍼) 데이터를 기반으로 학습되며, "정상"의 수학적 매니폴드를 구축합니다. 이 매니폴드에 부합하지 않는 특징을 발견하면 사전 레이블 지정 없이도 "이상"으로 표시합니다. 시스템은 벡터 특징 유사성을 기반으로 이러한 알 수 없는 이상 현상을 자동으로 클러스터링합니다. 유사한 알 수 없는 덩어리가 50개 이상 모여 클러스터를 형성하면 AI는 이를 "새로운 결함 유형 #001"로 자체 식별하고 엔지니어에게 경고합니다. 이러한 기능 덕분에 시스템은 인간 엔지니어가 수동으로 분류하기 몇 시간 또는 며칠 전에 새로운 공정 오류의 존재를 "자체 학습"할 수 있으므로, 치명적인 수율 하락을 초래하는 "알 수 없는 미지의 요소"를 효과적으로 포착할 수 있습니다. SK 하이닉스는 새롭게 발견된 이러한 패턴들을 분류하는 기술을 습득하기 위해 "생성형 AI 데이터 증강"을 활용합니다. 반도체 제조에서 치명적인 "킬러 결함"은 역설적으로 드물게 발생합니다. 특정 유형의 "브리지" 결함은 웨이퍼 1만 개 중 단 한 개 정도만 발생할 수 있습니다. 딥러닝 모델은 단 하나의 예시만으로는 효과적으로 학습할 수 없습니다(이른바 "소규모 예시 학습" 문제). 이를 해결하기 위해 SK 하이닉스는 GAN(생성적 적대 신경망) 또는 확산 모델을 활용하여 단일 결함의 실제 변형 수천 가지를 인위적으로 생성합니다. AI는 원본 결함 이미지를 회전, 확대/축소, 변형하여 다양한 배경 노이즈 및 회로 패턴에 겹쳐 놓습니다. 또한 수학적으로 다양한 조명 조건이나 초점 심도에서 해당 결함이 어떻게 보일지 "상상"합니다. 이러한 "합성 데이터 세트"로 분류 네트워크를 학습시킴으로써 AI는 더 많은 불량 웨이퍼가 생산될 때까지 기다리지 않고도 드문 결함을 강력하게 인식하는 능력을 확보합니다. 이로써 결함 데이터 부족이라는 약점이 오히려 계산상의 강점으로 바뀌어, 물리적으로 극소수의 샘플로만 존재하는 결함 유형에 대해 99%의 분류 정확도를 달성할 수 있게 되었습니다. 마지막으로, "자체 학습" 프로세스는 "사소한 결함"을 걸러내는 "능동 학습 루프"를 통해 강화됩니다. 자동 검사의 주요 과제는 "과잉 검사"입니다. 즉, 시스템이 무해한 먼지나 색상 변화를 치명적인 결함으로 오인하여 엔지니어링 시간을 낭비하는 경우입니다. SK 하이닉스의 AI는 "신뢰도 점수"를 기반으로 작동합니다. AI는 "치명적인" 결함과 "사소한 문제"의 경계에 있는 결함(예: 회로를 손상하지 않는 얕은 흠집)을 발견하면 단순히 추측하는 대신, 이러한 특정 "엣지 케이스"를 숙련된 엔지니어에게 전달하여 검증받도록 합니다. 엔지니어가 결정을 내리면(예: "무시"), AI는 단순히 답변을 저장하는 데 그치지 않고, 이 결정을 "역전파"하여 내부 결정 경계 가중치를 조정합니다. 즉, "혼란으로부터 학습"하는 것입니다. 시간이 지남에 따라 이러한 반복적인 피드백 루프는 문제 발생률을 획기적으로 줄입니다. AI는 엄격한 규칙 준수자에서 결함의 맥락을 이해하고 치명적인 단락과 무해한 표면 얼룩을 20년 경력의 베테랑 운영자에 버금가는 분별력으로 구분하는 섬세한 판단자로 진화합니다.