본문 바로가기
SK하이닉스

SK하이닉스의 수율 분석, 예측 유지보수 및 신호 처리, 최적 레시피

by 뷰메모리 2026. 2. 17.

반도체 제조라는 옹스트롬 수준의 경쟁 환경에서 데이터 분석은 단순한 지원 기능이 아니라, 800개가 넘는 공정 단계의 혼돈 속에서 공장을 이끌어가는 핵심 항해 시스템입니다. SK하이닉스 엔지니어에게 있어, 결함 감지 및 분류(FDC) 시스템에서 쏟아져 나오는 페타바이트 규모의 센서 로그를 해석하는 능력은 생산 라인 중단과 원활한 생산 진행을 가르는 핵심 요소입니다. 이는 단순히 차트를 읽는 것 이상의 것을 요구합니다. 웨이퍼 맵에서 나타나는 미세한 "수율 하락"과 몇 주 전에 발생한 진공 챔버 내 미세한 0.5% 압력 변화 사이의 상관관계를 파악하는 통계적 직관력이 필요합니다. 가상 계측(VM) 및 고급 공정 제어(APC) 알고리즘에 숙달함으로써 엔지니어는 결함에 단순히 대응하는 것을 넘어 수학적으로 예측하고 사전에 방지할 수 있습니다. 이러한 선제적 역량, 즉 가공되지 않은 데이터를 최적의 수율로 전환하는 능력은 SK 하이닉스가 HBM 및 DDR5 시장에서 선두 자리를 유지하고 데이터를 통해 실리콘을 수익으로 전환하는 데 핵심적인 역할을 합니다.

SK하이닉스의 수율 분석, 예측 유지보수 및 신호 처리, 최적 레시피
SK하이닉스의 수율 분석, 예측 유지보수 및 신호 처리, 최적 레시피

나노 수준 결함을 감지하기 위한 수율 분석 분야의 전문성

수율 분석의 핵심은 단순히 양품 다이의 개수를 세는 것이 아니라, 웨이퍼 빈 맵(WBM) 상의 "공간적 특징"을 분석하는 데 있습니다. 85%라는 단순한 수율 수치는 진실을 숨기고 있으며, 15% 불량의 분포를 파악하는 것이 바로 엔지니어링적 통찰력의 핵심입니다. 숙련된 분석가는 무작위적이지 않은 클러스터를 찾아냅니다. 웨이퍼 가장자리의 "도넛 패턴"은 플라즈마 에칭 균일성 문제나 화학 기계적 연마(CMP) 속도 불균형을 나타내는 경우가 많으며, "체커보드" 또는 "샷 필드" 불량 패턴은 특정 리소그래피 스테퍼 또는 레티클 헤이즈를 직접적으로 가리킵니다. 이러한 나노 수준의 결함을 감지하려면 "지도 위의 점들"을 보는 것에서 벗어나 3D 공정 마진을 시각화하는 인지적 도약이 필요합니다. 예를 들어, 여러 다이에 걸쳐 호를 그리며 나타나는 미세한 "스크래치 흔적"은 단순한 수율 손실이 아니라, 로봇 핸들링 오류나 특정 세척 챔버 내 입자 발생 사건을 시간상으로 기록한 증거입니다. SK하이닉스 엔지니어들은 합성곱 신경망(CNN)을 학습시켜 이러한 맵 특징을 자동으로 분류함으로써, 무작위로 발생하는 국부적인 결함(노이즈)과 체계적인 공정 편차(신호)를 구분하여 "수율 급락" 현상을 즉시 감지하고, 생산 라인 전체에 파급되기 전에 이를 포착할 수 있습니다. 결함 패턴이 파악되면 분석의 초점은 "장비 공통성 분석"으로 옮겨가는데, 이는 "핵심 장비"에 대한 통계적 삼각측량입니다. 최신 반도체 제조 시설에서 웨이퍼는 수백 가지 공정 단계를 거치며, 각 단계에서 동일한 장비 10개 중 하나로 보내질 수 있습니다. 수율 저하가 발생하면 분석가는 제조 실행 시스템(MES)에 조회하여 실패한 로트의 정확한 "장비 이력"을 확인해야 합니다. 여기서 핵심 역량은 "상호작용 효과"를 파악하는 것입니다. 단순히 "도구 A가 나쁘다"라고 단정 짓는 경우는 드뭅니다. 진정한 전문성은 "도구 A의 2번 챔버가 결함을 유발하는 것은 도구 B의 4번 챔버가 뒤따를 때뿐이다"와 같은 사실을 밝혀냅니다. 이를 위해서는 수 테라바이트에 달하는 장비 로그 데이터(FDC)에 대해 대규모 분산 분석(ANOVA) 테스트를 수행해야 합니다. 엔지니어는 에칭 장비의 특정 "질량 유량 제어기(MFC)"에서 가스 안정화에 0.1초의 지연이 발생하여 가장 밀도가 높은 메모리 셀 어레이에만 영향을 미치는 "미세 부하 효과"를 일으킬 수 있음을 발견할 수 있습니다. 이처럼 밀리초 단위의 센서 오류를 나노미터 규모의 회로 결함과 연결하는 수준의 정밀도는 단 하나의 불량 부품이 수주에 걸친 생산량을 오염시키는 것을 방지하는 데 결정적인 기술입니다. 마지막으로, 가장 세부적인 수준의 전문 지식은 추상적인 전기적 오류를 물리적 좌표로 변환하는 "비트 오류 매핑(BFM)"에 있습니다. 메모리 테스터는 1024번째 행, 512번째 열에서 "논리 주소 오류"를 보고할 수 있습니다. 하지만 칩 레이아웃 최적화를 위해 사용되는 복잡한 스크램블링 알고리즘 때문에 이 논리적 주소는 물리적 실리콘과 선형적으로 대응하지 않습니다. 분석가는 이를 정확한 물리적 위치(예: 뱅크 2의 워드 라인 3과 비트 라인 7의 교차점)로 매핑하기 위해 "스크램블 방정식"을 적용해야 합니다. 이러한 물리적 오류를 종합적으로 분석함으로써 엔지니어는 "단일 비트 오류"(아마도 임의의 입자)와 "컬럼 오류"(아마도 금속 인터커넥트의 개방 또는 단락)를 구분할 수 있습니다. 만약 비트맵에서 "쌍을 이루는 비트 오류"(인접한 두 비트의 오류)가 나타난다면, 이는 에칭 부족이나 포토레지스트 찌꺼기로 인한 "브리지 결함"을 강력하게 시사합니다. 이러한 "물리적 비트맵 분석"을 통해 엔지니어는 고장 분석(FA) 연구소에 투과 전자 현미경(TEM) 단면 분석을 위한 정확한 좌표를 제공할 수 있으며, 이를 통해 "건초 더미에서 바늘 찾기"와 같은 작업을 누설 전류 또는 개방 회로의 근본 원인을 정확하게 찾아내는 정밀한 분석으로 전환할 수 있습니다.

장비 가동 중단을 방지하기 위한 예측 유지보수 및 신호 처리

반도체 제조 공장에서 현대적인 예측 유지보수의 기반은 단순한 임계값 모니터링을 뛰어넘는 고급 "고주파 원격 측정 신호 처리"에 있습니다. 기존 시스템은 일반적으로 단일 변수 "FDC(고장 감지 및 분류)" 한계(예: 온도가 100°C를 초과하면 경보 발생)에 의존하지만, 이러한 접근 방식은 노이즈 속에 숨겨진 미묘하고 조기의 기계적 고장 징후를 놓칩니다. SK 하이닉스는 고속 푸리에 변환(FFT) 알고리즘을 사용하여 시간 영역의 진동 및 음향 방출 데이터를 주파수 영역으로 변환합니다. 예를 들어, 건식 진공 펌프는 단순히 "고장 것이 아니라, 볼 베어링이 고착되기 몇 주 전부터 특정 "결함 주파수"(내륜 직경과 회전 속도의 함수)를 방출하기 시작합니다. 이 시스템은 펌프 진동의 전력 스펙트럼 밀도(PSD)를 지속적으로 분석하여 하위 공정의 혼란스러운 배경 소음 속에서 이 특정 고조파 스파이크를 분리해낼 수 있습니다. 또한 플라즈마 챔버의 경우, 이 시스템은 "광학 방출 분광법(OES)" 신호를 강도뿐만 아니라 "미세 아크" 특성까지 분석합니다. 고주파 필터를 적용하고 원시 RF 반사 파형에서 첨도 및 왜도와 같은 통계적 특징을 추출함으로써, 이 알고리즘은 표준 인터록을 작동시키기에는 너무 짧지만 챔버 벽 침식이나 유전체 파괴가 임박했음을 나타내는 미세 아크 현상의 특징인 불규칙한 파형을 감지합니다. "공정 상호작용"의 복잡성을 해결하기 위해 유지보수 전략은 단일 센서 모니터링에서 주성분 분석(PCA)을 활용한 "다변량 이상 탐지"로 전환됩니다. 가스 유량, 압력, RF 전력이 관련된 증착 공정에서 세 변수 모두 개별적으로는 "정상 범위" 내에 있더라도 장비는 고장 위험에 노출될 수 있습니다. 이는 압력과 스로틀 밸브 위치 사이의 상관관계가 깨질 때 발생합니다. 예를 들어 압력이 상승했지만 위치가 그에 맞춰 조정되지 않는 경우입니다. SK 하이닉스는 이러한 다차원적 상태를 정량화하기 위해 호텔링의 T² 통계량과 Q 통계량(제곱 예측 오차)을 활용합니다. T²통계량은 다변량 모델의 중심에서 공정이 얼마나 벗어났는지를 측정하고, Q 통계량은 센서 간의 알려진 물리적 관계를 위반하는 편차인 "잔차 오차"를 측정합니다. Q 통계량이 관리 한계를 벗어나면 "상관관계 붕괴" 신호를 보내 엔지니어에게 사람이 개별 차트만으로는 절대 알아차릴 수 없는 미묘한 누출이나 센서 오차를 알려줍니다. 이러한 "센서 융합" 접근 방식은 오탐을 90%까지 효과적으로 줄이고 장비 가동을 중단하지 않고도 수율을 저하하는 "소프트 오류"를 감지합니다. 궁극적으로는 '상태 모니터링'에서 '예측 및 잔여 수명(RUL) 예측'으로의 전환이 목표입니다. 고장 감지는 사후 대응이지만, 정확한 고장 발생 시간을 예측하는 것은 사전 예방적 접근입니다. SK 하이닉스는 파티클 필터 알고리즘 또는 장단기 메모리(LSTM) 신경망을 활용한 '열화 모델링'을 통합했습니다. 이 모델들은 단순히 "양호/불량"이라는 이진 상태만 출력하는 것이 아니라, 부품 수명의 확률 분포를 출력합니다. 예를 들어, 정전기 척(ESC)이 클램핑력을 잃는 경우, 알고리즘은 수천 개의 이전 척에 대한 "고장 발생까지의 작동 시간" 데이터를 기반으로 실시간 감쇠 곡선을 맞춥니다. 그런 다음 신뢰 구간(예: "48시간 이내 고장 발생 확률 95%)과 함께 "고장 발생까지의 시간"을 계산합니다. 이 확률적 예측 결과는 제조 실행 시스템(MES) 스케줄러에 직접 입력됩니다. 사용할 수 있는 부품을 낭비하는 경직된 "월간 유지보수" 일정에 얽매이거나 웨이퍼를 폐기하게 만드는 고장을 기다리는 대신, 시스템은 "적시 유지보수(Just-in-Time Maintenance)" 티켓을 생성합니다. 장비는 예측된 고장 발생 정확히 한 배치 전에 자동으로 오프라인 상태가 되어, 제조 공장은 장비의 "그린 타임"(가동 시간)을 극대화하는 동시에 계획되지 않은 "다운 이벤트"로 인한 치명적인 위험을 사실상 제거할 수 있습니다.

최적의 레시피를 찾기 위한 통계적 공정 관리

현대 반도체 제조에서 최적의 레시피를 찾는 것은 더 이상 고정된 "황금 표준"을 설정하는 것이 아니라, 공정 장비의 자동 조종 장치 역할을 하는 동적인 "실행 간(R2R) 제어" 시스템을 구현하는 것입니다. 기존 방식에서는 엔지니어가 에칭 시간을 30초로 고정하고 최상의 결과를 기대하는 식이었습니다. 하지만 오늘날의 R2R 컨트롤러는 정교한 "피드포워드/피드백" 알고리즘을 활용합니다. 예를 들어, 상류의 화학 기상 증착(CVD) 장비에서 증착된 박막 두께가 목표치보다 2% 더 두껍지만 범위 내에 있다고 보고하는 경우, R2R 시스템은 이 데이터를 하류의 화학 기계적 연마(CMP) 장비로 자동으로 전달합니다. 그러면 CMP 장비는 보정 레시피를 동적으로 계산하여 연마 시간을 정확히 1.5초 늘려 유입되는 편차를 상쇄합니다. 동시에, 시스템은 연마 후 측정값을 CVD 장비에 피드백하여 다음 로트의 증착 시간을 조정합니다. 이러한 지속적인 양방향 보정을 통해 모든 웨이퍼의 중요 치수(CD)가 목표 평균값에 정확히 맞춰지도록 보장하며, 연마 패드나 에칭 링과 같은 소모품이 시간이 지남에 따라 마모되면서 자연적으로 발생하는 "공정 편차"를 효과적으로 제거합니다. "가상 계측(VM)"은 "측정 대기 시간"이라는 물리적 병목 현상을 극복하여 레시피 최적화 속도를 혁신적으로 향상합니다. 기존에는 레시피 변경을 확인하기 위해 "파일럿 웨이퍼"를 제작하고 별도의 계측 장비로 보내 결과를 기다리는 데 몇 시간을 소요해야 했습니다. VM은 "센서 융합"을 사용하여 물리적 결과를 즉시 예측함으로써 이러한 사각지대를 제거합니다. 이 시스템은 장비 내부 센서(플라즈마 광학 방출 스펙트럼(OES), RF 임피던스, 스로틀 밸브 각도, 정전기 척 온도)에서 고주파 자료를 수집합니다. 사전 학습된 회귀 모델을 통해 이러한 다변량 데이터를 처리함으로써 VM 시스템은 실제 SEM(주사 전자 현미경) 측정값과 95% 이상의 상관관계를 갖는 에칭 깊이 또는 박막 두께의 "가상 측정값"을 생성합니다. VM이 챔버 벽면의 온도 변화로 인해 에칭 프로파일에 미세한 변화가 발생할 것으로 예측하면, 고급 공정 제어(APC) 서버는 카세트에 있는 바로 다음 웨이퍼의 바이어스 전력 레시피에 "마이크로 보정"을 즉시 적용합니다. 이러한 기능을 통해 레시피는 고정된 명령어 세트에서 챔버 환경의 물리적 변화에 실시간으로 적응하는 유동적이고 자체 보정 가능한 방정식으로 변환됩니다. 궁극적으로 "최적의 레시피"는 엄격한 실험 설계(DOE)를 통해 "공정 능력 지수($C_{pk}$)"를 최대화함으로써 통계적으로 정의됩니다. 엔지니어는 단순히 최고 수율을 찾는 것이 아니라, 자연적인 변동에 가장 강한 "최적의 조건"인 가장 넓은 "공정 범위"를 찾습니다. "중심 합성 설계(Central Composite Design)" DOE를 수행함으로써 엔지니어는 가스 유량비, 챔버 압력, 열원 출력과 같은 주요 입력 변수를 의도적으로 변경하여 출력의 반응 표면을 파악합니다. 목표는 이 3D 등고선 지도의 "평탄 영역"을 찾는 것입니다. 이 영역에서는 온도 변동이 ±5%일 때 최종 임계 치수의 변화가 거의 없습니다. 이처럼 안정적인 작동 지점을 찾으면 레시피를 "중심화"합니다. 고객의 게이트 폭 사양이 10nm ± 1nm인 경우, 최적의 레시피는 (비록 기준을 통과하더라도) 10.5nm를 생성하는 레시피가 아니라, 가능한 한 가장 작은 시그마(σ)로 분포를 정확히 10.0nm에 집중시키는 레시피입니다. 이러한 통계적 중심화는 "타구치 손실 함수"를 최소화하여 공정 편차가 불가피하게 발생하더라도 "식스 시그마" 범위 내에 안전하게 유지되도록 보장하고, 지속적인 수동 개입 없이도 결함 없는 제품을 생산할 수 있도록 합니다.