본문 바로가기
SK하이닉스

SK하이닉스의 가상 측정, 품질보증 QRA, 독기 넘치는 문화

by 뷰메모리 2026. 1. 6.

현대 반도체 제조의 서브 나노미터 영역에서는 물리적 측정은 과거의 구시대적인 유물입니다. 300개의 층으로 이루어진 4D NAND 웨이퍼는 함부로 만지면 손상되기 마련입니다. 바로 이 지점에서 SK 하이닉스의 '가상 계측(Virtual Metrology, VM)'이 등장합니다. VM은 머신 러닝을 활용하여 실제 장비 검사 없이도 센서 데이터로부터 정확한 측정값을 "추출"하는 가상 센서 시스템입니다. 이 글에서는 실리콘 베일을 벗겨내고 이 예측 AI가 품질 및 신뢰성 보증(QRA) 팀과 어떻게 결합하는지 공개합니다. QRA 팀은 단순한 검사관이 아니라 면역 체계처럼 잠재적 결함이 나타나기 전에 이를 차단하는 역할을 합니다. 마지막으로, 이 시스템을 구동하는 논란의 여지가 있는 '강인한 문화'(도칸 정신)를 살펴보겠습니다. 흔히 단순히 '독성' 강렬함으로 오해되지만, 우리는 이를 계산된 "불완전함에 대한 적대감", 즉 HBM3E 모듈이 공장을 떠날 때 NVIDIA H100 클러스터의 극한 환경에서도 끄떡없이 살아남을 수 있도록 하는 데 필요한 심리적 압력솥으로 분석할 것입니다.

SK하이닉스의 가상 측정, 품질보증 QRA, 독기 넘치는 문화
SK하이닉스의 가상 측정, 품질보증 QRA, 독기 넘치는 문화

결함 발생 원인을 차단하기 위한 가상 측정

반도체 품질 관리의 전통적인 방법론은 역사적으로 "샘플링 검사"에 의존해 왔습니다. 이는 CD-SEM(임계 치수 주사 전자 현미경)과 같은 고가의 느린 측정 도구를 사용하여 카세트당(25개 웨이퍼) 한두 개의 웨이퍼만 물리적으로 측정하는 방식입니다. 이러한 통계적 접근 방식(SPC)은 위험한 사각지대를 남깁니다. 나머지 95%의 웨이퍼는 확률에 기반하여 양품으로 "추정"되는 것입니다. SK 하이닉스는 자사의 산업용 AI 자회사인 가우스랩과 공동 개발한 파놉테스 VM 솔루션, 즉 "가상 계측(VM)"을 도입하여 이러한 불확실성을 제거했습니다. 모든 칩을 물리적으로 측정하는 것은 공장 가동을 마비시킬 수 있으므로, 이 시스템은 제조 장비 자체의 "센서 시그니처"를 분석합니다. 증착 또는 에칭 장비는 매초 챔버 압력, RF 전력 임피던스, 가스 유량 및 플라스마 온도와 같은 기가바이트 단위의 데이터를 생성합니다. SK하이닉스의 AI 모델은 이러한 센서 입력값과 웨이퍼의 최종 물리적 형상 간의 정확한 수학적 상관관계를 학습했습니다. 이를 통해 시스템은 웨이퍼의 두께와 패턴 폭을 실시간으로 물리적 측정에 필적하는 정확도로 "예측"할 수 있으며, 실리콘에 직접 접촉하지 않고도 모든 원자를 검사하는 "유령 검사관"을 구현하는 것과 같습니다. 이 혁신의 핵심 기술은 APC(고급 공정 제어)와의 통합에 있습니다. 기존 반도체 제조 시설에서는 장비가 사양에서 조금이라도 벗어나면 다음 샘플에서 오류를 발견하기 전에 수십 개의 불량 웨이퍼를 처리해야 할 수도 있습니다. SK 하이닉스의 VM 시스템은 이러한 피드백 루프를 즉시 차단합니다. AI가 300층 NAND 스택 에칭 중 플라스마 밀도의 미세한 변동을 감지하면 단순히 경고만 하는 것이 아니라, "채널 홀" 직경의 예상 편차를 수학적으로 계산하여 기계 컨트롤러에 즉시 수정 명령을 보내 다음 웨이퍼의 전압이나 가스 혼합비를 조정합니다. 이 "런투런(R2R) 제어"는 공정 변동성을 29% 이상 줄여 일반적으로 불량이 발생하는 "분포 꼬리"(이상치 칩)를 안전한 "골든 윈도우" 영역으로 되돌립니다. 또한 SK 하이닉스는 원시 센서 데이터에 "범용 노이즈 제거" 알고리즘을 적용하여 제조 환경의 전자기 노이즈를 제거하고 순수한 "공정 신호"를 분리함으로써 AI가 전자적 오류가 아닌 실제 물리적 변화에 반응하도록 합니다. 마지막으로, 이 시스템은 HBM3E 공정에서 결함 발생 원인을 차단하는 데 매우 중요합니다. HBM3E 공정에서 결함 발생 시 비용은 천문학적입니다. TSV(Through-Silicon Via) 형성 과정에서 미세한 공극 하나만으로도 12층 높이의 전체 스택이 무용지물이 될 수 있습니다. 가상 계측은 "타임머신"과 같은 역할을 하여 엔지니어가 생산 라인 끝에서 발견된 결함을 몇 주 전 특정 챔버에서 발생한 특정 밀리초 길이의 압력 급증으로 거슬러 올라가 추적할 수 있도록 해줍니다. 센서 데이터의 "이상 현상"과 최종 수율 지도를 연관시켜 시스템은 동적인 "결함 라이브러리"를 구축합니다. 시간이 지남에 따라 AI는 초점 링의 열화나 가스 필터 막힘과 같은 장비 고장의 "지문"을 실제로 결함이 발생하기 몇 시간 전에 인식하는 방법을 학습합니다. 이는 품질 관리(불량 칩 발견)에서 품질 엔지니어링(불량 칩 발생 방지)로 패러다임을 전환하여 SK 하이닉스의 HBM 수율이 업계 표준을 유지하는 것이 우연이 아닌, 무작위성을 끊임없이 알고리즘적으로 제거함으로써 가능함을 보장합니다.

HBM 수율 극대화를 위한 숨겨진 비밀 품질 보증 QRA

SK 하이닉스의 "품질 및 신뢰성 보증"(QRA) 부서는 단순히 최종 검사 기관의 역할을 넘어, "시프트 레프트(Shift Left)"라는 방법론을 활용하여 칩 설계 프로세스의 아키텍처 자체에 깊숙이 자리 잡은 전체주의적인 "게이트키퍼" 역할을 수행합니다. 기존 반도체 제조 방식에서는 품질 관리가 대개 후처리 단계, 즉 웨이퍼가 공장을 떠난 후에 검사하는 방식으로 이루어집니다. 그러나 HBM3E의 경우, 최하층의 단 하나의 결함이 그 위에 있는 11개 층의 값비싼 실리콘 전체를 망가뜨리기 때문에 이러한 사후 대응 방식은 경제적으로 치명적입니다. SK 하이닉스 QRA의 "비밀"은 기술 개발(TD) 단계에서 개입할 수 있는 권한에 있습니다. 단 하나의 시제품 웨이퍼도 생산되기 전에 QRA 팀은 제안된 회로 배치 및 패키징 재료에 대해 엄격한 "고장 모드 및 영향 분석"(FMEA)을 수행합니다. 이들은 TSV 설계에서 열응력 지점과 잠재적인 전기 이동 경로를 시뮬레이션하여 기능 테스트는 통과했지만 신뢰성 테스트에 실패할 수 있는 엔지니어링 선택을 효과적으로 "거부"합니다. 이러한 선제적인 "신뢰성 설계"(DfR)는 수율 곡선이 단순히 낮은 지점에서 시작하여 천천히 상승하는 것이 아니라 "황금 기준선"에서 시작하도록 보장하여 품질을 나중에 고려하는 경쟁업체들을 괴롭히는 구조적 결함을 제거합니다. HBM 품질 보증의 핵심 기술적 난관은 "양호 적층 다이(KGSD)" 검증입니다. 프로브 핀을 통해 완벽하게 테스트할 수 있는 일반 DRAM 칩과 달리, 적층형 HBM 큐브는 "블랙박스"와 같은 문제를 안고 있습니다. 칩들이 접합된 후에는 내부 연결부에 물리적으로 접근할 수 없기 때문입니다. SK 하이닉스의 QRA 팀은 DRAM 다이를 적층하기 전에 극한의 전압과 온도로 스트레스 테스트를 실시하는 독자적인 "웨이퍼 레벨 번인(WLBI)" 프로토콜을 개발했습니다. 이 공정은 일종의 "고문실" 역할을 하여 "초기 불량률"을 유발함으로써, 품질이 약한 칩이 고가의 패키징 라인에 들어가기 전에 조기에 고장 나도록 하여 폐기할 수 있도록 합니다. 또한, 모듈은 적층 후 -40°;C에서 125°;C 사이를 급격하게 오가는 "동적 열 사이클(DTC)" 테스트를 거칩니다. 이러한 극한의 열 충격은 MR-MUF 에폭시의 미세 균열이나 마이크로 범프의 박리를 드러내기 위해 설계되었습니다. QRA는 이러한 온도 변화 동안 TSV의 전기 저항 변화를 상호 연관시켜 "잠재적 결함"을 식별할 수 있습니다. 잠재적 결함이란 현재는 작동하지만 서버에서 24시간 365일 작동할 경우 6개월 후에 고장 날 수 있는 칩을 의미하며, QRA는 이러한 결함이 있는 칩을 출하량에서 가차 없이 걸러낼 수 있습니다. 마지막으로, 업계 최고 수준의 수율을 유지하는 "숨겨진 비결"은 QRA 팀이 "매버릭 컨트롤"(부품 평균 테스트 - PAT)을 집착적으로 시행하는 데 있습니다. 반도체 성능은 정규 분포(종형 곡선)를 따르기 때문에 대부분의 칩은 평균 범위 내에 속합니다. 하지만 "매버릭" 칩이라고 불리는 예외적인 칩들이 존재합니다. 이러한 칩들은 기술적으로는 합격/불합격 규격을 통과하지만, 누설 전류가 약간 높거나 액세스 속도가 미미하게 느린 등의 통계적 이상 징후를 보입니다. 다른 제조업체들은 이러한 칩들을 "하위 등급" 제품으로 출시하여 수익을 극대화할 수도 있지만, SK 하이닉스의 품질보증 규제(QRA)는 "불량품 폐기" 정책을 의무화하고 있습니다. 웨이퍼 평균에서 특정 시그마 한계(예: 3-시그마)를 벗어나는 다이는 정상 작동 여부와 관계없이 자동으로 폐기됩니다. 이러한 통계적 엄격함은 "오늘의 통계적 이상치는 내일의 현장 불량으로 이어질 수 있다"라는 철학에 기반합니다. SK하이닉스는 이러한 "불량" 제품을 제거함으로써 고객에게 공급하는 HBM의 "현장 반품률"(RMA)을 사실상 0으로 유지하여 서버 시장에서 가격 프리미엄을 책정할 수 있는 기반이 되는 신뢰를 구축합니다.

단 하나의 실수도 용납하지 않는 끈질기고 독기 넘치는 문화

SK하이닉스 품질 부서의 내부 분위기는 한국어 단어 "독한"으로 자주 묘사되는데, 이는 "끈질긴", "독기 같은", "멈추지 않는" 등의 의미를 담고 있습니다. 외부인들은 이를 유해하고 압박감이 심한 환경으로 오해할 수도 있지만, 내부인들은 이를 원자 규모 제조 과정의 무질서에 맞서는 데 필요한 "심리적 방화벽"으로 인식합니다. HBM3E 생산 과정에서 오차 범위는 말 그대로 0에 가깝습니다. TSV 접합 공정에서 2마이크로미터의 오차만 발생해도 수율이 떨어지는 것은 물론, 3만 달러짜리 AI 서버 노드의 기능이 완전히 망가집니다. 따라서 이러한 환경은 사람을 비난하는 것이 아니라, 오류에 대해 "무자비"하도록 설계되어 있습니다. 이는 "품질 우선 거부권"이라는 문화적 규범으로 나타나는데, 이는 데이터 이상이 감지될 경우 하위 품질 엔지니어가 상위 생산 책임자가 승인한 출하를 중단할 수 있는 절대적인 권한을 갖는 것을 의미합니다. 데이터 앞에서 계층 구조가 허물어지는 이러한 현상은 출하 기한을 맞추기 위한 정치적 압력이 실리콘의 물리적 현실을 결코 압도하지 못하도록 보장하며, 순수하고 변질되지 않은 전문가적 불안감으로 짜인 안전망을 만들어냅니다. 이러한 "끈질긴" 문화는 "철라"(치열한 토론)라는 메커니즘을 통해 제도적으로 강화됩니다. 많은 전통적인 아시아 대기업에서는 체면을 지키고 연공서열을 존중하는 것이 비판적인 의견을 억압하는 요인이 될 수 있습니다. SK하이닉스는 품질 평가 과정에서 "직급 무관 토론"을 의무화함으로써 이러한 관행을 적극적으로 타파하고 있습니다. 결함이 발생하면 팀은 "작전실" 시나리오에 돌입하여 "근본 원인 분석"(RCA)에만 집중합니다. 엔지니어는 "5가지 왜" 방법론을 사용하여 표면적인 증상("전선이 끊어졌다")을 넘어 시스템적인 근본 원인("전선 합금 조달 사양은 3년 전에 승인된 비용 절감 조치로 인해 0.5%의 불순물 편차를 허용했다")까지 파고들어야 합니다. 이 과정은 불편하고 고되며, 종종 며칠씩 지속되지만, "일탈의 정상화"를 방지합니다. 이 문화는 어떤 변칙도 "결함"으로 치부해서는 안 된다고 요구합니다. 데이터의 모든 작은 이상 현상은 그 물리적 기원을 밝혀낼 때까지 철저히 조사되어야 하며, "미스터리 결함"은 관리되는 것이 아니라 완전히 제거되어야 합니다. 마지막으로, 이러한 "냉혹함"은 "실패의 제도화"로까지 이어집니다. SK 하이닉스는 단순한 디지털 아카이브를 넘어, 모든 엔지니어가 새로운 프로젝트를 시작하기 전에 반드시 참고해야 하는 "실패 기록부"인 "교훈 데이터베이스(LLD)"를 운영하고 있습니다. "도칸" 정신은 새로운 실수는 용서받을 수 있지만, 과거의 실수를 반복하는 것은 용서할 수 없는 죄악이라는 것을 의미합니다. 사소한 포장 균열부터 대규모 생산량 감소에 이르기까지 모든 과거의 품질 관련 사건은 "설계 규칙 검사(DRC)"로 기록되어 향후 설계에 자동으로 적용됩니다. 이는 조직의 과거 실패를 방어벽으로 전환합니다. 새로운 HBM4 아키텍처가 제안되면 시스템은 자동으로 "이 비아 구조는 2021년에 응력 균열을 일으켰습니다. 새로운 설계가 이를 완화한다는 것을 입증하십시오."라고 표시합니다. 이처럼 조직 내 축적된 경험을 적극적으로 활용함으로써 회사는 개개인의 천재성에 의존하는 것이 아니라, 수년간 자체적인 실패 경험을 냉혹하게 분석하여 얻은 "집단 면역"에 기반하여 과거의 오류를 가장 가치 있는 지적 재산으로 전환합니다.