COMPUTEX 2024에서 엔비디아의 기조 강연 둘러보기

COMPUTEX 2024에서 엔비디아의  기조 강연 둘러보기

COMPUTEX 2024가 지난 4일부터 7일까지 대만 타이베이에서 열렸다. COMPUTEX는 매년 대만에서 열리는 컴퓨터 관련 제품 전시회로 아시아 최대 규모의 ICT 행사로 꼽힌다. 1981년에 처음 시작됐으며, ‘COMPUTEX’는 COMPUTER와 EXPO를 합친 말로 알려져 있다.

전 세계 ICT 전시회 중에서 한 손에 꼽힐 정도로 규모도 크고 참가 기업도 쟁쟁한, 진작부터 초대형 전시회로 성장한 COMPUTEX이지만, 최근 들어 그 위상은 더욱 높아지고 있다. 라이젠 CPU의 약진으로 새로운 중흥기를 맞이한 AMD, 그리고 AI 열풍과 함께 현재 전 세계에서 가장 주목받는 기업으로 성장한 NVIDIA(이하 엔비디아)가 COMPUTEX에서 새로운 정보를 다수 공개하는 등 참가에 큰 공을 들이기 때문이다. 이들 기업의 CEO가 모두 대만계 미국인인 점도 어느 정도 영향을 끼쳤을 것이다.

그리고 이번 COMPUTEX 2024에서도 두 회사의 새로운 정보들이 다수 공개됐다. 이번 기사에서는 그중 엔비디아의 기조 강연에서 공개된 내용을 정리해 보았다.


세 줄 요약

  • 컴퓨텍스의 공식행사가 아닌, 엔비디아의 자체 행사에서 기조 강연이 진행됐다.
  • RTX AI PC가 출시될 것이라 발표했다.
  • NPU를 다른 용도로 사용할 수 있게끔 ISV에 개발을 위한 관련 API를 제공할 예정이다.
  • 「Blackwell」의 뒤를 이를 새로운 AI용 GPU 플랫폼 「Rubin」과 Arm CPU 「Grace」의 후속 제품인 「Vero」를 공개했다.

엔비디아, 별도의 독립적인 기조 강연을 진행

COMPUTEX 본 행사에 앞서 6월 2일 열린 기조 강연에서 엔비디아의 CEO인 젠슨 황은 자사의 AI용 GPU 로드맵에 대해 자세히 밝혔다. “NVIDIA의 정책은 매년 새로운 제품을 출시하는 것으로, 올해(2024년)는 「Blackwell」을 출시하고 내년(2025년)에는 해당 제품의 개선 버전인 「Blackwell Ultra」를 출시할 계획이다. 그 이후에는 「Rubin」을 계획하고 있으며, 2027년에는 「Rubin Ultra」를 출시할 예정이다”라고 설명했다.

한 가지 흥미로운 점은 「Rubin」 역시 실존 인물의 이름을 따왔다는 점이다. 엔비디아의 연례 개발자 회의, GTC 2024를 통해 공개된 코드네임 「Blackwell」이 미국 국립과학원(NAS)에 처음으로 등재된 첫 흑인 수학자이자 통계학자 ‘데이빗 헤롤드 블랙웰’의 이름을 따왔고, 현재 주력으로 사용되고 있는 AI용 GPU 「H100」의 코드네임 「Hopper」가 컴퓨터 과학자 ‘그레이스 호퍼’의 이름을 따온 것처럼 새로 공개된 AI용 GPU 「Rubin」은 2016년에 사망한 천문학자 ‘Vera Rubin’에서 따왔다. 참고로 성(姓) 「Rubin」은 「Blackwell」의 뒤를 이을 GPU의 코드네임에 사용되며, 이름 「Vera」는 다음 세대 Arm CPU의 이름에 사용된다.

베라 루빈은 은하 회전에 관한 연구에서 큰 업적을 남겨 암흑물질(Dark Matter) 이론의 바탕을 만들었다. (사진 출처 : https://alumni.cornell.edu/)

엔비디아의 기조 강연은 COMPUTEX를 주최한 대만대외무역발전협회(TAITRA)가 공식적으로 COMPUTEX 행사장에서 진행하는 기조 강연이 아니라, NVIDIA가 독자적으로 개최한 이벤트로 진행됐다.

보통 COMPUTEX 기조 강연은 오전이나 점심시간 직후의 오후 등 2회 정도 진행되는 것이 일반적인데, 이번에 NVIDIA가 진행한 기조 강연은 특이하게 저녁 7시(한국시간 저녁 8시)에 시작해 9시가 넘어 끝났다. 젠슨 황은 현장 참관객의 긴장과 피곤함을 풀어주기 위해 비디오를 상영하거나 대만 참관객을 위해 중국어로 농담을 하는 등 일반적인 기조 강연과는 다르게 아주 가벼운 분위기로 진행됐다.

차세대 AI용 GPU 「Rubin」처럼 새로운 소식은 기조 강연 후반부에 나왔으며 중반부까지는 엔비디아의 CUDA를 통해 AI 연구가 가속화되고 있고, 엔비디아의 마이크로 서비스인 NIM, 산업 분야를 위해 메타버스를 구현하는 ‘Omniverse’를 활용한 공장 자동화 이야기 등 기본적으로는 지난 3월에 진행된 GTC 24 발표 내용을 다시 정리해서 언급하는 내용이었다.

기조 강연은 국립 타이베이 대학교 스포츠센터에서 진행됐다. 참관객들이 현장을 가득 채웠다.

「RTX AI PC」를 발표

물론, 기조 강연의 내용이 전부 재탕이었던 건 아니다. 몇 가지 새로운 발표가 있었는데, 그중 하나가 「RTX AI PC」에 관한 내용이다. 이 발표에서 ASUS와 MSI가 COMPUTEX 기간에 엔비디아의 GeForce RTX 4070과 같은 dGPU를 탑재한 「RTX AI PC」 노트북을 발표할 예정이라고 공개됐다. 참고로 dGPU는 ‘discrete GPU’라는 뜻으로 CPU와는 별개로 전용 메모리를 가지고 작동하는 GPU를 의미한다.

「RTX AI PC」라는 새로운 용어가 등장해 복잡하게 느껴질 수도 있겠지만, 간단히 말해 「RTX AI PC」는 엔비디아가 ‘AI PC’를 부르는 용어다. NPU를 사용하지 않고 엔비디아의 GPU를 활용하여 AI 처리를 수행한다는 점에서 이미 널리 사용되고 있는 ‘AI PC’와 일치한다.

GeForce RTX에는 엔비디아가 ‘Tensor Core’라고 부르는 특정 유형의 NPU 엔진이 내장돼있다. 이 NPU와 유사한 엔진은 GPU를 통해야만 사용할 수 있기에, 소프트웨어 공급업체는 엔비디아 GPU의 Tensor Core를 활용할 수 있도록 소프트웨어를 대응시킬 필요가 있다.

이번에 엔비디아는 이러한 독립 소프트웨어 공급업체(ISV)를 대상으로 마이크로소프트와 협력하여 몇 가지 발표를 진행했는데, 중요한 내용 중 하나가 Windows Copilot Runtime에서 SLM(Small Language Model)이나 RAG(Retrieval-Augmented Generation)를 사용할 때 엔비디아 GPU의 Tensor Core를 활용할 수 있는 API를 제공한다는 것이다. 이를 통해 독립 소프트웨어 공급업체는 SLM이나 RAG의 부하를 GPU로 오프로드할 수 있게 되어, NPU를 다른 용도로 활용할 수 있게 된다. 이 API는 올해 중에 개발자용 프리뷰가 제공될 예정이다.

참고로 이 발표는 Windows Copilot Runtime에서 GPU를 활용한 연산이 가능한 소프트웨어에 관한 내용이므로, Copilot+ PC의 마케팅 프로그램 요구 사항으로 엔비디아 GPU가 필요하다는 뜻은 아니다. 따라서 AMD의 Strix Point, Intel의 Lunar Lake 및 Qualcomm의 Snapdragon X Elite 중 하나의 SoC가 필요하다는 사실은 그대로다.

차차세대 AI용 GPU는 「Rubin」

기조 강연이 이어지며 젠슨 황은 3월에 발표한 차세대 AI용 GPU인 「Blackwell」에 대해 언급했다. “「Blackwell」용 솔루션을 대만의 OEM 및 ODM 제조사들이 만들어주고 있다”라면서, “AI용 차세대 GPU 「Blackwell」은 대만의 도움으로 탄생했다”라고 대만을 치켜세워 관람객들을 호응을 끌어냈다.

젠슨 황의 설명에 따르면 「Blackwell」은 올해 출시되고, 내년에는 「Blackwell Ultra」라는 코드네임의 「Blackwell」 개선 버전이 출시될 예정이다. 「Hopper」에서도 H100의 개선 버전인 H200이 출시됐는데, 「Blackwell」도 비슷한 과정을 따라갈 것이라 발표한 것이다.

GTC 2024에서 처음 「Blackwell」을 공개하는 젠슨 황 CEO

처음 공개된 「Blackwell Ultra」에 이어 이를 잇는 ‘차차세대’ AI용 GPU, 「Rubin」도 이 자리에서 공개됐다. 「Rubin」도 역시 무인 버전의 「Rubin」을 출시하고, 그 후에 개선 버전인 「Rubin Ultra」가 출시될 예정이다.

이를 정리하면 2024년에는 「Blackwell」, 2025년에는 「Blackwell Ultra」, 2026년에는 「Rubin」, 2027년에는 「Rubin Ultra」가 출시된다. 자료에 따르면 「Rubin」은 HBM4를 지원하며 8 소켓으로 이루어져 있고, 「Rubin Ultra」 HBM4를 지원하며 12 소켓으로 이루어져 있다.

「Rubin」과 함께 Arm CPU인 「Grace」의 후속 제품으로서 「Vero」를 Rubin 플랫폼의 일부로 제공할 계획이라고 밝혔다. 이에 따라 차세대 ‘NVLink S Switch’, ‘CX8 SuperNIC’, ‘Spectrum-X800 Ethernet Switch’, ‘Quantum-X800 Switch’ 등 1,800GB/s 이상의 성능을 제공하는 GPU 스케일업 및 스케일아웃 솔루션에 필요한 관련 칩도 「Rubin」이 도입되면서 업데이트할 계획이라고 설명했다.

※ 별도의 표기가 없는 사진 출처 : 엔비디아의 홈페이지 또는 공식 기조 강연 영상