▲ 구글이 새로 공개한 자체 설계 인공지능 프로세서에 고대역폭 메모리(HBM) 사용량을 이전작 대비 크게 높였다. 구글 8세대 텐서 프로세서 'TPU 8i' 홍보용 이미지. <구글>
27일(현지시각) 구글은 기술 발표행사 ‘클라우드 넥스트’에서 8세대 텐서프로세서(TPU) 반도체인 TPU 8t 및 TPU 8i를 공개했다.
텐서프로세서는 구글이 자체 설계하는 인공지능 반도체다. 엔비디아를 비롯한 외부 협력사 제품에 의존을 낮추기 위해 개발 및 상용화가 이뤄지고 있다.
구글 딥마인드 연구소가 개발에 참여한 8세대 TPU는 인공지능이 스스로 판단하고 결정하는 에이전틱 AI 기술에 적합하도록 설계됐다.
에이전틱 AI는 기존의 생성형 인공지능 기술보다 많은 학습과 연산, 추론 작업을 필요로 한다. 지연히 더 뛰어난 성능 및 전력 효율을 갖춘 반도체가 필요하다.
구글은 8세대 TPU가 그동안 수 년에 걸쳐 자체 설계 반도체를 기반으로 ‘제미나이’ 인공지능 모델을 구동해 온 구글 기술의 집약체라고 강조했다.
TPU 8t는 지난해 공개된 구글 아이언우드 TPU와 비교해 하나의 시스템으로 구현할 수 있는 연산 성능이 이론상 3배 수준으로 높아졌다.
최대 2페타바이트(PB) 용량의 고대역폭 메모리를 활용할 수 있도록 한 점도 특징이다. 반도체들 사이 통신 속도가 이전작과 비교해 두 배 정도로 상향됐다.
TPU 8i는 하나의 시스템에서 최대 331.8테라바이트(TB)의 고대역폭 메모리를 활용할 수 있다. 아이언우드 TPU의 49.2TB와 비교해 7배 가까운 수준이다.
구글이 이번에 공개한 두 종류의 반도체는 서로 다른 역할과 기능을 수행한다. TPU 8t는 인공지능 모델 학습 및 훈련에, 8i는 관련 서비스를 실제로 구동하는 추론 작업에 주로 쓰인다.
그러나 두 신형 인공지능 반도체 모두 원활한 구동에 핵심인 고대역폭 메모리 사용량을 늘리는 데 중점을 뒀다는 공통점이 있다.
▲ 삼성전자 HBM3E 및 HBM4 고대역폭 메모리 전시용 샘플. <연합뉴스>
최근 엔비디아를 비롯한 고객사 제품에 고대역폭 메모리 탑재량이 늘어나는 추세를 보이며 메모리반도체 제조사들의 핵심 성장동력으로 떠오르고 있다.
구글의 새 인공지능 반도체는 고대역폭 메모리 주요 고객사가 엔비디아 이외 기업으로 다변화되며 수요도 크게 늘어나는데 영향을 줄 수 있다는 의미가 있다.
최근 구글 딥마인드는 인공지능 작업에 효율을 높여 메모리반도체 사용량을 대폭 줄일 잠재력이 있는 ‘터보퀀트’ 신기술을 공개했다.
이는 SK하이닉스와 삼성전자, 마이크론 주가가 한때 일제히 크게 떨어지는 원인으로 작용했다.
터보퀀트 기술이 널리 상용화되면 고대역폭 메모리 수요도 자연히 감소해 메모리반도체 제조사들의 미래 성장성이 낮아질 수 있다는 시장의 우려가 반영됐다.
하지만 구글이 신형 인공지능 반도체에 메모리반도체 사용량을 크게 높인 것은 여전히 성능 발전에 고대역폭 메모리의 역할이 절대적이라는 점을 보여주는 근거로 해석된다.
구글은 자체 설계한 8세대 TPU가 성능 향상뿐 아니라 전력 효율 개선에 중점을 뒀다는 점도 강조했다.
따라서 TPU 8i의 경우 이전 세대 반도체와 비교해 비용 대비 성능이 약 80% 개선된다고 발표했다.
구글의 자체 설계 인공지능 반도체 상용화가 본격적으로 확대된다면 데이터센터 증설에 필요한 전력 공급망 부족 문제도 어느 정도 해소될 잠재력이 있다.
이는 결국 데이터센터 투자가 더 활발해져 고대역폭 메모리 수요도 늘어나는 결과로 이어질 수 있다.
올해 안에 구글은 TPU 8t 및 8i를 모두 폭넓게 상용화하겠다는 계획을 밝혔다. 또한 이를 외부 고객사들에도 적극적으로 제공하겠다는 점을 시사했다.
구글은 “8세대 TPU는 인공지능으로 무엇이 가능한지를 재정의하는 기술이 될 것”이라며 “관심이 있는 고객사들에 더 많은 정보를 제공하겠다”고 덧붙였다. 김용원 기자