디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

주요 클라우드 기업들이 생성형 인공지능(AI) 시대를 위해 엔비디아와..모바일에서 작성

%%%%(211.36) 2024.03.23 19:50:45
조회 128 추천 0 댓글 0
														
7fed8275b58b6af73fed85e246ee776a216d95672fd3de6f72dd9d48ec728b7ef9888f3ff82b8174


엔비디아와 협력 강화 나선 클라우드 기업들…‘블랙웰 GPU’ 품는다

권용만 기자

권용만 기자



입력 2024.03.23 08:00

다른 공유 찾기기사스크랩하기글씨크기인쇄하기

AWS, ‘블랙웰’ 기반 인스턴스와 슈퍼컴 ‘프로젝트 세이바’ 발표
구글·마이크로소프트, 생성형 AI 환경 확장 위해 파트너십 강화
오라클, 엔비디아와 ‘소버린 AI’ 솔루션 위한 협력 확대

아마존 웹 서비스(AWS), 구글 클라우드, 마이크로소프트, 오라클 등 주요 클라우드 기업들이 생성형 인공지능(AI) 시대를 위해 엔비디아와 협력을 강화한다. 이들 클라우드 기업들은 엔비디아의 ‘블랙웰(Blackwell)’ 그래픽처리장치(GPU) 인프라를 활용한 다양한 서비스를 고객에 제공한다는 계획이다.
엔비디아가 18일(현지시각) 역대 최대 규모로 진행한 AI콘퍼런스 'GTC 2024'에서 선보인 블랙웰은 생성형 AI 시대에 최적화한 차세대 GPU다. 이 제품은 이전 세대 대비 최대 25배 적은 비용과 에너지로 조 단위의 대규모 언어 모델(LLM)에서 실시간 생성형 AI를 구축하고 실행할 수 있도록 지원한다.



대규모 생성형 AI 환경 위한 엔비디아 블랙웰 기반 DGX 슈퍼팟 / 엔비디아

AWS, ‘블랙웰’ 기반 인스턴스와 슈퍼컴퓨터 ‘프로젝트 세이바’ 발표

AWS는 5세대 엔비디아 NV링크로 상호 연결된 72개의 블랙웰 GPU와 36개의 그레이스 CPU로 구성된 ‘GB200 NVL72’ 기반 엔비디아 블랙웰 플랫폼을 제공할 예정이다. 고객은 고급 가상화와 하이퍼스케일 클러스터링의 지원을 받으면 수천 개의 GB200 슈퍼칩까지도 확장 가능하다.
또한 AWS는 EC2(Elastic Compute Cloud) 울트라클러스터에 배치된 새로운 B100 GPU를 탑재한 EC2 인스턴스를 제공할 계획이다. 엔비디아 DGX 클라우드에서도 GB200을 사용할 수 있다. AWS상에서의 블랙웰 기반 DGX 클라우드 인스턴스는 1조 개 이상의 파라미터를 처리할 수 있는 최첨단 생성형 AI와 LLM의 개발을 가속화할 것으로 기대된다.
아마존 EC2의 GB200을 통해 AWS는 고객이 AWS 니트로 엔클레이브와  AWS KMS(키 관리 서비스)를 사용해 EC2 인스턴스와 함께 신뢰할 수 있는 실행 환경을 구축하도록 지원한다. 니트로 엔클레이브를 통해 고객은 자신의 통제 하에 있는 키 재료(key material)를 사용해 KMS로 훈련 데이터와 가중치를 암호화할 수 있다. AWS 내부 운영자조차도 키에 액세스하거나 훈련 데이터 또는 모델 가중치를 복호화할 수 없도록 보장해 고객이 자신의 데이터를 통제할 수 있게 한다.
한편, AWS 리인벤트 2023에서 발표된 프로젝트 세이바는 세계에서 가장 빠른 AI 슈퍼컴퓨터를 구축하기 위해 엔비디아와 AWS가 협력하는 프로젝트이다. AWS에서 독점적으로 호스팅되는 이 슈퍼컴퓨터는 엔비디아의 자체 연구 개발에 사용된다. 엔비디아 GB200 NVL72시스템을 기반으로 구축된 세이바는 이전 세대 GPU 기반이었던 초기 계획에 비해 6배나 향상된 성능을 제공한다.  
2만736개의 B200 GPU를 사용하는 이 시스템은 새로운 엔비디아 GB200 NVL72시스템을 기반으로 구축되며, 엔비디아 GB200 NVL72시스템은 5세대 NV링크 기술로 2만736개의 B200 GPU와 1만368개의 엔비디아 그레이스 CPU를 연결한다. 이 슈퍼컴퓨터는 4세대 EFA 네트워킹을 통해 확장되고, 슈퍼칩당 최대 800Gbps의 저지연, 고대역폭 네트워킹 처리량을 제공해 414엑사플롭(EFlops)의 대규모 AI를 처리할 수 있다.

구글 클라우드·마이크로소프트, 생성형 AI 환경 확장 '엔비디아와 파트너십 강화'

구글은 새로운 엔비디아 그레이스 블랙웰 AI 컴퓨팅 플랫폼을 도입하고, 구글 클라우드에 엔비디아 DGX 클라우드 서비스를 적용한다고 발표했다. 아울러 엔비디아 H100 기반 DGX 클라우드 플랫폼은 이제 구글 클라우드에서 정식으로 사용할 수 있다.
또한 구글은 구글 쿠버네티스 엔진에 NIM 추론 마이크로서비스가 통합된다고 밝혔다. NIM은 기업에서 생성형 AI 배포 속도를 높이고, 원활하고 확장 가능한 AI 추론을 지원한다. 이와 함께, 양사는 엔비디아 GPU와 엔비디아 H100 그리고 L4 텐서 코어 GPU 기반의 버텍스 AI 인스턴스에서 고성능의 머신러닝 프레임워크인 JAX를 지원한다고 발표했다.

마이크로소프트는 엔비디아 ‘그레이스 블랙웰 GB200’과 ‘퀀텀-X800 인피니밴드’ 네트워킹 구성을 애저에 도입할 계획이라고 밝혔다. 또한 마이크로소프트는 엔비디아 H100 NVL 플랫폼에 기반한 애저 NC H100 v5 VM(virtual machine)의 정식 출시를 발표했다.
NC 시리즈 VM은 미드레인지 훈련과 추론을 위해 설계됐고, 고객들에게 1개에서 2개의 엔비디아 H100 94GB PCIe 텐서 코어 GPU로 구성된 두 등급의 VM을 제공한다. 또한 엔비디아 멀티 인스턴스 GPU(MIG) 기술을 지원해, 각 GPU를 최대 7개 인스턴스로 분할할 수 있어 다양한 AI 워크로드를 위한 유연성을 제공한다.
이와 함께, 마이크로소프트는 의료와 생명 과학 분야를 위해 애저의 강력한 성능을 엔비디아 DGX 클라우드와 엔비디아 클라라 마이크로서비스 제품군과 함께 활용할 수 있게 제공한다고 밝혔다. 또한 마이크로소프트는 엔비디아의 ‘옴니버스 클라우드’ API를 올해 말 애저에서 제공할 예정이며, 엔비디아 GPU와 엔비디아 트리톤 추론 서버(Triton Inference Server)는 마이크로소프트 365용 코파일럿에서 AI 추론 예측을 지원한다고 소개했다. NIM 추론 마이크로서비스도 애저 AI에 도입돼, AI 배포 가속화를 지원할 예정이다.

오라클, 엔비디아와 ‘소버린 AI’ 솔루션 위한 협력 확대

엔비디아와 오라클은 고객들에 소버린 AI 솔루션을 제공하기 위해 협력을 확대한다고 발표했다. 오라클의 분산형 클라우드, AI 인프라와 생성형 AI 서비스는 엔비디아의 가속 컴퓨팅과 생성형 AI 소프트웨어와 결합해 정부와 기업이 국가 또는 조직의 안전한 시설 안에서 클라우드 서비스를 실행할 수 있는 ‘AI 팩토리’를 구축할 수 있도록 지원한다.
오라클 엔터프라이즈 AI는 OCI(오라클 클라우드 인프라스트럭처) 전용 리전, 오라클 알로이, 오라클 EU 소버린 클라우드, 오라클 정부 클라우드에 배포 가능하다. 26개국 66개 클라우드 리전에서 고객들은 100개 이상의 클라우드와 AI 서비스에 액세스할 수 있다. 양사의 통합 솔루션은 퍼블릭 클라우드 또는 특정 위치의 고객 데이터센터에 유연한 운영 제어를 통해 배포할 수 있다.
또한 오라클은 최신 엔비디아 그레이스 블랙웰 컴퓨팅 플랫폼을 OCI 슈퍼클러스터와 OCI 컴퓨트에 활용할 계획이다. OCI 컴퓨트에는 엔비디아 GB200 그레이스 블랙웰 슈퍼칩과 엔비디아 블랙웰 B200 텐서 코어 GPU가 모두 탑재될 예정이다. 또한 검색 증강 생성(RAG) 추론 배포를 위한 엔비디아 네모 리트리버를 포함한 엔비디아 NIM과 쿠다-X 마이크로서비스도 활용된다.
‘엔비디아 DGX 클라우드 온 OCI’에도 엔비디아 그레이스 블랙웰이 추가돼, 고객들에 ‘GB200 NVL72’ 기반 인스턴스를 제공한다. 전체 DGX 클라우드 클러스터 구축에는 2만개 이상의 GB200 가속기와 엔비디아 CX8 인피니밴드 네트워킹이 포함돼 확장성과 성능이 뛰어난 클라우드 인프라를 제공한다는 계획이다.
권용만 기자 yongman.kwon@chosunbiz.com

기자의 다른기사

저작권자 © IT조선 무단전재 및 재배포 금지

관련기사

SK하이닉스, 엔비디아 'GTC'서 최신 AI 메모리 솔루션 선봬

엔비디아, 비주얼 콘텐츠 제공업체 위한 ‘3D 생성형 AI’ 출시

SK하이닉스, 엔비디아 GTC에서 AI PC용 최고 성능 SSD 신제품 공개

델, 엔비디아 기반 생성형 AI 지원 포트폴리오 강화

레노버, 맞춤형 ‘하이브리드 AI’ 솔루션 공개…“최신 GPU 탑재”

엔비디아, 생성형 AI 최적화 ‘블랙웰’ GPU 발표…“이전 대비 성능 5배 향상”

뉴스이슈






추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
AD 해커스로스쿨 기초인강 전강좌 100% 무료! 운영자 24/02/24 - -
AD 추가 고사장 오픈! 1타 연합 현장모의고사 선착순 신청 운영자 24/04/28 - -
공지 광운대 갤러리 이용 안내 [10] 운영자 21.02.25 3507 1
공지 광운대 캠퍼스 궁금한 늅늅이들을 위해서 잉여력 발산 -1 [41] 티모갤로그로 이동합니다. 12.01.10 38541 49
공지 광운대 캠퍼스 궁금한 늅늅이들을 위해서 잉여력 발산 -2 [41] 티모갤로그로 이동합니다. 12.01.11 22831 29
공지 ★☆ 광운대 주변 음식점 & 카페 정리 (11.01.25) ☆★ [100] ;ㅅ;(128.134) 11.01.25 35832 125
150403 4264t 규모 플랜트 모듈이 베트남에서 미국으로 운송되고 있다. [1] %(117.111) 05.10 25 0
150402 11 ㅇㅇ(211.176) 05.09 21 0
150401 GAA는 트랜지스터의 채널과 게이트가 4면에서 맞닿게 하는 기술로, [2] %(117.111) 05.08 74 0
150400 대만 R&D 센터 설립, 3㎚ 이하 개발 역량..첨단 패키징 설계 기술. %(117.111) 05.08 45 0
150399 ‘패스트트랙 사건’ 검찰이 직접 수사…강제수사 돌입하나? %(117.111) 05.08 40 0
150398 사건발생시?????????? %(117.111) 05.08 21 0
150397 2024년 6월 3일(월)부터 인터넷 방화벽 정책을 변경할 예정입니다. %(117.111) 05.08 38 0
150396 "AMD, 엔비디아보다 AI 수혜 더 클 수도" %(106.102) 05.08 66 0
150395 “SW교육 핵심은 문제를 정의하고 해결하면서 알고리즘을 배우는 데 있다" %(106.102) 05.08 29 0
150394 개방형 OS PC 환경이 갖고 있는 `시장 딜레마` 문제를 해결한다. [1] %(106.102) 05.08 39 0
150393 ☞운영체제(Operating System·OS), 소프트웨어 생태계. [1] %(106.102) 05.08 70 0
150392 경상남도 사천시 우주항공청 임시청사, %(106.102) 05.08 45 0
150391 내년도 공급까지 계약이 끝날 정도로 필수 AI 메모리로 부상했다. %(106.102) 05.08 24 0
150390 나스닥 5대 빅테크가 모두 자체 AI 칩 개발에 나서.. [4] %(106.102) 05.07 57 0
150389 AI는 안전이 가장 중요하다.결코 AI가 거짓말을 하도록 해서는 안 된다 [1] %(106.102) 05.07 45 0
150388 최근 수 년간 이 사이클은 무너졌고, 새 변화에 대비해야 한다는.. [3] %(106.102) 05.07 50 0
150387 언제까지 끌어안은 채..?, 그렇다고 당장 전부 새로운 기술로? [7] %(106.102) 05.07 99 0
150385 미국뿐 아니라 중국 공군 역시 무인 무기 보유에 속도를 내는 상황이다. %(106.102) 05.07 29 0
150384 [전문가 칼럼] 차세대통신 6G 미래상과 7대 기술 목표 %(106.102) 05.07 57 0
150383 “전면 재시공 결론을 내렸다는 것은 어떻게든 입주민들 피해가 없게, %(106.102) 05.07 115 0
150382 머스크는 “2009년에 멍거와 점심 자리에 함께 있었는데, %(106.102) 05.07 45 0
150381 통신사, 5G망 투자 축소 …"자금 여력 없어" %(117.111) 05.06 54 0
150380 엔비디아 GPU의 강점은 범용적인 ‘소프트웨어 스택’ 완성도에도 있다. [1] %(117.111) 05.06 116 0
150379 애플 투자비중 확 줄인 버핏 “그래도 코카콜라보다 낫다” %(117.111) 05.06 84 0
150378 사업 영역을 확대, 전기차 시대에 대응하겠다는 전략이다. [2] %(117.111) 05.06 68 0
150377 합동 보안 조사를 벌인 결과 “기술 유출 혐의가 있다”고 판단해 경찰에 %(117.111) 05.06 58 1
150376 마이크로소프트가 오픈AI를 통해 확보한 인공지능(AI) 기술력을 바탕으로 %(211.36) 05.05 30 0
150375 노스볼트 측은 나트륨 이온 배터리를 통해 단 몇 초 만에 전기차 배터리를 %(211.36) 05.05 42 0
150374 국내 조선업계, 차세대 전기추진선 성장 전망에 원천기술..2024. %(211.36) 05.05 62 0
150373 오는 7월부터는 새로운 혜택을 담은 새 멤버십 제도를 내놓을 계획입니다. %(211.36) 05.05 91 0
150372 자격 요건이 없어 접근이 쉬운 기능사들이 상위권이었다.노후위해 자격증, %(211.36) 05.05 55 0
150371 전환하려면 국가가 이미 은퇴 후 노후 소득을 충분히 보장해주는 것이 전제 [4] %%%%(211.36) 05.05 61 0
150370 자재를 인양하기 위해 만든 가로 4m, 세로 7m 크기공간으로, 지하부 %(211.36) 05.05 62 0
150369 AI로 인해 삼성전자의 절대 우위 영역인 낸드까지 흑자로 돌아서며 상황은 [1] %(211.36) 05.05 105 0
150368 "꽃피운 반도체의 봄"…삼성전자,반도체·갤럭시S24 호조로 영업익 10배 %(211.36) 05.05 42 0
150367 낸드플래시도 '역대급' 반전 드라마[삼성전자, 반도체 승부수②] [1] %(117.111) 05.05 48 0
150366 TSMC는 최근 미 캘리포니아주 샌타클래라에서 열린 기술 콘퍼런스에서, %(117.111) 05.05 59 0
150365 엔비디아·AMD·MS도 DPU(서버최적화가속기) 기술 확보 경쟁,2024 %(117.111) 05.05 59 0
150364 최근 AI가 만든 자신의 딥페이크 이미지를 봤다며, 부작용을 우려.. [3] %(117.111) 05.05 81 0
150363 MAY THE 4TH BE WITH YOU, AMERICA.2024. %(211.36) 05.05 25 0
150362 저렴하고 사용이 간편한 신속 면역진단방법이 중요한 역할을 하였습니다. %(211.36) 05.05 48 0
150361 효소면역측정법(ELISA) %(211.36) 05.05 31 0
150360 혈액 내에 포함된 지카 바이러스 RNA를 핵산 추출하고, 정제 과정 없이 %(211.36) 05.05 27 0
150359 Taking care of their yards, eliminating %(211.36) 05.05 31 0
150358 “감염 레벨을 극적으로 줄일 수 있는 강력하고 유용한 도구이며,2016. [1] %(211.36) 05.05 43 0
150357 브라질 노동고용부에 따르면 특히 산업, 토목 및 서비스 부문에서,2015 %(211.36) 05.05 30 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2