Jump to content

NVIDIA-მ წარადგინა მსოფლიოში ყველაზე მძლავრი ჩიპი - Blackwell B200, რომელიც გზას გაუხსნის გიგანტურ ნეიროქსელებს


Recommended Posts

Nvidia-მ კონფერენცია GTC 2024-ზე წარადგინა ახალი თაობის ხელოვნური ინტელექტის ამაჩქარებლები GPU-ების Blackwell არქიტექტურით. კომპანიის თქმით, მომავალი ხელოვნური ინტელექტის ამაჩქარებლები შესაძლებელს გახდის შექმნას კიდევ უფრო დიდი ნეიროქსელები, მათ შორის ტრილიონ პარამეტრის მქონე ენის დიდ მოდელებთან (LLM) მუშაობისთვის. ამავე დროს, ეს ამაჩქარებლების იქნება 25-ჯერ უფრო ენერგოეფექტური და ეკონომიური Hopper-თან შედარებით. 

image.jpeg 

ფოტოს წყარო: Nvidia 

გრაფიკული პროცესორის არქიტექტურა Blackwell ამერიკელ მათემატიკოს დევიდ ჰაროლდ ბლექველის სახელს ატარებს და მოიცავს კომპიუტერული აჩქარების ინოვაციურ ტექნოლოგიებს, რომლებიც საშუალებას იძლევა მიღწეულ იქნას გარღვევებ მონაცემთა დამუშავებაში, ინჟინრულ მოდილირებაში, ელექტრონიკის დაპროექტების ავტომატიზაციაში, კომპიუტერის დახმარებით წამლების შექმნაში, კვანტურ გამოთვლებსა და გენერაციულ ხელოვნურ ინტელექტში. Nvidia განსაკუთრებულ აქცენტს აკეთებს ამ უკანასკნელზე: „გენერაციული ხელოვნური ინტელექტი არის ჩვენი დროის განმსაზღვრელი ტექნოლოგია. Blackwell GPU - ეს არის ძრავ ახალი ინდუსტრიული რევოლუციისთვის, - განაცხადა Nvidia-ს აღმასრულებელმა დირექტორმა ჯენსენ ჰუანგმა (Jensen Huang) პრეზენტაციის ფარგლებში. 

კომპანია ზედმეტი მოკრძალების გარეშე უწოდებს Nvidia B200 გრაფიკულ პროცესორს მსოფლიოში ყველაზე ძლიერ ჩიპს. FP4 და FP8 გამოთვლებში ახალი GPU უზრუნველყოფს 20 და 10 Pflops-მდე წარმადობას, შესაბამისად. ახალი GPU შედგება ორი კრისტალისგან, რომლებიც იწარმოება TSMC 4NP 4-ნანომეტრიანი ტექნოპროცესის სპეციალური ვერსიით და აერთიანებს 2.5D CoWoS-L შეფუთვას. ეს არის Nvidia-ს პირველი GPU ჩიპლეტური განლაგებით. ჩიპები დაკავშირებულია NV-HBI სალტეთი, რომლის სიჩქარეა 10 ტბ/წმ და მუშაობს როგორც ერთი GPU. საერთო ჯამში, ახალ ჩიპს 208 მილიარდი ტრანზისტორი აქვს. 

image.jpeg 

Blackwell-ის ერთ-ერთი კრისტალი - GPU-ში ასეთი ორია წარმოდგენილი 

GPU-ის კრისტალების გვერდებზე მოცემულია HBM3e მეხსიერების რვა სტეკი ჯამური 192 გბ მოცულობით. მისი გამტარუნარიანობა აღწევს 8 ტბ/წმ-ს. რამდენიმე Blackwell ამაჩქარებლის ერთ სისტემაში გაერთიანების მიზნით ახალ GPU- აქვს მეხუთე თაობის NVLink ინტერფეისის მხარდაჭერა, რომელიც უზრუნველყოფს 1.8 ტბ/წმ-მდე სიჩქარეს ორივე მიმართულებით. ამ ინტერფეისის (NVSwitch 7.2T შეცვლა) გამოყენებით 576-მდე GPU შეიძლება გაერთიანდეს. 

B200-ის უმაღლესი წარმადობის ერთ-ერთი მთავარი წყაროახალი Tensor ბირთვები და მეორე თაობის მექანიზმი Transformer Engine. ამ უკანასკნელმა ისწავლა გარკვეული ამოცანებისთვის საჭირო გაანგარიშების სიზუსტის უფრო დეტალურად შერჩევა, რაც გავლენას ახდენს ნეიროქსელის როგორც სწვლების სიჩქარეზე, ასევე მხარდაჭერილი LLM-ების მაქსიმალურ მოცულობაზე. Nvidia გვთავაზობს ხელოვნური ინტელექტის სწავლებას FP8 ფორმატში, ხოლო FP4 საკმარისია განსწავლული ნეიროქსელების გასაშვებად. ასევე გასათვალისწინებელია, რომ Blackwell-ზე მხარდაჭერილია მრავალფეროვან ფორმატები, მათ შორის FP4, FP6, FP8, INT8, BF16, FP16, TF32 და FP64. 

image.jpeg 

ახალი არქიტექტურის ფლაგმანურამაჩქარებელი იქნება Nvidia Grace Blackwell Superchip, რომელიც აერთიანებს B200 GPU-ს და Nvidia Grace ცენტრალურ Arm პროცესორს 72 Neoverse V2 ბირთვით. ეს ამაჩქარებელი არის სერვერის თაროს სიგანის ნახევრის ზომის და აქვს 2.7 კვტ-მდე TDP. FP4 ოპერაციებში წარმადობა აღწევს 40 Pflops-ს, ხოლო FP8/FP6/INT8 ოპერაციებში ახალ GB200-ს შეუძლია 10 Pflops-ის უზრუნველყოფა. 

როგორც თავად Nvidia აღნიშნავს, ახალი ჩიპი უზრუნველყოფს წარმადობის 30-ჯერ ზრდას Nvidia H100-თან შედარებით სამუშაო დატვირთვებში, რომელიც დაკავშირებულია ენის დიდ მოდელებთან, ამასთან იგი 25-ჯერ უფრო ეკონომიური და ენერგოეფექტურია. 

image.jpeg 

Nvidia-მ ასევე წარმოადგინა სისტემა GB200 NVL72 - ფაქტობრივად, ეს არის სერვერის თარო, რომელიც აერთიანებს 36 Grace Blackwell Superchips-ს და NVSwitch 7.2T წყვილ გადამრთველს. სისტემა მოიცავს 72 B200 Blackwell გრაფიკულ პროცესორს და 36 Grace ცცენტრალურ პროცესორს, რომლებიც დაკავშირებულია მეხუთე თაობის NVLink-ით. სისტემას გააჩნია 13.5 ტბ HBM3e მეხსიერება, ჯამური სიჩქარე - 576 ტბ/წმ-მდე, ხოლო ოპერატიული მეხსიერების საერთო მოცულობა 30 ტბ-ს აღწევს. 

image.jpeg 

GB200 NVL72 პლატფორმა მუშაობს როგორც ერთიანი გრაფიკული პროცესორი და უზრუნველყოფს ხელოვნური ინტელექტის 1.4 Eflops (FP4) და 720 Pflops (FP8) წარმადობას. ეს სისტემა გახდება Nvidia-ს უახლესი სუპერკომპიუტერის, DGX SuperPOD-ის სამშენებლო ბლოკი. 

image.jpeg 

წინა ფონზე - HGX სისტემა რვა Blackwell-ის. უკან - სუპერჩიპი GB200 

და ბოლოს, Nvidia-მ წაადგინა სასერვერო სისტემები HGX B100, HGX B200 და DGX B200. ყველა მათგანს აქვს რვა Blackwell ამაჩქარებელ, რომლებიც ერთმანეთთან არის დაკავშირებული NVLink 5-ით. HGX B100 და HGX B200 სისტემებს არ აქვთ საკუთარი CPU და განსხვავდებიან მხოლოდ ენერგმოხმარებით და, შედეგად, სიმძლავრით. HGX B100 შემოიფარგლება 700 ვატი TDP-ით და უზრუნველყოფს 112 და 56 Pflops-მდე წარმადობას FP4 და FP8/FP6/INT8 ოპერაციებში, შესაბამისად. თავის მხრივ, HGX B200-ს აქვს TDP ვატი W და უზრუნველყოფს 144 და 72 Pflops-მდე წარმადობას FP4 და FP8/FP6/INT8 ოპერაციებში, შესაბამისად. 

DGX B200 იმეორებს HGX B200-ის წარმადობას, მაგრამ წარმოადგენს სრულ სისტემა წყვილი Intel Xeon Emerald Rapids CPU-ით. Nvidia-ს თანახმად, DGX B200 15-ჯერ უფრო სწრაფია უკვე განსწავლულ ტრილიონიანწინამორბედ მოდელებთან შედარებით. 

image.jpeg 

ყველაზე ფართომასშტაბიანი ხელოვნური ინტელექტის სისტემების შესაქმნელად, მათ შორის ერთ მონაცემთა ცენტრში 10 ათასიდან 100 ათას GB200 ამაჩქარებლის გაერთიანებისთვის Nvidia გვთავაზობს მათ კლასტერებად გაერთიანებას Nvidia Quantum-X800 InfiniBand და Spectrum-X800 Ethernet ქსელური ინტერფეისების გამოყენებით. ისინი ასევე დაანონსდა ახლახანს და უზრუნველყოფენ გაფართოებულ ქსელურ შესაძლებლობებს 800 გბ/წმ-მდე სიჩქარით. 

ბევრი კომპანია მალე წარადგენს Nvidia B200-ზე დამყარებულ საკუთარ სისტემებს, მათ შორის იქნება Aivres, ASRock Rack, ASUS, Eviden, Foxconn, GIGABYTE, Inventec, Pegatron, QCT, Wistron, Wiwynn და ZT Systems. ასევე Nvidia GB200, როგორც Nvidia DGX Cloud პლატფორმის ნაწილი მიმდინარე წელს მოგვიანებით ხელმისაწვდომი გახდება ქლაუდის ძირითადი პროვაიდერებისგან, რომელთა შორისაა AWS, Google Cloud და Oracle Cloud. 

  • Thanks 1
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.