Magdalena Posted March 21 Share Posted March 21 Nvidia-მ კონფერენცია GTC 2024-ზე წარადგინა ახალი თაობის ხელოვნური ინტელექტის ამაჩქარებლები GPU-ების Blackwell არქიტექტურით. კომპანიის თქმით, მომავალი ხელოვნური ინტელექტის ამაჩქარებლები შესაძლებელს გახდის შექმნას კიდევ უფრო დიდი ნეიროქსელები, მათ შორის ტრილიონი პარამეტრის მქონე ენის დიდ მოდელებთან (LLM) მუშაობისთვის. ამავე დროს, ეს ამაჩქარებლების იქნება 25-ჯერ უფრო ენერგოეფექტური და ეკონომიური Hopper-თან შედარებით. ფოტოს წყარო: Nvidia გრაფიკული პროცესორის არქიტექტურა Blackwell ამერიკელ მათემატიკოს დევიდ ჰაროლდ ბლექველის სახელს ატარებს და მოიცავს კომპიუტერული აჩქარების ინოვაციურ ტექნოლოგიებს, რომლებიც საშუალებას იძლევა მიღწეულ იქნას გარღვევები მონაცემთა დამუშავებაში, ინჟინრულ მოდილირებაში, ელექტრონიკის დაპროექტების ავტომატიზაციაში, კომპიუტერის დახმარებით წამლების შექმნაში, კვანტურ გამოთვლებსა და გენერაციულ ხელოვნურ ინტელექტში. Nvidia განსაკუთრებულ აქცენტს აკეთებს ამ უკანასკნელზე: „გენერაციული ხელოვნური ინტელექტი არის ჩვენი დროის განმსაზღვრელი ტექნოლოგია. Blackwell GPU - ეს არის ძრავი ახალი ინდუსტრიული რევოლუციისთვის“, - განაცხადა Nvidia-ს აღმასრულებელმა დირექტორმა ჯენსენ ჰუანგმა (Jensen Huang) პრეზენტაციის ფარგლებში. კომპანია ზედმეტი მოკრძალების გარეშე უწოდებს Nvidia B200 გრაფიკულ პროცესორს მსოფლიოში ყველაზე ძლიერ ჩიპს. FP4 და FP8 გამოთვლებში ახალი GPU უზრუნველყოფს 20 და 10 Pflops-მდე წარმადობას, შესაბამისად. ახალი GPU შედგება ორი კრისტალისგან, რომლებიც იწარმოება TSMC 4NP 4-ნანომეტრიანი ტექნოპროცესის სპეციალური ვერსიით და აერთიანებს 2.5D CoWoS-L შეფუთვას. ეს არის Nvidia-ს პირველი GPU ჩიპლეტური განლაგებით. ჩიპები დაკავშირებულია NV-HBI სალტეთი, რომლის სიჩქარეა 10 ტბ/წმ და მუშაობს როგორც ერთი GPU. საერთო ჯამში, ახალ ჩიპს 208 მილიარდი ტრანზისტორი აქვს. Blackwell-ის ერთ-ერთი კრისტალი - GPU-ში ასეთი ორია წარმოდგენილი GPU-ის კრისტალების გვერდებზე მოცემულია HBM3e მეხსიერების რვა სტეკი ჯამური 192 გბ მოცულობით. მისი გამტარუნარიანობა აღწევს 8 ტბ/წმ-ს. რამდენიმე Blackwell ამაჩქარებლის ერთ სისტემაში გაერთიანების მიზნით ახალ GPU-ს აქვს მეხუთე თაობის NVLink ინტერფეისის მხარდაჭერა, რომელიც უზრუნველყოფს 1.8 ტბ/წმ-მდე სიჩქარეს ორივე მიმართულებით. ამ ინტერფეისის (NVSwitch 7.2T შეცვლა) გამოყენებით 576-მდე GPU შეიძლება გაერთიანდეს. B200-ის უმაღლესი წარმადობის ერთ-ერთი მთავარი წყაროა ახალი Tensor ბირთვები და მეორე თაობის მექანიზმი Transformer Engine. ამ უკანასკნელმა „ისწავლა“ გარკვეული ამოცანებისთვის საჭირო გაანგარიშების სიზუსტის უფრო დეტალურად შერჩევა, რაც გავლენას ახდენს ნეიროქსელის როგორც სწავლების სიჩქარეზე, ასევე მხარდაჭერილი LLM-ების მაქსიმალურ მოცულობაზე. Nvidia გვთავაზობს ხელოვნური ინტელექტის სწავლებას FP8 ფორმატში, ხოლო FP4 საკმარისია განსწავლული ნეიროქსელების გასაშვებად. ასევე გასათვალისწინებელია, რომ Blackwell-ზე მხარდაჭერილია მრავალფეროვანი ფორმატები, მათ შორის FP4, FP6, FP8, INT8, BF16, FP16, TF32 და FP64. ახალი არქიტექტურის ფლაგმანური ამაჩქარებელი იქნება Nvidia Grace Blackwell Superchip, რომელიც აერთიანებს B200 GPU-ს და Nvidia Grace ცენტრალურ Arm პროცესორს 72 Neoverse V2 ბირთვით. ეს ამაჩქარებელი არის სერვერის თაროს სიგანის ნახევრის ზომის და აქვს 2.7 კვტ-მდე TDP. FP4 ოპერაციებში წარმადობა აღწევს 40 Pflops-ს, ხოლო FP8/FP6/INT8 ოპერაციებში ახალ GB200-ს შეუძლია 10 Pflops-ის უზრუნველყოფა. როგორც თავად Nvidia აღნიშნავს, ახალი ჩიპი უზრუნველყოფს წარმადობის 30-ჯერ ზრდას Nvidia H100-თან შედარებით სამუშაო დატვირთვებში, რომელიც დაკავშირებულია ენის დიდ მოდელებთან, ამასთან იგი 25-ჯერ უფრო ეკონომიური და ენერგოეფექტურია. Nvidia-მ ასევე წარმოადგინა სისტემა GB200 NVL72 - ფაქტობრივად, ეს არის სერვერის თარო, რომელიც აერთიანებს 36 Grace Blackwell Superchips-ს და NVSwitch 7.2T წყვილ გადამრთველს. სისტემა მოიცავს 72 B200 Blackwell გრაფიკულ პროცესორს და 36 Grace ცცენტრალურ პროცესორს, რომლებიც დაკავშირებულია მეხუთე თაობის NVLink-ით. სისტემას გააჩნია 13.5 ტბ HBM3e მეხსიერება, ჯამური სიჩქარე - 576 ტბ/წმ-მდე, ხოლო ოპერატიული მეხსიერების საერთო მოცულობა 30 ტბ-ს აღწევს. GB200 NVL72 პლატფორმა მუშაობს როგორც ერთიანი გრაფიკული პროცესორი და უზრუნველყოფს ხელოვნური ინტელექტის 1.4 Eflops (FP4) და 720 Pflops (FP8) წარმადობას. ეს სისტემა გახდება Nvidia-ს უახლესი სუპერკომპიუტერის, DGX SuperPOD-ის სამშენებლო ბლოკი. წინა ფონზე - HGX სისტემა რვა Blackwell-ის. უკან - სუპერჩიპი GB200 და ბოლოს, Nvidia-მ წარადგინა სასერვერო სისტემები HGX B100, HGX B200 და DGX B200. ყველა მათგანს აქვს რვა Blackwell ამაჩქარებელი, რომლებიც ერთმანეთთან არის დაკავშირებული NVLink 5-ით. HGX B100 და HGX B200 სისტემებს არ აქვთ საკუთარი CPU და განსხვავდებიან მხოლოდ ენერგომოხმარებით და, შედეგად, სიმძლავრით. HGX B100 შემოიფარგლება 700 ვატი TDP-ით და უზრუნველყოფს 112 და 56 Pflops-მდე წარმადობას FP4 და FP8/FP6/INT8 ოპერაციებში, შესაბამისად. თავის მხრივ, HGX B200-ს აქვს TDP ვატი W და უზრუნველყოფს 144 და 72 Pflops-მდე წარმადობას FP4 და FP8/FP6/INT8 ოპერაციებში, შესაბამისად. DGX B200 იმეორებს HGX B200-ის წარმადობას, მაგრამ წარმოადგენს სრულ სისტემას წყვილი Intel Xeon Emerald Rapids CPU-ით. Nvidia-ს თანახმად, DGX B200 15-ჯერ უფრო სწრაფია უკვე განსწავლულ „ტრილიონიან“ წინამორბედ მოდელებთან შედარებით. ყველაზე ფართომასშტაბიანი ხელოვნური ინტელექტის სისტემების შესაქმნელად, მათ შორის ერთ მონაცემთა ცენტრში 10 ათასიდან 100 ათას GB200 ამაჩქარებლის გაერთიანებისთვის Nvidia გვთავაზობს მათ კლასტერებად გაერთიანებას Nvidia Quantum-X800 InfiniBand და Spectrum-X800 Ethernet ქსელური ინტერფეისების გამოყენებით. ისინი ასევე დაანონსდა ახლახანს და უზრუნველყოფენ გაფართოებულ ქსელურ შესაძლებლობებს 800 გბ/წმ-მდე სიჩქარით. ბევრი კომპანია მალე წარადგენს Nvidia B200-ზე დამყარებულ საკუთარ სისტემებს, მათ შორის იქნება Aivres, ASRock Rack, ASUS, Eviden, Foxconn, GIGABYTE, Inventec, Pegatron, QCT, Wistron, Wiwynn და ZT Systems. ასევე Nvidia GB200, როგორც Nvidia DGX Cloud პლატფორმის ნაწილი მიმდინარე წელს მოგვიანებით ხელმისაწვდომი გახდება ქლაუდის ძირითადი პროვაიდერებისგან, რომელთა შორისაა AWS, Google Cloud და Oracle Cloud. https://tinyurl.com/53325mf8 1 Quote Link to comment Share on other sites More sharing options...
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.