Magdalena Posted August 29, 2019 Share Posted August 29, 2019 კონფერენცია Hot Chips 31-ზე კომპანია Huawei-მ წარადგინა მსოფლიოში ერთ-ერთი უმძლავრესი პროცესორი ხელოვნური ინტელექტის ბაზაზე - Ascend 910. ამგვარი პროცესორები ნებისმიერი მწარმოებლისთვის მიღწევაა, თუმცა ყველა ვერ ბედავს თავისი ქმნილება მოწინავე NVIDIA-სა და INTEL Xeon-ს შეადაროს. NVIDIA-მ ერთ-ერთმა პირველმა დაიწყო თავისი გრაფიკული არქიტექტურის მოდიფიკაცია მანქანური სწავლების სფეროში გამოსაყენებლად. Huawei მიიჩნევს, რომ საკუთარი პლატფორმებით თავისუფლად შეუძლია გახდეს NVIDIA-ს ალტერნატივა სულ მცირე ჩინურ ბაზარზე მაინც. იგი აპირებს გამოუშვას მილიონობით პროცესორი მანქანური სწავლებისათვის. ზემოთხსენებულ პროცესორ Ascend 910-ს უშვებს კომპანია TSMC მეორე თაობის 7-ნანომეტრიანი ტექნოლოგიით (7+ EUV). ეს ტექნოპროცესი ხასიათდება EUV სკანერების გამოყენების მეშვეობით ჩიპის რამდენიმე შრის დასამზადებლად. კონფერენციაზე Huawei-მ Ascend 910 შეადარა NVIDIA Volta-ს, რომელიც გამოშვებულია TSMC-ს მიერ 12-ნანომეტრიანი FinFET ტექნოლოგიით. ზედა ფოტოზე წარმოდგენილია Ascend 910-სა და Volta-ს მონაცემები 12-ნანომეტრიანი ნორმალიზებით. კრისტალზე Huawei-ს პროდუქტის ფართობი 2.5-ჯერ მეტია NVIDIA-ზე, თუმცა Ascend 910-ის წარმადობა 4.7-ჯერ მაღალია NVIDIA-ს არქიტექტურა Volta-ზე. Huawei თავის არქიტექტურას მასშტაბირების მეტად მაღალ დონეს მიაწერს. DaVinci-ბირთვები, რომლებიც საფუძვლად უდევს Ascend 910-ს, შესაძლებელია გამოიშვას სკალური ოპერირების სიდიდეების კონფიგურაციებად (16), ვექტორებად (16 x 16) და მატრიცული სახით (16 × 16 × 16). ეს კი იმას ნიშნავს, რომ მოცემული არქიტექტურა და DaVinci ბირთვები გამოჩნდება ინტერნეტ-ნივთების აბსოლუტურად ყველა სპექტრში. Ascend 910-ისთვის განკუთვნილი DaVinci ბირთვი მაქსიმალურ კონფიგურაციაში შეიცავს 4096 Cube ბლოკს ნაწილობრივი გამოთვლისთვის (FP16). ბირთვის შემადგენლობაში ასევე შედის სკალარული და ვექტორული სიდიდეების გამომთვლელი სპეციალიზებული ბლოკები. 32 DaVinci ბირთვის მქონე Ascend-ის უმაღლესი წარმადობა FP16 გამოთვლებში 256 ტერაფლოპსს აღწევს, მთელი რიცხვების გამოთვლებში კი - 512 ტერაფლოპსს. ამ დროს მოხმარებული ენერგია 350 ვატს შეადგენს. ტენსორული ბირთვების მქონე NVIDIA-ს ალტერნატიული პროდუქტის მაჩვენებელი მაქსიმუმ 125 ტერაფლოპსია FP16-ზე. DaVinci ბირთვების გარდა Ascend 910-ის კრისტალზე კიდევ რამდენიმე ბლოკია, მათ შორის მეხსიერების კონტროლერი HBM2 და 128-არხიანი ძრავი ვიდეონაკადების დეკოდირებისთვის. მძლავრი ჩიპი input/output ოპერაციებისათვის - Nimbus V3 - ცალკე კრისტალზეა წარმოდგენილია. ჯამში ყველა კრისტალის ფართობი 1228 მმ2-ს შეადგენს. 2048 ნოუდისგან შემდგარი კლასტერების ჯამური წარმადობა 512 პეტაფლოპსია FP16 ოპერაციებში. NVIDIA DGX Superpod-ის მაჩვენებელი 96 ნოუდისგან შემდგარი ნაკრების შემთხვევაში 9.4 პეტაფლოპსია. განსხვავება შესამჩნევია, თუმცა განვითარების სტიმულს იძლევა. https://servernews.ru/993066 Quote Link to comment Share on other sites More sharing options...
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.