Magdalena Posted August 29, 2019 Posted August 29, 2019 კონფერენცია Hot Chips 31-ზე კომპანია Huawei-მ წარადგინა მსოფლიოში ერთ-ერთი უმძლავრესი პროცესორი ხელოვნური ინტელექტის ბაზაზე - Ascend 910. ამგვარი პროცესორები ნებისმიერი მწარმოებლისთვის მიღწევაა, თუმცა ყველა ვერ ბედავს თავისი ქმნილება მოწინავე NVIDIA-სა და INTEL Xeon-ს შეადაროს. NVIDIA-მ ერთ-ერთმა პირველმა დაიწყო თავისი გრაფიკული არქიტექტურის მოდიფიკაცია მანქანური სწავლების სფეროში გამოსაყენებლად. Huawei მიიჩნევს, რომ საკუთარი პლატფორმებით თავისუფლად შეუძლია გახდეს NVIDIA-ს ალტერნატივა სულ მცირე ჩინურ ბაზარზე მაინც. იგი აპირებს გამოუშვას მილიონობით პროცესორი მანქანური სწავლებისათვის. ზემოთხსენებულ პროცესორ Ascend 910-ს უშვებს კომპანია TSMC მეორე თაობის 7-ნანომეტრიანი ტექნოლოგიით (7+ EUV). ეს ტექნოპროცესი ხასიათდება EUV სკანერების გამოყენების მეშვეობით ჩიპის რამდენიმე შრის დასამზადებლად. კონფერენციაზე Huawei-მ Ascend 910 შეადარა NVIDIA Volta-ს, რომელიც გამოშვებულია TSMC-ს მიერ 12-ნანომეტრიანი FinFET ტექნოლოგიით. ზედა ფოტოზე წარმოდგენილია Ascend 910-სა და Volta-ს მონაცემები 12-ნანომეტრიანი ნორმალიზებით. კრისტალზე Huawei-ს პროდუქტის ფართობი 2.5-ჯერ მეტია NVIDIA-ზე, თუმცა Ascend 910-ის წარმადობა 4.7-ჯერ მაღალია NVIDIA-ს არქიტექტურა Volta-ზე. Huawei თავის არქიტექტურას მასშტაბირების მეტად მაღალ დონეს მიაწერს. DaVinci-ბირთვები, რომლებიც საფუძვლად უდევს Ascend 910-ს, შესაძლებელია გამოიშვას სკალური ოპერირების სიდიდეების კონფიგურაციებად (16), ვექტორებად (16 x 16) და მატრიცული სახით (16 × 16 × 16). ეს კი იმას ნიშნავს, რომ მოცემული არქიტექტურა და DaVinci ბირთვები გამოჩნდება ინტერნეტ-ნივთების აბსოლუტურად ყველა სპექტრში. Ascend 910-ისთვის განკუთვნილი DaVinci ბირთვი მაქსიმალურ კონფიგურაციაში შეიცავს 4096 Cube ბლოკს ნაწილობრივი გამოთვლისთვის (FP16). ბირთვის შემადგენლობაში ასევე შედის სკალარული და ვექტორული სიდიდეების გამომთვლელი სპეციალიზებული ბლოკები. 32 DaVinci ბირთვის მქონე Ascend-ის უმაღლესი წარმადობა FP16 გამოთვლებში 256 ტერაფლოპსს აღწევს, მთელი რიცხვების გამოთვლებში კი - 512 ტერაფლოპსს. ამ დროს მოხმარებული ენერგია 350 ვატს შეადგენს. ტენსორული ბირთვების მქონე NVIDIA-ს ალტერნატიული პროდუქტის მაჩვენებელი მაქსიმუმ 125 ტერაფლოპსია FP16-ზე. DaVinci ბირთვების გარდა Ascend 910-ის კრისტალზე კიდევ რამდენიმე ბლოკია, მათ შორის მეხსიერების კონტროლერი HBM2 და 128-არხიანი ძრავი ვიდეონაკადების დეკოდირებისთვის. მძლავრი ჩიპი input/output ოპერაციებისათვის - Nimbus V3 - ცალკე კრისტალზეა წარმოდგენილია. ჯამში ყველა კრისტალის ფართობი 1228 მმ2-ს შეადგენს. 2048 ნოუდისგან შემდგარი კლასტერების ჯამური წარმადობა 512 პეტაფლოპსია FP16 ოპერაციებში. NVIDIA DGX Superpod-ის მაჩვენებელი 96 ნოუდისგან შემდგარი ნაკრების შემთხვევაში 9.4 პეტაფლოპსია. განსხვავება შესამჩნევია, თუმცა განვითარების სტიმულს იძლევა. https://servernews.ru/993066 Quote
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.