Jump to content

Huawei Ascend 910: NVIDIA-ს ხელოვნური ინტელექტის პლატფორმის ჩინური ალტერნატივა


Recommended Posts

კონფერენცია Hot Chips 31-ზე კომპანია Huawei-მ წარადგინა მსოფლიოში ერთ-ერთი უმძლავრესი პროცესორი ხელოვნური ინტელექტის ბაზაზე - Ascend 910. ამგვარი პროცესორები ნებისმიერი მწარმოებლისთვის მიღწევაა, თუმცა ყველა ვერ ბედავს თავისი ქმნილება მოწინავე NVIDIA-სა და INTEL Xeon-ს შეადაროს. NVIDIA-მ ერთ-ერთმა პირველმა დაიწყო თავისი გრაფიკული არქიტექტურის მოდიფიკაცია მანქანური სწავლების სფეროში გამოსაყენებლად.

image.png

Huawei მიიჩნევს, რომ საკუთარი პლატფორმებით თავისუფლად შეუძლია გახდეს NVIDIA-ს ალტერნატივა სულ მცირე ჩინურ ბაზარზე მაინც. იგი აპირებს გამოუშვას მილიონობით პროცესორი მანქანური სწავლებისათვის.

ზემოთხსენებულ პროცესორ Ascend 910-ს უშვებს კომპანია TSMC  მეორე თაობის 7-ნანომეტრიანი ტექნოლოგიით (7+ EUV). ეს ტექნოპროცესი ხასიათდება EUV სკანერების გამოყენების მეშვეობით ჩიპის რამდენიმე შრის დასამზადებლად. კონფერენციაზე Huawei-Ascend 910 შეადარა NVIDIA Volta-ს, რომელიც გამოშვებულია TSMC-ს მიერ 12-ნანომეტრიანი FinFET ტექნოლოგიით. ზედა ფოტოზე წარმოდგენილია Ascend 910-სა და Volta-ს მონაცემები 12-ნანომეტრიანი ნორმალიზებით. კრისტალზე Huawei-ს პროდუქტის ფართობი 2.5-ჯერ მეტია NVIDIA-ზე, თუმცა Ascend 910-ის წარმადობა 4.7-ჯერ მაღალია NVIDIA-ს არქიტექტურა Volta-ზე.

image.png

Huawei თავის არქიტექტურას მასშტაბირების მეტად მაღალ დონეს მიაწერს. DaVinci-ბირთვები, რომლებიც საფუძვლად უდევს Ascend 910-, შესაძლებელია გამოიშვას სკალური ოპერირების სიდიდეების კონფიგურაციებად (16), ვექტორებად (16 x 16) და მატრიცული სახით (16 × 16 × 16). ეს კი იმას ნიშნავს, რომ მოცემული არქიტექტურა და DaVinci ბირთვები გამოჩნდება ინტერნეტ-ნივთების აბსოლუტურად ყველა სპექტრში.

image.png

Ascend 910-ისთვის განკუთვნილი DaVinci ბირთვი მაქსიმალურ კონფიგურაციაში შეიცავს 4096 Cube ბლოკს ნაწილობრივი გამოთვლისთვის (FP16). ბირთვის შემადგენლობაში ასევე შედის სკალარული და ვექტორული სიდიდეების გამომთვლელი სპეციალიზებული ბლოკები. 32 DaVinci ბირთვის მქონე Ascend-ის უმაღლესი წარმადობა FP16 გამოთვლებში 256 ტერაფლოპსს აღწევს, მთელი რიცხვების გამოთვლებში კი - 512 ტერაფლოპსს. ამ დროს მოხმარებული ენერგია 350 ვატს შეადგენს. ტენსორული ბირთვების მქონე NVIDIA-ს ალტერნატიული პროდუქტის მაჩვენებელი მაქსიმუმ 125 ტერაფლოპსია FP16-ზე.

image.png

DaVinci ბირთვების გარდა Ascend 910-ის კრისტალზე კიდევ რამდენიმე ბლოკია, მათ შორის მეხსიერების კონტროლერი HBM2 და 128-არხიანი ძრავი ვიდეონაკადების დეკოდირებისთვის. მძლავრი ჩიპი input/output ოპერაციებისათვის - Nimbus V3 - ცალკე კრისტალზეა წარმოდგენილია. ჯამში ყველა კრისტალის ფართობი 1228 მმ2-ს შეადგენს.

2048 ნოუდისგან შემდგარი კლასტერების ჯამური წარმადობა 512 პეტაფლოპსია FP16 ოპერაციებში. NVIDIA DGX Superpod-ის მაჩვენებელი 96 ნოუდისგან შემდგარი ნაკრების შემთხვევაში 9.4 პეტაფლოპსია. განსხვავება შესამჩნევია, თუმცა განვითარების სტიმულს იძლევა.

https://servernews.ru/993066

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.