Jump to content

Recommended Posts

Posted

კონფერენცია Hot Chips 31-ზე კომპანია Huawei-მ წარადგინა მსოფლიოში ერთ-ერთი უმძლავრესი პროცესორი ხელოვნური ინტელექტის ბაზაზე - Ascend 910. ამგვარი პროცესორები ნებისმიერი მწარმოებლისთვის მიღწევაა, თუმცა ყველა ვერ ბედავს თავისი ქმნილება მოწინავე NVIDIA-სა და INTEL Xeon-ს შეადაროს. NVIDIA-მ ერთ-ერთმა პირველმა დაიწყო თავისი გრაფიკული არქიტექტურის მოდიფიკაცია მანქანური სწავლების სფეროში გამოსაყენებლად.

image.png

Huawei მიიჩნევს, რომ საკუთარი პლატფორმებით თავისუფლად შეუძლია გახდეს NVIDIA-ს ალტერნატივა სულ მცირე ჩინურ ბაზარზე მაინც. იგი აპირებს გამოუშვას მილიონობით პროცესორი მანქანური სწავლებისათვის.

ზემოთხსენებულ პროცესორ Ascend 910-ს უშვებს კომპანია TSMC  მეორე თაობის 7-ნანომეტრიანი ტექნოლოგიით (7+ EUV). ეს ტექნოპროცესი ხასიათდება EUV სკანერების გამოყენების მეშვეობით ჩიპის რამდენიმე შრის დასამზადებლად. კონფერენციაზე Huawei-Ascend 910 შეადარა NVIDIA Volta-ს, რომელიც გამოშვებულია TSMC-ს მიერ 12-ნანომეტრიანი FinFET ტექნოლოგიით. ზედა ფოტოზე წარმოდგენილია Ascend 910-სა და Volta-ს მონაცემები 12-ნანომეტრიანი ნორმალიზებით. კრისტალზე Huawei-ს პროდუქტის ფართობი 2.5-ჯერ მეტია NVIDIA-ზე, თუმცა Ascend 910-ის წარმადობა 4.7-ჯერ მაღალია NVIDIA-ს არქიტექტურა Volta-ზე.

image.png

Huawei თავის არქიტექტურას მასშტაბირების მეტად მაღალ დონეს მიაწერს. DaVinci-ბირთვები, რომლებიც საფუძვლად უდევს Ascend 910-, შესაძლებელია გამოიშვას სკალური ოპერირების სიდიდეების კონფიგურაციებად (16), ვექტორებად (16 x 16) და მატრიცული სახით (16 × 16 × 16). ეს კი იმას ნიშნავს, რომ მოცემული არქიტექტურა და DaVinci ბირთვები გამოჩნდება ინტერნეტ-ნივთების აბსოლუტურად ყველა სპექტრში.

image.png

Ascend 910-ისთვის განკუთვნილი DaVinci ბირთვი მაქსიმალურ კონფიგურაციაში შეიცავს 4096 Cube ბლოკს ნაწილობრივი გამოთვლისთვის (FP16). ბირთვის შემადგენლობაში ასევე შედის სკალარული და ვექტორული სიდიდეების გამომთვლელი სპეციალიზებული ბლოკები. 32 DaVinci ბირთვის მქონე Ascend-ის უმაღლესი წარმადობა FP16 გამოთვლებში 256 ტერაფლოპსს აღწევს, მთელი რიცხვების გამოთვლებში კი - 512 ტერაფლოპსს. ამ დროს მოხმარებული ენერგია 350 ვატს შეადგენს. ტენსორული ბირთვების მქონე NVIDIA-ს ალტერნატიული პროდუქტის მაჩვენებელი მაქსიმუმ 125 ტერაფლოპსია FP16-ზე.

image.png

DaVinci ბირთვების გარდა Ascend 910-ის კრისტალზე კიდევ რამდენიმე ბლოკია, მათ შორის მეხსიერების კონტროლერი HBM2 და 128-არხიანი ძრავი ვიდეონაკადების დეკოდირებისთვის. მძლავრი ჩიპი input/output ოპერაციებისათვის - Nimbus V3 - ცალკე კრისტალზეა წარმოდგენილია. ჯამში ყველა კრისტალის ფართობი 1228 მმ2-ს შეადგენს.

2048 ნოუდისგან შემდგარი კლასტერების ჯამური წარმადობა 512 პეტაფლოპსია FP16 ოპერაციებში. NVIDIA DGX Superpod-ის მაჩვენებელი 96 ნოუდისგან შემდგარი ნაკრების შემთხვევაში 9.4 პეტაფლოპსია. განსხვავება შესამჩნევია, თუმცა განვითარების სტიმულს იძლევა.

https://servernews.ru/993066

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.