Jump to content

Amazon-მა დააანონსა სერვერული Arm-პროცესორები Graviton3 და ხელოვნური ინტელექტის მქონე ჩიპები Trainium


Recommended Posts

Amazon-ის ქლაუდ-განყოფილება AWS-მა დააანონსა EC2 ინსტანციები C7g საკუთარი წარმოების მესამე თაობის ARM-პროცესორ Graviton3-ის ბაზაზე, აგრეთვე Trn1 ინსტანციები, რომლებშიც გამოიყენება ხელოვნური ინტელექტის მქონე ამაჩქარებლები Trainium - ისინი შექმნილია AWS-ის ძალისხმევით და განკუთვნილია მანქანური სწავლებისთვის. 

ორივე მათგანის ანონსი წინასწარ ხასიათს ატარებს. Graviton3-ის შემთხვევაში არ კონკრეტდება არც ARM-არქიტექტურის თაობა, არც ბირთვების რაოდენობა და სიხშირეები. სამაგიეროდ ცნობილია, რომ ახალ პროდუქტებს  Graviton2 ინსტანციებთან შედარებით მეოთხედით მეტი წარმადობა და ორჯერ უფრო სწრაფი გამოთვლების უნარი აქვს კრიპტოგრაფიასთან მუშაობისას. ამასთან, ახალი მოწყობილობები 60%-ით ნაკლებ ენერგიას მოიხმარენ. 

image.png 

მოხდა გარკვეული არქიტექტურული ცვლილებები. bfloat16-ის მხარდაჭერა საშუალებას იძლევა ორჯერ დაჩქარდეს ხელოვნურ ინტელექტთან დაკავშირებული გამოთვლები (სავარაუდოდ საუბარია ინფერენსზე), DDR5 სტანდარტზე გადასვლა კი 50%-ით აამაღლებს მეხსიერების სიჩქარეს. თითოეულ vCPU-ს საკუთარი ქეში აქვს, დამატებით უსაფრთხოებას კი უზრუნველყოფს სტეკის აპარატული დაცვა. გარდა ამისა, ახალ ინსტანციებში ჩუმათობის პრინციპით (default-ად) გამოიყენება მეხსიერების სავალდებულო დაშიფვრა, მხარდაჭერილია EBS-ტომების დაშიფვრა, EFA-კავშირის სიჩქარე კი 30 გბ/წმ-ს აღწევს. 

AWS-ის განცხადებით, EC2 C7g შესაფერეისია HPC-სთვის, EDA-სთვის, ანალიტიკისთვის, გეიმინგ და სარეკლამო პლატფორმებისთვის, მედიაკოდირებისთვის და ა.შ. მათთვის ხელმისაწვდომია დისტრიბუტივები Amazon Linux 2, RHEL, SUSE და Ubuntu, აგრეთვე მთელი რიგი უკვე ადაპტირებული პროგრამული უზრუნველყოფები. ჯერჯერობით C7g ხელმისაწვდომია დახურული ტესტირებებისთვის, თუმცა მისი შეფასება უკვე მოასწრეს Epic Games-მა, Formula 1 Management-მა, Honeycomb.io-მ და Twitter-მა. 

image.png 

თავად Graviton3 პროცესორები წინამორბედების მსგავსად ნაკლებად სავარაუდოა, რომ გაიყიდება "გარეთ" და ძირითადი AWS ინფრასტრუქტურის მიღმა მოხვდება მხოლოდ Outposts-ში. ნებისმიერ შემთხვევაში, ეს მიღწევა თავად Amazon-ისთვის, Nitro-ს დანერგვასთან ერთად,  გარე მომწოდებლებისგან დამოუკიდებლობისა და საკუთარი სერვისების მუშაობის გაუმჯობესებისკენ გადადგმული მნიშვნელოვანი ნაბიჯია. Graviton2-ის ბაზაზე ამჟამად უკვე შემოთავაზებულია 12 ტიპის ინსტანცია, თუმცა AWS-ს საკმაოდ აქტიურად და წარმატებულად გადააქვს ყველა დანარჩენი სერვისი საკუთარ CPU-ებზე.  

EC2 ინსტანცია Trn1 ჯამში ამავე მიზნისკენაა მიმართული. ისინი დამყარებულია Trainium ამაჩქარებლებზე, ეს არის Amazon-ის წარმოების მეორე ჩიპი, რომელიც სპეციალურად მანქანური სწავლებისთვის შეიქმნა. ჩიპს აქვს 32 გბ HBM2e, მისი წარმადობა შეადგენს 210 Tops-ს. Trn1 ინსტანციებში გაერთიანებულია 16-მდე ამგვარი ამაჩქარებელი, რომლებიც ინტერკონექტ NeuronLink-თანაა დაკავშირებული (768 გბ/წმ), აქვთ EFA-კავშირი სიჩქარით 800 გბ/წმ-მდე (ორჯერ მეტი წინა თაობის GPU-ინსტანციებთან შედარებით) და გააჩნიათ 8 ტბ-მდე NVMe SSD. 

image.png 

AWS საშუალებას იძლევა შეიქმნას კლასტერები ათიათასობით Trainium-ისგან, რომლებიც გაერთიანებულია პეტაბაიტური კლასის ქსელით და Amazon FSx-ის მეშვეობით დაკავშირებულია პეტაბაიტიან Lustre-სანახ სივრცესთან. ეს ყველაფერი საშუალებას იძლევა სწრაფად მოხდეს გიგანტური მოდელების სწავლება. სამუშაო პროცესისთვის შემოავაზებულია ინსტრუმენტების საფირმო ნაკრები Neuron SDK (იგივე, რაც განკუთვნილია AWS Inferentia-სთვის), აგრეთვე მხარდაჭერილია ისეთი პოპულარული ფრეიმვორქები, როგორებიცაა Tensorflow ან PyTorch. Trn1 ამჟამად ჯერჯერობით წინასწარ წვდომაშია მოთხოვნის შესაბამისად. 

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.