Jump to content

Recommended Posts

Posted

OpenAI-მ წარმოადგინა ენის ახალი მოდელი, o1, რომელსაც  მსჯელობის და პრობლემების ლოგიკურად გადაჭრის უნარი გააჩნია. წინა მოდელებისგან განსხვავებით, o1-ს შეუძლია ადამიანის აზროვნების პროცესის იმიტაცია, რთული პრობლემების უფრო მარტივ ნაბიჯებად დაყოფა, სხვადასხვა მიდგომის გაანალიზება და საკუთარი შეცდომების გამოსწორება. 

image.jpeg 

ფოტოს წყარო: OpenAI 

O1 Large Language Model-მა (LLM) აჩვენა გამორჩეული შედეგები ადამიან-ექსპერტებთან შედარებულ ტესტებსა და შეჯიბრებში. პროგრამირებაში o1-მა 2024 წლის ინფორმატიკის საერთაშორისო ოლიმპიადაზე (IOI) 49- ადგილი დაიკავა და Codeforces-ის პლატფორმაზე ადამიანების 89%- აჯობა. მათემატიკაში o1 მოხვდა შეერთებული შტატების 500 საუკეთესო სტუდენტს შორის ამერიკის მათემატიკური ოლიმპიადის (AIME) საკვალიფიკაციო ეტაპზე, რაც აჩვენებს ყველაზე ნიჭიერი სტუდენტებისთვის შექმნილი პრობლემების გადაჭრის უნარს, წერს OpenAI თავის ვებ-გვერდზე. 

image.jpeg 

ფოტოს წყარო: OpenAI 

საბუნებისმეტყველო მეცნიერებებში მოდელი აღემატებოდა ექიმებს და მეცნიერებათა კანდიდატებს კომპლექსურ ტესტ GPQA diamond-ში, რომელიც აფასებს ცოდნას ქიმიის, ფიზიკისა და ბიოლოგიის სფეროებში. „ეს არ ნიშნავს, რომ o1 მეცნიერების ნებისმიერ კანდიდატზე ჭკვიანია, განმარტავენ დეველოპერები. ეს მიგვანიშნებს, რომ მოდელს შეუძლია გარკვეული პრობლემების გადაჭრა მაღალკვალიფიციური სპეციალისტების დონეზე.” 

O1 მოდელმა ასევე აჩვენა უპირატესობა წინა მოდელებთან შედარებით ინტელექტუალურ და პრობლემის გადაჭრის ტესტებში, მათში შედის MMMU და MMLU. OpenAI-ის თანახმად, ახალი მოდელი მნიშვნელოვნად აღემატება წინამორბედ GPT-4o-ს მსჯელობის ამოცანების უმეტესობაში. „ჩვენმა ტესტირებამ აჩვენა, რომ o1 თანმიმდევრულად აუმჯობესებს შედეგებს ინტერვენციის სწავლის და მსჯელობასა და აზროვნებაზე დახარჯული დროის გაზრდით“, - აღნიშნავს კომპანია. კერძოდ, AIME ტესტებში o1 მოდელმა გადაჭრა პრობლემების საშუალოდ 83%, ხოლო GPT-4o-ის შედეგი იყო 13%. 

მოდელ o1-ს ნაკლებად ახასიათებს ჰალუცინაციები GPT-4o-თან შედარებით, თუმცა უფრო ნელი და ძვირია. გარდა ამისა, o1 ჩამორჩება GPT-4o-ს ენციკლოპედიურ ცოდნაში და ვერ ამუშავებს ვებ-გვერდებს, ფაილებს და სურათებს. გარდა ამისა, ახალ მოდელს შეუძლია მონაცემების მანიპულირება, გადაწყვეტილების და გამოსავლის მორგება შედეგზე. 

წარმატების საიდუმლო მდგომარეობს ფუნდამენტურად ახალ სასწავლო ალგორითმში - "აზრების ჯაჭვში". მოდელს შეუძლია გააუმჯობესოს ეს ჯაჭვი გაძლიერებული სწავლის მეთოდის გამოყენებით სწავლით, რომლის წყალობითაც ის აღიარებს და ასწორებს შეცდომებს, შლის რთულ ეტაპებს მარტივებად და ცდილობს სხვადასხვა მიდგომს პრობლემების გადასაჭრელად. ეს მეთოდოლოგია მნიშვნელოვნად აუმჯობესებს მოდელის მსჯელობის უნარს, რომელმაც „ადამიანის მსგავსად შეიძლება დიდხანს იფიქროს რთულ კითხვაზე პასუხის გაცემამდე“. 

OpenAI-მ უკვე გამოუშვა o1-preview მოდელის წინასწარი ვერსია, რომელიც ხელმისაწვდომია ChatGPT-ში გამოსაყენებლად და დეველოპერებისთვის API-ის საშუალებით. კომპანია აღიარებს, რომ ჯერ კიდევ ბევრი სამუშაოა გასაკეთებელი იმისათვის, რომ O1 იყოს მარტივად გამოსაყენებელი, როგორც ამჟამინდელი მოდელები. ასევე ხაზგასმულია ახალი მოდელის უსაფრთხოება და ეთიკურობა, რადგან მისი მსჯელობის კონტროლი შესაძლებელია, რაც თავიდან აცილებს პოტენციურად არასასურველ ქცევას. სანამ o1-preview-ს გამოუშვებდა საჯარო გამოყენებისთვის, OpenAI-მ ჩაატარა უსაფრთხოების ტესტები. 

o1-preview-ის გამოყენების ღირებულებაა 15 აშშ დოლარი 1 მილიონი input-ტოკენისთვის და 60$ 1 მილიონი - output-ტოკენისთვის. შედარებისთვის, GPT-4o-ის საფასურია 5 აშშ დოლარი 1 მილიონი შეყვანის ტოკენზე და 15 აშშ დოლარი - მილიონ გამომავალ ტოკენზე. 

 

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.