Magdalena Posted September 16, 2024 Posted September 16, 2024 OpenAI-მ წარმოადგინა ენის ახალი მოდელი, o1, რომელსაც მსჯელობის და პრობლემების ლოგიკურად გადაჭრის უნარი გააჩნია. წინა მოდელებისგან განსხვავებით, o1-ს შეუძლია ადამიანის აზროვნების პროცესის იმიტაცია, რთული პრობლემების უფრო მარტივ ნაბიჯებად დაყოფა, სხვადასხვა მიდგომის გაანალიზება და საკუთარი შეცდომების გამოსწორება. ფოტოს წყარო: OpenAI O1 Large Language Model-მა (LLM) აჩვენა გამორჩეული შედეგები ადამიან-ექსპერტებთან შედარებულ ტესტებსა და შეჯიბრებში. პროგრამირებაში o1-მა 2024 წლის ინფორმატიკის საერთაშორისო ოლიმპიადაზე (IOI) 49-ე ადგილი დაიკავა და Codeforces-ის პლატფორმაზე ადამიანების 89%-ს აჯობა. მათემატიკაში o1 მოხვდა შეერთებული შტატების 500 საუკეთესო სტუდენტს შორის ამერიკის მათემატიკური ოლიმპიადის (AIME) საკვალიფიკაციო ეტაპზე, რაც აჩვენებს ყველაზე ნიჭიერი სტუდენტებისთვის შექმნილი პრობლემების გადაჭრის უნარს, წერს OpenAI თავის ვებ-გვერდზე. ფოტოს წყარო: OpenAI საბუნებისმეტყველო მეცნიერებებში მოდელი აღემატებოდა ექიმებს და მეცნიერებათა კანდიდატებს კომპლექსურ ტესტ GPQA diamond-ში, რომელიც აფასებს ცოდნას ქიმიის, ფიზიკისა და ბიოლოგიის სფეროებში. „ეს არ ნიშნავს, რომ o1 მეცნიერების ნებისმიერ კანდიდატზე ჭკვიანია“, განმარტავენ დეველოპერები. ”ეს მიგვანიშნებს, რომ მოდელს შეუძლია გარკვეული პრობლემების გადაჭრა მაღალკვალიფიციური სპეციალისტების დონეზე.” O1 მოდელმა ასევე აჩვენა უპირატესობა წინა მოდელებთან შედარებით ინტელექტუალურ და პრობლემის გადაჭრის ტესტებში, მათში შედის MMMU და MMLU. OpenAI-ის თანახმად, ახალი მოდელი მნიშვნელოვნად აღემატება წინამორბედ GPT-4o-ს მსჯელობის ამოცანების უმეტესობაში. „ჩვენმა ტესტირებამ აჩვენა, რომ o1 თანმიმდევრულად აუმჯობესებს შედეგებს ინტერვენციის სწავლის და მსჯელობასა და აზროვნებაზე დახარჯული დროის გაზრდით“, - აღნიშნავს კომპანია. კერძოდ, AIME ტესტებში o1 მოდელმა გადაჭრა პრობლემების საშუალოდ 83%, ხოლო GPT-4o-ის შედეგი იყო 13%. მოდელ o1-ს ნაკლებად ახასიათებს ჰალუცინაციები GPT-4o-თან შედარებით, თუმცა უფრო ნელი და ძვირია. გარდა ამისა, o1 ჩამორჩება GPT-4o-ს ენციკლოპედიურ ცოდნაში და ვერ ამუშავებს ვებ-გვერდებს, ფაილებს და სურათებს. გარდა ამისა, ახალ მოდელს შეუძლია მონაცემების მანიპულირება, გადაწყვეტილების და გამოსავლის მორგება შედეგზე. წარმატების საიდუმლო მდგომარეობს ფუნდამენტურად ახალ სასწავლო ალგორითმში - "აზრების ჯაჭვში". მოდელს შეუძლია გააუმჯობესოს ეს ჯაჭვი გაძლიერებული სწავლის მეთოდის გამოყენებით სწავლით, რომლის წყალობითაც ის აღიარებს და ასწორებს შეცდომებს, შლის რთულ ეტაპებს მარტივებად და ცდილობს სხვადასხვა მიდგომას პრობლემების გადასაჭრელად. ეს მეთოდოლოგია მნიშვნელოვნად აუმჯობესებს მოდელის მსჯელობის უნარს, რომელმაც „ადამიანის მსგავსად შეიძლება დიდხანს იფიქროს რთულ კითხვაზე პასუხის გაცემამდე“. OpenAI-მ უკვე გამოუშვა o1-preview მოდელის წინასწარი ვერსია, რომელიც ხელმისაწვდომია ChatGPT-ში გამოსაყენებლად და დეველოპერებისთვის API-ის საშუალებით. კომპანია აღიარებს, რომ ჯერ კიდევ ბევრი სამუშაოა გასაკეთებელი იმისათვის, რომ O1 იყოს მარტივად გამოსაყენებელი, როგორც ამჟამინდელი მოდელებია. ასევე ხაზგასმულია ახალი მოდელის უსაფრთხოება და ეთიკურობა, რადგან მისი მსჯელობის კონტროლი შესაძლებელია, რაც თავიდან ააცილებს პოტენციურად არასასურველ ქცევას. სანამ o1-preview-ს გამოუშვებდა საჯარო გამოყენებისთვის, OpenAI-მ ჩაატარა უსაფრთხოების ტესტები. o1-preview-ის გამოყენების ღირებულებაა 15 აშშ დოლარი 1 მილიონი input-ტოკენისთვის და 60$ 1 მილიონი - output-ტოკენისთვის. შედარებისთვის, GPT-4o-ის საფასურია 5 აშშ დოლარი 1 მილიონი შეყვანის ტოკენზე და 15 აშშ დოლარი - მილიონ გამომავალ ტოკენზე. https://tinyurl.com/354yst99 Quote
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.