ChatGPT-მ ისწავლა ხმოვანი ბრძანებების გაგება და გამოსახულებასთან მუშაობა

Magdalena · September 28, 2023

OpenAI-მ გააფართოვა ChatGPT-სთან ურთიერთობის ვარიანტები. ჩატ-ბოტის ახალი ვერსია მოთხოვნისა და მინიშნების სახით მიიღებს არა მხოლოდ ტექსტს, არამედ სურათებს და ხმოვან ბრძანებებს. კომერციული მომხმარებლებისთვის ახალი ფუნქციები ხელმისაწვდომი გახდება მომდევნო ორ კვირაში, დანარჩენებს გარკვეული დრო მოუწევთ ლოდინი.

ფოტოს წყარო: The Verge

ChatGPT-სთან ხმოვანი საუბრები გარკვეულწილად ნებისმიერ ხმოვან ასისტენტთან საუბრის მსგავსია, მაგრამ OpenAI აცხადებს, რომ პასუხების ხარისხი მნიშვნელოვნად მაღალია გაუმჯობესებული საბაზისო ტექნოლოგიის წყალობით. მომხმარებელი აჭერს ღილაკს და წარმოთქვამს შეკითხვას, ChatGPT მას ტექსტად გარდაქმნის და აწვდის მას დიდ ენობრივ მოდელს, იღებს პასუხს, აქცევს მას საუბრად და ხმამაღლა ამბობს პასუხს.

ChatGPT-ის ახალი შესაძლებლობები ეყრდნობა დიდ ენის მოდელ Whisper-ს, რომელიც ახორციელებს მეტყველების ტექსტად გადაქცევას და უკან დაბრუნებას. OpenAI-ის თანახმად ახალ მოდელს შეუძლია შექმნას „ადამიანის ხმა ტექსტიდან და მეტყველების ნიმუში რამდენიმე წამში“. ამჟამად არსებობს ChatGPT-ის ხმის ხუთი ვარიანტი, თუმცა OpenAI ამ მოდელში ბევრად მეტ პოტენციალს ხედავს.

ნებისმიერი ადამიანის სინთეზირებული ხმის შექმნის შესაძლებლობა მისი მეტყველების მხოლოდ რამდენიმე წამის საფუძველზე უზრუნველყოფს კიბერკრიმინალების საქმიანობისთვის ფართო ველის გახსნას - აღიარებს OpenAI ახალი ფუნქციების გამოცხადებისას: ”ეს ქმნის ახალ რისკებს, როგორებიცაა თავდამსხმელების შესაძლებლობა - განასახიერონ საზოგადო ფიგურები ან ჩაიდინონ თაღლითობა“. კომპანიის თქმით, ამ მიზეზით მოდელი არ არის ხელმისაწვდომი ფართო გამოყენებისთვის: OpenAI გეგმავს მოდელის შეზღუდვას კონკრეტული გამოყენების შემთხვევებითა და პარტნიორობის ხელშეკრულებებით.

რაც შეეხება ChatGPT-ში მოთხოვნის გაგზავნას სურათის გამოყენებით, მომხმარებელმა უბრალოდ უნდა გადაიღოს ფოტო ან დახატოს მისთვის საინტერესო ნივთი და გაუგზავნოს ბოტს. კომუნიკაციის დროს შეგიძლიათ გამოიყენოთ ტექსტური ან ხმოვანი ბრძანება თქვენი მოთხოვნის გასარკვევად ან ძიების არეალის შესაზღუდად.

ცხადია, ჩატ-ბოტისთვის მინიშნებების სახით ფოტოების გამოყენებასაც აქვს თავისი პოტენციური პრობლემები. ეს, უპირველეს ყოვლისა, ეხება ფოტოზე გამოსახული პიროვნების ვინაობის შესახებ შეკითხვას, თუმცა OpenAI ამბობს, რომ მან შეზღუდა ChatGPT-ის „ადამიანების შესახებ ანალიზისა და პირდაპირი განცხადებების გაკეთების უნარი“ როგორც სიზუსტის, ასევე კონფიდენციალურობის დაცვის მიზნით.

ChatGPT-ის თავდაპირველი გაშვებიდან თითქმის ერთი წლის შემდეგ OpenAI აგრძელებს აპლიკაციის საზღვრების გაფართოებას და ცდილობს თავიდან აიცილოს მასთან დაკავშირებული პრობლემები და ხარვეზები. კერძოდ, კომპანია მიზანმიმართულად ზღუდავს თავისი ახალი ხელოვნური ინტელექტის მოდელების შესაძლებლობებს, მაგრამ ეს მიდგომა სამუდამოდ არ იმუშავებს. რაც უფრო მეტი ადამიანი გამოიყენებს ხმოვან კონტროლს და გამოსახულების ძიებას და ChatGPT გახდება მულტიმოდალური და სასარგებლო ვირტუალური ასისტენტი, ხელოვნური ინტელექტის ჩარჩოებში შეკავება უფრო და უფრო რთული გახდება.

https://tinyurl.com/mr4bar9e

Sign In

ChatGPT-მ ისწავლა ხმოვანი ბრძანებების გაგება და გამოსახულებასთან მუშაობა

Recommended Posts

Magdalena

Link to comment

Share on other sites

Join the conversation

Browse

Activity

My Activity Streams

Important Information