Jump to content

ChatGPT-მ ისწავლა ხმოვანი ბრძანებების გაგება და გამოსახულებასთან მუშაობა


Recommended Posts

OpenAI-მ გააფართოვა ChatGPT-თან ურთიერთობის ვარიანტები. ჩატ-ბოტის ახალი ვერსია მოთხოვნისა და მინიშნების სახით მიიღებს არა მხოლოდ ტექსტს, არამედ სურათებს და ხმოვან ბრძანებებს. კომერციული მომხმარებლებისთვის ახალი ფუნქციები ხელმისაწვდომი გახდება მომდევნო ორ კვირაში, დანარჩენებს გარკვეული დრო მოუწევთ ლოდინი. 

image.jpeg 

ფოტოს წყარო: The Verge 

ChatGPT-სთან ხმოვანი საუბრები გარკვეულწილად ნებისმიერ ხმოვან ასისტენტთან საუბრის მსგავსია, მაგრამ OpenAI აცხადებს, რომ პასუხების ხარისხი მნიშვნელოვნად მაღალია გაუმჯობესებული საბაზისო ტექნოლოგიის წყალობით. მომხმარებელი აჭერს ღილაკს და წარმოთქვამს შეკითხვას, ChatGPT მას ტექსტად გარდაქმნის და აწვდის მას დიდ ენობრივ მოდელ, იღებს პასუხს, აქცევს მას საუბრად და ხმამაღლა ამბობს პასუხს. 

ChatGPT-ის ახალი შესაძლებლობები ეყრდნობა დიდ ენის მოდელ Whisper-ს, რომელიც ახორციელებს მეტყველების ტექსტად გადაქცევას და უკან დაბრუნებას. OpenAI-ის თანახმად ახალ მოდელს შეუძლია შექმნას „ადამიანის ხმა ტექსტიდან და მეტყველების ნიმუში რამდენიმე წამში“. ამჟამად არსებობს ChatGPT-ის ხმის ხუთი ვარიანტი, თუმცა OpenAI ამ მოდელში ბევრად მეტ პოტენციალს ხედავს. 

ნებისმიერი ადამიანის სინთეზირებული ხმის შექმნის შესაძლებლობა მისი მეტყველების მხოლოდ რამდენიმე წამის საფუძველზე უზრუნველყოფს კიბერკრიმინალების საქმიანობისთვის ფართო ველის გახსნას -  აღიარებს OpenAI ახალი ფუნქციების გამოცხადებისას: ”ეს ქმნის ახალ რისკებ, როგორებიცაა თავდამსხმელების შესაძლებლობა - განასახიერონ საზოგადო ფიგურები ან ჩაიდინონ თაღლითობა“. კომპანიის თქმით, ამ მიზეზით მოდელი არ არის ხელმისაწვდომი ფართო გამოყენებისთვის: OpenAI გეგმავს მოდელის შეზღუდვას კონკრეტული გამოყენების შემთხვევებით და პარტნიორობის ხელშეკრულებებით. 

რაც შეეხება ChatGPT-ში მოთხოვნის გაგზავნას სურათის გამოყენებით, მომხმარებელმა უბრალოდ უნდა გადაიღოს ფოტო ან დახატოს მისთვის საინტერესო ნივთი და გაგზავნოს ბოტ. კომუნიკაციის დროს შეგიძლიათ გამოიყენოთ ტექსტური ან ხმოვანი ბრძანება თქვენი მოთხოვნის გასარკვევად ან ძიების არეალის შესაზღუდად. 

ცხადია, ჩატ-ბოტისთვის მინიშნებების სახით ფოტოების გამოყენებასაც აქვს თავისი პოტენციური პრობლემები. ეს, უპირველეს ყოვლისა, ეხება ფოტოზე გამოსახული პიროვნების ვინაობის შესახებ შეკითხვას, თუმცა OpenAI ამბობს, რომ მან შეზღუდა ChatGPT-ის „ადამიანების შესახებ ანალიზისა და პირდაპირი განცხადებების გაკეთების უნარი“ როგორც სიზუსტის, ასევე კონფიდენციალურობის დაცვის მიზნით. 

ChatGPT-ის თავდაპირველი გაშვებიდან თითქმის ერთი წლის შემდეგ OpenAI აგრძელებს აპლიკაციის საზღვრების გაფართოებას და ცდილობს თავიდან აიცილოს მასთან დაკავშირებული პრობლემები და ხარვეზები. კერძოდ, კომპანია მიზანმიმართულად ზღუდავს თავისი ახალი ხელოვნური ინტელექტის მოდელების შესაძლებლობებს, მაგრამ ეს მიდგომა სამუდამოდ არ იმუშავებს. რაც უფრო მეტი ადამიანი გამოიყენებს ხმოვან კონტროლს და გამოსახულების ძიებას და ChatGPT გახდება მულტიმოდალური და სასარგებლო ვირტუალური ასისტენტი, ხელოვნური ინტელექტის ჩარჩოებში შეკავება უფრო და უფრო რთული გახდება. 

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.