Jump to content

Recommended Posts

Posted

OpenAI-მ წარმოადგინა ხელოვნური ინტელექტის მოდელ Voice Engine-ის წინასწარი ტესტირების შედეგები, რომელსაც 15-წამიანი ნიმუშის საფუძველზე შეუძლია შეყვანილი ტექსტის რეალისტურად გახმოვანება, ცდილობს ზუსტად გადმოსცეს მოლაპარაკის ხმა და მეტყველების მახასიათებლები. 

image.jpeg 

ფოტოს წყარო: Unsplash, Igor Omilaev 

Voice Engine-ის პირველი განვითარება გამოჩნდა 2022 წლის ბოლოს და გამოიყენებოდა API-ში ტექსტის მეტყველებად გადაქცევისთვის, ასევე ChatGPT Voice-თან და Read Aloud-თან ერთად. OpenAI-მ იცის სინთეზირებული ხმის ტექნოლოგიის შესაძლო ბოროტად გამოყენების შედეგების შესახებ, ამიტომ იმედოვნებს, რომ მიიღებს გამოხმაურებას საზოგადოებისგან შესაძლო საფრთხეებისა და გამოყენების სფეროების შესახებ. რაც შეეხება ამ უკანასკნელს, გასული წლიდან OpenAI-მ შესთავაზა Voice Engine ტესტირება პარტნიორთა მცირე ჯგუფ და მიიღო გამოყენების მაგალითები: 

  • კითხვის პრობლემების მქონე ადამიანებისა და ბავშვების დახმარება ბუნებრივი, ემოციური და მრავალფეროვანი ხმებით. მაგალითად, საგანმანათლებლო ტექნოლოგიების კომპანია Age of Learning იყენებს Voice Engine-ს კონტენტის გასახმოვანებლად და GPT-4-თან ერთად რეალურ დროში აძლევს სტუდენტებს პერსონალიზებულ პასუხებს. 
  • ისეთი კონტენტის თარგმნა, როგორიცაა ვიდეოები და პოდკასტი, საშუალებას მისცემს ავტორებსა და კომპანიებს გააფართოვონ თავიანთი აუდიტორია მთელ მსოფლიოში ინფორმაციის გადაცემის გზით საკუთარი და თანამშრომლების ხმით. ერთ-ერთი პირველია HeyGen, ხელოვნური ინტელექტის მეშვეობით ვიზუალური ამბის მოთხრობის პლატფორმა კორპორატიული მომხმარებლებისთვის, რომელიც შექმნილია ჰუმანოიდური ავატარების შესაქმნელად ვრცელი მიზნებისთვის - დაწყებული პროდუქტის მარკეტინგიდან - დამთავრებული გაყიდვებით. Voice Engine ინარჩუნებს მოლაპარაკის მშობლიურ აქცენტს, ასე რომ, როდესაც ფრანგი საუბრობს ინგლისურ ტექსტზე, ისმის ფრანგული აქცენტი. 
  • მეტყველების პრობლემების მქონე ადამიანების მხარდაჭერა, თერაპიული აპლიკაციები, საგანმანათლებლო დანამატები. Livox არის AI აპლიკაცია ალტერნატიული და გაძლიერებული საკომუნიკაციო მოწყობილობებისთვის, რომელიც ეხმარება კომუნიკაციის პრობლემების მქონე ადამიანებს. Voice Engine-ის გამოყენებით Livox სთავაზობს უნიკალურ, არარობოტულ ხმებს მეტყველებადაქვეითებულ ადამიანებს. მომხმარებელს შეუძლია აირჩიოს მისთვის ყველაზე შესაფერისი ხმა, რომელიც ილაპარაკებს სხვადასხვა ენაზე. 
  • ხელს უწყობს ხმის აღდგენას უეცარი და მეტყველების დეგენერაციული  დარღვევის შემთხვევაში. ნორმან პრინცის ნეირომეცნიერების ინსტიტუტი (NPNI) პილოტირებს პროგრამას ონკოლოგიური დაავადებების ან ნევროლოგიური მეტყველების დარღვევების მქონე ადამიანების დასახმარებლად. Voice Engine-ის უნარის წყალობით, მეტყველება წარმოიქმნას 15-წამიან ნიმუშებით, ექიმმა ფატიმა მირზამ, როჰაიდ ალიმ და კონსტანტინა სვოკოსმა გამოიყენეს აუდიოჩანაწერი ვიდეოდან სკოლის პროექტისთვის და აღადგინეს ახალგაზრდა პაციენტის ხმა, რომელსაც მეტყველების სირთულეები აქვს ტვინის სისხლძარღვების სიმსივნის გამო. 

OpenAI-ის პარტნიორები შეთანხმდნენ ტექნოლოგიის გამოყენების წესებზე, რომლებიც კრძალავს მის გამოყენებას სხვა პიროვნების განსახიერებისთვის, რაც არ შეიძლება ითქვას შესაძლო თავდამსხმელებზე, რომლებიც სულ უფრო ხშირად იყენებენ ნეიროქსელის ტექნოლოგიებს კრიმინალური მიზნებისთვის. 

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.