Jump to content

OpenAI-მ წარადგინა AI Voice Engine, რომელიც ახდენს ხმის კლონირებას 15-წამიანი ნიმუშის გამოყენებით


Recommended Posts

OpenAI-მ წარმოადგინა ხელოვნური ინტელექტის მოდელ Voice Engine-ის წინასწარი ტესტირების შედეგები, რომელსაც 15-წამიანი ნიმუშის საფუძველზე შეუძლია შეყვანილი ტექსტის რეალისტურად გახმოვანება, ცდილობს ზუსტად გადმოსცეს მოლაპარაკის ხმა და მეტყველების მახასიათებლები. 

image.jpeg 

ფოტოს წყარო: Unsplash, Igor Omilaev 

Voice Engine-ის პირველი განვითარება გამოჩნდა 2022 წლის ბოლოს და გამოიყენებოდა API-ში ტექსტის მეტყველებად გადაქცევისთვის, ასევე ChatGPT Voice-თან და Read Aloud-თან ერთად. OpenAI-მ იცის სინთეზირებული ხმის ტექნოლოგიის შესაძლო ბოროტად გამოყენების შედეგების შესახებ, ამიტომ იმედოვნებს, რომ მიიღებს გამოხმაურებას საზოგადოებისგან შესაძლო საფრთხეებისა და გამოყენების სფეროების შესახებ. რაც შეეხება ამ უკანასკნელს, გასული წლიდან OpenAI-მ შესთავაზა Voice Engine ტესტირება პარტნიორთა მცირე ჯგუფ და მიიღო გამოყენების მაგალითები: 

  • კითხვის პრობლემების მქონე ადამიანებისა და ბავშვების დახმარება ბუნებრივი, ემოციური და მრავალფეროვანი ხმებით. მაგალითად, საგანმანათლებლო ტექნოლოგიების კომპანია Age of Learning იყენებს Voice Engine-ს კონტენტის გასახმოვანებლად და GPT-4-თან ერთად რეალურ დროში აძლევს სტუდენტებს პერსონალიზებულ პასუხებს. 
  • ისეთი კონტენტის თარგმნა, როგორიცაა ვიდეოები და პოდკასტი, საშუალებას მისცემს ავტორებსა და კომპანიებს გააფართოვონ თავიანთი აუდიტორია მთელ მსოფლიოში ინფორმაციის გადაცემის გზით საკუთარი და თანამშრომლების ხმით. ერთ-ერთი პირველია HeyGen, ხელოვნური ინტელექტის მეშვეობით ვიზუალური ამბის მოთხრობის პლატფორმა კორპორატიული მომხმარებლებისთვის, რომელიც შექმნილია ჰუმანოიდური ავატარების შესაქმნელად ვრცელი მიზნებისთვის - დაწყებული პროდუქტის მარკეტინგიდან - დამთავრებული გაყიდვებით. Voice Engine ინარჩუნებს მოლაპარაკის მშობლიურ აქცენტს, ასე რომ, როდესაც ფრანგი საუბრობს ინგლისურ ტექსტზე, ისმის ფრანგული აქცენტი. 
  • მეტყველების პრობლემების მქონე ადამიანების მხარდაჭერა, თერაპიული აპლიკაციები, საგანმანათლებლო დანამატები. Livox არის AI აპლიკაცია ალტერნატიული და გაძლიერებული საკომუნიკაციო მოწყობილობებისთვის, რომელიც ეხმარება კომუნიკაციის პრობლემების მქონე ადამიანებს. Voice Engine-ის გამოყენებით Livox სთავაზობს უნიკალურ, არარობოტულ ხმებს მეტყველებადაქვეითებულ ადამიანებს. მომხმარებელს შეუძლია აირჩიოს მისთვის ყველაზე შესაფერისი ხმა, რომელიც ილაპარაკებს სხვადასხვა ენაზე. 
  • ხელს უწყობს ხმის აღდგენას უეცარი და მეტყველების დეგენერაციული  დარღვევის შემთხვევაში. ნორმან პრინცის ნეირომეცნიერების ინსტიტუტი (NPNI) პილოტირებს პროგრამას ონკოლოგიური დაავადებების ან ნევროლოგიური მეტყველების დარღვევების მქონე ადამიანების დასახმარებლად. Voice Engine-ის უნარის წყალობით, მეტყველება წარმოიქმნას 15-წამიან ნიმუშებით, ექიმმა ფატიმა მირზამ, როჰაიდ ალიმ და კონსტანტინა სვოკოსმა გამოიყენეს აუდიოჩანაწერი ვიდეოდან სკოლის პროექტისთვის და აღადგინეს ახალგაზრდა პაციენტის ხმა, რომელსაც მეტყველების სირთულეები აქვს ტვინის სისხლძარღვების სიმსივნის გამო. 

OpenAI-ის პარტნიორები შეთანხმდნენ ტექნოლოგიის გამოყენების წესებზე, რომლებიც კრძალავს მის გამოყენებას სხვა პიროვნების განსახიერებისთვის, რაც არ შეიძლება ითქვას შესაძლო თავდამსხმელებზე, რომლებიც სულ უფრო ხშირად იყენებენ ნეიროქსელის ტექნოლოგიებს კრიმინალური მიზნებისთვის. 

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.