Magdalena Posted April 3 Share Posted April 3 OpenAI-მ წარმოადგინა ხელოვნური ინტელექტის მოდელ Voice Engine-ის წინასწარი ტესტირების შედეგები, რომელსაც 15-წამიანი ნიმუშის საფუძველზე შეუძლია შეყვანილი ტექსტის რეალისტურად გახმოვანება, ცდილობს ზუსტად გადმოსცეს მოლაპარაკის ხმა და მეტყველების მახასიათებლები. ფოტოს წყარო: Unsplash, Igor Omilaev Voice Engine-ის პირველი განვითარება გამოჩნდა 2022 წლის ბოლოს და გამოიყენებოდა API-ში ტექსტის მეტყველებად გადაქცევისთვის, ასევე ChatGPT Voice-თან და Read Aloud-თან ერთად. OpenAI-მ იცის სინთეზირებული ხმის ტექნოლოგიის შესაძლო ბოროტად გამოყენების შედეგების შესახებ, ამიტომ იმედოვნებს, რომ მიიღებს გამოხმაურებას საზოგადოებისგან შესაძლო საფრთხეებისა და გამოყენების სფეროების შესახებ. რაც შეეხება ამ უკანასკნელს, გასული წლიდან OpenAI-მ შესთავაზა Voice Engine ტესტირება პარტნიორთა მცირე ჯგუფს და მიიღო გამოყენების მაგალითები: კითხვის პრობლემების მქონე ადამიანებისა და ბავშვების დახმარება ბუნებრივი, ემოციური და მრავალფეროვანი ხმებით. მაგალითად, საგანმანათლებლო ტექნოლოგიების კომპანია Age of Learning იყენებს Voice Engine-ს კონტენტის გასახმოვანებლად და GPT-4-თან ერთად რეალურ დროში აძლევს სტუდენტებს პერსონალიზებულ პასუხებს. ისეთი კონტენტის თარგმნა, როგორიცაა ვიდეოები და პოდკასტი, საშუალებას მისცემს ავტორებსა და კომპანიებს გააფართოვონ თავიანთი აუდიტორია მთელ მსოფლიოში ინფორმაციის გადაცემის გზით საკუთარი და თანამშრომლების ხმით. ერთ-ერთი პირველია HeyGen, ხელოვნური ინტელექტის მეშვეობით ვიზუალური ამბის მოთხრობის პლატფორმა კორპორატიული მომხმარებლებისთვის, რომელიც შექმნილია ჰუმანოიდური ავატარების შესაქმნელად ვრცელი მიზნებისთვის - დაწყებული პროდუქტის მარკეტინგიდან - დამთავრებული გაყიდვებით. Voice Engine ინარჩუნებს მოლაპარაკის მშობლიურ აქცენტს, ასე რომ, როდესაც ფრანგი საუბრობს ინგლისურ ტექსტზე, ისმის ფრანგული აქცენტი. მეტყველების პრობლემების მქონე ადამიანების მხარდაჭერა, თერაპიული აპლიკაციები, საგანმანათლებლო დანამატები. Livox არის AI აპლიკაცია ალტერნატიული და გაძლიერებული საკომუნიკაციო მოწყობილობებისთვის, რომელიც ეხმარება კომუნიკაციის პრობლემების მქონე ადამიანებს. Voice Engine-ის გამოყენებით Livox სთავაზობს უნიკალურ, არარობოტულ ხმებს მეტყველებადაქვეითებულ ადამიანებს. მომხმარებელს შეუძლია აირჩიოს მისთვის ყველაზე შესაფერისი ხმა, რომელიც ილაპარაკებს სხვადასხვა ენაზე. ხელს უწყობს ხმის აღდგენას უეცარი და მეტყველების დეგენერაციული დარღვევის შემთხვევაში. ნორმან პრინცის ნეირომეცნიერების ინსტიტუტი (NPNI) პილოტირებს პროგრამას ონკოლოგიური დაავადებების ან ნევროლოგიური მეტყველების დარღვევების მქონე ადამიანების დასახმარებლად. Voice Engine-ის უნარის წყალობით, მეტყველება წარმოიქმნას 15-წამიანი ნიმუშებით, ექიმმა ფატიმა მირზამ, როჰაიდ ალიმ და კონსტანტინა სვოკოსმა გამოიყენეს აუდიოჩანაწერი ვიდეოდან სკოლის პროექტისთვის და აღადგინეს ახალგაზრდა პაციენტის ხმა, რომელსაც მეტყველების სირთულეები აქვს ტვინის სისხლძარღვების სიმსივნის გამო. OpenAI-ის პარტნიორები შეთანხმდნენ ტექნოლოგიის გამოყენების წესებზე, რომლებიც კრძალავს მის გამოყენებას სხვა პიროვნების განსახიერებისთვის, რაც არ შეიძლება ითქვას შესაძლო თავდამსხმელებზე, რომლებიც სულ უფრო ხშირად იყენებენ ნეიროქსელის ტექნოლოგიებს კრიმინალური მიზნებისთვის. https://tinyurl.com/mypn8kte Quote Link to comment Share on other sites More sharing options...
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.