Dünyaca ünlü e-ticaret şirketi Amazon, yapay zeka alanındaki yoğun çalışmaların neticelerinden birisi olan Nova Sonic modelini duyurdu. Gerçek zamanlı ve insan benzeri sesli konuşmalar içeren uygulamalar içeren bu model konuşmadan konuşmaya (speech-to-speech) sistemini kullanacağı bildirildi.

Nova Sonic tanıtıldı

Geleneksel sesli uygulamalarda, konuşmayı metne çeviren bir model, ardından dil modeli ve son olarak metni sese dönüştüren üçüncü bir model kullanılıyordu. Ancak bu çok katmanlı yapı; konuşma tarzı, tonlama ve diyalog akışındaki doğallığın sağlanmasında yetersiz kalıyordu.

Amazon’dan Insan Gibi Konuşan Yapay Zeka Nova Sonic Tanıtıldı (1)

Üç aşamadan oluşan bu işlemi tek çatıda toplayan Nova Sonic, doğal bir konuşma deneyimi sunarken aynı zamanda araya girme ve tepki süresi gibi detayları da başarıyla kullanıyor.

ABD ve İngiliz İngilizcesi dilleri mevcut

Yeni model; Amerikan ve İngiliz İngilizcesi dahil olmak üzere farklı İngilizce aksanlarında hem kadın hem de erkek sesiyle çalışabiliyor. Geliştiriciler, Amazon Bedrock platformu üzerinden çift yönlü bir akış API’si sayesinde Nova Sonic’e erişim sağlayabiliyor. Bunun yanında, içerik denetimi ve dijital filigranlama gibi güvenlik önlemleri de sistemin bir parçası olarak sunuluyor.

Daha önce sesli yapay zeka alanında Nova Reel 1.1 modelini duyuran Amazon, bu modelle beraber 2 dakikaya kadar video üretimi yapılabileceğini duyurmuştu.

Kaynak: Technopat