Adobe Konuşmaları Değiştirebilen Yazılım Geliştirdi!

0
36
Adobe tarafından geçtiğimiz gün tanıtılan Project VoCo isimli yazılım, konuşmaları tıpkı metin gibi düzenleyip değiştirme imkanı sunuyor.

Adobe geçtiğimiz gün düzenlenen MAX konferansında yeni deneysel aracının tanıtımını gerçekleştirdi. Project VoCo isimli yazılım, kaydedilen konuşmaları tıpkı metin gibi düzenlemeyi mümkün hale getiriyor. Bununla da yetinmeyen Project VoCo daha önce kaydedilen bir ses modeli üzerinde yepyeni ses kayıtları da oluşturabiliyor.

Project VoCo 1

 

Peki bu nasıl gerçekleşiyor?

Bahsi geçen yazılım öncelikle 20 dakikalık bir ses kaydına ihtiyaç duyuyor. Daha sonra yapılan analiz sonucunda alınan kaydın transkripsiyon ve ses modelini oluşturuyor. Oluşturulan transkripte kaydı alınan konuşma metin olarak yer alıyor. Bu metni düzenleme imkanı sunan Project VoCo, yapılan düzenlemeyi kaydı alınan sesle neredeyse birebir aynı olacak şekilde tekrar seslendirebiliyor.

Project VoCo bu noktada daha zorlu görevleri de yerine getiriyor. Örneğin düzenlenen metinde ses vurgularını ve tonlamaları belirtmeye de gerek kalmıyor. Adobe’nin geleneksel konuşma sentezleme teknolojisi kullanılarak geliştirilen yazılım, bu işi manuel bir yardımcıya ihtiyacı olmadan gerçekleştirebiliyor. Geliştirilen algoritma ile daha önceden kaydı alınan konuşmada hiç geçmeyen cümleler kurup seslendirmek mümkün. Üstelik yeniden seslendirilen konuşmayı eskisinden ayırt etmek çoğu zaman mümkün olmuyor.

Project VoCo 2

Bu yazılım günümüzde birçok sorunun üstesinden gelebilir. Örneğin bir konuşma kaydında yapılan kelime yanlışları, anlatım bozuklukları gibi hatalar daha sonra düzeltilip ek açıklamalar eklenebilir. Ancak bu noktada yeni sorunlar orataya çıkıyor. Gelecek zamanlarda başka biriyle konuşurken duyduklarımızın ne kadarına güvenebileceğiz?

Project Voco paylaşılan bilgilere rağmen şimdilik deneysel aşamada. Kesin bir tarih verilmese de geliştirilmesi tamamlanan yazılım yakın bir zamanda piyasaya sürülecektir.