Apple AirPods'tan Spotify podcast'lerine: Yapay zeka dil engelini nasıl aşıyor?

Anında çeviri yapabilen kulaklıklar, video ve podcast'lerin otomatik dublajı... Yapay zeka, dil engellerini ilk kez ortadan kaldırıyor ve içerik üreticilerinin hedef kitlesini genişletiyor.
Madrid'in merkezindeki bir kafede Çinli bir öğrenci içecek sipariş ediyor. Garson, her ikisi de birbirinin dilini bilmese de, doğal bir şekilde cevap veriyor. Basit kulaklıklar, aralarında anında çeviri yapıyor. Sahne bilim kurgudan fırlamış gibi görünse de, Apple'ın geçen hafta tanıttığı yeni AirPods Pro 3'ün sunduğu gerçek zamanlı çeviri özelliği sayesinde bu mümkün olacak.
Bu, yapay zekânın gelişiminin insanlığın en eski engeli olan dili nasıl yıkmaya başladığının sadece bir örneği. Ancak ilerleme bununla da sınırlı değil. YouTube, videolarına otomatik dublaj özelliğini entegre etmeye başladı ve içerik üreticilerinin Gemini AI'nın yeteneklerini kullanarak farklı dillerde ses parçaları oluşturmasına olanak sağladı. Meta , Ağustos ayında Facebook ve Instagram için otomatik dudak senkronizasyonu çevirisini kullanıma sundu; Spotify ise podcast'leri yazıya dökmek ve çevirmek için OpenAI ile iş birliği yapıyor.
Apple'ın geçen haftaki yıllık etkinliğinde yaptığı en şaşırtıcı duyurulardan biri, 19 Eylül'de satışa sunulacak yeni AirPods Pro 3 kulaklıklarına entegre edilen gerçek zamanlı çeviri özelliğiydi. Apple Intelligence entegrasyonu ve OpenAI desteği sayesinde kulaklıklar, farklı dillerde akıcı konuşmalar yapmanıza olanak tanıyor. Kulaklıkları kullanmak için, çeviri özelliğini etkinleştirmek üzere her iki kulaklığa aynı anda dokunmanız gerekiyor. Bu sayede, bir dil algılandığında AirPods dış gürültüyü azaltarak çeviriyi gerçekleştiriyor.
Çeviri doğrudan kulaklık aracılığıyla çalınır ve çevrilen metin kullanıcının iPhone'unda görünür; kullanıcı da bu metni diğer kişiye göstererek sohbeti sürdürebilir. Canlı çeviri İngilizce, İspanyolca, Fransızca, Almanca ve Portekizce dillerinde mevcut olacak ve 2025 yılı sonuna kadar İtalyanca, Japonca, Korece ve Çince dillerine de genişletilmesi planlanıyor. Ancak, Apple'ın AB'de gerçek zamanlı çevirinin şimdilik mevcut olmayacağını duyurması nedeniyle Avrupalı kullanıcıların bu özelliği kullanmak için beklemeleri gerekecek.
İsveçli müzik yayını devi, popüler ChatGPT'nin arkasındaki şirket olan OpenAI ile ürünlerine üretken yapay zekayı entegre etmek için bir ortaklık imzaladı. Bu anlaşmanın bir parçası olarak Spotify, podcast'leri orijinal konuşmacının tarzını taklit ederek ve geleneksel dublajdan daha doğal bir ses tonuyla farklı dillere dublajlayacak bir pilot proje başlattı. Araştırmacı Lex Fridman ve spor gazetecisi Bill Simmons gibi İngilizce konuşan podcast dünyasından tanınmış isimler ilk testlere katıldı ve içeriklerinin bir kısmı İspanyolca, Fransızca ve Almanca'ya çevrilebilecek.
Şimdilik, katalogdan seçili sayıda bölüm ve gelecekteki bölümler diğer dillerde de yayınlanacak. Spotify, içeriğini daha fazla dilde sunarak daha geniş bir kitleye ulaşmayı ve podcast tüketimini teşvik etmeyi umuyor. Bu içerik, Daniel Ek liderliğindeki şirketin son yıllardaki en büyük girişimlerinden biri oldu. Spotify, toplamda yedi milyondan fazla podcast ve 330.000'den fazla kayıtlı programa (video podcast formatında da) sahip.
Facebook ve Instagram'ın ana şirketi Meta, bu yaz Meta AI makine çeviri aracını kullanıma sundu. Yapay zeka destekli bu yeni özellik, içerik üreticilerinin içeriklerini diğer dillere çevirerek daha geniş bir kitle tarafından görülebilmesini sağlıyor. Instagram'ın başkanı Adam Mosseri, "Aynı dili konuşmayan potansiyel kitlelere sahip çok sayıda harika içerik üreticisi olduğuna inanıyoruz," diye açıkladı.
Yeni özellik, içeriği otomatik olarak çevirerek orijinal içerik oluşturucunun ses özelliklerini korurken dudak hareketlerini de doğal bir görüntüleme deneyimi yaratacak şekilde ayarlıyor. Bu özellik, 1.000'den fazla takipçisi olan Facebook içerik oluşturucuları ve Meta AI'nın faaliyet gösterdiği bölgelerdeki tüm herkese açık Instagram hesapları tarafından kullanılabilir. Bu, aracın düzenleyici nedenlerle kullanılamadığı Avrupa Birliği'ni kapsamaz.
YouTube, geçen yılın sonlarında, içerik üreticilerinin videoları için çevrilmiş ses parçaları oluşturmalarına olanak tanıyan otomatik dublaj özelliğini kullanıma sundu. Araç, Gemini'nin yapay zeka yeteneklerini kullanarak sentetik sesi çevirir, uyarlar ve sesi orijinal videoyla senkronize eder. Diğer platformların aksine, bu özellik abone sayılarına bakılmaksızın tüm içerik üreticilerine açıktır, böylece herkes kitlesini genişletebilir ve yeni kitlelere ulaşabilir.
Bu seçeneğe ek olarak, YouTube'un sahibi Google, yakın zamanda Translator uygulamasını güncelleyerek, ekranda sesli ve yazılı olarak gerçek zamanlı konuşmalar yapma özelliğini ekledi. Gemini'nin gelişmiş modelleri yetmiş dile kadar çeviri yapabiliyor.
Expansion