Teknoloji devi Google, siber güvenlikten yapay zekaya kadar uzanan geniş inovasyon yelpazesine bir yenisini daha ekleyerek sesli iletişimde sınırları ortadan kaldıran Gemini 3.5 Live Translate modelini resmi olarak duyurdu. Küresel çapta 70’ten fazla dile tam destek sunan bu devrimsel yapay zeka mimarisi, farklı dilleri konuşan insanların birbirleriyle tamamen pürüzsüz ve anlık olarak anlaşabilmesini sağlıyor. Konuşmaları geleneksel sistemler gibi mekanik kalıplarla değil, tamamen doğal bir konuşma akışıyla dönüştüren bu teknoloji, dil bariyerini tarihe gömmeyi hedefliyor.

İnsansı Dokunuş: Tonlama, Hız ve Ses Perdesi Aynen Korunuyor

Gemini 3.5 Live Translate modelini piyasadaki diğer tüm rakiplerinden ayıran en büyük mühendislik başarısı, sesin sadece kelimelerini değil, duygusunu ve karakterini de çevirebilmesi oldu. Yapay zeka yongaları, kaynak dildeki konuşmacının vurgularını, konuşma hızını, sevinç veya endişe gibi tonlamalarını ve ses perdesini (pitch) anlık olarak analiz ediyor. Çeviri hedeflenen dile aktarıldığında, yapay zeka tarafından üretilen ses de orijinal konuşmacının ses karakterini koruyarak konuşuyor. Üstelik sistem, karşı tarafın cümlesini tamamen bitirmesini beklemeden, konuşma esnasında sürekli bir akışla (streaming) çalışarak gecikmesiz ve çift taraflı (full-duplex) bir diyalog ortamı oluşturuyor.

Google Translate Uygulamasına Entegre Edildi

Google, bu ileri düzey yapay zeka teknolojisini kullanıcılarla buluşturmak için zaman kaybetmedi. Gemini 3.5 Live Translate, bugünden itibaren hem iOS hem de Android platformlarındaki resmi Google Translate uygulaması üzerinden küresel olarak erişime açıldı. 70’ten fazla dili herhangi bir ön seçim gerektirmeden otomatik olarak algılayabilen sistem, kulaklık kullanım alışkanlıklarını da değiştiriyor. Yeni eklenen “Listening mode” (Dinleme modu) sayesinde, kulaklık takmanıza gerek kalmadan, yapay zekanın yaptığı anlık sesli çevirileri doğrudan Android ve iPhone telefonların ahizesinden veya hoparlöründen net bir şekilde dinleyebiliyorsunuz.

Geliştiriciler İçin API Desteği Yayınlandı

Google, bu muazzam yapay zeka motorunu sadece kendi yerleşik servisleriyle kısıtlamıyor. Gemini 3.5 Live Translate mimarisi, bulut tabanlı bir API (Uygulama Programlama Arayüzü) olarak dünya genelindeki tüm yazılımcıların ve kurumsal şirketlerin erişimine açıldı. Bu destek sayesinde, küresel müşteri hizmetleri ağları, uluslararası telekonferans uygulamaları, uzaktan eğitim platformları ve mobil oyun içi canlı sesli sohbet odaları, Google’ın bu anlık çeviri altyapısını kendi sistemlerine saniyeler içinde entegre edebilecek.