Ses Kayıtları: TTS Teknolojisi, Konuşmayı Yeniden Yaratma, Politika

Ses kaydı üretme

Ses Kayıtları: TTS Teknolojisi, Konuşmayı Yeniden Yaratma, Politika

Son bir iki yılda ortalık ses kayıtlarından geçilmiyor. Çeşitli kişilere ait olduğu iddia adilen ses kayıtları televizyonlardan dinlettiriliyor. Gazetelere ses kayıt haberleri düşüyor. Tartışmalar yaşanıyor. Dinlemenin hukuksal boyutları ele alınıyor vs...

Hukuksal bir değeri olmasa da ses kayıtları halkın zihnini karıştırmaya yetiyor. Onları çeşitli konularda ikna olmaya zorluyor. Özellikle kaynağı belli olmayan kayıtlar, bu kayıtların nasıl yapıldığı sorusunu akla getirse de bir süre sonra kaynağı üzerinde durulmuyor. "Nasıl yapılmışsa yapılmış, sonuçta şunları söylemiş, önemli olan budur" diye düşünüyoruz. Böylece - hukuksal olmasa da" kasetlere, ses kayıtlarına olan inancımız, konuşan kişilere karşı gelişen yargılarımız haline dönüşüyor.

İşin garibi, bu kayıtları televizyonlarında yayınlayan, gazetelerinde haber yapan medya grupları - hangi cenahtan olursa olsun- bu seslerin nasıl edilmiş veya üretilmiş olabileceği konusunda pek haber yapmıyor, bilgi vermiyor. Oysa ses teknolojileri yakından incelenmiş olsa herhangi bir kişinin sesinden, herhangi bir şeyleri söylettirebilme imkanının olduğu rahatlıkla görülecektir.

Bu imkanı sağlayan teknolojiye TTS denmektedir. Yani "metni konuşmaya çevirme" teknolojisi. Bilgisayarlarla orta düzeyde ilgilenen herkes bu teknolojiyi uzun zamandır bilmektedir. Nereden baksanız 15 yıllık bir geçmişi vardır.

Başlangıç aşamasında, seslerin fiziksel titreşiminlerini kullanarak metinleri seslendirmeyi deneyen bu teknoloji son bir kaç yıldır çalışma prensiplerini değiştirerek yeni boyutlara ulaşmıştır. Yeni gelinen aşama "Doğal dil işleme çalışmaları (natural language processing)" olarak adlandırmaktadır. Özetle, çalışma prensibi şöyledir: Konuşulan dili morfolojik olarak en küçük ses birimlerine bölersiniz. Bu bölünmeyele bir dilin bütün seslerini elde edebilirsiniz. Sonra herhangi bir metni bu seslerle yeniden seslendirebilirsiniz.

Yukardaki teknikte işin püf noktası şudur: Sistem doğal ses kayıtlarından yola çıkılarak çalışmaktadır. Diğer bir deyişle, eski sistemde bilgisayarlar sesi fiziksel olarak taklit etmeye çalışmaktaydı. Ancak "Doğal Dil İşleme" sistemi, sesi taklit etmemektedir. Sesin kendisini kullanarak konuşmayı üretmektedir. Burada bilimsel teknik ayrıntılara girmeye gerek yok. Şöyle özetleyelim ve bitirelim:

Diyelim ki, Sayın Başbakan Erdoğan'a veya Sayın Deniz Baykal'a asla söylemeyeceği şeyleri söylettirmek istiyorsunuz ve bunu da internette yaymak istiyorsunuz. Önce bir ses kaydını elde edersiniz - ki bu çok kolay - mesela ulusa sesleniş programını kaydedersiniz veya herhangi bir anda yapılmış konuşma kaydını alırsınız. Sesleri ayrıştırırsınız. Daha sonra hazırladığınız bir metni - istediğinizi yazın- ayrıştırılan sesleri kullanarak okutturursunuz.
Televizyonlar dünden hazır...

Sorgulamadan, araştırmadan, bilmeden bilimum ses kayıtları yayınlanır. Yandı gülüm keten helva.

kategoriden rastgele blog getir

Diğer Yazarlarımızdan

Toplam blog: : 12; : 934
Kayıt tarihi: : 06.04.08

Müzik, programlama ve tasarım konularıyla ilgileniyorum. ..

Adsum

25 Mart '09

Ses Kayıtları: TTS Teknolojisi, Konuşmayı Yeniden Yaratma, Politika

Yazdığım Kategoriler