+10 344 123 64 77

18 Ocak 2012 Çarşamba

Text-to-Speech Teknolojisinin Ayrıntıları

Artık bilgisayar başında ekrana odaklanmadan vakit geçirilebilen bir yer var mı? Belki de bilgisayar başında uzun saatler geçirildiğinden çoğu kişi kendisini yorgun hissetmekte… Bilgisayar başında ekrandan bir şeyler okuyarak, araştırmalar yaparak saatler geçirmek yerine bilgisayarın kendisinin bir şeyler okuması güzel olmaz mıydı :) ? Sadece yapılması gereken gözlerin kapatılarak okunması gerekli şeylerin dinlenilmesi… Bu kadar basit!

text2speech

Text-to-Speech (TTS) teknolojisi yani metinden konuşma sentezleme; bilgisayarda görünen bir metinin dijital veya sentezlenmiş bir ses yardımıyla bu metinin yüksek ses ile bilgisayarda gösterilen kombinasyonunun ifade edilmiş şeklidir. Yani sayısallaştırılmış bir konuşma ya da kaydedilmiş insan sesinin sentezlenmesiyle metinin ses halinin bilgisayar tarafından oluşturulan sesidir.


TTS yazılım araçlarının kullanılabilir geniş bir aralığı mevcut. Shareware programları gibi shareware paylaşım sitelerinde de internet üzerinden kolayca bulunabilir. Text-to-Speech yazarak arama yapılırsa, ucuz ya da ücretsiz edinilebilen birçok yazılımla karşılaşmak da oldukça mümkündür. Genelde shareware ve freeware programlar kendi yetenekleri ile sınırlıdır ancak bu yeni gelişen teknolojiyi denemek için mutlaka yararlı olacak yazılımlardır. Shareware ve ücretsiz bir Text-to-Speech araçları için bazı örnekler şunlardır;

  • Hearlt-Macintosh: Tucows’dan ücretsiz olarak indirilebilir.
  • Natural Reader: Windows için ücretsiz olarak indirilebilir.
  • Freedom Scientific – Jaws: Ekran okuyucuları, görme engelli kullanıcılar için ticari bir TTS yazılımı. Ekran okuyucular metin dosyalarını okumanın yanında aynı zamanda kullanıcı ara yüzüyle kullanıcı imleci ile ekranda gösterilen metin için sesli navigasyon desteği de vermekte.
Okuma zorluğu çekenler, görme bozukluğu olanlar ya da dil desteğine ihtiyaç duyanlar için ayrıca ikinci bir dil desteği sağlayan TTS yazılımları da ticari metin okuyucuları olarak karşımıza çıkmakta. Ticari metin okuyucu örnekleri de şunlardır;

  • Read Please, Inc. tarafından sunulan REadingBar2
  • LCambrium Learning yazılımı olan Kurzweil
  • TextHELP Systems Ltd. tarafından yayınlanan textHelp
  • Freedom Scientific tarafından yayınlanan WYNN
  • Apple Mac OS X: Mac TTS, çeşitli kadın ve erkek sesleri olmak üzere birçok doğal ses kütüphanesine sahip ve içerdiği bu sesler Alex adını taşımakta. Alex, uzun pasajlar okurken nefes alış verişleriyle duraklar ve normal konuşma hızında devam etme özelliğine sahip. Mac TTS, OS X konuşma motorunu destekleyen tüm uygulamalarda ( Mail, iChat… ) çalışıyor.

apple-mac-os-x

Text-to-Speech (TTS) yazılım araçları bir metnin sesli bir hale çevrilmesini sağlarken yazılımlar da kendi içerisinde işlevsellik açısından oldukça farklar göstermekte. Hangi yazılımın en iyi desteği verebileceği TTS yazılımlarının özellikleri hakkında yeterince bilgi sahibi olunmasıyla anlaşılabilir.

TTS Yazılımlarının Özellikleri
  • Dijital Metin Hazırlanması: Tescilli OCR (Optik Karakter Tanıma, OCR – Optical Character Recognition)  yazılımı kullanılarak TTS yazılım içerisinde tarayıcı ile metin kontrollerinin yapılması sağlanır. Bir kitabın taranması ve okunması için TTS yazılımı sayesinde taranan görüntünün OCR yazılımıyla da desteklenmesi sağlanmıştır. Tarayıcılar aynı zamanda dijital baskı malzeme metinleri oluşturmak için de kullanılıyor.
  • Metin Biçimlendirme: Oluşturulan dijital metinlerin biçimlendirilme süreci internetten download yapmaya ya da kelime işlem programına (Word processing program) benzeyerek bilgisayardan tarama yapılmasını sağlar.
  • Yazılanları Anında Seslendirme: Yazılan kelimelerin anında seslendirilmesinin sağlanması için çoğu yazılım programlarında farklı destek düzeyleri mevcuttur.


Dosya Türlerinin Okutulması

RTF ve TXT dosyaları: Dijital metin hazırlama yazılımları ile kolayca RFT ve TXT dosya biçimlerine dönüşüm yapılabilir.
Tescilli Biçim: Kendi tarama özelliği ve OCR yazılımı destekleyen özel TTS programları ile birlikte formatı da dahil olmak üzere çeşitli dosya türleri tescilli şekilde kaydedilebilir.
HTML ve İnternet: Bazı TTS programlar, bir tarayıcı (örneğin Internet Explorer) ile yerel olarak saklanabilen HTML sayfalarının internet üzerinden okunmasını sağlamakta.


Dijital Metin Edinme Adımları

Metin konuşma yazılımları dijital ya da bilgisayar tabanlı metinleri okur. Bazı Text-to-Speech (TTS) programları belgeleri veya Microsoft gibi diğer programlar tarafından oluşturulan dosyaları kolayca okuyabilir olsa da, birçok TTS programı sadece kendi özel formatında oluşturulan dosyaları kabul etmekte. RTF ve TXT formatları birçok farklı yazılım programları tarafından desteklenmekte. TXT formatı özel yazı tipleri veya biçimlendirme ile yapılan kalın, alt çizgili ya da karışık font boyutları ile kolay ve sade bir kullanım ara yüzüne sahip. TXT formatına göre RTF formatı özel yazı tiplerini korumada çok daha iyidir. Bu yüzden mümkün olduğunca dosyaların RTF formatında kaydedilmesi TTS programlarından daha iyi sonuçlar elde edilmesini sağlar.

RTF veya TXT formatını kelime işlem dosyasına çevirmek için;
  • Microsoft Word gibi orijinal olan program dosyası açılır.
  • Dosya menüsünün iletişim kutusundan “Farklı Kaydet” seçeneği seçilir.
  • İletişim kutusunun alt kısmında yer alan menüde RTF ya da TXT seçilir.
  • RTF veya TXT formatındaki yeni belge Text-to-Speech programında açılır.


Gelecekte Text-to-Speech

Dijital dosyaları sese çeviren Text-to Speech (TTS) teknolojisi iki bileşenden yani metin ve teknoloji bileşenlerinden oluşur. Gelecekte TTS teknolojisi ile birlikte;
  • Daha iyi ve daha gerçekçi sentezlenmiş ses motorları olacak.
  • Metin dosyalarını çalabilen sayısallaştırılmış insan sesinin senkronize haliyle karşı karşıya kalınacak.
  • Kitapların kolayca dijitalleştirilmesi yayıncıların ve yazarların haklarının ihlal edilmesine yol açacak.
  • Dijital kitap görüntüleme cihazlarının daha da yaygınlaşmasıyla tüm elektronik kitaplar için koruma standartları geliştirilecek ve böylece yeni bir teknolojinin adımı atılabilecek.
  • Elektronik posta ile gelen yazışmaların telefondan sisteme okutulması yaygınlaşacak böylece yüzlerce gelen elektronik postaları saatlerce okumaya gerek kalmadan dinleyerek yanıtlanacak.
  • TTS teknolojisinin daha da yaygınlaşması ile sesli yanıt sistemleri her alanda kullanılmaya başlayacak.
Lion (4 and a half years) - Panthera leo

Çiğdem TANKER | Eğitim ve Dokümantasyon Uzmanı | Blog Yöneticisi

0 yorum:

Yorum Gönder