• RSS ile takip et

HAL 9000’in neresinde kaldık? Gerçekten bir yerlerde kaldık mı?

Kas 15, 2012 by     1 Yorum    Bu kategorinin altına gönderildi:: bilgisayar, dilbilim, Genel, internet
Kurmaca bir tanrı gerçek olanından mı yoksa kurmaca bir tanrının olduğu bir dünya kurmaca bir tanrının olmadığı dünyadan mı daha iyidir? | Bir YouTube videosundan: (id=oUv1RJu928I)

Bu dönem aldığım Çağdaş Dilbilim Yorumları dersindeki ekip ile birlikte Nalan Hoca önderliğinde müthiş tartışmalar yapıyoruz ve bu tartışmaları bir sonraki hafta rapor olarak sunuyoruz. Ne tartışıyoruz diye sormaya bile gerek kalmıyor, ne tartışmıyoruz ki? Geçtiğimiz haftanın konusu Nigel Love’ın [8] “Are languages digital codes?” adlı makalesi üzerinde gerçekleşti ve bir anda diller analog kodlardan mı yoksa dijital kodlardan mı oluşur tartışması içinde bulduk kendimizi. Tartışmayı buraya taşımak istedim ve ders sonunda rapor olarak yazdıklarımın bir bölümünü örneklerle aşağıda içerdim. Bana soracak olursanız, diller dijital kodlardır. Haydi buyurun, tartışmaya yazının altından devam edebiliriz.

Bir bankanın müşteri hizmetlerini düşünün, sizi arıyor ve telefonun diğer ucunda söyledikleriyle ve konuşma sırasında yaptığı şakalarla sizi etkiliyor ve nasıl olduğunu anlayamadığınız bir şekilde kredi kartı sahibi oluyorsunuz. Clarke ve Kubrick’in yarattığı HAL 9000 [1] benzeri bir otobüs kaptanı olsa mesela, ucunda kırmızı bir ışık olan kamera otursa kaptan koltuğuna, şehrin tüm yollarını bilse, trafik yoğunluğuna pek yakalanmadan sizi evinize ulaştırsa… Hatta o sırada tüm yolcularla sohbete dalsa, dikkati dağılmasa. Bu gibi kurmaca olguların altını çizdiği şey evrendeki bir varlığın dijital bir şekilde girdi olarak alınması ve bu sürecin sonunda yine varlık biçiminde çıktı olarak verilmesi. Yani üst limiti sınırsız 1 ve 0 girdiyi oluşturuyor, yine üst limiti tanımlanamayan 1 ve 0 çıktıyı. Tamam, bu durum bilimkurgu karakterlerini düşündüğümüzde bir anlam kazanabilir fakat bizim HAL 9000’i kurmaca bir karakter olarak tanımlamamızın altında yatan neden ne? Şu an evrende gördüklerimizin analog girdi olarak çevremizde hazır bulunması mı? Çevremizde gördüğümüz her şey analog işaretler midir? Sadece bu yüzden mi HAL 9000 ve benzeri karakterleri yaratıp “gelecekte bunlar olacak” deyip buna günümüzde bilimkurgu diyoruz? Geleceğin elde edeceği bir yapay zekayı bugün “kurgu” olarak tanımlamak… Ne kadar tutarlı? Yani imkansızı TV ekranına taşımak ve bunun gelecekte “imkanlı olabilir” bağlamı altına yerleştirmek kastım. Yapay zekaya ulaşmada bilimin bir “sınırı” geçmesi mi gerekiyor yoksa o “sınırın” aşılması geçmişte bir yerlerde gerçekleşti mi?

HAL 9000 ile başlamış bulundum, öyle devam edeyim. Diğer kurmaca karakterleri de düşünebiliriz aynı içerikte. Klonlamadan en basit bilgisayara, sıradan bir yazılımdan sınırlı komutları yerine getirebilen robotlara, dillere ait tipoloji oluşturmadan bozuk para atıp içecek aldığımız otomatlara kadar… Bu ve bunun gibi parçaları olan sürecin sonu olarak görünen yapay bir zeka, çevresinde bulunan ve birer girdi olarak tanımlanan bilişsel, toplumsal ve ulamsal gerçeklikleri algılayabilir ve bunu çıktı olarak verebilir. Çıktıyı dilsel bir birim olarak alırsak, girdi olarak alınan bir ağaç, ağaç ile eşleşen işaretler, yazı sistemi birimleri, ses sistemi, sözcük dizilişindeki yerleşimi, sözcük kategorisi, anlamsal kategori, sözcüğün yan anlamları ve bizim için çağrıştırdıkları… Hepsi dijital bir veri olarak yapay zeka tarafından alınır ve çıktı olarak dilsel bir veri şeklinde sunulur. Yani bir yapay zeka, çevresinde ne olup bittiğinin farkındadır, bunu kavramsallaştırabilir ve buna göre bilişsel süreçleri tamamlar. İşte günümüz insanı gibi.

Yukarıda üst limiti tanımlanamayan 1 ve 0 ile gelen girdiyi ve aynı sonsuzlukta verilen çıktıdan bahsetmiştim. Hint matematikçi ve dilbilimci Pingala [2] (MÖ 5 – MÖ 2 yy’lar arasında yaşadığı tahmin ediliyor) Sanskrit bürünü üzerinde çalışırken sessel dizileri işaretlemek için kullandığı 1 ve 0’ların gelecekte bilgisayar adının verileceği aygıtların temel girdileri olduğunu düşünmüş müdür? Şöyle sorayım, acaba kendisi ikili ve üçlü ses örüntülerini işaretlemek için kullandığı 1 ve 0’ların, yani ikili sayı sisteminin, dilin dijital bir olgu olduğunun işaretini verdiğinin farkında mıydı? Bilimin yapay zekaya ulaşması yönünde yapılan en esnek ve verimli çalışmalara olanak tanıyan günümüz bilgisayarları da bu 1 ve 0’ın içerildiği ikili sayı sistemini kullanarak belirli komutları yerine getirebiliyor, bunları farklı biçimlere sokabiliyor ve süreçleyebiliyor. Elde olan şey sadece 1 ve 0. Yani ne 1’in bir üzeri, ne de 0’ın bir altı. Yalnızca 1 ve 0’ın bulunduğu, 1’in üzerinde ya da 0’ın altında bir diziye izin verilmeyen süreksiz ikili dizi. Kabaca sağı solu belli. İşte bu sinyaller Maley’e [3] göre süreksiz (discontinuous) bir dizidir ve kesintilidir (discrete). Sırayla 0-1 şeklinde bir dizi olur, bu dizide üçüncü bir sinyal bulunmaz, yani sürdürülemez ve 0 ile başlayıp 1 ile sonlanır ve bu ikili diziyle sınırsız sayıda 1-0 yerleşimi uygulanabilir. Bu sınırsız yerleşimi oluşturan sinyallerin temel birimlerine bakıldığında da elde 1 ve 0 olur, yani kesintilidir.

Örneklere geçmeden önce yukarıda adını sıklıkla andığım dijital ve analog kavramlarına daha bir netlik kazandırmak gerekiyor sanırım. Dijital ve analog kavramlarını birer sinyal olarak ve bu sinyalin dalga olarak karşıya iletildiğini düşünürsek, analog bir sinyalin fiziksel görünümü tipik dalga halinde, dijital sinyalde ise bu durumun kesintili ve köşeleri olan, her bir çizgisi kesilerek süreksizleşen ve tekrar eden bir dalga olduğunu görebiliriz. Yani bildiğimiz bir dalga zaten analog iken, bu dalganın dijital sürümü işlenmiş ve biçimlenmiş durumdadır.

1 ve 0’lardan oluşan dijital hanelerin kesintili, yani ayrıştırılabilir olduğunu, hatta bunun da tipik bir dalganın dijital boyutta nasıl gösterildiğini yukarıda verdim. Olayı dil boyutuna getirdiğimde dilin özelliklerinden birinin kesintili olmasını verebilirim. Yani bir dil, dilbilgisi boyutunda kesintilidir, karmaşık bir mesaj parçalara ayrılabilir ve bu parçalar birleştirildiğine aynı ya da farklı bir mesaj oluşturulabilir:

Dilin kesintili özelliğinin tipik bir örneği olan (1)’deki gibi “p”, “a” ve “t”den oluşan farklı sessel birimler bir araya geldiklerinde tap ve pat sözcüklerini oluşturabiliyor. Bireyin doğuştan gelen dilbilgisi yetisi de bu kesintililik dahilindeki “p”, “a” ve “t” seslerinin başlangıcına ve hangi diziyi takip edeceğine karar veriyor. Haydi bunu bir bilgisayara taşıdık diyelim ve bilgisayarlardaki 1 ve 0 hanelerinden ziyade elimizdeki süreksiz ve kesintili sistemin ʀ ve ʁ’den oluştuğunu varsayalım:

“Pat” sözcüğünü oluşturan ʀ ve ʁ dijital ikili sistemi ile (1)’de verilen örneği birleştirirsek bazı soruları rahatlıkla sorabiliriz: /p/ sesini ya da ʀ kesitini /t/ sesinin ya da ʁ kesitinin önünde yer almasını ya da ʀʁ dizisinin ʁʁ dizisinin arkasında yer almasını gerektiren kural nedir? Kesintisiz olarak bildiğimiz dilbilimsel birimlerin bir düzlemde gerçekleşmesine karar veren bir sınırlılık var mıdır? Örnek (3)’e bakalım:

Örnek (3)’te “christmas” sözcüğünün sesbilgisel gösterimleri var. İngilizceden verilen bu örnekte /k/ sesinin mi yoksa /ɹ/ sesinin mi daha önce geleceği, ya da benzer diziler arasındaki öncelik/sonralık yerleşimi Chomsky ve Halle’in İngilizcenin ses örüntüleri açısından verdiği çalışmada sınırlılık olarak belirtilmiştir [4].  (3)’te verilen örneğe benzer olarak, dijital bilgi de 1 ve 0’ların oluşturduğu süreksiz ve kesintili diziler halinde iletilir. Burada nokta atışı yapılabilecek bir soru sorabilirim: Bu dijital semboller tıpkı İngilizcenin ses örüntüsünde olduğu gibi dünyadaki tüm diller için aynı sınırlılığı getirebilir mi? Tipolojik açısından bakarsak diller evrensel örüntüler gösterir ve bu evrensel örüntüler dil-içi kurallar ile bütünleşik olarak diller çerçevesinde yönetilir. Dillerin yöneten ve baskın özelliklerine bağlı olarak da dil-içi sistemler diğer dilbilgisel birimlerin dizilişlerinde ve bulunuşlarında yönetici konumundadır, Greenberg’in [5] evrenselleri gibi:

Yukarıdaki örnek (4) temel olarak şunu belirtiyor: Eğer bir dil Özne – Nesne – Eylem dizilişine sahipse bu dilde ilgeçler birimin önünde değil, ardında gelir. Hawkins de [6] bunun istatistiksel gerçekleşimini dünyadaki tüm diller bağlamında %93 olarak vermiş.

Yukarıda verdiğim örneklerde “sınırlılık” kavramını sıklıkla kullandım. Yani dildeki A kuralının B kuralını yönetmesi ya da /x/ sesinden sonra /y/ sesinin gelmesi belirli sınırlılıklar çerçevesinde gerçekleşir görüşünün varlığını belirttim. Ross [7], dillerin dijital mi yoksa analog mu olduğu tartışmasına görüş belirtirken dillerde bulunan sınırlılıkların dijitallik açısından bir kanıt oluşturduğunu belirtiyor. Aslında (3). ve (4). örnekler bu açıklamanın somutlaşması açısından oldukça uygun. Bu durumda da dilbilimsel birimlerin gerçekleşiminde belirli sınırlılıklar var ve bu sınırlılıklar da dilin kesintili özelliği özelliğinin bir işlevi olarak diğerleriyle eşgüdümlü süreçleniyor. Yukarıda Greenberg’in evrenselliği çerçevesinde verdiğim örneği aşağıda (Örnek (5)) bilgisayarın işletim sistemi üzerinden vermek daha açıklayıcı olacak:

Örnek (5), dilbilimsel bağlamda verilen dil-içi kurallar ve evrenselliği iki farklı işletim sistemi benzetmesiyle açıklıyor. Şimdi elimizde Python ile yazılan abcd.exe adında bir yazılım var ve diğer tüm exe uzantılı programlar gibi öntanımlı olarak Windows işletim sistemi üzerinde çalıştırılabiliyor. Fakat biz bu programı Linux işletim sistemi üzerinde çalıştırmak istiyoruz ama üzerinde Linux kurulu bir bilgisayar bu exe uzantılı programın varlığını algılayabiliyor fakat çalıştıramıyor. Bu durumda ihtiyaç olan şey Windows işletim sisteminde öntanımlı çalışan bir programı Linux üzerinde çalıştırma görevini yerine getiren bir öykünücü (emulator). Burada öykünücülerin yaptığı şey dijital veriyi farklı platformlarda çalıştırmak için eşzamanlama (synchronization). Benzer olarak aşağıdaki örneği üç farklı dil çerçevesinde verebilirim:

İngilizce, Türkçe ve Rusçanın kullandığı yazı sisteminin bir öykünücü tarafından okunması, yani şu meşhur Latin alfabesi çeviriyazısında verilmesi örnek (6)’da içeriliyor. İlk satırda dil-içi, ya da yazı sistemi bağlamında verilen dizi semboller ikinci satırda bir öykünücü görevi üstlenen Latin harfleriyle yazılmış. Bu da Rusçadaki “ДOM” sözcüğünü “dom” olarak bize veriyor, yani eşzamanlama gerçekleşiyor. Böylelikle bir yazı sistemi içerisinde var olan bir sınırlılık, tüm yazı sistemlerine genellendiğinde açıklanabilir, okunabilir ve algılanabilir boyuta gelmiş oluyor.

Yukarıda sürekli dilsel örneklere ağırlık verdim. Dilbilimsel düzeyin üzerine çıkarsak, yani ses, harf ya da dilsel birim dizileri haricinde elbette toplumsal, kültürel ve diğer belirleyiciler bağlamında kavramsal bilgiyi zihnimize yerleştiren durumların olduğu bir gerçek. Dillerin doğasının analog kodlar çerçevesinde şekillendiğini öne sürenler bu gerçekliğin daha ön planda olduğunu belirtiyorlar. Ben bu durumu dillerin bütüncül bir dijital duruşunu henüz açıklayamamış olan şu anki bilimsel kanıtların bulunabilirlik durumuna bağlıyorum. Birkaç paragraf ötede tekrar değinmek üzere bu belirtmeyi bir kenara bırakıp iki örnek daha vermek istiyorum.

Dünyadaki tüm dillerde bulunan karakterler metin işleyen bilgisayar ya da herhangi bir iletişim ortamına aktarıldıklarında belirli sembollerle karşılanır ve bu aslında bir karakter kodlama şeması dahilinde gerçekleşir. Unicode Consortium tarafından bilgisayarlar üzerinde sabitlenen bir dizi karakter kodlama şeması, bizlerin bilgisayara girdiği her bir harfe belirli kodlar atar ve ekranımızda girdiğimiz karakterleri bire bir görüntüleyebiliriz. Kullandığımız dil Türkçe ve bu dilin yazı sisteminde “ş”, “ç” .vb gibi harfler mevcut. Aşağıdaki Şekil 2 içinde “ş” ve “ı” bulunan bir tümcenin UTF değerlerinde basit bir sözcük işlemci tarafından nasıl algılanıp işlendiğini gösteriyor:

Yazı tipi dahilinde kullandığımız karakterleri biraz değiştirelim ve Rusçadan, kiril alfabesinden bir örnek verelim:

Şekil 3’te görebiliriz ki sadece bir tümce içerisindeki “ş” ve “ı” değil, tümcenin tamamı UTF olarak bilgisayarlarda eşzamanlanabiliyor.

Yavaş yavaş dilsel kodların analog olduğunu vurgulayan görüşe yaklaşalım. Analog kodların varlığının en güçlü savı çevremizde gördüğümüz gerçekliklerin toplumsal, kültürel ve algısal bağlarının olduğu ve bunun süreksiz ve kesintili kodlarla gösterilemeyecek olması. “Hayat asıl sana tozpembe görünüyor” şeklinde bir tümceyi verdiğimde bunun toplumsal, kültürel algısal bağlarını bir yapay zeka nasıl çözer? Buna bağlı bir yanıt olarak ilk aşamada RGB renk şeması örneğini, ikinci aşamada da edimbilimsel tümevarıma yönelik geçtiğimiz aylarda yapılan bir çalışmayı vereceğim. Evinizdeki televizyonu açtığınızda, AV kanalı üzerinde hiç “RGB renk” yazısını gördünüz mü? Görmüş olmalısınız çünkü bu yazıyı ilk gören insanın üzerinden 40 yıl gibi bir zaman geçti. RGB renk şemasının (red-green-blue) temel amacı elektronik sistemlerde yer alan görselleri ve görüntüleri algılamak, göstermek ve görüntülemek. Yani herhangi bir renk için süreksiz ve kesintisiz dijital kodlarla oluşturulan kırmızı-yeşil-mavi renk bir araya gelerek pembe rengi oluşturabilir ve bu pembe rengi yukarıdaki örneklerde verilen izlere bağlı kalarak dünyadaki tüm dillerin sistemlerinde eşzamanlayabilir. Peki “benim için tozpembedir, onun için pembedir, başkası için beyaza yatkın bir pembedir” şeklindeki bir içeriği nasıl sabitleyecek? Frank ve Goodman’ın [7] geçtiğimiz Mayıs ayında ilk bulgularını sunduğu bir çalışma var. Çalışmanın sonunda Frank ve Goodman bağlamsal belirginliğin (contextual salience) öncelikli olasılığını tahmin edebildiklerini belirtiyor. Yani yazarlar toplumsal, kültürel ve bu doğrultuda bağlamsal olarak belirgin olan nesnelerin, konuşucu ve dinleyicinin ortak bilgi dağarcığında yakalayabildiklerini söylüyorlar. Bayesian çıkarımının verdiği matematiksel işlemlerle elde edilen bu sonuçlar gelecekte çıkarımları, bağlamları ve toplumsal kuralları etkileşimsel olarak algılayan ve tanımlayan makinelerin icatlarında büyük rol oynayacak. Bu bilimsel birikimin üzerine Frank ve Goodman’ın yaptığı araştırmaların şu anki yönelimi ise dillerin alaycılık ve abartı gibi bağlamla etkileşimde bulunan diğer söz biçimleri üzerinde ilerliyor.

Yazı boyunca yukarıda verdiğim örnekler dillerin dijital kodlara sahip olduğu, bu kodların girdi olarak alınıp çıktı olarak benzer sistemde verilebileceği yönünde gördüğüm somutluklardan oluşuyor. Bu örnekleri vermemin arkaplanındaki güçlü savlar ise bilimin gelecekte vereceği daha güçlü örneklere açık kapı bırakması. Tabi çevremizde dijitallik adına örnekleyemeyeceğimiz ve bu yüzden sadece analog olarak kabul edilen nesneler, düşünceler ya da gerçeklikler de mevcut. Peki bunlar gelecekte ne olacak? Geleceğin dijital dillerinin kullanıcısı olan bilimkurgu karakterleri bu düşüncenin tek temsilcisi olarak kalmaya devam edecek mi? Yapay zeka yolunda bilimin bir sınırı çoktan geçtiğini düşünüyorum. Bu düşüncenin kökünde var olan şey ise elde güçlü kanıtların olması, bizim bu kanıtlarla her daim etkileşim içinde bulunmamız ve bu kanıtların bir gün bizleri hiç sevmediğimiz bir ürünü almaya ikna edecek kadar güçlü konuşma yeteneğine sahip bir çağrı merkezi operatörü olan robotlarla telefon görüşmesi yapacağımızın işaretini vermesi.


[1a] Clarkei A. C. (1968). 2001: A Space Odyssey. London: New American Library.

[1b] Kubrick, S. (Yapımcı ve Yönetmen). (1968). 2001: A Space Odyssey. Los Angeles: MGM.

[2] Anglin, W. S. and Lambek, J. (1995). The Heritage of Thales. NY: Springer.

[3] Maley, C. J. (2011). Analog and digital, continuous and discrete. Philosophical Studies 155. pp. 117-131.

[4]  Chomsky, N. and Halle, M. (1968). The Sound Pattern of English. NY: Harper&Row.

[5] Greenberg, J. (1966). Language Universals: With Special Reference to Feature Hierarchies. The Hague: Mouton&Co.

[6] Hawkins, J. A. (1987). Implicational universals as predictors of language acquisition. Linguistics 25. pp. 453-473.

[7] Frank, M. C. and Goodman, N. D. (2012). Predicting Pragmatic Reasoning in Language Games. Sciencemag 336. p.998.

[8] Love, N. (2007). Are languages digital codes? Language Sciences 29(5). pp.690-709.

—-

Yazdığım raporu buradaki bağlantıdan görüntüleyebilirsiniz.

1 Yorum + Yorum ekle

  • Emre, henüz orijinal metni okumadım ancak bu haliyle ayağı yere çok sağlam basan bir yazı olmuş, ellerine ve zihnine sağlık. Derste verdiğin örneği burda daha iyi kavrayabildim. Açıkçası derste ve kendi raporumda da savunduğum gibi halen dilin özünde ve günümüz itibariyle analog olduğunu ve bunun için fazlasıyla kanıtımız olduğunu düşünüyorum.

    Ancak kendi görüşümden ve dilin analog olduğunu düşünmemi sağlayan çeviribilim şapkamdan bağımsız olarak teknolojinin gidebileceği en uca kadar gelişmesini, Frank ve Goodman’ın çalışmasının gelecekte daha da şaşırtıcı şeylere yol açmasını bir bir yapay zeka ve transhumanizm savunucusu olarak yürekten diliyorum.

    Sevgiler!

Yorum yap

XHTML: Bu etiketleri kullanabilirsiniz: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>