• RSS ile takip et

#2 Dilbilim ve arama motoru optimizasyonu

Mar 27, 2012 by     2 Yorum    Bu kategorinin altına gönderildi:: dilbilim, internet

15 Kasım’da yazdığım bu yazı aslında aşağıda okuyacaklarınızın giriş kısmını oluşturuyordu, en azından öyle planlamıştım. Yazılarını sıklıkla takip ettiğim Google arama motoru optimizasyonu (Search Engine Optimization (bundan sonra SEO)) takımından Matt Cutts’ın Google arama botlarının geleceğine ilişkin açıklamalarını okuyunca ikinci bölümü yazmak ve iki aylık zamanda yaptığım yoğun okumları gözden geçirmek geldi. Önceki çalışmalarımda aldığım notları Cutts’ın açıklamaları doğrultusunda yönlendirmedim desem yanlış olacak, Cutts beni bayağı bir etkiledi açıklamalarıyla. Yazıyı elimden açıklayıcılık açısından çerçeveli tutmaya çalışacağım.

Dilbilim ve SEO bağlantısını kurmakla işe başlamak en doğrusu olacak. Dilbilim için “dilin bilimsel olarak çalışılması” tanımını verirken SEO için vereceğimiz tanım “herhangi bir Google araması çerçevesinde dilin nasıl kullanıldığın incelenmesi ve incelemeler sonucunda elde edilen bulgular doğrultusunda ağ içerisinde kullanıcılar için güvenli bağlantılar oluşturmak” olabilir. Burada esas olarak alınması gereken şey “organik” sözcüğü. Yani bizler, dili kullananlar ne kadar organik isek, yine bizler, ellerimiz klavyenin her bir tuşuna vurduğunda ya da interneti kullandığımızda o kadar organiğiz, bu açıdan evrensel tutarlılıklarımız var. Dil üzerinde çalışırken “görünürlük” kapsamında betimlemelere yöneliyorsak SEO da bir sitenin organik isteklerden gelen talepleri doğrultusunda herhangi bir internet sitesini “en görünür” yapar (Pinkerton, 2000). [bağlantı]

Dilbilim ve SEO bağlantısını genel olarak yukarıdaki belirtmelerle ve yapılacak olası karşılaştırmalı okumalarla açıklamak mümkün. Arama motorlarında SEO dahilinde kullanılan alt yapı karmaşık mıdır? Evet, fakat normalde basittir. Burada karmaşık olan şey dilbilim kapsamında incelenen ve betimlenmeye çalışılan dil. Sanırım bu, ikisi arasındaki en büyük fark. İşte bu da web alanları tasarımını yapanların iştahını kabartır ve “arama motoru optimizasyonu yapılır” gibilerinden sloganlar görürüz web sağlayıcılığı hizmeti sunan kişilerin internet sitelerinde. Hatta yanında da her yazıya iliştirilmiş biçimde gördüğümüz bir sürü etiket… İşte Cutts, Google’ın bunun önüne geçmeyi planladığını belirtmek istiyor. Olur da bu yapıldı diyelim, Google’ın açıklamalarındaki tutarlılığı ve vizyonuna dair “organikleşme” projesini görmüş oluruz. Nasıl mı?

Aşağıdaki alıntı Google’ın ağ yöneticileri (webmaster) için yıllar önce yaptığı birincil öneri [bağlantı1]  [bağlantı2] (Brin, 1998)

“Ağ sayfalarını kullanıcılar için yapın, arama motorları için değil. Sunduğunuz içerik haricindeki sayfalara ziyaretçileri yönlendirerek, yani paravan yaparak onları aldatmayın.”

Şubat 2011′de açıklanan ve insan temelli süreçlenen Google’ın Panda projesi: [bağlantı] (Google Panda)

Bu da 20 Mart tarihli Matt Cutts’ın açıklaması: [bağlantı]

“Büyük uğraşlar vererek bir yığın optimizasyon yapmaya çalışan insanlara bir bakın. Normalde Google olarak bizler arama motoru optimizasyonu algoritmalarında hangi değişikliği yapacağımızı söylemeyiz fakat son birkaç aydır bu iş üzerinde çalışıyoruz ve algoritmaları işleme sokmak için birkaç ayımız daha var. Temel olarak oyun alanını biraz daha büyütmeye çalışıyoruz. Arama motoru optimizasyonu yapan pek çok insan daha iyi bir anahtar sözcük bulmak uğruna aşırı optimizasyona yöneliyor ve bu da iyi içerikler sağlayanları ya da sağlam site yapanları mağdur ediyor. Proje yönetimim dahilindeki mühendisler şu an daha akıllı bir GoogleBot yapmak ve tutarlılığımızı üst seviyelere çekmek için uğraş veriyor. Tabi bu da sayfalara bir yığın etiket dolduran, bağlantı değişimi yaparak bir insanın arama motorundan talep ettiğini saptıran, yani arama motorunu kötüye kullanan insanları bulmamızı sağlayacak.”

Cutts’ın son tümcesi açık bir tehdit ve bu algoritmalar uygulamaya geçtiğinde optimizasyon işiyle uğraşan birçok insanın bundan haberi olmayacak. Son açıklamanın sonucuna dair bir şey söylemek gerekirse: Güzel ve zengin içerik sağlayanların artık emeklerini alma vakti geldi.

Yavaştan dilbilim ve SEO arasındaki bağlantıya, olası bir SEO çalışmasında dilbilimcinin hangi aşamada uygulamaya dahil olabileceğine gelelim. Burada şunu belirtmek gerekli. Evet, Cutts’ın açıklamalarıya Google SEO uygulamalarının yeni bir döneme gireceği söylenebilir fakat uygulamaya yerinde dahil olan bir dilbilimci “geleneksel SEOculuk” diyebileceğim ilk dönemde de etkin olacaktı. Demek istemem o ki aynı yöntemlerle dahilinde yapısal uygulamaların da ötesinde birden fazla alana ait ekip çalışması, hem ilk dönemde hem de ikinci dönemde başarılı sonuçlar verecek SEO uygulamaları yapabilir.

Bunun bir örneği hakia.com. Nükleer fizikçi Rıza Can Berkan’ın kurduğu Hakia arama motorunun sloganı: “Bir soru, öbek ya da anahtar sözcük gir.” Anlam arayan arama motoru var karşımızda. Hatta dilbilimcilere tanıdık gelecek bir isim daha var kadrolarında: Viktor Raskin. Anlamsal arama (Semantic Search) özelliğiyle ön plana çıkan Hakia’nın yaptıklarını artık Google da yapacak. Hem daha “organik” olacak, hem de insanların doğal dil kullanımlarına yönelecek. Hakia’nın organikliğe ulaşmak için uyguladığı üç temel aşama var, bunlar: (i) tümceleri anlamlı bilgi dizileri şeklinde işleyen QDEX, (ii) QDEX ile dizgilenen bilgileri “diyalog”, “doğrudan yanıt”, “ilişkili sonuçlar”, “bir bakıma ilişkili sonuçlar”, “belirsiz şekilde ilişkili sonuçlar” olarak sınıflandıran SemanticRank ve (iii) dizgi içerisinde bulunan bilginin, insan zihninde var olup olmadığını sorgulayabilen Commericial Ontology (ki bu iş Raskin’den sorulur).

Sanırım Google’ın nasıl bir anlamsal ağ algoritmasına geçmek istediğini kestirebiliyoruz. İşte bu anlamsal ağ ile zaman, çoğul ek .vb gibi biçimbilimsel çeşitlilik, herhangi bir sözcüğün en geleneksel anlamını merkeze alarak eş ve yakın anlamlılığa dair çeşitlilik, genelleştirmeler ve zihnimizdeki kavramsal ağlar haritalanarak yaptığımız sorgulama bizi en doğru kaynağa götürecek.

Şu andan itibaren örneklerle yazıyı sürdürmek istiyorum. İlk örnek Google’ın geçmişte ve bugün kullandığı algoritmalara göre yapılacak olası bir SEO çalışmasına, diğeri ise Anlamsal aramayı aktifleştirdiği andan sonra yapılan SEO çalışmasına ait olacak. Tabi buradan “anlambilimsel sorgulama” yöntemlerinin sadece ikinci dönem olarak gördüğüm kısımda kullanılacağı çıkmamalı. Google, şu an içinde bulunduğumuz dönemde de anlam yakalamaya dair bir algoritma kullanıyor. Bunların adları kullanıma göre evrilme sırasıyla (i) sözcük dizilişini yakalayamayan “Latent Semantic Analysis” (Dumais, 2005) ve sözcük dizilişinin yakalanamaması nedeniyle arama motoru optimizasyonunda sürece sokulan “Syntagmatic Paradigmatic Model” (Dennis ve Harrington, 2002) [bağlantı]

İlk örnekle ilişkili olduğu için bunları da kısaca açıklamak gerekli. Potansiyel anlamı gösterme amacı güden Latent Semantic Analysis anlam olarak yakın olan ve farklı internet sayfalarında kullanılan sözcükleri birbirleriyle ilişkilendirir ve arama sonuçlarımızda bu sayfalar “ilişkin” olarak sorgu ekranında belirir. Sadece eş ve yakın anlamlılık ya da az da olsa kavramsal benzerliğe yönelmesi sözcük dizilişine dair varolan gerçeği görememesine neden olmakta. Bu durumda sürece dahil edilen ve “Dizim ve Örneklem Modeli” olarak çevirebileceğim Sytagmatic Paradigmatic Model” ise aşağıdaki görselde gördüğümüz gibi dizimsel ve anlamsal bileşenleri göstergebilim bağlamında yapısal olarak betimleyebilmekte. Saussure’ün (1916) açıklaması çerçevesinde gidersek dizimsel alanda “bu-ve-bu” dizisinin kombinasyonu, örnekleme dair alanda ise işlevsel zıtlıkların farklılaşmasını verebiliriz.

Google mühendislerinin algoritmalara döktüğü bu süreçlemeyi biz yukarıdaki basitlikte ele alabiliriz. Zaten yazının hemen başında “arama motorlarında SEO dahilinde kullanılan alt yapı karmaşık mıdır? Evet, fakat normalde basittir.” dememin nedeni de bu. Google mühendislerinin bizler için karmaşık görünen kodlarını ancak bizim farkındalığımız basitleştirebilir. Böylelikle de internet gibi pazar tanıtımının en kolay yapılabileceği ortamda bir internet sitesiyle varolmak mümkün olacaktır.

Pazar demişken ilk örneğime geçeyim (nihayet!). Bir kahve sağlayıcısı dükkanınız var, yeni açtınız ve pazarda etkin bir yere sahip olmak istiyorsunuz. Tek dezavantaj olarak gördüğünüz şey ise dükkanınızın herhangi bir Starbucks, Gloria Jean’s, Lavazza .vs gibi büyük kahve dükkanı zincirlerinden birine ait olmaması, üstelik onların pazarda sizin rakibiniz olması. Avantajınız ise Ankara’nın en gözde alışveriş merkezinde ya da caddesinde bir şubenizin olması ve büyümeye açık bir şirket profili oluşturmanız. Kurumsal kimliğinizi ve vizyonunuzu sunmak istediğiniz bir internet sitesi kurdunuz ve sattığınız kahveleri, çeşitlerinizi bu internet sitesi aracılığıyla tanıtmak istiyorsunuz. Ayrıca TV’de reklamınız da yok, tek yol internet.

“Eskimo dilinde “kar” sözcüğünü karşılayan yüzlerce sözcük vardır” gibi yaygın yanılgıya sahip bir görüşü biliriz fakat aynı durum rakibiniz Starbucks için gerçekten de geçerli, onlarda bir tane değil, yüzlerce kahve var, hepsinin de birer adı var. Google, son iki yıldır uyguladığı algoritmalarda internet sitenize “Ankara kahve, ankara kahve mekan, ankara kahve içmek, ankara kahve dükkanı, kahve dükkanı ankara, ankara kahve sağlayıcı, toptancı ankara kahve .vs” gibi etiketler basmanızı kısmen onaylamıyor. Hatta birden fazla internet sitesi açıp, oralardan “ana sitenize” verdiğiniz bağlantıları her ne kadar yutsa da(güvenilir olarak algılasa da) buna da kısmen karşı çıkabiliyor. Böyle bir durumda yapılacak pazar çalışması “kahve” anlamını karşılayabilecek kavramsal bağlantılar oluşturarak, kahve türleri indekslenerek ve en uygun seçenekler anlamsal açıdan belirlenerek desteklenebilir. Tüm bunların yanında Goolge’nın yönergede belirttiği gibi ürününüzü kavramsal olarak bağlantılı dizin yapılarıyla ve dizilişlerle betimlenemiz de cabası. Yoksa kim bilir geçtiğimiz yıl Türkiye pazarına giriş yapan Orta Doğulu kahve devi Mahmood Coffee’yi buralarda. Goolge’da “ankara kahve mekan” araması yaptığınızda karşınıza fırsat siteleri ya da Hayal Kahvesi çıkıyorsa bu işe sadece masa başında vakit ayırdığınız açıktır.

Hatta şöyle bir şey de var: Yapılan araştırmalar gösteriyor ki insanlar arama motorlarında “anahtar sözcük” kullanmaktan daha çok “öbek” ve “tümce” kullanıyor. Yani işin dizimsel yönü öne çıkıyor. Sadece yukarıdaki gibi temel etiketlere yöneldiğinizde ise işlevsel zıtlıkların kurbanı olmak an meselesi. “kahve”, “ankara”, kahve dükkanı” (bile) sözcük örneklemi açısından “değiştirilebilir işlevsel zıtlıklardan” ibaret. Yani sizin bu kavramları belirli bir mantıksal kavram dizisi içerisine yerleştirmeniz gerekiyor, burada da Syntagmatic Paradigmatic Model çoktan devreye giriyor zaten.

İkinci döneme dair verebileceğim örnek de yukarıdaki paragraf çerçevesinde. Bugün bir internet sitesi açsak ve düzenli aralıklarla içerik girsek bu bile sayfamızın Google tarafından “güvenilir” olarak etiketlenmesi için yeterli olmayabilir. Emin olmamakla birlikte Goolge Panda projesine dair verilen genel açıklamaların “belirli bir sözcük sayısı” çerçevesinde içerikleri tanımlaması burada başarısızlığın bir işareti olabilir. Yaklaşık dört-beş ay sonra gelmesi beklenen PageRank değerlerini kısa içerkli yazılarla beklemek ne kadar mantıklıdır? Tartışmaya açık. Matt Cutts’ın yukarıda yaptığım alıntısı buna yönelik izler taşıyor ve iyi içerikleri sağlayanların artık mağdur olmayacağını söylüyor. Yani bundan sonra sitenize eklediğiniz içerikler daha fazla özveri istiyor. Hatta burada şöyle bir örnek vereyim, Google’da sadece “kahve” sözcüğünü kullanarak bir arama yapın, çıkan sonuçlar içerisinde Starbucks bulunduğu kadar ilk iki sayfada içerik bakımından özverili hazırlanmış birkaç blog var. Burada “belagat” ya da “söz söyleme sanatı” bunu karşılar mı bilemiyorum ama ikinci dönem olarak gördüğüm yeni güncelleme ile birlikte insanların en “organik” açıklamalarını vermesi gerekecek. Yani zihnimizde yer alan kavramların yazıda iyi bir şekilde dizilmesi ve metinlerin meta tanımları “iyi biçimlenmiş” görsellerle desteklenmesi gerekmekte. Tabi şunu da belirtmek gerekir, hangi iş ya da ilgi kolunda olursa olsun, site içeriğinde yer alan kavramların da doğal dilde toplumsal olarak kabul görüyor olması önemli, sonuçta insanlar bu sözcüklerle arama yapacak, bu sözcüklerle aramalarındaki öbekleri ya da tümceleri oluşturacak (belirli bir toplumdilbilimsel araştırmaya kadar yolu var gibi bunun)…

İşin özü, önceden 15 satırda içerik sağlayan sitelerin anahtar sözcük ya da öbeklerle etiket basıp, farklı sitelerde ve edu, com.tr gibi saygın uzantılarda bağlantı yerleştirip başarılı olması mümkünken bugün bu durum aynı şekilde mümkün olmamakta. Bir de Google’ın anlambilimsel modeli algoritmalarında kullanacak olmasını düşünün. Ama şu da var, algoritmalar hâlâ zor ama basit, bizim yapmamız gerekenler ise sadece iyi içerik girmek, o da basit. Organik.

——-

NOT *** Bu yazıda bulunan Google’ın ikinci dönemi olarak gördüğüm algoritma değişikliği öncesindeki içerikleri (Latent Semantic Analysis ve Syntagmatic Paradigmatic Model ve bunlara dair örneklemler) şu ana kadar her yıl Türkiye’de yapılan ve “internet ve sosyal medya” konulu uluslarası (??) bir konferans için hazırlamışlığım vardı. Türkiye’nin teknoloji devlerinin sponsor olduğu bu akademik etkinliğin önceki programlarına baktığımda işin iç yüzünde şirket yöneticilerinin 15 satırlık konuşmalarını ve halkla ilişkiler çalışması yaptıklarını görünce benzer bir kolpacılık içerisinde bulunmak istemedim ve vazgeçtim.

2 Yorum + Yorum ekle

  • Ağzım açık bir solukta okudum, bu mudur? budur. SEO oyuncak değil, ve google çok kısa zamanda sanırım bunu oyuncak edenlerin pillerini ellerinden alacak.

  • [...] da ne gibi süreçlerle temellendirilmiş gibi bir sorunun yanıtını almak isteyenler şurada ve şurada yazdığım yazılara baklabilir. Aşağıda 22 Şubat 2010-1 Eylül 2012′ye kadar olan genel [...]

Yorum yap

XHTML: Bu etiketleri kullanabilirsiniz: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>