İnsan Gibi Öğrenen Makineler

Nesne tanıma sistemleri oldukça ilerledi; hele Facebook’un yüz tanıma algoritmaları korkutucu derecede iyi. Bu sistemler, insanların nesneleri tanımayı öğrenişinden farklı biçimde, tipik olarak milyonlarca görsel örnekkullanılarak geliştirilir. Bir insan ise bir nesnenin iki-üç resmini gördüğünde, genellikle o nesnenin yeni örneklerini tanıyabilir duruma gelir.

Dört yıl önce, Massachusetts Teknoloji Enstitüsü Beyin Araştırma Bölümü’nden Tomaso Poggio’nun ekibi, görsel temsil için yeni bir bilgisayar modeli üzerinde çalışmaya başladı. Amaçları, beynin tam olarak ne yaptığınıanlayabilmekti. Ekip, Theoretical Computer Science dergisinde yayımlanması için geçtiğimiz günlerde hazırladıkları makalelerinde, geliştirdikleri modeli temel alan bir makine öğrenimi sisteminin, sadece birkaç örneğe dayanarak son derece başarılı nesne tanımlamaları yapabildiğini gösteriyor.

Araştırmacılar ayrıca hem bu son makalelerinde, hem de geçtiğimiz Ekim ayında PLOS Computational Biologydergisinde yayımladıkları makalelerinde, beynin işleyişine ilişkin eldeki kanıtların modelleri ile gayet uyumlu olduğunu da belirtiyorlar.

“Eğer bana yüzünüzün belli bir uzaklıktan çekilmiş bir resmini gösterseler ve daha sonra ben sizi farklı bir uzaklıktan görsem, görüntü resimdekinden farklı olur ve basit karşılaştırma yöntemleri işe yaramaz. Bu durumda ya çok fazla sayıda örnek resme gerek vardır; yani yüzünüzü tüm olası pozisyonlarda görmüş olmalıyımdır ya da nesnenin değişmez bir temsilini bulmak gerekir,” diyor Prof. Poggio.

Bir nesnenin değişmez temsilinin boyut değişimine, konum değişimine ve dönmeye karşı bağışıklı olması, bu değişimlerden etkilenmemesi gerekir. Bilgisayar görüş araştırmacıları değişmez nesne temsili için çeşitli teknikler önermişti, fakat Poggio’nun grubunun çalışması beynin işleyiş mekanizması ile uyumlu bir değişmez temsil bulması bakımından ayrıca önem taşıyor.

Sinirler Neyi Hesaplıyor?

Sinir hücreleri, yani nöronlar uçları dallanan uzun ve ince yapılı hücrelerdir. Görsel işlemenin yapıldığı beyin kabuğunda (İng. cerebral cortex), herbir nöronun her ucunda yaklaşık 10.000 dallanma bulunur.

Böylece iki kabuk nöronu (İng. cortical neuron) birbirleri ile sinir kavşağı (sinaps [İng. synapse]) adı verilen 10.000 ayrı kimyasal eklem üzerinden iletişim kurar. Her sinir kavşağının kendi “ağırlığı” (gelen sinyalin gücünü katlayan bir çarpan) vardır. 10.000 sinir kavşağının hepsinden geçen sinyaller, nöronun bedeninde biraraya getirilir. Uyarım desenleri ve elektriksel etkinlik, zaman içinde sinir kavşaklarının ağırlıklarını değiştirir; bu kökleşmiş alışkanlıkları ve anıları oluşturan mekanizmadır.

Öte yandan, matematiğin lineer cebir dalındaki anahtar işlemlerden biri nokta (skaler) çarpımdır. Bu işleme girdi olarak iki sayı dizisi (veya iki vektör) verilir, bunların elemanları belli bir düzende çarpılır ve ortaya tek bir sayıbiçiminde bir sonuç çıkar. Dolayısıyla, beyin kabuğunda bulunan tek bir nöral devrenin çıktısını, 10.000 değişkenli iki vektörün nokta çarpımı olarak düşünebiliriz. Bu büyük çaplı işlemi, beyindeki her bir nöron her an yapar.

Poggio’nun grubu, nokta çarpımlara dayanan değişmez nesne temsilleri geliştirmiş bulunuyor. Bir düzlemde 360 derecelik dönme yapan bir nesnenin minik bir dijital filmini çektiğinizi varsayın. Örneğin 24 karelik olsun ve herbir kare bir öncekinden birazcık daha dönmüş durumu göstersin. Filmi 24 tane fotoğraf biçiminde depolamış oluyorsunuz.

Ardından tanımadığınız bir nesnenin dijital resmini size gösterdiklerini farz edin. Söz konusu resim piksellerin renk değerlerine karşılık gelen bir dizi sayı (bir vektör) olarak yorumlanabileceğinden, filminizin karelerinin herbiri ile nokta çarpımlarını alabilir ve sonuçta 24 sayılık bir dizi elde edebilirsiniz.

Değişmezlik

Şimdi de aynı nesnenin bir öncekine göre 90 derecelik dönme yapmış halinin resmini alın. Elinizdeki 24 kare ile bunun nokta çarpımını hesaplayın. Yine aynı 24 sayıyı elde edersiniz, fakat sıralamaları farklı olur. Örneğin ilk kare ile yapılan çarpımdan elde edilen sonuç, bu kez altıncı kare ile yapılan çarpımın sonucu olarak çıkabilir. Ama sonuçta elde aynı 24 sayı olur.

O halde bu sayı listesi, yeni nesnenin dönme altından değişmezliği olan bir temsilidir. Bir nesneyi dönerken değil de boyutu değişirken veya konumu değişirken filme alarak elde edeceğiniz film kareleri de, sırasıyla boyut ve konum değişmezliği olan nokta çarpım listeleri verecektir.

Poggio ve meslektaşları son makalelerinde dönme, boyut ve konum değişmezliği olan bir nesne temsili üretmek amaçlandığında, en uygun kalıbın Gabor filtreleri olarak bilinen görüntüler kümesi olduğunu gösterdi. Beyin kabuğundaki görsel işleme hücreleri tarafından yapılan görüntü işleme operasyonları için de Gabor filtreleri iyi bir tanım sunuyor.

Üç Boyut

Bu teknik bir düzlem üzerindeki görsel değişimlerde iyi çalışsa da, üç boyutlu dönme olduğunda pek iyi iş görmüyor. Yani bir arabanın karşıdan çekilmiş fotoğrafı ile yandan çekilmiş fotoğraflarının ortaya çıkaracağı sonuçlar çok farklı oluyor.

Bununla birlikte araştırmacılar, eğer yeni nesne olarak filmdeki ile aynı tip nesne kullanılırsa , nokta çarpımların yeterince değişmez tanımları hala verebildiğini de gösterdiler. Bu gözlem, Nancy Kanwisher ve başka araştırmacılar tarafından yapılmış olan ve görsel işleyen beyin kabuğu bölümlerinin , belli nesne sınıfları için uzmanlaşan bölümleri olduğuna işaret eden araştırmaları ile örtüşüyor.

Ekip, PLOS Computational Biology dergisinde yayımlanan makalelerinde, nokta çarpım algoritmasını kullanarak binlerce rastgele nesneyi sınıflandırmayı öğrenen bir bilgisayar sistemi tasarladıklarını anlatıyor. Öğrendiği her nesne sınıfı için sistem bir şablonlar kümesi üretiyor. Bu şablonlar, insan beyninin görsel işleyen bölümünde karşılık gelen sınıflara ayrılan bölgelerin boyutunu ve çeşitliliğine ilişkin öngörü yapıyor. Bu da, araştırmacalara göre, beyin ile kendi yapılandırdıkları sistemin benzer birşeyler yaptığına işaret ediyor.

Ekibin değişmezlik hipotezi, Caltech profesörlerinden Christof Koch’a göre geleneksel makine öğrenimi ile primat görsel sistemi arasındaki büyük boşluğa kurulan güçlü bir köprü. “Eğer varolan doğal zeki sistemleri anlayacaksak, güçlü yapay zeka sistemlerinin yapılandırılmasına giden yolda bu gibi zarif matematiksel çerçeveler gerekecek,” diye ekliyor.

 


Kaynak:

  • Bilimfili,
  • Massachusetts Teknoloji Enstitüsü, “Machines that learn like people”
    < http://news.mit.edu/2015/algorithms-recognize-objects-few-examples-1223 >

Referans Makaleler:

  • Fabio Anselmi et al. Unsupervised learning of invariant representations, Theoretical Computer Science (2015). DOI: 10.1016/j.tcs.2015.06.048
  • Joel Z. Leibo et al. The Invariance Hypothesis Implies Domain-Specific Regions in Visual Cortex, PLOS Computational Biology (2015). DOI: 10.1371/journal.pcbi.1004390

Robotikçiler Robotlara Nasıl Öğreteceklerini Çocuklardan Öğreniyor

Bebekler ellerinin havadaki hareketlerine bakarak, eşyaları masadan aşağı iterek ve yetişkinlerin yaptıklarına bakıp, onları taklit ederek dünyayı keşfederler. Fakat robotikçiler robotlara birşey öğretmek istediklerinde, tipik olarak ya kod yazarlar ya da eylemi nasıl gerçekleştirebileceğini göstermek için robotun ilgili uzvunu fiziksel olarak hareket ettirirler.

Washington Üniversitesi’nden gelişimsel psikologlar ile bilgisayar bilimcilerin ortaklaşa yürüttüğü bir çalışmanın sonucunda ise robotların, çocuklara çok benzer biçimde öğrenebilecekleri ortaya koyuldu. Bir veri yığınını tarayıp keşfederek, bir insanın nasıl yaptığına bakarak ve kendisinin en rahat nasıl yapabileceğini belirleyerek öğrenme sürecine girebilirler. “Bu çalışmayı, tıpkı çocukların yetişkinlerden birşeyler öğrenişi gibi insanlardan yeni şeyler öğrenebilen robotların yapılandırılması yönünde atılmış bir adım olarak görebiliriz,” diyor ekipten Prof. Rajesh Rao.

“Eğer bilgisayar programlama hakkında hiçbir şey bilmeyen insanların robotlara birşeyler öğretebilmesini istiyorsanız, bunun yolu göstermekten geçer. Robota bulaşıkları nasıl yıkayacağını, giysileri nasıl katlayacağını, ev işlerini nasıl yapacağını göstermek gerekir. Ama bunu başarabilmek için de robotun o eylemleri anlayabilmesi ve kendi kendine yapabilmesi gerekir,” diye ekliyor Rao.

Çocuk gelişim araştırmalarını makine öğrenimi ile harmanlayan çalışmanın ayrıntıları PLOS ONE dergisinin Kasım sayısında yayımlanan bir makale ile paylaşıldı. Makalede, ekibin geliştirdiği yeni bir olasılıksal model sunuluyor. Modelin amacı robotikteki temel problemlerden biri olan bu zorluğa çözüm bulmak; yani insanları izleyerek ve taklit ederek öğrenebilen bir robot yapmak.

Robotikçiler, araştırmalarını psikoloji profesörü Andrew Meltzoff ile ortaklaşa yürütmüş. Meltzoff’un, 18 aylık kadar küçük çocukların, bir yetişkinin eyleminin amacını anlayarak, o amaca kendi başlarına ulaşmalarını sağlayacak farklı yollar geliştirebileceklerini gösteren bir çalışması bulunuyor.

Örneklerden birinde çocuk, bir yetişkinin çan biçimli bir oyuncağın parçalarını ayırmaya çalıştığını görüyor. Yetişkin bunu başaramıyor, çünkü parçalar birbirine çok sıkı geçmiş ve elleri kayıyor. Çocuk dikkatlice izliyor ve alternatif metodlar kullanmaya karar veriyor. O minicik parmaklarını oyuncağın uçlarına doluyor ve güçlü bir şekilde bir anda asılıyor. Yani yetişkinin yapmaya çalıştığı, ama elleri kaydığı için yapamadığını yapıyor.

Çocuklar, niyet okuma becerisini kısmen onların fizik yasalarının farkına varmalarını sağlayan kendi keşifleri yoluyla kazanırlar. Sonuç olarak başkalarından öğrenebilirler ve başkalarının niyetlerine ilişkin yorum yapabilirler. Meltzoff ayrıca bebeklerin o denli çabuk öğreniyor olma nedenlerinin çok oyuncu olmaları olduğunu düşünüyor.“Bebekler öylesine oynuyorlarmış gibi görünebilir, ama onların gelecekte öğrenecekleri için bu çok önemli. Yeni bir oyuncakla nasıl oynanacağını anlamaya çalışırken, diğer oyuncaklarla oynarken edindiği bilgiyi kullanıyorlar. Oyun esnasında kendi eylemlerinin fiziksel dünya üzerinde yarattığı etkinin zihinsel modelini öğreniyorlar. Bir kez bu modele sahip olursanız, basit problemleri çözmeye başlayabilir ve başkalarının niyetlerine ilişkin öngörüler yapabilirsiniz,” diyor.

Rao’nun ekibi bebekler üzerinde yaptıkları bu çalışmayı, bir robotun kendi eylemlerinin nasıl sonuçlar doğuracağını keşfetmesine izin verecek makine öğrenimi algoritmaları geliştirmek için kullanıyor. Ardından bu öğrenilmiş olasılıksal modeli, bir insanın ne yapmak istediğini çıkarsamak ve görevi tamamlamak ve eğer kendi başına tamamlayabilmesi kesin değilse yardım istemek için kullanılacak.

Araştırmacılar, robotik modellerini iki farklı senaryo ile sınamış. Biri, robotun insanın bakışlarını izleyerek öğrendiği bir bilgisayar simülasyonu deneyi; diğer deney de gerçek bir robotun insan davranışlarını taklit ederek oyuncak yiyecekleri bir masanın üzerinde gezdirmesi ile ilgili. Bakış deneyinde robot kendi kafa hareketlerinin bir modelini öğreniyor ve insanın kafasının da aynı kurallara göre işlediğini varsayıyor. Robot, insan odanın değişik yerlerinde göz gezdirirken, insan kafasının hareketlerinin başlangıç ve bitiş noktalarını izliyor. Bu bilgiyi kullanarak, insanın nereye bakmakta olduğunu anlıyor. Ardından kafa hareketlerine ilişkin öğrendiği modeli, insanla aynı konumda sabitlemek için kullanıyor.

Ekip ayrıca Meltzoff’un, bebeklerin görsel engeller ve göz bağı olan yetişkinlerin nereye baktıkları ile ilgilenmediklerini, çünkü onların aslında göremediklerini anladıklarını gösteren bir testini de yeniden tasarlamış. Robota, gözleri bağlı olmanın sonuçlarını bir kez öğrettiklerinde, robot insanın kafa hareketlerini izlemeyi bırakmış.“Bebekler kendi deneyimlerine dayanarak ötekilerin davranışlarını yorumlar; bizim robotumuzun yaptığı da bu,”diyor Meltzoff.

İkinci deneyde ekip bir robotun farklı nesneleri bir masada alıp bırakmasına izin vermiş. Robot bu modeli kullanarak, nesneleri masada gezdiren veya aşağı atan bir insanı taklit etmiş. Her seferinde insanın eylemlerini birebir taklit etmek yerine, robot bazen aynı sonuca ulaştıracak farklı yollar kullanmış. “Eğer insan bir nesneyi yeni bir konuma iterse, robot için itmek yerine kaldırıp koymak o nesneyi oraya götürmek için daha kolay ve güvenli bir yol olabilir. Ama bunun için amacın ne olduğunun bilinmesi gerekir ki, çalışmamızın ele aldığı zor robotik problemi de işte bu,” diyor başyazar Michael Jae-Yoon Chung.

Robotik masa üstü düzenleme görevi düzeneği. (a) Robot çalışma alanının sol tarafında bulunuyor ve Kinect (hareket algılayıcı) robotun görüş açısından bakıyor. Önceden tanımlanmış üç farklı alan var: Sol, sağ ve masa dışı. (b) Masanın üstündeki nesneler. Robot, kendi geometrisi için en uygun hareketin ne olduğunu seçerek, insanın hareketinin amacını saptayıp, kendine uygun yolla aynısını yapıyor. Telif: University of Washington

 


Kaynak:

  1. Bilimfili,
  2. Washington University, “UW roboticists learn to teach robots from babies”
    < http://www.washington.edu/news/2015/12/01/uw-roboticists-learn-to-teach-robots-from-babies/ >

Referans Makale: Michael Jae-Yoon Chung et al. A Bayesian Developmental Approach to Robotic Goal-Based Imitation Learning, PLOS ONE (2015). DOI: 10.1371/journal.pone.0141965

Bilgisayarlar Düş Kurar mı?

Bilgisayarlarının rüyalarını analiz etmeye karar veren Google’ın yazılım mühendislerinin bulgularına göre,androidler elektrikli koyun düşlüyor! Hatta salyangoz kabuklu domuzlar, deveye benzeyen kuşlar ve köpek gibi balıklar da… Google’ın server bilgisayarlarının, alışılmış nesnelerin görüntülerini tanıma ve yaratma becerisini sınadıktan sonra bu kanıya varan araştırmacılar, deney sonucunda Escher’in çizimlerini ya da Dali’nin tablolarını anımsatan sonuçlara ulaştı.

bilgisayarlar-dus-kurar-mi-bilimfilicom

Peki bu araştırmanın hedefi, bilgisayarlardan garip görüntüler yaratmalarını istemenin amacı nedir? Geleceğin parlak sanatçı robotlarının artistik potansiyellerini ortaya çıkarmaktan mı ibaret, yoksa daha bilimsel bir nedeni var mı? Asıl amaç elbette bütünüyle bilimsel: Google, bilgisayarların ne kadar verimli bir biçimdeöğrenebildiklerini bilmek istiyor.

Google’ın yapay sinir ağı bir tür bilgisayar beyin ve tasarımında hayvanlarda bulunan merkezi sinir sisteminden esinlenilmiş. Mühendisler bu ağa bir görüntü ilettiklerinde, ilk “nöron” katmanı şöyle bir bakıyor. Ardından bu katman, bir sonraki katman ile “haberleşiyor” ve görüntü işleme süreci başlamış oluyor. Bu süreç, nöron katmanı sayısı kadar (10-30 katman) yinelenirken, her bir katman görüntünün ne olduğu anlaşılana dek önemli özellikleri tanımlayıp izole ediyor. Bu nesne tanıma sürecinden sonra, sinir ağı bize nesnenin ne olduğunu söyleyebiliyor.

Google ekibi bu süreci tersine çevirebileceklerini fark etmiş. Yapay sinir ağına bir nesne söyleyip, o nesnenin bir görüntüsünü yaratmasını söylemişler. Bilgisayar da, nesneye ait olduğunu bildiği çeşitli özellikleri bir araya getirerek görüntü oluşturmayı denemiş. Bir çatal resmi istendiğinde, çatalın tanımlayıcı özellikleri bir sap ve sapın ucundaki birkaç sivri uçtur; boyut, renk ve duruş şekli önemli değildir. Bilgisayarların bu ayrımı yapıp yapamadığını anlamak için bir dizi görüntü çıktısı istenmiş. Tabi bazen sonuçlar pek beklendiği gibi çıkmamış. Örneğin aşağıdaki dambıl görüntülerinde, bilgisayarın değişik açılardan alınmış ve farklı uzaklık ya da boyuttaki dambıl görüntülerinin bir karışımını sunduğunu anlıyoruz. Dikkat ederseniz bilgisayar, ağırlık kaldıran kaslı kolu da dambılın bir parçası kabul etmiş. Google’da dambıl araması yaptığınızda karşınıza çıkan görüntülerin çoğu dambıl kaldıran bir kol oluyor. Bu nedenle bilgisayarı anlayışla karşılamak gerek.

bilgisayarlar-dus-kurar-mi-bilimfilicom

Bilgisayarların nesnelerde görüntü tanıma yetenekleri, sanatçıların hayal gücüyle yarışacak düzeyde. Dağların arasında tapınaklar, ağaçlarda binalar ve insanlar veya çiçeklerde kuşlar görebilirler.

bilgisayarlar-dus-kurar-mi-bilimfilicom

Hatta bazen son derece ayrıntılı öğeler, ortada hiçbir şey yok gibiyken belirebilir. Aşağıdaki işlenmiş bulutlu gökyüzü fotoğrafı, Google’ın yapay sinir ağının bulutları bir şeylere benzetmede bir numara olduğunu kanıtlıyor. Ortada hiç görüntü yokken onları yaratan bu tekniğe “başlatımcılık (inceptionism)” adı veriliyor. Bilgisayarların bu teknikle ortaya koyduğu yapıtları inceleyebileceğiniz bir sanat galerisi bile var.

bilgisayarlar-dus-kurar-mi-bilimfilicom

bilgisayarlar-dus-kurar-mi-bilimfilicom

Tasarımcılar makineden belli bir görüntü istemek yerine, sanatsal çalışmalarını bütünüyle özgür biçimde yapmasını sağladıklarında, mekanik bir zihinden ortaya çıkan eserlerin güzelliğinden çok etkilenmişler. Mühendisler bu görüntüleri “rüya” olarak adlandırıyor. Rüyaları ortaya çıkarmak için bilgisayara beyaz gürültüden (tüm frekanslarda rastgele dağılımlı gürültü) oluşan bir boş “beyaz kağıt” veriliyor. Makine bu gürültüden desenler çekerek, düşsel manzaralar oluşturuyor. Bu tablolara baktığınızda, ancak ve ancak sonsuz bir düş gücünün ürünü olabileceklerini seziyorsunuz.

bilgisayarlar-dus-kurar-mi-bilimfilicom


Kaynak:

  1. Bilimfili
  2. Iflscience.com “Google’s AI Can Dream, and Here’s What it Looks Like”
    <http://www.iflscience.com/technology/artificial-intelligence-dreams>
  3. Googlesearch