4 Ocak 2023 Çarşamba

YZ düşündüğünüz kadar akıllı değil ama olabilir

 

Yapay zeka gerçekten nedir? Google'ın yapay zeka çalışmalarının başındaki Jeff Dean, yapay zekanın dili anlamaktan hastalıkları teşhis etmeye kadar her türlü şeyi yapmasını sağlayan temel teknolojiyi açıklıyor ve dünyayı daha derinlemesine anlayan daha iyi, daha sorumlu sistemler inşa etmek için bir yol haritası sunuyor. (Ardından TED Başkanı Chris Anderson ile soru-cevap bölümü var)


Youtube'de kullanılan yapay zeka örneğin insanı öğrendi. Videolardaki insanları tanıyabiliyor. Bir sürücüsüz araba yapay zekası da insanı öğrendi. Yoldaki insanları tanıyıp dikkat ediyor. Ama bu iki yapay zeka insanı temelde çok farklı şekilde öğrenmiş oluyor. Yani Youutube'in öğrendiği insan bilgisini, sürücüsüz arabanın yapay zekasına uyarlamak mümkün olmuyor. Youtube'la sürücüsüz arabanın sinir ağları birbirine bağlanamıyor. Bu şu anlama geliyor. Yeni başlanan her yapay zeka işi için, sinir ağlarına insanı yeniden öğretilmesi gerekiyor.

Youtube da sürücüsüz araba da insanı bizim kadar derinden anlamıyor. Mesela bizim gibi tarif edemezler. Biz, her konunun içinde insanı fark ederiz. Konunun içeriğine insan tanımımızı uyarlayabiliriz. Yani öğrendiğimiz her yeni konu için insanın da ne olduğunu tekrar tekrar öğrenmemize gerek yoktur. Çünkü biz konulara genel bakıp birbirine bağlayabiliriz. Konudaki bir çağrışımla, ilgili başka bir konu hakkındaki bilgimizi aktifleştiririz. Kafamızdaki her konu hakkında oluşturduğumuz sinir ağı modelleri birbirine bağlıdır.

Günümüzde yapay sinir ağları tek bir alana odaklanıyor. İşe yarayacakları alan en baştan öğretiliyor. O alan dışında hiçbir şeyi bilmezler. Bir alan için oluşturulan sinir ağı modeline, başka bir alan için oluşturulan sinir ağı modeli bağlanamıyor henüz. Bizim gibi farklı konuları bilmesi, farkındalıklarını arttırılması için “genel yapay zekanın” oluşturulabilmesi gerekiyor. İşte o zaman insan bilincine de yaklaşmış olacaktır. İnsan gibi, konulara daha genel bakıp birbirine bağlayabilecek sinir ağı üzerinde çalışılıyor. Konuşmacının değindiği ağırlıklı konu bu. Bunu sağlamanın yöntemi aranıyor. Elbette bunun için modellerin şimdikinden daha farklı şekilde eğitilip oluşturulması gerekiyor. Mesela bunun için bir model oluşturulurken önce daha temel modeldeki bilgileri öğrenmesi sağlanabilir. Ama o daha temel modellerin neye göre belirleneceğini saptamak kolay değil.

Not: Konuşmaya Türkçe alt yazı henüz eklenmemiştir.


“Öyleyse , bugün yapay zeka sistemlerindeki ilerlemenin altında yatan iki temel bileşene bakalım . Birincisi sinir ağları, son 15 yılda gerçekten parıldayan bu zor problemlerden bazılarını çözmek için çığır açan bir yaklaşım . Ama bunlar yeni bir fikir değil. İkincisi ise hesaplama gücüdür. Sinir ağlarının gerçekten şarkı söyleyebilmesini sağlamak çok fazla hesaplama gücü gerektiriyor ve son 15 yılda buna sahip olabildik ve tüm bu ilerlemeyi kısmen sağlayan da buydu. Ama aynı zamanda, birçok şeyi yanlış yaptığımızı düşünüyorum ve konuşmanın sonunda sizinle bunun hakkında konuşmak istiyorum.”

“Yani sinir ağları yeni bir fikir değil. Gerçek sinir sistemlerinde bulunan bazı özelliklere gevşek bir şekilde dayanıyorlar . Sinir ağlarının arkasındaki fikirlerin çoğu 1960'lar ve 70'lerden beri var. Bir sinir ağı, gerçek nöronlarınızın özelliklerini gevşek bir şekilde taklit eden birbirine bağlı bir dizi yapay nöron gibi göründüğü gibidir . Bu sistemlerden birindeki tek bir nöron , her biri ilişkili bir ağırlığa sahip bir dizi girdiye sahiptir ve bir nöronun çıktısı, bu girdilerin bu ağırlıklarla çarpılan bir fonksiyonudur. Oldukça basit ve bunların birçoğu, karmaşık şeyleri öğrenmek için birlikte çalışıyor.”

“Peki bir sinir ağında gerçekte nasıl öğreniriz? Öğrenme sürecinin , ağırlık değerlerinde tekrar tekrar küçük ayarlamalar yapmaktan , bazı şeylerin etkisini güçlendirmekten, diğerlerinin etkisini zayıflatmaktan ibaret olduğu ortaya çıktı. Genel sistemi istenen davranışlara yönlendirerek, bu sistemler bir dilden diğerine çeviri yapmak , bir fotoğrafta ne tür nesnelerin olduğunu tespit etmek, her türlü karmaşık şey gibi gerçekten karmaşık şeyler yapmak üzere eğitilebilir.”

“Bu yüzden sinir ağlarının paralel eğitimi, bir bilgisayardaki veya bir bilgisayar sistemindeki işlemcilerin hepsinin aynı göreve, yani sinir ağlarını eğitme görevine yönelik olarak kullanılması fikri üzerine bir son sınıf tezi yapmaya karar verdim . 32 işlemci, vay canına, bununla harika şeyler yapabilmeliyiz.”

“Ama yanılmışım. Etkileyici şeyler yapmak için nöral ağlara gerçekten sahip olmadan önce , 1990'da sahip olduğumuzdan yaklaşık bir milyon kat daha fazla hesaplama gücüne ihtiyacımız olduğu ortaya çıktı. Ancak 2005 civarında başlayarak , Moore yasasının bilgi işlem ilerlemesi sayesinde, aslında o kadar fazla bilgi işlem gücüne sahip olmaya başladık ve dünyadaki birkaç üniversitedeki araştırmacılar, çok çeşitli farklı türde görevler için sinir ağlarını kullanmada başarı görmeye başladılar. . Ben ve Google'daki diğer birkaç kişi bu başarılardan bazılarını duyduk ve çok büyük sinir ağlarını eğitmek için bir proje başlatmaya karar verdik. Eğittiğimiz bir sistem, YouTube videolarından rastgele seçilmiş 10 milyon çerçeve ile eğittik. Sistem, her türlü farklı nesneyi tanıma yeteneğini geliştirdi. Ve tabii ki YouTube olduğu için kedileri tanıma yeteneğini geliştirdi. YouTube kedilerle dolu.”

Ama bunu bu kadar dikkat çekici yapan şey, sisteme kedinin ne olduğunun asla söylenmemesiydi. Dolayısıyla, verilerdeki yalnızca kalıpları kullanan sistem, tek başına bir kedi kavramına odaklandı. Tüm bunlar, sinir ağlarını Google'da ve başka yerlerde çok çeşitli görevler için kullanma konusunda on yıllık bir başarı dizisinin başlangıcında meydana geldi.”

Ancak tüm bu başarılara rağmen, hala birçok şeyi yanlış yaptığımızı düşünüyorum ve size yanlış yaptığımız üç önemli şeyi ve bunları nasıl düzelteceğimizi anlatacağım. Birincisi, günümüzdeki sinir ağlarının çoğu yalnızca tek bir şey yapmak üzere eğitilmiştir. Onu derinden önemsediğiniz belirli bir görev için eğitirsiniz, ancak bu oldukça ağır bir aktivitedir. Bir veri kümesi düzenlemeniz, bu problem için hangi ağ mimarisini kullanacağınıza karar vermeniz , ağırlıkları rastgele değerlerle başlatmanız, ağırlıklarda ayarlamalar yapmak için çok sayıda hesaplama uygulamanız gerekir. Ve sonunda, eğer şanslıysan, sonunda bir modelin olur. Bu, önemsediğin görevde gerçekten çok iyi. Ancak bunu tekrar tekrar yaparsanız, her biri belki de çok yetenekli, ancak önemsediğiniz tüm farklı görevler için ayrı binlerce farklı model elde edersiniz.”

Ama insanların nasıl öğrendiğini bir düşünün. Geçen yıl, çoğumuz bir sürü yeni beceri edindik. Dikey hidrofonik bahçecilikle deneyler yaparak bahçecilik becerilerimi geliştiriyorum . Bunu yapmak için bitkiler hakkında zaten bildiğim her şeyi yeniden öğrenmeme gerek yoktu. Bir bitkiyi bir deliğe nasıl koyacağımı, nasıl su dökeceğimi, bitkilerin güneşe ihtiyacı olduğunu bilebildim ve bu yeni beceriyi öğrenirken bundan faydalanabildim. Bilgisayarlar aynı şekilde çalışabilir, ancak bugün çalışmıyorlar. Bir sinir ağını sıfırdan eğitirseniz, yeni bir şey yapmaya çalıştığınız her seferinde tüm eğitiminizi unutmak gibi bir şey. Bu çılgınlık, değil mi?”

Bunun yerine, binlerce veya milyonlarca farklı görevi yapabilen çoklu görev modellerini eğitebiliriz ve eğitmemiz gerektiğini düşünüyorum . Bu modelin her parçası farklı türde şeylerde uzmanlaşacaktı. Ve sonra, bin şeyi yapabilen bir modelimiz varsa ve bin birinci şey ortaya çıkarsa, bu yeni şeyi daha hızlı yapabilmek için ilgili türde zaten sahip olduğumuz uzmanlığı kullanabiliriz. Görev, tıpkı sizin gibi, yeni bir sorunla karşı karşıya kaldığınızda, o sorunu çözmede yardımcı olacak zaten bildiğiniz 17 şeyi çabucak belirlersiniz.”

İkinci sorun ise, bugünkü modellerimizin çoğunun yalnızca tek bir veri modalitesiyle ilgilenmesi - görüntülerle, metinle veya konuşmayla, ancak bunların hepsiyle aynı anda değil. Ancak dünyayı nasıl dolaştığınızı düşünün. Dünyadan öğrenmek, tepki vermek ve dünyada hangi eylemleri gerçekleştirmek istediğinizi belirlemek için sürekli olarak tüm duyularınızı kullanıyorsunuz. Bunu yapmak çok daha mantıklı ve biz de aynı şekilde modeller oluşturabiliriz. Girdi verilerinin, metinlerin, görüntülerin, konuşmaların bu farklı modalitelerini alan, ancak daha sonra bunları bir araya getiren modeller oluşturabiliriz, böylece model "leopar" kelimesini görse de, bir leopar videosu görse de veya birinin "leopar" kelimesini söylediğini duysa da, modelin içinde aynı tepki tetiklenir: leopar kavramı, genetik diziler, 3B nokta bulutları, görüntüler, metinler ve videolar gibi insan olmayan girdiler de dahil olmak üzere farklı türde girdi verileriyle başa çıkabilir.”

Üçüncü sorun, günümüz modellerinin yoğun olmasıdır. Tek bir model var, model ister gerçekten basit ister gerçekten karmaşık bir şey olsun, gerçekleştirmek istediğimiz her örnek için her görev için tamamen etkinleştirildi . Bu da kendi beynimizin çalışma şekline benzemez. Beynimizin farklı bölümleri farklı şeylerde iyidir ve sürekli olarak elimizdeki görevle ilgili olan parçalarını çağırırız . Örneğin, arabanıza doğru geri dönen bir çöp kamyonunu gergin bir şekilde izlerken , beyninizin Shakespeare sonelerini düşünen kısmı muhtemelen etkin değildir.”

YZ modelleri aynı şekilde çalışabilir. Yoğun bir model yerine , seyrek olarak etkinleştirilen bir modele sahip olabiliriz. Dolayısıyla, belirli farklı görevler için, modelin farklı kısımlarını kullanırız. Eğitim sırasında model, yeni bir görevi gerçekleştirmek için hangi bölümleri çağırmak istediğini sürekli olarak belirlemek için hangi bölümlerin hangi şeylerde iyi olduğunu da öğrenebilir. Bunun avantajı, çok yüksek kapasiteli bir modele sahip olabilmemizdir, ancak çok verimlidir, çünkü herhangi bir görev için yalnızca ihtiyacımız olan parçaları çağırıyoruz.”

Bu tür yaklaşımları mümkün kılan bir sistem inşa ediyoruz ve bu sisteme "Pathways" adını verdik. Buradaki fikir, bu modelin binlerce veya milyonlarca farklı görevi yerine getirebileceği ve daha sonra aşamalı olarak yeni görevler ekleyebileceğimiz ve aynı anda tüm modalitelerle başa çıkabileceği ve daha sonra gerektiğinde yeni görevleri aşamalı olarak öğrenebileceği ve farklı örnekler veya görevler için modelin ilgili parçalarını çağırabileceğidir. Ve bu konuda oldukça heyecanlıyız, bunun yapay zeka sistemlerini nasıl oluşturacağımız konusunda ileriye doğru bir adım olacağını düşünüyoruz.”

“Örneğin, bu modelleri binlerce veya milyonlarca görev üzerinde eğiteceksek, onları büyük miktarda veri üzerinde eğitebilmemiz gerekir. Verilerin dikkatli bir şekilde toplandığından ve dünyanın her yerindeki farklı toplulukları ve durumları temsil ettiğinden emin olmamız gerekiyor . Ve veri endişeleri, sorumlu yapay zekanın yalnızca bir yönüdür. Burada yapacak çok işimiz var.”

Verilerdeki kalıpları tanıyan tek amaçlı sistemlerden dünyayı daha derinden anlayan bu tür genel amaçlı akıllı sistemlere geçmek , insanlığın karşı karşıya olduğu en büyük sorunlardan bazılarının üstesinden gelmemizi gerçekten sağlayacaktır . Örneğin daha fazla hastalığa teşhis koyabileceğiz; bu modellere kimya ve fizik bilgisini aşılayarak daha iyi ilaçlar üretebileceğiz ; insanların yeni ve daha iyi yollarla öğrenmelerine yardımcı olmak için daha bireyselleştirilmiş eğitim sağlayarak eğitim sistemlerini ilerletebileceğiz ; iklim değişikliği ve belki de temiz enerji çözümlerinin mühendisliği gibi gerçekten karmaşık konuların üstesinden gelebileceğiz . Yani gerçekten, tüm bu tür sistemler dünyanın her yerindeki insanların multidisipliner uzmanlığını gerektirecek . Bu nedenle, ilerleme kaydetmek için yapay zekayı hangi alanda olursanız olun ona bağlayın.”

Soru-Cevap Bölümü:

Jeff Dean: “Bence YZ'deki en büyük zorluk , nasıl yapılacağını zaten bildiğiniz bir dizi görevi yeni görevlere mümkün olduğunca kolay ve zahmetsizce nasıl genelleyeceğinizdir. Ve her şey için ayrı modeller eğitme şeklindeki mevcut yaklaşım, söz konusu sorun hakkında çok fazla veriye ihtiyacınız olduğu anlamına gelir, çünkü etkili bir şekilde dünya ve bu sorun hakkında her şeyi sıfırdan öğrenmeye çalışıyorsunuz. Ancak , halihazırda binlerce ve milyonlarca görevin nasıl yapılacağı ile aşılanmış bu sistemleri kurabilirseniz , onlara nispeten az sayıda örnekle yeni bir şey yapmayı etkili bir şekilde öğretebilirsiniz.”

Chris Anderson: “Ama siz Google için çalışıyorsunuz, araştırmayı Google finanse ediyor. Bu yapay zekanın inşa edeceği ana değerlerin dünya için olduğunu ve örneğin bir reklam modelinin karlılığını en üst düzeye çıkarmak için olmadığını nasıl bilebiliriz? İnsan dikkati hakkında bilinmesi gereken her şeyi bildiğinizde, küçük, kıvrımlı, tuhaf, karanlık parçalarımız hakkında çok şey bileceksiniz. Grubunuzda, mühendislerinize ve diğerlerine bunu dünya için, hepimiz için yapmaları konusunda ilham verebilmeniz için "Bunu şu amaçla yapmalısınız" gibi bir tür ticari zorlama ile kilise-devlet duvarı arasında nasıl durduğunuza dair kurallar var mı?”

Jeff Dean: “Evet, araştırma grubumuz Reklam grubu, Arama grubu, Haritalar grubu da dahil olmak üzere Google'daki bir dizi grupla işbirliği yapıyor, bu nedenle bazı işbirliklerimiz var, ancak aynı zamanda açık olarak yayınladığımız birçok temel araştırma da var. Geçen yıl, bahsettiğiniz konular da dahil olmak üzere, farklı konularda 1.000'den fazla makale yayınladık; adalet, makine öğrenimi modellerinin yorumlanabilirliği, çok önemli olan şeyler ve bu modellerin güvenli ve sorumlu bir şekilde geliştirildiğinden emin olmak için ilerleme kaydetmeye devam etmek için bu konudaki son teknolojiyi ilerletmemiz gerekiyor.”


Bunlar da İlginizi Çekebilir:
Yapay Zekanın Öğrenme Kapasitesi
Öz Farkındalık Seviyesi - Zihin Felsefesi
Yapay Zeka İnsanları İşsiz Bırakacak mı – Teknoloji
Sebastian Thrun ve Chris Anderson: Kendini programlayan yeni nesil bilgisayarlar
Aklı Vücutta Olan Beyin - Zihin Felsefesi


Hiç yorum yok:

Yorum Gönder