Demis Hassabis, CEO ve Google DeepMind Kurucusu, Gemini ekibi adına
Yapay zeka, bu alanda araştırma yapan çoğu çalışma arkadaşım gibi benim de iş hayatım boyunca odak noktam oldu. Gençliğimde bilgisayar oyunları için yapay zeka programlarken başlayan ve beynin işleyişini anlamaya çalışan bir sinirbilim araştırmacısı olarak geçirdiğim yıllar boyunca, daha akıllı makineler geliştirebilirsek bunun insanlık için inanılmaz yararlar sağlayabileceğine her zaman inandım.
Sorumluluk çerçevesinde yapay zeka tarafından desteklenen bir dünya vaadi, Google DeepMind'daki çalışmalarımızı yönlendirmeye devam ediyor. Uzun zamandır insanların dünyayı anlama ve onunla etkileşim kurma biçiminden ilham alan yeni nesil yapay zeka modelleri geliştirmeyi hedefliyorduk. Akıllı bir yazılım parçasından daha ziyade, kullanışlı ve sezgisel nitelikleri olan, uzman yardımcı veya asistan özellikli yapay zekadan bahsediyorum.
Bugün şimdiye kadar ürettiğimiz en yetenekli ve genel model olan Gemini'ı tanıtırken bu vizyona bir adım daha yaklaştık.
Gemini, Google Research’teki çalışma arkadaşlarımız da dahil olmak üzere Google içindeki ekiplerin büyük ölçekli bir işbirliğinin ürünüdür. En baştan çok modlu (multimodal) olacak şekilde geliştirildi. Çok modlu olması; metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerinden genel fikir edinip sorunsuz bir şekilde anlayabileceği, bunlar üzerinde çalışabileceği ve bu bilgileri birleştirebileceği anlamına geliyor.
Gemini, en büyük en yetenekli yapay zeka modelimiz
Gemini aynı zamanda şimdiye kadarki en esnek modelimiz olup veri merkezlerinden mobil cihazlara kadar her ortamda verimli bir şekilde çalışabilir. En son teknolojiye sahip yetenekleri, geliştiricilerin ve kurumsal müşterilerin yapay zeka ile üretme ve ölçeklendirme yöntemlerini önemli ölçüde geliştirecek.
İlk versiyonumuz Gemini 1.0, üç farklı ölçeğe göre optimize edildi:
Gemini Ultra: Karmaşıklık seviyesi yüksek işler için uygun en büyük ve en yetenekli model.
Gemini Pro: Genel anlamda çeşitli amaçlara yönelik en ideal model.
Gemini Nano: Cihazlar üzerindeki görevlere göre özelleştirilmiş model.
Yüksek performans
Gemini modellerimizi titizlikle test ediyoruz ve bu modellerin çeşitli görevlerdeki performanslarını değerlendiriyoruz. Gemini Ultra, doğal görüntü, ses ve video anlayışından matematiksel akıl yürütmeye kadar farklı görevlerde, büyük dil modeli (LLM - Large Language Model) araştırma ve geliştirme çalışmalarında yaygın olarak kullanılan 32 akademik kriterin 30'unda mevcut en başarılı sonuçların üzerinde performans gösteriyor.
Gemini Ultra, %90,0'lık skorla, matematik, fizik, tarih, hukuk, tıp ve etik gibi 57 alanın birleşiminde genel kültürü ve problem çözme kabiliyetini test etmede kullanılan MMLU (büyük çoklu görev dil anlama) alanında insan uzmanlardan daha iyi performans gösteren ilk modeldir.
MMLU için geliştirdiğimiz yeni kıyaslama yaklaşımı, Gemini'ın zor soruları cevaplamadan önce daha dikkatli düşünmesini sağlayarak, ilk kat ettiği konumun ötesinde daha önemli gelişmeler sağlamaktadır.
Gemini, metin ve kodlama da dahil olmak üzere bir dizi kıyaslamada mevcut en iyi performans skorlarını geride bırakıyor. Alt text: Gemini Ultra'nın ortak metin karşılaştırmalarındaki performansını GPT-4 ile karşılaştırmalı olarak gösteren grafik (raporlanan sayıların eksik olduğu yerlerde API sayıları hesaplanmıştır).
Gemini Ultra ayrıca, bilinçli akıl yürütme gerektiren farklı alanlarda çoklu mod görevlerden oluşan yeni MMMU kıyaslama testinde 59.4% gibi en yüksek puanı aldı.
Gemini Ultra, görüntü temelli kıyaslama testlerinde önceki en başarılı modellerin performansını aştı. Bu testlerde, Gemini Ultra, görüntülerden metin çıkarıp daha ileri düzey işleme için kullanılan nesne tabanlı karakter tanıma (OCR) sistemlerinin yardımı olmadan bu başarıya ulaştı. Bu sonuçlar, Gemini’ın doğal çok modlu yapısının ve daha karmaşık akıl yürütme yeteneklerinin ilk işaretlerini gösteriyor.
Gemini, bir dizi çok modlu (multimodal) kıyaslamada mevcut en yüksek performansı geride bırakıyor.
Alt text: Gemini Ultra'nın GPT-4V ile kıyaslamalı olarak çok modlu performansını gösteren bir grafik (GPT-4V tarafından desteklenmeyen becerilerde önceki SOTA modelleri listelenmiştir).
Yeni nesil yetenekler
Şimdiye kadar çok modlu modeller oluşturmada standart yaklaşım, farklı yöntemler için ayrı bileşenlerin eğitilmesi ve daha sonra bu işlevselliği kısmen kabaca taklit edecek şekilde bunları bir araya getirme şeklindeydi. Bu modeller, görüntü tanıma gibi belirli görevleri yapmada başarılı olsa da daha kavramsal ve karmaşık akıl yürütme konusunda zorluk yaşayabiliyor.
Gemini'ı temelinde çok modlu olacak ve başlangıçtan itibaren farklı modlarda önceden eğitilmiş olarak tasarladık. Daha sonra etkinliğini daha da geliştirmek için ekstra çok modlu verilerle ince ayarlamalar yaptık. Bu sayede, Gemini'ın her türlü girdiyi en başından itibaren sorunsuz bir şekilde anlayabilmesi ve bunlar hakkında akıl yürütmesi sağlandı. Bu açıdan hemen her alandaki yetenekleri, mevcut çok modlu modellerden çok daha gelişmiş ve en üst düzeydedir.
Gemini’ın yetenekleri ve çalışma şekliyle ilgili daha fazla bilgi
Gelişmiş akıl yürütme
Gemini 1.0'ın gelişmiş çok modlu akıl yürütme yetenekleri, karmaşık yazılı ve görsel bilgilerin anlaşılmasına yardımcı olabilir. Bu özelliği ona, büyük miktarda veri içinde ayırt edilmesi zor olabilecek bilgileri elde etme konusunda benzersiz bir beceri kazandırıyor.
Yüzbinlerce belgeyi okuyarak, filtreleyerek ve anlayarak kayda değer çıkarım elde etme konusundaki olağanüstü yeteneği, bilimden finans alanına kadar birçok alanda dijital hızlarda yeni atılımlar yapmaya yardımcı olacaktır.
Gemini yeni bilimsel bilgileri açığa çıkarır.
Metinleri, görüntüleri, sesleri anlama ve daha fazlası
Gemini 1.0; metinleri, görüntüleri, sesleri ve daha fazlasını aynı anda tanıyıp anlayacak şekilde eğitildiği için ince detayları daha iyi kavrıyor ve karmaşık konularla ilgili soruları yanıtlayabiliyor. Bu yönü onu özellikle matematik ve fizikte akıl yürütmeyi açıklamada başarılı yapıyor.
Gemini matematik ve fizikte akıl yürütme açıklaması yapabiliyor.
Gelişmiş kodlama
Gemini'ın ilk sürümü; Python, Java, C++ ve Go gibi dünyanın en popüler programlama dillerindeki yüksek kaliteli kodları anlayabilir, açıklayabilir ve üretebilir. Farklı diller arasında çalışabilme ve karmaşık bilgiler hakkında akıl yürütme yeteneği, onu dünyada kodlamanın önde gelen temel modellerinden biri haline getiriyor.
Gemini Ultra, önemli bir endüstri standardı karşılaştırma testi olan HumanEval ile kendi veri seti kodlama testimiz Natural2Code gibi, çeşitli kodlama karşılaştırma testlerinde üstün performans gösteriyor.
Gemini ayrıca daha gelişmiş kodlama sistemlerinin motoru olarak da kullanılabilir. Programlama yarışmalarında rekabetçi bir performans seviyesine ulaşan ilk yapay zeka kod üretim sistemi AlphaCode'u iki yıl önce kullanıma sunduk.
Gemini'ın özel bir versiyonunu kullanarak geliştirdiğimiz AlphaCode 2, karmaşık matematik ve teorik bilgisayar bilimini kapsayacak şekilde kodlamanın ötesine geçerek zorlu programlama problemlerini çözme konusunda üstün performans gösteriyor.
Gemini, kodlama ve rekabetçi programlamada üstün başarı gösteriyor.
Orijinal AlphaCode ile aynı platformda değerlendirildiğinde, AlphaCode 2 büyük ilerleme kaydederek neredeyse iki kat daha fazla sorunu çözüyor. AlphaCode 2, yarışma katılımcılarının %85’inden ve AlphaCode için neredeyse %50'sinden daha başarılı oluyor. Programcılar, takip etmeleri gereken kod örnekleri için belirli özellikler tanımlayarak AlphaCode 2 ile birlikte çalıştıklarında çok daha iyi sonuçlar elde ediliyor.
Programcıların, problemlerle ilgili akıl yürütme, kod tasarım önerileri ve uygulama adımında yardımcı olabilecek araçlar olarak üstün yetenekli yapay zeka modellerini giderek daha fazla kullanmaları oldukça heyecan verici. Bu sayede uygulamalarını daha hızlı kullanıma sunabilirler, daha iyi hizmetler tasarlayabilirler.
Daha Güvenilir, Daha Ölçeklenebilir, Daha Verimli
Gemini 1.0'ı, Google'ın şirket içinde tasarladığı Tensör İşleme Birimleri (TPU'lar) v4 ve v5e'yi kullanarak yapay zekayla optimize edilmiş altyapımız üzerinde geniş ölçekte eğittik. Bu eğitim için modelimizi öncelikle en güvenilir ve ölçeklenebilir, en verimli model olacak şekilde tasarladık.
Gemini, TPU'larda daha önceki daha küçük ve daha az yetenekli modellere göre önemli ölçüde daha hızlı çalışıyor. Özel olarak tasarlanmış bu yapay zeka hızlandırıcıları, Google'ın Arama, YouTube, Gmail, Google Haritalar, Google Play ve Android gibi milyarlarca kullanıcıya hizmet veren yapay zeka destekli ürünlerinin merkezinde yer alıyor. Ayrıca bu hızlandırıcılar, dünyadaki şirketlere büyük ölçekli yapay zeka modellerini uygun maliyetli bir şekilde eğitme olanağı da sağladı.
Bugün aynı zamanda bugüne kadarki en güçlü, en verimli ve en ölçeklenebilir TPU sistemi olan ve son teknoloji yapay zeka modellerini eğitmek için tasarlanan Cloud TPU v5p'yi de duyuruyoruz. Bu yeni nesil TPU, Gemini'ın gelişimini hızlandıracak, geliştiricilerin ve kurumsal müşterilerin büyük ölçekli üretken yapay zeka modellerini daha hızlı eğitmesine yardımcı olarak yeni ürün ve yeteneklerin müşterilere daha erken ulaşmasını sağlayacak.
Google veri merkezinde bulunan Cloud TPU v5p AI hızlandırıcı süper bilgisayarlar kümesi
Sorumluluk anlayışı ve güvenlik önceliğimiz
Google olarak yaptığımız her şeyde cesur ve sorumlu yapay zekayı geliştirmeye kararlıyız. Google'ın Yapay Zeka İlkeleri’ni ve ürünlerimizdeki güçlü güvenlik ilkelerini temel alarak Gemini'ın çok modlu yeteneklerine uygun yeni koruma özellikleri ekliyoruz. Geliştirmenin her aşamasında potansiyel riskleri değerlendiriyor ve bunları test edip azaltmak için çalışıyoruz.
Gemini, önyargı ve toksik yaklaşım dahil olmak üzere bugüne kadarki tüm Google yapay zeka modelleri arasında en kapsamlı güvenlik özelliklerine sahip. Siber suç, manipülatif yönlendirme ve otonomi gibi potansiyel risk alanlarıyla ilgili yeni araştırmalar yaptık ve Gemini'ın dağıtımından önce kritik güvenlik sorunlarının belirlenmesine yardımcı olmak için Google Research'ün sınıfının en iyisi çekişmeli (adversarial) test tekniklerini uyguladık.
Kendi değerlendirme yaklaşımımızın yakalayamadığı alanları belirlemek amacıyla, çeşitli konularda modellerimizi stres testine tutmak üzere çeşitli şirket dışı sektör uzmanlarından ve iş ortaklarımızdan oluşan bir grupla birlikte çalışmaya devam edeceğiz.
Gemini'ın eğitim aşamaları sırasında içerik güvenliği sorunlarını teşhis etmek ve çıktısının politikalarımıza uygun olmasını sağlamak için, Allen Yapay Zeka Enstitüsü'ndeki uzmanlar tarafından geliştirilen, web'den alınan farklı derecelerde toksisiteye sahip 100.000 istemden oluşan bir dizi olan Gerçek Toksik İstemler gibi kriterlerden yararlanıyoruz. Bu çalışmayla ilgili daha fazla ayrıntı yakında gelecek.
Olası olumsuz sonuçları sınırlamak amacıyla, örneğin şiddet veya olumsuz stereotipler içeren içerikleri tanımlama, etiketleme ve sıralama amacına yönelik özel güvenlik sınıflandırıcıları oluşturduk. Güçlü filtrelerle birleştirilen bu katmanlı yaklaşım, Gemini'ı herkes için daha güvenli ve daha kapsayıcı hale getirmeyi hedeflemektedir. Gerçeklik, temellendirme, atıf ve doğrulama gibi modellere ilişkin bilinen zorluklar üzerinde çalışmalarımıza her zaman devam ediyoruz.
Sorumluluk ve güvenlik anlayışı, her zaman modellerimizin geliştirilmesi ve kullanıma sunulmasında önceliğimiz olacaktır. Bu, işbirliği anlayışıyla çalışma gerektiren uzun vadeli bir taahhüttür. Bu nedenle, MLCommons, Frontier Model Forum, AI Safety Fund gibi kuruluşlar ile kamu ve özel sektördeki yapay zeka sistemlerine özgü güvenlik risklerinin azaltılmasına yardımcı olmak için tasarlanan Secure AI Framework (SAIF) inisiyatifimiz gibi, en doğru uygulamaları bulma, emniyet ve güvenlik kriterlerini belirleme konusunda sektörle ve geniş bir ekosistemle birlikte çalışıyoruz. Gemini'ı geliştirirken dünya çapındaki araştırmacılar, hükümetler ve sivil toplum gruplarıyla işbirliği yapmaya devam edeceğiz.
Gemini’ı tüm dünyanın kullanımına sunma
Gemini 1.0 şimdi çeşitli ürün ve platformlarda kullanıma sunuluyor:
Google ürünlerinde Gemini Pro
Gemini’ı Google ürünleri aracılığıyla milyarlarca kullanıcıya getiriyoruz.
Bugünden itibaren Bard, daha gelişmiş akıl yürütme, planlama, anlama ve daha fazla özelliği için Gemini Pro'nun özel bir sürümünü kullanacak. Bu değişiklik, Bard'ın kullanılmaya başlanmasından bu yana yapılan en önemli yenilik olup Gemini Pro destekli Bard'ı, mevcut en yetenekli ücretsiz modellerden biri haline getiriyor.
Gemini Pro destekli Bard, 170'den fazla ülke ve bölgede İngilizce olarak kullanıma açılacak. Yakın zamanda da farklı modları da kapsayacak şekilde genişlemeyi, yeni dilleri ve bölgeleri desteklemeyi planlıyoruz.
Ayrıca Pixel telefonlara Gemini'ı getiriyoruz. Böylece Pixel 8 Pro, "Kaydedici" uygulamasında "Özetle" ve WhatsApp'tan başlayarak diğer mesajlaşma uygulamalarının da dahil olacağı, Gboard'da Akıllı Yanıt özellikleriyle Gemini Nano'yu kullanmak üzere tasarlanan ilk akıllı telefon oluyor.
Aramada Gemini'yi denemeye başlıyoruz; bu sayede kullanıcılar için Arama Üretken Deneyimimizi (SGE) daha hızlı hale getiriyoruz; ABD'de İngilizce gecikmesinde %40'lık bir azalmanın yanı sıra kaliteyi de artırıyoruz.
Önümüzdeki aylarda Gemini; Arama, Ads, Chrome ve Duet AI gibi daha fazla ürün ve hizmetimizde kullanılabilecek.
Gemini ile geliştirme
13 Aralık'tan itibaren geliştiriciler ve kurumsal müşteriler Gemini Pro'ya, Google AI Studio veya Google Cloud Vertex AI'daki Gemini API aracılığıyla erişebilecek.
Google AI Studio; geliştiricilerin ve kurumsal müşterilerin, bir API anahtarıyla hızlı bir şekilde uygulamalarının prototipini oluşturmasına ve kullanıma sunmasına yardımcı olan ücretsiz, web tabanlı bir geliştirici aracı. Tamamen yönetilen bir yapay zeka platformu söz konusu olduğunda Vertex AI, Gemini'ın tam veri kontrolüyle özelleştirilmesine olanak tanır ve kurumsal güvenlik, emniyet, gizlilik ile veri yönetimi ve uyumluluğu için ekstra Google Cloud özelliklerinden yararlanır.
Android geliştiricileri aynı zamanda AICore aracılığıyla, cihazda gerçekleştirilecek görevler için en verimli modelimiz olan Gemini Nano'yla birlikte uygulama geliştirebilecek. AICore, Pixel 8 Pro cihazlardan başlayarak Android 14'te sunulan yeni bir sistem özelliği. Erken ön izleme için kaydolmayı unutmayın.
Gemini Ultra yakında
Geniş ölçekte kullanıma sunulmasından önce, Gemini Ultra için güvenilir iş ortaklarımızca gerçekleştirilen kırmızı takım (red-teaming) testleri dahil olmak üzere çeşitli güvenirlik ve güvenlik kontrollerini tamamlıyoruz ve pekiştirmeli insan geri bildiriminden öğrenme (RLHF) ile ince ayarlama tekniklerini kullanarak geliştirmeye devam ediyoruz.
Bu sürecin bir parçası olarak Gemini Ultra'yı önümüzdeki yılın başlarında geliştiricilere ve kurumsal müşterilerin kullanımına açmadan önce erken deneyim ve geri bildirim amaçlı olarak belirli müşterilerimiz, geliştiriciler, iş ortaklarımız ile politika değerlendirme uzmanlarının kullanımına açacağız.
Gelecek yılın başında Gemini Ultra'dan başlayarak en iyi modellerimize ve yeteneklerimize erişmenizi sağlayan yeni, son teknolojiye sahip bir yapay zeka deneyimi olan Bard Advanced’i de kullanıma sunmayı planlıyoruz.
Gemini çağı: İnovasyonun geleceğine ışık tutuyor
Gemini, yapay zekanın geliştirilmesinde önemli bir kilometre taşıdır. Yapay zeka modellerimizin yeteneklerini hızla yenilemeye ve bunları sorumlu bir şekilde geliştirmeye devam ederken, Google olarak biz de yeni bir dönemin başlangıcında olduğumuzu hissediyoruz.
Gemini'da şu ana kadar büyük ilerlemeler kaydettik. Gelecek sürümlerde, planlama ve bellek alanlarında ilerlemeler yaparak ve bağlam penceresini genişleterek, daha iyi yanıtlar verebilme yeteneğini geliştirmek için çalışmaya da devam ediyoruz.
Yaratıcılığı artıracak, bilgi dünyamızı genişletecek, bilimi daha ileri taşıyacak ve dünya çapında milyarlarca insanın hayatını ve çalışma şeklini dönüştürecek bir inovasyon geleceği olan “yapay zeka ile sorumlu bir şekilde desteklenen dünyanın” inanılmaz olanaklarını hayal etmek bizi çok heyecanlandırıyor.