Google'ın en geniş ve en yetenekli yapay zeka modeli ile tanışın: Gemini

7 Aralık 2023 Perşembe

Tüm insanlık için daha akıllı bir yapay zeka

Google ve Alphabet CEO’su Sundar Pichai’den

Her teknolojik gelişme yeni bilimsel keşifler, insanlığın ilerlemesi ve daha iyi bir yaşam için fırsat. Yapay zeka konusunda şahit olduğumuz gelişme, içinde bulunduğumuz dönemin en etkilisi, hatta kendinden önceki mobil veya web alanındaki gelişmelerden de etkili. Yapay zeka gündelik hayattan olağanüstü durumlara kadar birçok alanda ve herkesin hayatına yönelik fırsatlar barındırıyor. Yeni inovasyonları ve ekonomik gelişmeleri tetikleyerek bilgiye ulaşma, öğrenme, yaratıcılık, üretkenlik konusunda daha önce hiç görmediğimiz boyutta ilerlemeyi sağlayacak.

Beni en çok da heyecanlandıran şey, yapay zekayı bütün dünyadaki herkesin yararına bir teknolojiye dönüştürme fırsatı.

Yapay zeka konusunda öncü bir şirket olarak sekiz yıllık yolculuğumuzda en çok ivmenin görüldüğü dönemdeyiz. Milyonlarca insan daha bir yıl öncesine kadar üretken yapay zeka teknolojisini kullanamazken artık bütün ürünlerimizde karmaşık sorularına yanıt bulmaktan kullanacakları araçları yapmaya kadar birçok işi üretken yapay zeka ile işbirliği yaparak gerçekleştiriyor. Aynı zamanda geliştiriciler de bizim modellerimizi ve altyapımızı kullanarak yeni üretken yapay zeka uygulamaları geliştirebiliyorlar. Böylece tüm dünyada girişimler ve kuruluşlar yapay zeka araçlarımızla daha da büyüyor.

Bu ne kadar inanılmaz bir ivme de olsa, henüz yapılabileceklerin çok azını gerçekleştirebildik.

Bu çalışmalara cesurca ve sorumlu şekilde yaklaşıyoruz. Yani araştırmalarımızı durmaksızın sürdürürken, insanlığın ve toplumun yararına olacak yetenekleri keşfetmeye devam ediyoruz. Yapay zeka daha da geliştikçe ortaya çıkacak riskleri engellemek için uzmanlar ve hükümetlerle işbirliği yapıyor ve önlemler alıyoruz. En iyi araçlara, temel modellere ve altyapıya yatırımlarımızı sürdürürken Yapay Zeka İlkelerimizden sapmadan bu teknolojileri ürünlerimize entegre edeceğiz ve başkalarıyla buluşturacağız.

Şimdi Gemini ile yolculuğumuzda yeni bir aşamaya geçiyoruz. Gemini bizim en yetenekli, genel ve karşılaştırmalarımızda en üstün performansa sahip modelimiz. Gemini modelinizin ilk sürümü 1.0 farklı boyutlara optimize edildi: Ultra, Pro ve Nano. Bunlar Gemini döneminin ilk modelleri ve Google DeepMind’ı kurarken sahip olduğumuz vizyonun hayat bulmuş hali. Bu yeni dönem modeller şirket olarak yürüttüğümüz ileri düzey bilimsel ve mühendislik çalışmalarının sonucunda ortaya çıktı. Gelecekteki çalışmalar ve bütün insanlık için Gemini’ın ortaya çıkaracağı fırsatlar çok heyecan verici.

-Sundar

Gemini ile tanışın

Demis Hassabis, CEO ve Google DeepMind Kurucusu, Gemini ekibi adına

Yapay zeka, bu alanda araştırma yapan çoğu çalışma arkadaşım gibi benim de iş hayatım boyunca odak noktam oldu. Gençliğimde bilgisayar oyunları için yapay zeka programlarken başlayan ve beynin işleyişini anlamaya çalışan bir sinirbilim araştırmacısı olarak geçirdiğim yıllar boyunca, daha akıllı makineler geliştirebilirsek bunun insanlık için inanılmaz yararlar sağlayabileceğine her zaman inandım.

Sorumluluk çerçevesinde yapay zeka tarafından desteklenen bir dünya vaadi, Google DeepMind'daki çalışmalarımızı yönlendirmeye devam ediyor. Uzun zamandır insanların dünyayı anlama ve onunla etkileşim kurma biçiminden ilham alan yeni nesil yapay zeka modelleri geliştirmeyi hedefliyorduk. Akıllı bir yazılım parçasından daha ziyade, kullanışlı ve sezgisel nitelikleri olan, uzman yardımcı veya asistan özellikli yapay zekadan bahsediyorum.

Bugün şimdiye kadar ürettiğimiz en yetenekli ve genel model olan Gemini'ı tanıtırken bu vizyona bir adım daha yaklaştık.

Gemini, Google Research’teki çalışma arkadaşlarımız da dahil olmak üzere Google içindeki ekiplerin büyük ölçekli bir işbirliğinin ürünüdür. En baştan çok modlu (multimodal) olacak şekilde geliştirildi. Çok modlu olması; metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerinden genel fikir edinip sorunsuz bir şekilde anlayabileceği, bunlar üzerinde çalışabileceği ve bu bilgileri birleştirebileceği anlamına geliyor.

Gemini, en büyük en yetenekli yapay zeka modelimiz

Gemini aynı zamanda şimdiye kadarki en esnek modelimiz olup veri merkezlerinden mobil cihazlara kadar her ortamda verimli bir şekilde çalışabilir. En son teknolojiye sahip yetenekleri, geliştiricilerin ve kurumsal müşterilerin yapay zeka ile üretme ve ölçeklendirme yöntemlerini önemli ölçüde geliştirecek.

İlk versiyonumuz Gemini 1.0, üç farklı ölçeğe göre optimize edildi:

Gemini Ultra: Karmaşıklık seviyesi yüksek işler için uygun en büyük ve en yetenekli model.
Gemini Pro: Genel anlamda çeşitli amaçlara yönelik en ideal model.
Gemini Nano: Cihazlar üzerindeki görevlere göre özelleştirilmiş model.

Yüksek performans

Gemini modellerimizi titizlikle test ediyoruz ve bu modellerin çeşitli görevlerdeki performanslarını değerlendiriyoruz. Gemini Ultra, doğal görüntü, ses ve video anlayışından matematiksel akıl yürütmeye kadar farklı görevlerde, büyük dil modeli (LLM - Large Language Model) araştırma ve geliştirme çalışmalarında yaygın olarak kullanılan 32 akademik kriterin 30'unda mevcut en başarılı sonuçların üzerinde performans gösteriyor.

Gemini Ultra, %90,0'lık skorla, matematik, fizik, tarih, hukuk, tıp ve etik gibi 57 alanın birleşiminde genel kültürü ve problem çözme kabiliyetini test etmede kullanılan MMLU (büyük çoklu görev dil anlama) alanında insan uzmanlardan daha iyi performans gösteren ilk modeldir.

MMLU için geliştirdiğimiz yeni kıyaslama yaklaşımı, Gemini'ın zor soruları cevaplamadan önce daha dikkatli düşünmesini sağlayarak, ilk kat ettiği konumun ötesinde daha önemli gelişmeler sağlamaktadır.

Gemini, metin ve kodlama da dahil olmak üzere bir dizi kıyaslamada mevcut en iyi performans skorlarını geride bırakıyor. Alt text: Gemini Ultra'nın ortak metin karşılaştırmalarındaki performansını GPT-4 ile karşılaştırmalı olarak gösteren grafik (raporlanan sayıların eksik olduğu yerlerde API sayıları hesaplanmıştır).

Gemini Ultra ayrıca, bilinçli akıl yürütme gerektiren farklı alanlarda çoklu mod görevlerden oluşan yeni MMMU kıyaslama testinde 59.4% gibi en yüksek puanı aldı.

Gemini Ultra, görüntü temelli kıyaslama testlerinde önceki en başarılı modellerin performansını aştı. Bu testlerde, Gemini Ultra, görüntülerden metin çıkarıp daha ileri düzey işleme için kullanılan nesne tabanlı karakter tanıma (OCR) sistemlerinin yardımı olmadan bu başarıya ulaştı. Bu sonuçlar, Gemini’ın doğal çok modlu yapısının ve daha karmaşık akıl yürütme yeteneklerinin ilk işaretlerini gösteriyor.

Gemini teknik raporunda daha fazla ayrıntıya ulaşabilirsiniz.

Gemini, bir dizi çok modlu (multimodal) kıyaslamada mevcut en yüksek performansı geride bırakıyor.

Alt text: Gemini Ultra'nın GPT-4V ile kıyaslamalı olarak çok modlu performansını gösteren bir grafik (GPT-4V tarafından desteklenmeyen becerilerde önceki SOTA modelleri listelenmiştir).

Yeni nesil yetenekler

Şimdiye kadar çok modlu modeller oluşturmada standart yaklaşım, farklı yöntemler için ayrı bileşenlerin eğitilmesi ve daha sonra bu işlevselliği kısmen kabaca taklit edecek şekilde bunları bir araya getirme şeklindeydi. Bu modeller, görüntü tanıma gibi belirli görevleri yapmada başarılı olsa da daha kavramsal ve karmaşık akıl yürütme konusunda zorluk yaşayabiliyor.

Gemini'ı temelinde çok modlu olacak ve başlangıçtan itibaren farklı modlarda önceden eğitilmiş olarak tasarladık. Daha sonra etkinliğini daha da geliştirmek için ekstra çok modlu verilerle ince ayarlamalar yaptık. Bu sayede, Gemini'ın her türlü girdiyi en başından itibaren sorunsuz bir şekilde anlayabilmesi ve bunlar hakkında akıl yürütmesi sağlandı. Bu açıdan hemen her alandaki yetenekleri, mevcut çok modlu modellerden çok daha gelişmiş ve en üst düzeydedir.

Gemini’ın yetenekleri ve çalışma şekliyle ilgili daha fazla bilgi

Gelişmiş akıl yürütme

Gemini 1.0'ın gelişmiş çok modlu akıl yürütme yetenekleri, karmaşık yazılı ve görsel bilgilerin anlaşılmasına yardımcı olabilir. Bu özelliği ona, büyük miktarda veri içinde ayırt edilmesi zor olabilecek bilgileri elde etme konusunda benzersiz bir beceri kazandırıyor.

Yüzbinlerce belgeyi okuyarak, filtreleyerek ve anlayarak kayda değer çıkarım elde etme konusundaki olağanüstü yeteneği, bilimden finans alanına kadar birçok alanda dijital hızlarda yeni atılımlar yapmaya yardımcı olacaktır.

Gemini yeni bilimsel bilgileri açığa çıkarır.

Metinleri, görüntüleri, sesleri anlama ve daha fazlası

Gemini 1.0; metinleri, görüntüleri, sesleri ve daha fazlasını aynı anda tanıyıp anlayacak şekilde eğitildiği için ince detayları daha iyi kavrıyor ve karmaşık konularla ilgili soruları yanıtlayabiliyor. Bu yönü onu özellikle matematik ve fizikte akıl yürütmeyi açıklamada başarılı yapıyor.

Gemini matematik ve fizikte akıl yürütme açıklaması yapabiliyor.

Gelişmiş kodlama

Gemini'ın ilk sürümü; Python, Java, C++ ve Go gibi dünyanın en popüler programlama dillerindeki yüksek kaliteli kodları anlayabilir, açıklayabilir ve üretebilir. Farklı diller arasında çalışabilme ve karmaşık bilgiler hakkında akıl yürütme yeteneği, onu dünyada kodlamanın önde gelen temel modellerinden biri haline getiriyor.

Gemini Ultra, önemli bir endüstri standardı karşılaştırma testi olan HumanEval ile kendi veri seti kodlama testimiz Natural2Code gibi, çeşitli kodlama karşılaştırma testlerinde üstün performans gösteriyor.

Gemini ayrıca daha gelişmiş kodlama sistemlerinin motoru olarak da kullanılabilir. Programlama yarışmalarında rekabetçi bir performans seviyesine ulaşan ilk yapay zeka kod üretim sistemi AlphaCode'u iki yıl önce kullanıma sunduk.

Gemini'ın özel bir versiyonunu kullanarak geliştirdiğimiz AlphaCode 2, karmaşık matematik ve teorik bilgisayar bilimini kapsayacak şekilde kodlamanın ötesine geçerek zorlu programlama problemlerini çözme konusunda üstün performans gösteriyor.

Gemini, kodlama ve rekabetçi programlamada üstün başarı gösteriyor.

Orijinal AlphaCode ile aynı platformda değerlendirildiğinde, AlphaCode 2 büyük ilerleme kaydederek neredeyse iki kat daha fazla sorunu çözüyor. AlphaCode 2, yarışma katılımcılarının %85’inden ve AlphaCode için neredeyse %50'sinden daha başarılı oluyor. Programcılar, takip etmeleri gereken kod örnekleri için belirli özellikler tanımlayarak AlphaCode 2 ile birlikte çalıştıklarında çok daha iyi sonuçlar elde ediliyor.

Programcıların, problemlerle ilgili akıl yürütme, kod tasarım önerileri ve uygulama adımında yardımcı olabilecek araçlar olarak üstün yetenekli yapay zeka modellerini giderek daha fazla kullanmaları oldukça heyecan verici. Bu sayede uygulamalarını daha hızlı kullanıma sunabilirler, daha iyi hizmetler tasarlayabilirler.

AlphaCode 2 teknik raporunda daha fazla ayrıntıya ulaşabilirsiniz.

Daha Güvenilir, Daha Ölçeklenebilir, Daha Verimli

Gemini 1.0'ı, Google'ın şirket içinde tasarladığı Tensör İşleme Birimleri (TPU'lar) v4 ve v5e'yi kullanarak yapay zekayla optimize edilmiş altyapımız üzerinde geniş ölçekte eğittik. Bu eğitim için modelimizi öncelikle en güvenilir ve ölçeklenebilir, en verimli model olacak şekilde tasarladık.

Gemini, TPU'larda daha önceki daha küçük ve daha az yetenekli modellere göre önemli ölçüde daha hızlı çalışıyor. Özel olarak tasarlanmış bu yapay zeka hızlandırıcıları, Google'ın Arama, YouTube, Gmail, Google Haritalar, Google Play ve Android gibi milyarlarca kullanıcıya hizmet veren yapay zeka destekli ürünlerinin merkezinde yer alıyor. Ayrıca bu hızlandırıcılar, dünyadaki şirketlere büyük ölçekli yapay zeka modellerini uygun maliyetli bir şekilde eğitme olanağı da sağladı.

Bugün aynı zamanda bugüne kadarki en güçlü, en verimli ve en ölçeklenebilir TPU sistemi olan ve son teknoloji yapay zeka modellerini eğitmek için tasarlanan Cloud TPU v5p'yi de duyuruyoruz. Bu yeni nesil TPU, Gemini'ın gelişimini hızlandıracak, geliştiricilerin ve kurumsal müşterilerin büyük ölçekli üretken yapay zeka modellerini daha hızlı eğitmesine yardımcı olarak yeni ürün ve yeteneklerin müşterilere daha erken ulaşmasını sağlayacak.

Google veri merkezinde bulunan Cloud TPU v5p AI hızlandırıcı süper bilgisayarlar kümesi

Sorumluluk anlayışı ve güvenlik önceliğimiz

Google olarak yaptığımız her şeyde cesur ve sorumlu yapay zekayı geliştirmeye kararlıyız. Google'ın Yapay Zeka İlkeleri’ni ve ürünlerimizdeki güçlü güvenlik ilkelerini temel alarak Gemini'ın çok modlu yeteneklerine uygun yeni koruma özellikleri ekliyoruz. Geliştirmenin her aşamasında potansiyel riskleri değerlendiriyor ve bunları test edip azaltmak için çalışıyoruz.

Gemini, önyargı ve toksik yaklaşım dahil olmak üzere bugüne kadarki tüm Google yapay zeka modelleri arasında en kapsamlı güvenlik özelliklerine sahip. Siber suç, manipülatif yönlendirme ve otonomi gibi potansiyel risk alanlarıyla ilgili yeni araştırmalar yaptık ve Gemini'ın dağıtımından önce kritik güvenlik sorunlarının belirlenmesine yardımcı olmak için Google Research'ün sınıfının en iyisi çekişmeli (adversarial) test tekniklerini uyguladık.

Kendi değerlendirme yaklaşımımızın yakalayamadığı alanları belirlemek amacıyla, çeşitli konularda modellerimizi stres testine tutmak üzere çeşitli şirket dışı sektör uzmanlarından ve iş ortaklarımızdan oluşan bir grupla birlikte çalışmaya devam edeceğiz.

Gemini'ın eğitim aşamaları sırasında içerik güvenliği sorunlarını teşhis etmek ve çıktısının politikalarımıza uygun olmasını sağlamak için, Allen Yapay Zeka Enstitüsü'ndeki uzmanlar tarafından geliştirilen, web'den alınan farklı derecelerde toksisiteye sahip 100.000 istemden oluşan bir dizi olan Gerçek Toksik İstemler gibi kriterlerden yararlanıyoruz. Bu çalışmayla ilgili daha fazla ayrıntı yakında gelecek.

Olası olumsuz sonuçları sınırlamak amacıyla, örneğin şiddet veya olumsuz stereotipler içeren içerikleri tanımlama, etiketleme ve sıralama amacına yönelik özel güvenlik sınıflandırıcıları oluşturduk. Güçlü filtrelerle birleştirilen bu katmanlı yaklaşım, Gemini'ı herkes için daha güvenli ve daha kapsayıcı hale getirmeyi hedeflemektedir. Gerçeklik, temellendirme, atıf ve doğrulama gibi modellere ilişkin bilinen zorluklar üzerinde çalışmalarımıza her zaman devam ediyoruz.

Sorumluluk ve güvenlik anlayışı, her zaman modellerimizin geliştirilmesi ve kullanıma sunulmasında önceliğimiz olacaktır. Bu, işbirliği anlayışıyla çalışma gerektiren uzun vadeli bir taahhüttür. Bu nedenle, MLCommons, Frontier Model Forum, AI Safety Fund gibi kuruluşlar ile kamu ve özel sektördeki yapay zeka sistemlerine özgü güvenlik risklerinin azaltılmasına yardımcı olmak için tasarlanan Secure AI Framework (SAIF) inisiyatifimiz gibi, en doğru uygulamaları bulma, emniyet ve güvenlik kriterlerini belirleme konusunda sektörle ve geniş bir ekosistemle birlikte çalışıyoruz. Gemini'ı geliştirirken dünya çapındaki araştırmacılar, hükümetler ve sivil toplum gruplarıyla işbirliği yapmaya devam edeceğiz.

Gemini’ı tüm dünyanın kullanımına sunma

Gemini 1.0 şimdi çeşitli ürün ve platformlarda kullanıma sunuluyor:

Google ürünlerinde Gemini Pro

Gemini’ı Google ürünleri aracılığıyla milyarlarca kullanıcıya getiriyoruz.

Bugünden itibaren Bard, daha gelişmiş akıl yürütme, planlama, anlama ve daha fazla özelliği için Gemini Pro'nun özel bir sürümünü kullanacak. Bu değişiklik, Bard'ın kullanılmaya başlanmasından bu yana yapılan en önemli yenilik olup Gemini Pro destekli Bard'ı, mevcut en yetenekli ücretsiz modellerden biri haline getiriyor.

Gemini Pro destekli Bard, 170'den fazla ülke ve bölgede İngilizce olarak kullanıma açılacak. Yakın zamanda da farklı modları da kapsayacak şekilde genişlemeyi, yeni dilleri ve bölgeleri desteklemeyi planlıyoruz.

Ayrıca Pixel telefonlara Gemini'ı getiriyoruz. Böylece Pixel 8 Pro, "Kaydedici" uygulamasında "Özetle" ve WhatsApp'tan başlayarak diğer mesajlaşma uygulamalarının da dahil olacağı, Gboard'da Akıllı Yanıt özellikleriyle Gemini Nano'yu kullanmak üzere tasarlanan ilk akıllı telefon oluyor.

Aramada Gemini'yi denemeye başlıyoruz; bu sayede kullanıcılar için Arama Üretken Deneyimimizi (SGE) daha hızlı hale getiriyoruz; ABD'de İngilizce gecikmesinde %40'lık bir azalmanın yanı sıra kaliteyi de artırıyoruz.

Önümüzdeki aylarda Gemini; Arama, Ads, Chrome ve Duet AI gibi daha fazla ürün ve hizmetimizde kullanılabilecek.

Gemini ile geliştirme

13 Aralık'tan itibaren geliştiriciler ve kurumsal müşteriler Gemini Pro'ya, Google AI Studio veya Google Cloud Vertex AI'daki Gemini API aracılığıyla erişebilecek.

Google AI Studio; geliştiricilerin ve kurumsal müşterilerin, bir API anahtarıyla hızlı bir şekilde uygulamalarının prototipini oluşturmasına ve kullanıma sunmasına yardımcı olan ücretsiz, web tabanlı bir geliştirici aracı. Tamamen yönetilen bir yapay zeka platformu söz konusu olduğunda Vertex AI, Gemini'ın tam veri kontrolüyle özelleştirilmesine olanak tanır ve kurumsal güvenlik, emniyet, gizlilik ile veri yönetimi ve uyumluluğu için ekstra Google Cloud özelliklerinden yararlanır.

Android geliştiricileri aynı zamanda AICore aracılığıyla, cihazda gerçekleştirilecek görevler için en verimli modelimiz olan Gemini Nano'yla birlikte uygulama geliştirebilecek. AICore, Pixel 8 Pro cihazlardan başlayarak Android 14'te sunulan yeni bir sistem özelliği. Erken ön izleme için kaydolmayı unutmayın.

Gemini Ultra yakında

Geniş ölçekte kullanıma sunulmasından önce, Gemini Ultra için güvenilir iş ortaklarımızca gerçekleştirilen kırmızı takım (red-teaming) testleri dahil olmak üzere çeşitli güvenirlik ve güvenlik kontrollerini tamamlıyoruz ve pekiştirmeli insan geri bildiriminden öğrenme (RLHF) ile ince ayarlama tekniklerini kullanarak geliştirmeye devam ediyoruz.

Bu sürecin bir parçası olarak Gemini Ultra'yı önümüzdeki yılın başlarında geliştiricilere ve kurumsal müşterilerin kullanımına açmadan önce erken deneyim ve geri bildirim amaçlı olarak belirli müşterilerimiz, geliştiriciler, iş ortaklarımız ile politika değerlendirme uzmanlarının kullanımına açacağız.

Gelecek yılın başında Gemini Ultra'dan başlayarak en iyi modellerimize ve yeteneklerimize erişmenizi sağlayan yeni, son teknolojiye sahip bir yapay zeka deneyimi olan Bard Advanced’i de kullanıma sunmayı planlıyoruz.

Gemini çağı: İnovasyonun geleceğine ışık tutuyor

Gemini, yapay zekanın geliştirilmesinde önemli bir kilometre taşıdır. Yapay zeka modellerimizin yeteneklerini hızla yenilemeye ve bunları sorumlu bir şekilde geliştirmeye devam ederken, Google olarak biz de yeni bir dönemin başlangıcında olduğumuzu hissediyoruz.

Gemini'da şu ana kadar büyük ilerlemeler kaydettik. Gelecek sürümlerde, planlama ve bellek alanlarında ilerlemeler yaparak ve bağlam penceresini genişleterek, daha iyi yanıtlar verebilme yeteneğini geliştirmek için çalışmaya da devam ediyoruz.

Yaratıcılığı artıracak, bilgi dünyamızı genişletecek, bilimi daha ileri taşıyacak ve dünya çapında milyarlarca insanın hayatını ve çalışma şeklini dönüştürecek bir inovasyon geleceği olan “yapay zeka ile sorumlu bir şekilde desteklenen dünyanın” inanılmaz olanaklarını hayal etmek bizi çok heyecanlandırıyor.