İçeriğe geç

Rehberler

Burakinyow

Tüm rehberlere dön

GenelBurak

Telefonunda çalışan mini AI ajan geliyor

Yayınlanma Tarihi:

Yapay zeka dünyasında her gün yeni bir "en büyük", "en güçlü" model duyurulmasına alıştık. OpenAI, Google, Anthropic derken milyarlarca parametrelik devasa modeller havada uçuşuyor. Ancak yazılım geliştiren, SaaS üreten veya sahada gerçek ürün sunan bizlerin en büyük ortak derdi hiç değişmiyor: Pahalı bulut sunucuları, gigabytelarca RAM ihtiyacı ve bitmek bilmeyen internet gecikmeleri.

Dün gece açık kaynak dünyasında sessiz sedasız öyle bir proje yayınlandı ki, yukarıda saydığım tüm dertleri tek gecede çöpe atabilir. Cactus Compute ekibinin geliştirdiği Needle (İğne) adlı bu model, yapay zekanın geleceğinin "daha büyük" olmakta değil, "daha akıllıca küçülmekte" olduğunu kanıtlıyor.

Gelin, bu 14 megabaytlık devrimin detaylarına, arkasındaki akıllıca mühendisliğe ve bizim gibi geliştiriciler için ne anlama geldiğine yakından bakalım.


Nedir Bu Needle?

Kısacası Cactus Needle; Google’ın devasa Gemini 3.1 modelinin en akıllı yeteneğini, yani "Tool-Calling" (Fonksiyon Çağırma/Yazılım Tetikleme) beynini alıp, sadece 26 milyon parametrelik minnacık bir gövdeye sığdırmış (damıtmış) bir model.

Boyutu ne kadar mı? Sadece 14 Megabayt.

Bugün bilgisayarınıza indirdiğiniz basit bir fotoğraf düzenleme uygulamasından bile daha küçük. Ama yaptığı iş, kendi boyutunun binlerce katı büyüklükteki modellere taş çıkartıyor.


Arkasındaki Mühendislik Hilesi: Hafızayı Çöpe Atmak

Bir yapay zeka modelinin bu kadar küçük kalıp nasıl bu kadar zeki olabildiğini anlamak için arkasındaki harika mantığı bilmek gerekiyor.

Standart yapay zeka modelleri dünyadaki her şeyi ezberlemeye çalışır. Tarih, coğrafya, felsefe... Bu yüzden beynini (parametrelerini) büyütmek zorundadır. Ancak Cactus ekibi çok zekice bir şey yapmış: "Bizim bu modele bir şeyler ezberletmemize gerek yok. Biz ona dışarıdan fonksiyonları (araçları) vereceğiz, o sadece hangisini seçeceğini bilecek" demişler.

Bu yüzden modelin mimarisindeki tüm gereksiz hafıza katmanlarını (FFN/MLP) söküp atmışlar. Geriye sadece "Attention" (Dikkat) katmanı kalmış. Model hiçbir şeyi ezberlemiyor, ama önüne koyduğunuz verinin içinden neyi, ne zaman tetiklemesi gerektiğini milisaniyeler içinde şak diye anlıyor.


Neden Bir Devrim? (Bulut Devri Bitiyor mu?)

Yazılımcılar olarak bugüne kadar lokalde (cihaz üzerinde) yapay zeka çalıştırmayı hep hayal ettik. Ama en küçük model bile bilgisayarı ağlatıyor, gigabytelarca RAM sömürüyordu. Needle ile kurallar tamamen değişti:

  • Sıfır İnternet, %100 Gizlilik: Needle, çalışmak için OpenAI veya Google sunucularına "ping" atmaz. Telefonunuzu uçak moduna alın, interneti kesin, yine de cihazın içinde tıkır tıkır çalışır. Veriniz asla dışarı çıkmaz.

  • İnanılmaz Bir Hız: İnternet üzerinden buluta gidip gelmek saniyeler sürerken, Needle cihaz üzerinde göz açıp kapayıncaya kadar (0.1 saniyede) yanıt veriyor.

  • Her Cihaza Uygun: Bu modeli çalıştırmak için pahalı GPU'lara ihtiyacınız yok. Evde köşede duran eski bir Raspberry Pi, akıllı bir saat, hatta bir mikrodenetleyici bile Needle'ı koşturmaya yetiyor.


Gerçek Hayatta Nerede İşimize Yarayacak?

"Peki Burak, bu 14 megabaytlık model bizim ne işimize yarayacak?" diyebilirsiniz. Hemen somutlaştıralım:

Akıllı ev sistemlerini düşünün. İnternetiniz koptuğunda "Işıkları kapat" dediğinizde akıllı asistanınızın donup kalmasını istemezsiniz. Ya da benim gibi restoran otomasyonları (SaaS) geliştiriyorsanız; mutfaktaki yoğunlukta internet yavaşladığında, garsonun sesli komutla mutfak yazıcısını tetiklemesini istersiniz.

İşte Needle, internet bağımlılığını sıfıra indirerek yapay zekayı tamamen "Edge" (Cihaz Üstü) hale getiriyor. Üstelik karmaşık durumlarda otomatik olarak buluta paslama (Cloud Fallback) yeteneği de var.


Burakinyow’un Notu ve Kurulum

Ben bizzat yerel sunucumda test ettim; kendi kategorisindeki tüm rakiplerinden (FunctionGemma vb.) çok daha kararlı ve hızlı çalışıyor. Kendi bilgisayarınızda denemek isterseniz kurulumu tek satır kodla yapabiliyorsunuz:

git clone https://github.com/cactus-compute/needle.git

cd needle && source ./setup
needle playground

Bu komuttan sonra yerelinizde bir arayüz açılıyor ve modeli kendi fonksiyonlarınızla eğitmeye (finetune) başlayabiliyorsunuz.

Açık kaynak dünyası dev şirketlerin tekelini işte böyle kırıyor. Sizce bu tarz minik ve nokta atışı modeller, buluttaki o devasa bütçeli yapay zekaları bitirebilir mi? Yorumlarınızı merak ediyorum. Takipte kalın!

İlgili rehberler

Genel ·

RUFLO SWARM İLE TOKEN MALİYETİNİ DÜŞÜR!

Devamını okuyun.

Rehberi aç

Telefonunda çalışan mini AI ajan geliyor