Üretken Yapay Zeka Teknolojisi Nedir?

Okuma süresi: 9dk, 25sn

Üretken yapay zeka, son yıllarda teknoloji dünyasını şekillendiren en büyük atılımlardan biri haline geldi. ChatGPT’nin beş gün içinde bir milyon kullanıcıya ulaşmasıyla birlikte, yapay zeka uygulamaları tarihte benzeri görülmemiş bir hızla yayıldı. Bu makalede, üretkenyapay zeka ve büyük dil modellerinin (LLM’ler) etrafındaki teknoloji ekosisteminin yapılandırılmış bir genel bakışını bulacaksınız.

1. Üretken Yapay Zeka Temelinde Yatan Teknolojiler

Temel Modeller (Foundation Models)

Temel modeller, çok büyük miktarda veri (metin, kod, görüntüler vb.) üzerinde önceden eğitilmiş büyük yapay zeka modelleridir. Bu modellerin özel yanı, sadece tek bir görevi değil, birçok farklı uygulama için esnek bir şekilde kullanılabilmeleridir. Metin yazabilir, kod düzeltebilir, görüntü oluşturabilir veya müzik besteleyebilirler.

Temel modelleri anlamak için üç önemli nokta:

Önceden Eğitilmiş: Bu modeller, devasa veri setleri üzerinde eğitilmiştir. Bu aşama çok maliyetli ve zaman alıcıdır.
Çoklu Görev Yapabilme: Bu temel modeller birçok görevi çözebilir. GPT-4o’ya bakarsak, bilgi soruları, metin iyileştirmeleri ve kod oluşturma gibi günlük sorunları çözmek için kullanabilirsiniz.
Aktarılabilir: İnce ayar (fine-tuning) veya Alım Destekli Üretim (RAG) yoluyla, bu Temel Modelleri belirli alanlara uyarlayabilir veya belirli uygulama alanları için özelleştirebiliriz.

Eğitim verilerinin boyutunu anlamak için FineWeb örneğine bakalım. FineWeb, LLM’lerin ön eğitim aşamasını desteklemek için Hugging Face tarafından geliştirilen devasa bir veri setidir. Veri seti 96 ortak tarama anlık görüntüsünden oluşturulmuştur ve 15 trilyon token içerir – bu da yaklaşık 44 terabayt depolama alanı kaplar.

Üretken Yapay Zeka Çok Modlu Modeller (Multimodal Models)

GPT-3 modeli sadece saf metin işleyebilirken, çok modlu modeller bir adım daha ileri gidiyor: Sadece metni değil, aynı zamanda görüntüleri, sesi ve videoyu da işleyebilir ve oluşturabilirler. Yani, aynı anda birkaç veri türünü işleyebilir ve üretebilirler.

Örneğin:

GPT-4-Vision: Bu OpenAI modeli metin ve görüntüleri işleyebilir.
Gemini 1.5: Google’ın modeli metin, görüntü, ses ve video işleyebilir.
Claude 3: Anthropic’in modeli metin ve görüntüleri işleyebilir ve görsel muhakemede çok iyidir.

GPU ve Hesaplama Sağlayıcıları

Üretken (Generatif) yapay zeka modelleri eğitildiğinde, bu muazzam hesaplama kapasitesi gerektirir. Özellikle ön eğitim için, ancak aynı zamanda çıkarım (inference) – modelin yeni girdilere uygulanması – için de.

Ön eğitim sırasında, GPT-4, Claude 3, LLaMA 3 veya DeepSeek-VL gibi bir model, metinler, kodlar, görüntüler ve diğer kaynaklardan gelen trilyonlarca tokendan öğrenir. Bu veri hacimleri, GPU’lar (Grafik İşleme Birimleri) veya TPU’lar (Tensör İşleme Birimleri) ile işlenir.

Üretken Yapay Zeka ML Çerçeveleri ve Kütüphaneleri

Programlama dilleri veya web geliştirmede olduğu gibi, yapay zeka görevleri için de çerçeveler vardır. Bunlar, her şeyi sıfırdan programlama ihtiyacı olmadan sinir ağları oluşturmak için hazır işlevler sağlar.

Üretken (Generatif) yapay zeka için en önemli ML çerçeveleri:

PyTorch: Meta tarafından geliştirilmiştir ve açık kaynaktır.
TensorFlow: Google tarafından geliştirilmiştir ve büyük yapay zeka modelleri için çok güçlüdür.
Keras: TensorFlow’un bir parçasıdır ve çoğunlukla başlangıç düzeyindekiler ve prototip geliştirme için kullanılır.
JAX: Ayrıca Google’dan gelen ve yüksek performanslı yapay zeka hesaplamaları için özel olarak geliştirilmiştir.

2. Üretken Yapay Zeka Uygulama Çerçeveleri

Bu çerçeveler, Temel Modelleri belirli uygulamalara entegre etmemizi sağlar. Temel Modellere erişimi, komutların yönetimini ve yapay zeka destekli iş akışlarının verimli yönetimini kolaylaştırırlar.

Üç araç örneği:

LangChain: Sohbet robotları, belge işleme ve otomatik analizler gibi uygulamalar için LLM’lerin orkestrayonunu sağlar.
LlamaIndex: Özellikle büyük miktardaki yapılandırılmamış veriyi LLM’ler için verimli bir şekilde erişilebilir kılmak için tasarlanmıştır.
Ollama: Buluta bağlı kalmadan büyük dil modellerini kendi dizüstü bilgisayarınızda veya sunucunuzda çalıştırmayı mümkün kılar.

Veritabanları ve Vektör Depoları

LLM’lerle, şimdi semantik bilgileri depolamak ve aramak için bir yola da ihtiyacımız var. Bu, vektör veritabanlarını gerektirir: Bir temel model, girdiyi metin olarak işlemez, ancak sayısal vektörlere – gömülümlere (embeddings) dönüştürür. Vektör veritabanları, gömülümler için hızlı benzerlik ve hafıza yönetimi gerçekleştirmeyi ve böylece ilgili bağlamsal bilgileri sağlamayı mümkün kılar.

Bu nasıl çalışır, örneğin Alım Destekli Üretim (RAG) ile?

Her metin (örneğin, bir PDF’den bir paragraf) bir vektöre çevrilir.
Modele bir sorgu iletirsiniz. Örneğin, bir soru sorarsınız. Bu soru da şimdi bir vektöre çevrilir.
Veritabanı şimdi hangi vektörlerin giriş vektörüne en yakın olduğunu hesaplar.
Bu üst sonuçlar, cevap vermeden önce LLM’e sunulur. Ve model daha sonra bu bilgileri cevap için ek olarak kullanır.

Örnekler: Pinecone, FAISS, Weaviate, Milvus ve Qdrant.

Programlama Dilleri

Üretken (Generatif) yapay zeka geliştirme için bir programlama diline de ihtiyaç vardır.

Python, neredeyse tüm yapay zeka uygulamaları için muhtemelen ilk tercihtir. Python, AI & ML için ana dil olarak kendini kabul ettirmiştir ve en popüler ve yaygın olarak kullanılan dillerden biridir.

Python neden her şey için kullanılmıyor? Python çok hızlı değil. Ancak CUDA arka uçları, TensorFlow veya PyTorch sayesinde yine de çok performanslıdır. Bununla birlikte, performans gerçekten çok önemliyse, Rust, C++ veya Go daha çok tercih edilir.

3. Üretken Yapay Zeka Ölçeklendirme: Altyapı ve Hesaplama Gücü

Çekirdek bileşenlerin yanı sıra, modelleri ölçeklendirmek ve eğitmek için yollara da ihtiyacımız var.

Konteynerler ve Orkestrasyon

Geleneksel uygulamalar gibi, yapay zeka uygulamaları da sağlanmalı ve ölçeklendirilmelidir. Konteynerlerle, bir yapay zeka modelini (veya başka herhangi bir uygulamayı) herhangi bir sunucuda çalıştırabilir ve aynı şekilde çalışır. Bu, tutarlı, taşınabilir ve ölçeklenebilir yapay zeka iş yüklerini sağlamamıza olanak tanır.

Docker, konteynerizasyon için standarttır. Üretken (Generatif) yapay zeka da farklı değildir. Onu izole, tekrarlanabilir birimler olarak yapay zeka uygulamaları geliştirmek için kullanabiliriz. Docker, LLM’leri bulutta veya uç cihazlarda dağıtmak için kullanılır.

Kubernetes, konteyner iş yüklerini yönetmek ve ölçeklendirmek içindir. GPU’ları kaynak olarak yönetebilir. Bu, bir küme üzerinde birden fazla modeli verimli bir şekilde çalıştırmayı – ve talep yüksek olduğunda otomatik olarak ölçeklendirmeyi mümkün kılar.

Çip Üreticileri ve Üretken Yapay Zeka Donanımı

Gerekli olan muazzam hesaplama gücü üretilmelidir. Bu, çip üreticileri tarafından yapılır. Güçlü donanım, eğitim sürelerini azaltır ve model çıkarımını iyileştirir.

Yapay zeka alanında belki de en iyi bilinen çip üreticisi, en değerli şirketlerden biri olan Nvidia’dır. Şirket, özelleştirilmiş A100 ve H100 GPU’larıyla, büyük yapay zeka modellerinin eğitimi ve çıkarımı için fiili standart haline gelmiştir.

Üretken Yapay Zeka Temel Modeller için API Sağlayıcıları

Temel Modeller önceden eğitilmiş modellerdir. Kendimiz barındırmak zorunda kalmadan onlara mümkün olduğunca hızlı erişebilmek için API’ları kullanırız. API sağlayıcıları, OpenAI API, Hugging Face Inference Endpoints veya Google Gemini API gibi modellere hızlı erişim sunar.

En iyi bilinen sağlayıcı, API’si ile GPT-3.5, GPT-4, görüntü oluşturma için DALL-E ve konuşmadan metne için Whisper’a erişim sağlayan OpenAI’dir.

4. YÜretken Yapay Zeka Sosyal Katmanı: Açıklanabilirlik, Adalet ve Yönetişim

Büyük güç ve yetenek, beraberinde sorumluluk getirir. Yapay zekayı günlük uygulamalarımıza ne kadar çok entegre edersek, Sorumlu Yapay Zeka ilkeleriyle ilgilenmek o kadar önemli hale gelir.

Üretken Yapay Zeka birçok soru ortaya çıkarır:

Model cevaplarına nasıl ulaştığını açıklıyor mu? (Şeffaflık)
Belirli gruplar favori mi? (Adalet)
Modelin kötüye kullanılmaması nasıl sağlanır? (Güvenlik)
Hatalardan kim sorumludur? (Hesap verebilirlik)
Yapay zekanın nasıl ve nerede kullanıldığını kim kontrol eder? (Yönetişim)
Web’den hangi mevcut veriler (örneğin sanatçılardan görüntüler) kullanılabilir? (Telif hakkı / veri etiği)

5. Ortaya Çıkan Yetenekler: Yapay Zeka Etkileşim Kurmaya ve Harekete Geçmeye Başladığında

Bu, klasik komut-yanıt modelinin ötesine geçen yeni yetenekler hakkındadır. Yapay zeka daha aktif, daha dinamik ve daha özerk hale geliyor.

Üretken Yapay Zeka Ajanları

Yapay zeka ajanları, Temel Modellere dayanan bir uygulama mantığıdır. Kararları orkestra eder ve adımları bağımsız olarak yürütür. AutoGPT gibi ajanlar, çok adımlı görevleri bağımsız olarak gerçekleştirir. Döngülerde düşünürler ve adım adım bir hedefi iyileştirmeye veya başarmaya çalışırlar.

Yapay zeka ajanları genellikle şu bileşenlerden oluşur:

Büyük Dil Modeli: LLM, çekirdek veya düşünme motorudur.
Planlama birimi: Planlayıcı, daha yüksek seviyeli bir hedefi somut bir plana veya adım dizisine dönüştürür.
Araç erişimi: Bu bileşen, ajanın harici araçları kullanmasını sağlar.
Hafıza: Bu bileşen, önceki etkileşimler, ara sonuçlar veya bağlamsal bilgi hakkında bilgileri saklar.
Yürütücü: Bu bileşen, planlanan adımları doğru sırayla yürütür, ilerlemeyi izler ve hata durumunda yeniden planlar.

Pekiştirmeli Öğrenme

Pekiştirmeli öğrenme ile modeller daha “insan dostu” hale getirilir. Bu eğitim yönteminde, model ödül yoluyla öğrenir. Bu, net bir “doğru” veya “yanlış” olmayan, ancak kademeli kalite olan görevler için özellikle önemlidir.

Bunun bir örneği, ChatGPT’yi kullandığınızda, iki farklı yanıt alıp hangisini tercih ettiğinizi derecelendirmeniz istendiğinde görülür.

Ödül, ya insan geri bildiriminden (İnsan Geri Bildiriminden Pekiştirmeli Öğrenme – RLHF) ya da başka bir modelden (AI Geri Bildiriminden Pekiştirmeli Öğrenme – RLVR) gelebilir.

Sonuç

Yapay zeka yıllardır araştırılıyor ve uygulanıyor. Ancak şu anda araçların, uygulamaların ve çerçevelerin patladığı bir andayız – yapay zeka, özellikle Üretken (Generatif) yapay zeka, gerçekten günlük hayatımıza girdi.

Bu makalede, Üretken yapay zekanın arkasındaki teknoloji ekosistemini inceledik. Temel modellerden, çok modlu modellere, yapay zeka uygulama çerçevelerinden vektör veritabanlarına, konteynerlerden yapay zeka ajanlarına kadar geniş bir yelpazede teknolojileri ele aldık. Bu teknolojilerin hepsi birlikte çalışarak, bugün gördüğümüz etkileyici yapay zeka uygulamalarını mümkün kılıyor.