Yapay zeka artık yalnızca büyük teknoloji şirketlerinin veri merkezlerinde çalışan bir sistem olmaktan çıktı. Günümüzde güçlü dil modelleri, sıradan bir masaüstü bilgisayarda bile çalıştırılabiliyor. Özellikle açık kaynaklı yapay zeka modellerinin gelişmesiyle birlikte geliştiriciler, şirketler ve teknoloji meraklıları kendi yerel yapay zeka altyapılarını kurmaya başladı.
Bu yeni dünyada sık sık duyduğumuz bazı kavramlar var:
- Ollama
- Open WebUI
- LangChain
- n8n
- AI Agent
- RAG
- Vector Database
- MCP
- Prompt Engineering
- Function Calling
Peki bunlar tam olarak nedir? Ne işe yararlar? Birbirleriyle nasıl bağlantılıdırlar?
Bu makalede modern yerel yapay zeka ekosistemini detaylı şekilde inceleyeceğiz.
Yerel Yapay Zeka (Local AI) Nedir?
Yerel yapay zeka, bir yapay zeka modelinin kendi bilgisayarınızda veya kendi sunucunuzda çalıştırılması anlamına gelir.
Yani verileriniz:
- başka şirkete gitmez
- internete yüklenmez
- tamamen sizde kalır
Bu yaklaşım özellikle:
- gizlilik
- veri güvenliği
- kurumsal kullanım
- internet bağımsızlığı
- maliyet kontrolü
gibi konularda büyük avantaj sağlar.
Ollama Nedir?
Ollama modern yapay zeka modellerini bilgisayarda kolayca çalıştırmayı sağlayan bir AI çalışma ortamıdır.
Eskiden bir modeli çalıştırmak oldukça karmaşıktı:
- CUDA kurulumu
- Python bağımlılıkları
- model dönüşümleri
- terminal ayarları
gibi birçok işlem gerekiyordu.
Ollama bu süreci tek komut seviyesine indirdi.
Örneğin:
ollama run gemma4
komutu ile Google’ın Gemma modeli saniyeler içinde çalıştırılabilir.
Ollama Ne İşe Yarar?
Ollama aslında bir “AI motorudur”.
Yapay zeka modellerini:
- indirir
- yönetir
- çalıştırır
- API olarak sunar
Böylece diğer uygulamalar yapay zekayı kullanabilir.
Ollama ile Neler Yapılabilir?
Yerel ChatGPT Sistemi
Bilgisayarınızda tamamen size ait bir ChatGPT oluşturabilirsiniz.
Kod Asistanı
VS Code gibi editörlere bağlayarak AI destekli geliştirme yapılabilir.
Şirket İçi Yapay Zeka
Kurumsal belgeleri analiz eden özel AI sistemleri kurulabilir.
İnternetsiz AI
İnternet olmadan çalışan sohbet sistemleri oluşturulabilir.
LLM Nedir?
LLM (Large Language Model), büyük dil modeli anlamına gelir.
Örnek modeller:
- Gemma
- Llama
- Mistral
- DeepSeek
- Qwen
Bu modeller:
- metin üretir
- kod yazar
- analiz yapar
- çeviri yapar
- sohbet eder
Quantization (Q4, Q8) Nedir?
Yapay zeka modelleri çok büyük boyutlara ulaşabilir.
Örneğin:
- 8 GB
- 20 GB
- 70 GB
- 200 GB+
Bu nedenle modeller optimize edilir.
Buna “quantization” denir.
Örnek:
- Q4 → daha hızlı, daha az RAM
- Q8 → daha kaliteli ama daha ağır
Open WebUI Nedir?
Open WebUI, Ollama gibi yerel AI sistemleri için web tabanlı arayüzdür.
Yani:
Ollama = motor
Open WebUI = kullanıcı arayüzü
ilişkisi vardır.
Open WebUI Özellikleri
ChatGPT Benzeri Arayüz
Tarayıcı üzerinden sohbet yapılabilir.
Çoklu Model
Birden fazla model aynı anda kullanılabilir.
Dosya Yükleme
PDF, Word veya metin dosyaları AI’a okutulabilir.
RAG Sistemi
Belgeler üzerinden bilgi sorgulama yapılabilir.
Kullanıcı Yönetimi
Kurumsal sistemlerde kullanıcı yetkilendirmesi yapılabilir.
RAG Nedir?
RAG (Retrieval-Augmented Generation), yapay zekanın harici verilerden bilgi çekerek cevap üretmesidir.
Normal AI:
- yalnızca eğitim verisini bilir
RAG sistemi:
- dosyaları okur
- veri tabanına bakar
- belgeleri tarar
- sonra cevap verir
RAG Kullanım Örneği
Bir şirket düşünelim.
Şirketin:
- PDF belgeleri
- prosedürleri
- eğitim dokümanları
AI sistemine yüklenir.
Kullanıcı şunu sorar:
“İzin prosedürü nasıl işliyor?”
AI:
- ilgili PDF’i bulur
- metni okur
- cevap üretir
Vector Database Nedir?
Yapay zeka sistemleri belgeleri normal veri tabanı gibi saklamaz.
Metinleri “embedding” denilen matematiksel vektörlere dönüştürür.
Bu vektörler:
- anlam benzerliği
- konu ilişkisi
- bağlamsal arama
için kullanılır.
Popüler Vector Database Sistemleri
- ChromaDB
- Weaviate
- Pinecone
- Qdrant
- Milvus
Embedding Nedir?
Embedding:
- metnin matematiksel temsilidir
Örneğin:
"Kedi"
kelimesi bir sayı dizisine dönüştürülür.
Benzer anlamlı kelimeler:
- birbirine yakın vektörlerde tutulur
Bu sayede AI:
- anlamsal arama yapabilir
LangChain Nedir?
LangChain, gelişmiş AI uygulamaları geliştirmek için kullanılan framework’tür.
Sadece sohbet değil:
- araç kullanımı
- hafıza
- görev zinciri
- agent sistemi
oluşturur.
LangChain Ne Sağlar?
Hafıza
AI önceki konuşmaları hatırlar.
Tool Calling
AI:
- internet açabilir
- hesap yapabilir
- API çağırabilir
Workflow
Çok aşamalı görevler yapılabilir.
AI Agent Nedir?
AI Agent:
- karar verebilen
- araç kullanabilen
- görev yürütebilen
yapay zeka sistemidir.
Agent Örneği
Kullanıcı:
“İstanbul’daki en ucuz uçuşları bul ve bana tablo hazırla.”
AI Agent:
- interneti tarar
- fiyatları toplar
- karşılaştırır
- rapor üretir
Function Calling Nedir?
Function Calling:
- AI’ın yazılım fonksiyonlarını çağırabilmesidir.
Örneğin:
get_weather()
AI karar verir:
- hava durumu gerekiyor
- fonksiyonu çalıştır
MCP Nedir?
MCP (Model Context Protocol), AI sistemlerinin dış araçlarla standart şekilde haberleşmesini sağlayan modern protokoldür.
Bir AI:
- dosya sistemine
- GitHub’a
- terminale
- veri tabanına
MCP üzerinden erişebilir.
Bu sistem özellikle AI agent dünyasında hızla yaygınlaşmaktadır.
n8n Nedir?
n8n görsel otomasyon platformudur.
Kod yazmadan:
- otomasyon
- entegrasyon
- AI workflow
oluşturulabilir.
n8n Kullanım Örneği
Senaryo:
Yeni bir e-posta geldiğinde:
- AI özet çıkarsın
- Google Sheets’e kaydetsin
- Telegram mesajı göndersin
Bütün bunlar sürükle-bırak mantığıyla yapılabilir.
Prompt Engineering Nedir?
Prompt Engineering:
- AI’a doğru komut verme sanatıdır.
Kötü prompt:
“Kod yaz.”
İyi prompt:
“Node.js kullanarak JWT doğrulamalı REST API oluştur.”
Fine-Tuning Nedir?
Bir AI modelinin özel veriyle yeniden eğitilmesidir.
Örneğin:
- hukuk AI’ı
- tıp AI’ı
- müşteri temsilcisi AI’ı
oluşturulabilir.
AI Modelleri GPU Kullanır mı?
Evet.
Özellikle:
- NVIDIA CUDA
- AMD ROCm
AI performansında kritik rol oynar.
GPU:
- token üretimini
- model yüklemeyi
- inference hızını
çok ciddi artırır.
Inference Nedir?
Inference:
- modelin cevap üretme sürecidir.
Yani AI’ın düşünme ve cevap yazma aşamasıdır.
Token Nedir?
AI modelleri metni kelime kelime değil:
- token
- parça
- karakter grupları
şeklinde işler.
Örneğin:
Merhaba dünya
birkaç token olabilir.
Context Window Nedir?
AI’ın aynı anda okuyabildiği maksimum içeriktir.
Örnek:
- 8K
- 32K
- 128K token
Daha büyük context:
- daha uzun belge
- daha uzun hafıza
demektir.
AI Dünyasında Yeni Dönem: Local Agent Sistemleri
Eskiden AI yalnızca:
- soru cevaplayan chatbot
olarak görülüyordu.
Şimdi ise:
- internete giren
- işlem yapan
- karar veren
- otomasyon kuran
agent sistemlerine dönüşüyor.
Gelecekte Neler Olacak?
Önümüzdeki dönemde:
- kişisel AI asistanları
- şirket içi AI çalışanları
- tam otomatik workflow sistemleri
- yerel gizli AI altyapıları
çok yaygın hale gelecek.
Özellikle:
- Ollama
- LangChain
- Open WebUI
- MCP
- n8n
gibi teknolojiler bu dönüşümün merkezinde yer alıyor.
Sonuç
Yapay zeka artık yalnızca bulut tabanlı hizmetlerden ibaret değil. Günümüzde herkes:
- kendi AI modelini çalıştırabilir
- özel agent sistemleri kurabilir
- şirket içi yapay zeka geliştirebilir
- tamamen yerel ve güvenli AI altyapıları oluşturabilir
Özellikle açık kaynak ekosistemi sayesinde AI dünyası giderek daha erişilebilir hale geliyor.
Bugün küçük bir bilgisayarda başlayan sistemler, yarının tam otonom dijital asistanlarının temelini oluşturuyor.

Bir yanıt yazın