AI Agent Nasıl Çalışır? Yapay Zeka Asistanlarının Arkasındaki Teknoloji

Son iki yılda “AI agent” kavramı, kurumsal yazılım dünyasının en çok konuşulan başlıklarından biri haline geldi. ChatGPT'nin yaygınlaşmasıyla başlayan dalga, artık tek başına soru-cevap yapan sohbet botlarından çok daha ileride: kendi başına karar veren, araçları kullanan, sistemler arasında veri taşıyan otonom yazılım katmanları konuşuluyor. Peki bir AI agent gerçekten nasıl çalışır? Sihir nerede biter, mühendislik nerede başlar?

Bu yazıda, bir AI agent'ın altında yatan teknolojiyi —büyük dil modelleri (LLM), prompt mühendisliği, araç kullanımı (tool use), RAG ve fine-tuning— mümkün olduğunca sade anlatacağız. Sonunda otel, emlak ve e-ticaret için gerçek dünya senaryolarına da değineceğiz.

1. Temel taş: Büyük Dil Modelleri (LLM)

Bir AI agent'ın kalbinde her zaman bir büyük dil modeli (Large Language Model — LLM) vardır. Claude (Anthropic), GPT (OpenAI), Gemini (Google) ve Llama (Meta) gibi modeller, milyarlarca parametreyle eğitilmiş, dili istatistiksel olarak çok güçlü temsil eden sinir ağlarıdır. Bu modeller bir metin parçası alır ve “bir sonraki en olası kelimeyi” tahmin eder — ancak bu basit tahmin döngüsü, milyarlarca parametre üzerinde çalıştığında akıl yürütme benzeri davranışlar sergiler.

Önemli bir kavram yanılgısı şudur: LLM “bilmez”, “hatırlamaz”, “anlamaz” — istatistiksel olarak en olası yanıtı üretir. Bu yüzden bir agent kurarken modelin yalın çıktısına güvenmek yerine, etrafına yapılandırılmış bir mühendislik katmanı örmek gerekir. İşte agent dediğimiz şey tam olarak bu katmanın adıdır.

2. Prompt Engineering: modele konuşmayı öğretmek

Prompt mühendisliği, LLM'e ne istediğinizi en az belirsizlikle anlatma sanatıdır. İyi bir prompt üç bileşenden oluşur: rol tanımı (system prompt), bağlam (context) ve görev (task). Örneğin bir otel concierge agent'ı için system prompt şöyle olabilir: “Sen ABC Hotel'in concierge asistanısın. Türkçe ve İngilizce konuşursun. Misafirlere kısa, sıcak ve net cevaplar verirsin. Fiyat sorulduğunda her zaman PMS sisteminden anlık veri çekersin.”

Profesyonel bir agent projesinde prompt'lar tek seferde yazılmaz; A/B test edilir, hatalı senaryolar derlenir, edge case'ler için kurallar eklenir. İyi bir prompt kütüphanesi, projenin “yazılı kaynak kodu” gibi düşünülmelidir — versiyonlanır, test edilir, dokümante edilir.

3. Tool Use: agent'ın dış dünyaya açılan kapısı

Bir LLM, tek başına internete bağlanamaz, veritabanı sorgulayamaz, e-posta gönderemez. Bunlar için “tool use” (araç kullanımı) mekanizması devreye girer. Modele “Şu araçları kullanabilirsin: search_pms(date), send_whatsapp(to, message), book_room(guest_id, room, dates)” gibi bir liste verilir. Model, kullanıcı isteğine göre hangi aracı, hangi parametrelerle çağıracağına karar verir; orkestrasyon katmanı (n8n, LangGraph, kendi yazdığınız Python/Node servisi) bu çağrıyı gerçek API'lere taşır.

4. RAG: agent'a kurumsal hafıza vermek

RAG (Retrieval-Augmented Generation), agent'a şirketinize ait belgeleri, ürün katalogunu, SSS'leri veya geçmiş müşteri konuşmalarını “hatırlatma” tekniğidir. Süreç şöyle işler: belgeleriniz küçük parçalara bölünür (chunking), her parça bir embedding modeliyle sayısal vektöre dönüştürülür, bu vektörler Pinecone, Supabase pgvector veya Weaviate gibi vektör veritabanlarında saklanır. Kullanıcı bir soru sorduğunda, soru da aynı embedding modeliyle vektöre çevrilir ve en benzer 3–5 belge parçası bulunur. Bu parçalar prompt'a eklenerek modele verilir.

Sonuç: model, fine-tuning yapmadan, sadece prompt seviyesinde şirketinize ait bilgilerle cevap verir. RAG'in büyük avantajı, içerik güncellendiğinde modeli yeniden eğitmek zorunda olmamanızdır — vektör veritabanını güncellersiniz, agent ertesi gün yeni bilgileri kullanır.

5. Fine-tuning: ne zaman gerekir?

Fine-tuning, hazır bir LLM'i kendi verinizle ek olarak eğitmek demektir. Pek çok projenin sandığının aksine, fine-tuning çoğu zaman gerekmez. Tool use + iyi yazılmış prompt + RAG ile vakaların %85'ini çözebilirsiniz. Fine-tuning'e ihtiyaç duyduğunuz başlıca durumlar:

Çok özel bir yazım tonu (örn. bir markanın imzalı dili) sürekli korunmak isteniyorsa
Yüksek hacimli, tekrarlayan görevlerde token maliyetini düşürmek gerekiyorsa (küçük bir model fine-tune edilip GPT-4 yerine kullanılabilir)
Hassas alan terminolojisi (medikal, hukuki, finansal) ezberletilmek isteniyorsa
Görev çok dar ve net (örn. müşteri mesajını 12 kategoriden birine sınıflandırma) ise

6. Gerçek dünya senaryoları

Otel: 7/24 rezervasyon asistanı

Misafir Instagram DM'den “3 kişilik aile, 12–15 Temmuz, deniz manzaralı oda var mı?” yazıyor. Agent mesajı okuyor, PMS API'sine bağlanıyor, müsait odaları çekiyor, fiyat ve iptal politikasını ekleyip iki dilde cevap dönüyor. Misafir onaylarsa ödeme linki üretip gönderiyor; ödeme tamamlanınca rezervasyonu PMS'e yazıyor ve onay e-postasını otomatik gönderiyor.

Emlak: gece yarısı çalışan lead asistanı

Sitenize giren bir kullanıcı “Beşiktaş'ta 3+1, bütçem 12 milyon” yazıyor. Agent CRM'deki ilanları sorguluyor, en uygun 5 ilanı görsellerle birlikte sunuyor, kullanıcı ilgilendiğini söyleyince ertesi gün için satış temsilcisinin takvimine slot rezerve ediyor ve Hubspot'a lead kaydı açıyor.

E-ticaret: iade ve takip otomasyonu

Müşteri WhatsApp'tan sipariş numarasıyla yazıyor. Agent kargo takip API'sinden son durumu çekiyor, gecikme varsa otomatik kupon kodu öneriyor, iade isteklerinde Shopify'da iade etiketi oluşturup PDF olarak gönderiyor. Müşteri hizmetleri ekibinin yükü %60 azalıyor.

Sonuç

Bir AI agent; LLM'in dil yeteneği, prompt mühendisliğinin disiplini, tool use'un eylem gücü ve RAG'in kurumsal hafızasının birleşiminden doğar. Doğru tasarlanmış bir agent, yorulmayan, gece çalışan, ölçeklenen ve sürekli iyileşen bir dijital çalışan gibidir. Ancak başarısı %20 model seçimine, %80 mühendislik kalitesine bağlıdır — model değişebilir, mühendislik kalır.