Claude 4.5 geldi: Kodlama ve gerçek-dünya ajanlarında seviye atlattı; Microsoft 365 Copilot ve AWS Bedrock entegrasyonlarıyla yayında

Anthropic’in bugün duyurduğu Claude Sonnet 4.5, şirketin bugüne kadarki en yetenekli modeli olarak konumlanıyor. İlgi odağı yalnızca “demo” sonuçları değil; şirket, modelin gerçek iş akışlarında üretim kalitesinde uygulamalar çıkarabildiğini ve ajan tabanlı süreçlerde daha güvenilir çalıştığını vurguluyor. İç testlerde Claude 4.5’in tek başına 11 bin satır kod üretip Slack/Teams benzeri bir sohbet uygulamasını çalışır hâle getirdiği; otonom çalışma süresinin 7 saatten 30 saate yükseldiği paylaşıldı.

Performans boyutunda, özellikle işletim sistemi ve bilgisayar kullanımı sınıfındaki görevlerde kayda değer artış raporlanıyor. Bazı değerlendirmelerde önceki kuşağın %40 civarındaki skorlarının %60 seviyesine taşındığı belirtilirken, bilimsel muhakeme ve finansal görevler gibi uzmanlık gerektiren alanlarda da çıta yükseliyor. Anthropic, 4.5’i “gerçek-dünya ajanları, kodlama ve bilgisayar kullanımı” için en güçlü model olarak tanımlıyor.

Ekosistem entegrasyonu lansmanın ikinci büyük ayağı. Microsoft, geçen hafta başlattığı çok-modelli yaklaşımın devamı olarak Anthropic modellerini Microsoft 365 Copilot bünyesine ekledi; bugün ise Copilot Studio içinde Claude Sonnet 4.5’in kademeli dağıtımının başladığını duyurdu. Bu sayede kurumlar, Copilot tabanlı ajanlarında OpenAI modelleri yanında Anthropic’i de seçebilecek. Aynı gün AWS, Bedrock çatısı altında 4.5’in kullanıma açıldığını açıkladı. Böylece Claude 4.5, iki büyük bulut üzerinde “işe hazır” bir seçenek olarak yayına girdi.

Geliştirici yüzünde Claude Code güncellendi: VS Code eklentisi, terminal arayüzünde v2.0, daha uzun ufuklu görevler ve kontrollü otonomi için checkpoint mantığı sunuluyor. Anthropic, hafıza (kalıcı bağlam) ve bağlam yönetimiaraçlarını da geliştirici platformuna ekleyerek, çok adımlı işleri daha az “unutma” ve daha iyi durum takibi ile yürütmeyi hedefliyor. Ayrıca çoklu-ajan kurgularını besleyen VM erişimi ve orkestrasyon seçenekleri de duyuruldu.

Güvenlik/uyum tarafı, 4.5’in kurumsal odağının temel bileşeni. Anthropic, bu modelin “şimdiye kadarki en hizalanmış”sürüm olduğunu; safety eğitimleriyle yaltaklanma (sycophancy), aldatma, güç arayışı ve halüsinasyon teşviki gibi istenmeyen davranış eğilimlerinin baskılandığını belirtiyor. Korumalı çıktı (guardrail) yaklaşımı ve denetlenebilir araç kullanımı, regüle sektörler (finans, hukuk, sağlık) için kritik kabul ediliyor. İlk kullanıcı geri bildirimlerinde özellikle uzun bağlam ve doğrulama adımlarında iyileşme öne çıkıyor.

OpenAI ve Google’ın hızla yenilenen üst seviye modelleri karşısında Anthropic, 4.5 ile “ajanik iş” ve kodlama alanlarında çıtayı yükselterek kurumsal sahada rekabeti kızıştırıyor. Microsoft ve AWS kanallarındaki aynı-gün erişim, model seçimini artık platform kararı olmaktan çıkarıp iş yükü bazında tercihe dönüştürüyor. Türkiye’de kurumsal müşteriler için bu, Copilot ve Bedrock üzerinden vendor çeşitliliği ve saha denemelerini hızlandırma anlamına geliyor; geliştirici ekipler ise Claude Code’un IDE/terminal yenilikleriyle daha uzun soluklu görevleri otonom modda devrede tutabilecek.

What's Hot

İran–İsrail savaşında yeni eşik: Khamenei’nin öldürülmesi sonrası karşılıklı saldırılar tırmanıyor

Zorlu Holding, 2018’ten bu yana en büyük kurumsal borç yapılandırmasına hazırlanıyor

OpenAI–Pentagon anlaşması “QuitGPT” tepkisini büyüttü

Claude 4.5 geldi: Kodlama ve gerçek-dünya ajanlarında seviye atlattı; Microsoft 365 Copilot ve AWS Bedrock entegrasyonlarıyla yayında

İran–İsrail savaşında yeni eşik: Khamenei’nin öldürülmesi sonrası karşılıklı saldırılar tırmanıyor

Zorlu Holding, 2018’ten bu yana en büyük kurumsal borç yapılandırmasına hazırlanıyor

OpenAI–Pentagon anlaşması “QuitGPT” tepkisini büyüttü

İran–İsrail savaşında yeni eşik: Khamenei’nin öldürülmesi sonrası karşılıklı saldırılar tırmanıyor

Zorlu Holding, 2018’ten bu yana en büyük kurumsal borç yapılandırmasına hazırlanıyor

OpenAI–Pentagon anlaşması “QuitGPT” tepkisini büyüttü

Hedge fonlar satış dalgasının ardından yeniden teknoloji ve AI hisselerine dönüyor

OpenAI–Pentagon anlaşması “QuitGPT” tepkisini büyüttü

Trump yönetiminden Anthropic’e sert darbe: Federal kurumlara “kademeli yasak” talimatı

İngiltere’de “March Against The Machines”: AI veri merkezlerine karşı iklim ve toplum odaklı isyan

Subscribe to Updates

What's Hot

Claude 4.5 geldi: Kodlama ve gerçek-dünya ajanlarında seviye atlattı; Microsoft 365 Copilot ve AWS Bedrock entegrasyonlarıyla yayında

İlgili Haberler