GPT-4.5: Maksimum fiyat, minimum ilerleme

Fotoğraf: Unsplash
OpenAI kısa süre önce yeni geniş dil modeli (LLM) GPT-4.5’i tanıttı. OpenAI’ın iddialarına kulak verecek olursak GPT-4.5, şirketin bugüne kadarki “en büyük ve en bilgili” geniş dil modeli. Modelin genel olarak bilgi seviyesi arttırılırken halüsinasyon oranını da azaltmayı başarmışlar. “GPT-4.5, Sam Altman başta olmak üzere geniş dil modeli pazarlamacılarının abartılı iddialarını karşılayabilmeye aday mı?” sorusunu sormadığımız sürece modelin öncellerine kıyasla makul bir ilerleme kaydettiğini söyleyip geçebilirdik. Ancak LLM’lerin her alanda kullanımının pazarlanmaya çalışıldığı mevcut tablo meseleyi biraz daha detaylı tartışmamızı gerektiriyor.
Sam Altman GPT-4.5’i pazarlamaya dönük açıklamalarında[0] modelin “Oldukça büyük ve pahalı bir model olduğunu”, “Ellerindeki grafik işlemci stoklarının tükendiğini” ve “Yüz binlerce yeni grafik işlemci eklemeye hazırlandıklarını” belirtiyor. GPT-4.0’ın eğitim maliyeti 100 milyon doların üzerindeydi. Andrej Karpathy’nin açıklamalarına göre GPT-4.5’in eğitimi sırasında GPT-4.0’ın 10 misli hesaplama gücü kullanılmış. Buna Altman’ın bahsettiği “yüz binlerce grafik işlemci” de eklendiğinde milyarlarca dolarlık bir maliyet söz konusu. Bu devasa maliyet GPT-4.5’i kullanmak isteyenlere 1 milyon girdi tokenı başına 75 dolar, 1 milyon çıktı tokenı başına ise 150 dolar olarak yansıyacak. Kıyas açısından DeepSeek’in 1 milyon girdi ve çıktı tokenı başına fiyatları 0.07 ve 1.10 dolar. Diğer rakip LLM’lerde de fiyatlar oldukça çeşitli olmakla birlikte OpenAI’ın GPT-4.5 için talep ettiği miktarın yakınına yaklaşan yok.
OpenAI açısından sorun şu, GPT-4.5 rakip LLM’ler karşısında aradaki devasa fiyat uçurumunu makul gösterebilecek kadar bir yenilik ve gelişme sunmuyor. Ayrıca, LLM’lerin kullanım alanları pazarlanmaya çalışılan yaygın kullanım tablosunun zaten çok altında. Halüsinasyonlar nedeni ile LLM’lerin pek çok alanda kullanımı ya ciddi risk taşıyor ya da gerekli insan denetimi, işi doğrudan bir insanın LLM desteği olmadan yapmasından daha maliyetli hale getiriyor. Üstelik bu sınırlı kullanım alanı içinde benzer performans sergileyebilen rakip LLM sayısı da son bir yılda önemli ölçüde arttı: DeepSeek mayıs ayında yayımlamayı planladığı bir sonraki modelinin yayım tarihini öne çekmeye çalışıyor, Meta kendi bağımsız yapay zeka uygulamasını çıkartmayı tartışıyor, Grok ve Claude model performansı konusunda son sürümleri ile rakiplerini yakaladı ya da aştı…
OpenAI alandaki lider konumunu günden güne yitirirken buna karşılık olarak sunduğu yeni ve pahalı modelinin kayda değer düzeyde bir iyileşme sunduğunu söylemek zor. Bugüne kadar sürekli tekrarlanan “Daha fazla veri ve daha fazla hesaplama gücü daha da iyi modeller anlamına gelir” önermesi de GPT-4.5 ile birlikte duvara toslamış durumda. Piyasaları 1 trilyon dolardan fazla zarara uğratan “DeepSeek anı”nın ardından herkes bir an önce elinde ne var ne yoksa hızla yayımlama yarışına girişti. DeepSeek anı gerçekleşmemiş olsa pek çok LLM üreticisinin belki birkaç yıla yayarak gıdım gıdım kullanıma açacağı güncellemeler bir anda toplu olarak geldi. Dar bir kullanım alanı içindeki bu hızlı gelişen rekabette OpenAI şimdilik ciddi şekilde geride kalmış görünüyor.
Evrensel'i Takip Et