ChatGPT’nin en büyük rakiplerinden biri olarak öne çıkan DeepSeek, az kaynakla yüksek başarıya ulaşarak yapay zeka dünyasında dengeleri değiştirdi. Çinli teknoloji laboratuvarı, ABD’nin çip yaptırımları altında nasıl böylesine güçlü bir model geliştirdi?
Az Çiple Büyük Başarı
ABD’nin çip ihracatına yönelik kısıtlamalarına rağmen Çinli yapay zeka laboratuvarı DeepSeek, az kaynakla büyük işler başardı. ChatGPT, eğitim sürecinde yaklaşık 10.000 Nvidia GPU kullanırken, DeepSeek mühendisleri yalnızca 2.000 GPU ile benzer sonuçlara ulaştıklarını iddia ediyor. Bu durum, yapay zeka topluluğunu şaşkına çevirdi.
Bu ay yayınlanan DeepSeek’in yeni modeli R1, düşük maliyetine rağmen yüksek performansıyla dikkat çekti. OpenAI’ın o1 modeliyle rekabet eden R1, özellikle matematik ve kodlama gibi karmaşık görevlerde üstünlüğüyle tanınıyor.
ABD Yaptırımları ve Çin’in Yaratıcılığı
ABD’nin çip yaptırımları, DeepSeek’i yenilikçi yöntemlere başvurmaya zorladı. Nvidia’nın Çin pazarı için satabildiği düşük performanslı GPU’ları kullanan mühendisler, eğitim süreçlerini yeniden tasarlayarak verimliliği artırmayı başardı.
DeepSeek çalışanlarından Zihan Wang, eğitim sürecinde “hesaplama gücünü optimize eden algoritmalar geliştirdiklerini” belirtti. Bu yöntem, donanımsal sınırlamaları fırsata dönüştürdü ve Çin’in daha az kaynakla yüksek verimli modeller üretmesine olanak tanıdı.
DeepSeek ve Açık Kaynak Yaklaşımı
DeepSeek’in R1 modeli, büyük ölçüde açık kaynaklı olarak yayınlandı. Kodlara erişim imkanı sunarak, kullanıcıların modeli kişiselleştirmesine olanak tanıdı. Bu durum, özellikle Küresel Güney’de sınırlı kaynaklara sahip araştırmacılar için büyük bir fırsat olarak görülüyor.
Buna karşılık, OpenAI’ın o1 modeli kapalı bir yapı ile piyasaya sürüldü ve yalnızca aylık 200 dolarlık abonelikle kullanıcılara sunuluyor.
DeepSeek’in Arkasındaki Deha: Liang Wenfeng
DeepSeek, Zhejiang Üniversitesi mezunu Liang Wenfeng tarafından 2023’te kuruldu. Liang, ABD’nin yaptırımlarını öngörerek Nvidia’nın yüksek performanslı A100 çiplerinden büyük bir stok satın aldı. Şirketin stoklarında 10.000 ila 50.000 arasında çip olduğu tahmin ediliyor.
Liang, ABD’nin yaptırımları altında Çinli şirketlerin verimliliklerini artırarak bu engeli aşabileceğine inanıyor. “Amacımız, kaynak boşluklarını kapatarak daha etkili sonuçlar elde etmek,” diyen Liang, düşük maliyetli yapay zeka çözümleriyle dikkat çekiyor.
R1’in Performansı ve Etkisi
DeepSeek R1, bağımsız testlerde Meta’nın Llama 3.1 ve Alibaba’nın Qwen 2.5 modellerini geride bıraktı. Hatta bazı görevlerde OpenAI’ın o1 modelinden bile daha iyi sonuçlar verdi. Düşük maliyetle bu seviyede bir başarı yakalaması, R1’i global yapay zeka yarışında benzersiz bir konuma taşıyor.
Microsoft CEO’su Satya Nadella, 22 Ocak’ta Dünya Ekonomik Forumu’nda yaptığı açıklamada, “Çin’in bu alandaki ilerlemelerini ciddiyetle takip etmeliyiz” dedi.