neurologyLLM & Modeller

DeepTechTR@DeepTechTR
DeepTechTR (@DeepTechTR)
Deepseek V4 geliyor ve bu sefer parametreler trilyon seviyesine çıkıyor. Aktif parametre sayısı token başına 32 milyar civarında olacakmış, yani sparse mimariyle devasa bir modeli son derece verimli çalıştırmayı planlıyorlar.
1 milyon token context window ile geliyor. Bu ne
model
favorite40