DeepSeek fortsätter att skaka om AI-världen. Nu släpper företaget DeepSeekMath-V2, ett öppet matematikmodell-LLM som tar ett enormt kliv framåt inom avancerad matematisk problemlösning. Modellen når 118 av 120 poäng på Putnam 2024, en nivå som inte bara slår tidigare AI-system – utan även toppresultaten från mänskliga tävlingsdeltagare.
Med andra ord: vi pratar om den mest kapabla öppet tillgängliga matematikmodellen som byggts hittills.
En helt ny approach till matematiskt resonemang
Till skillnad från tidigare matematik-LLM:er som främst tränats på att producera rätt svar, är DeepSeekMath-V2 konstruerad för att skapa korrekta resonemang, bevis och förklaringar. Modellen tränas inte enbart på slutresultat, utan på hur bevis ska byggas upp logiskt, steg för steg.
DeepSeek gör detta med en metod man kallar ”verifier-first-träning”:
- först tränas en verifierare som lär sig bedöma kvaliteten på matematiska bevis
- därefter tränas modellen att generera lösningar som verifieraren godkänner
- en meta-verifierare kontrollerar att verifierarens kritik inte är hallucinerad
Systemet utvecklar alltså en egen intern ”kritiker”, vilket gör att modellen lär sig resonera mer likt en mänsklig matematiker.
685B Mixture-of-Experts – helt öppet
DeepSeekMath-V2 byggs på DeepSeek-V3.2-Exp-Base, en massiv 685-miljarders Mixture-of-Experts-modell, men släpps ändå som öppna vikter (Apache 2.0).
Det innebär att:
- forskare kan finjustera modellen
- företag kan använda den kommersiellt
- utvecklare får tillgång till hela systemet utan licensbegränsningar
Att ett system som matchar (och överträffar) tävlingsnivå på IMO och Putnam släpps öppet är i sig en stor händelse inom AI-världen.
Prestationer som sticker ut
DeepSeekMath-V2 uppvisar toppresultat på flera tunga benchmark-tester:
- Putnam 2024: 118/120 → nära perfektion
- IMO 2025 (intern utvärdering): Guldnivå
- CMO 2024: Fullständiga lösningar på fyra problem + delpoäng på ett till
- IMO ProofBench: Högre beviskvalitet än tidigare toppmodeller
Modellen klarar dessutom komplexa bevisuppgifter som kräver långa resonemang – något som tidigare varit en stor svårighet för alla LLM:er.
Varför detta är stort
Som öppet system möjliggör DeepSeekMath-V2:
- forskning på verifierad AI-resonering
- utveckling av säkrare, mer logiska AI-modeller
- användbara matematik-agenter som kan skapa, granska och förklara bevis
- utbildningsverktyg som hjälper studenter förstå matematisk logik
Kort sagt: detta är ett av de största stegen hittills inom ”AI som kan tänka”.
Redaktionens kommentar
DeepSeekMath-V2 är ett tydligt bevis på hur snabbt AI-fältet utvecklas. Modellen är inte bara ett verktyg – den representerar ett nytt paradigm där AI lär sig förstå sina egna resonemang. Öppna vikter, hög prestanda och avancerad självverifiering gör att systemet kan få stor påverkan både inom forskning, tävlingsmatematik och utbildning.
