DeepSeekMath-V2 – Matematik-AI når Putnam 118/120

DeepSeek fortsätter att skaka om AI-världen. Nu släpper företaget DeepSeekMath-V2, ett öppet matematikmodell-LLM som tar ett enormt kliv framåt inom avancerad matematisk problemlösning. Modellen når 118 av 120 poäng på Putnam 2024, en nivå som inte bara slår tidigare AI-system – utan även toppresultaten från mänskliga tävlingsdeltagare.

Med andra ord: vi pratar om den mest kapabla öppet tillgängliga matematikmodellen som byggts hittills.

En helt ny approach till matematiskt resonemang

Till skillnad från tidigare matematik-LLM:er som främst tränats på att producera rätt svar, är DeepSeekMath-V2 konstruerad för att skapa korrekta resonemang, bevis och förklaringar. Modellen tränas inte enbart på slutresultat, utan på hur bevis ska byggas upp logiskt, steg för steg.

DeepSeek gör detta med en metod man kallar ”verifier-first-träning”:

först tränas en verifierare som lär sig bedöma kvaliteten på matematiska bevis
därefter tränas modellen att generera lösningar som verifieraren godkänner
en meta-verifierare kontrollerar att verifierarens kritik inte är hallucinerad

Systemet utvecklar alltså en egen intern ”kritiker”, vilket gör att modellen lär sig resonera mer likt en mänsklig matematiker.

685B Mixture-of-Experts – helt öppet

DeepSeekMath-V2 byggs på DeepSeek-V3.2-Exp-Base, en massiv 685-miljarders Mixture-of-Experts-modell, men släpps ändå som öppna vikter (Apache 2.0).

Det innebär att:

forskare kan finjustera modellen
företag kan använda den kommersiellt
utvecklare får tillgång till hela systemet utan licensbegränsningar

Att ett system som matchar (och överträffar) tävlingsnivå på IMO och Putnam släpps öppet är i sig en stor händelse inom AI-världen.

Prestationer som sticker ut

DeepSeekMath-V2 uppvisar toppresultat på flera tunga benchmark-tester:

Putnam 2024: 118/120 → nära perfektion
IMO 2025 (intern utvärdering): Guldnivå
CMO 2024: Fullständiga lösningar på fyra problem + delpoäng på ett till
IMO ProofBench: Högre beviskvalitet än tidigare toppmodeller

Modellen klarar dessutom komplexa bevisuppgifter som kräver långa resonemang – något som tidigare varit en stor svårighet för alla LLM:er.

Varför detta är stort

Som öppet system möjliggör DeepSeekMath-V2:

forskning på verifierad AI-resonering
utveckling av säkrare, mer logiska AI-modeller
användbara matematik-agenter som kan skapa, granska och förklara bevis
utbildningsverktyg som hjälper studenter förstå matematisk logik

Kort sagt: detta är ett av de största stegen hittills inom ”AI som kan tänka”.

Redaktionens kommentar

DeepSeekMath-V2 är ett tydligt bevis på hur snabbt AI-fältet utvecklas. Modellen är inte bara ett verktyg – den representerar ett nytt paradigm där AI lär sig förstå sina egna resonemang. Öppna vikter, hög prestanda och avancerad självverifiering gör att systemet kan få stor påverkan både inom forskning, tävlingsmatematik och utbildning.