GLM 5 Turbo: En teknisk gjennomgang

744 milliarder parametere, 40 milliarder aktive. GLM 5 Turbo er bygget for agentbaserte arbeidsflyter og slår GPT-4o og Claude 3.5 Sonnet på BrowseComp til en brøkdel av prisen.

Z.ai, tidligere kjent som Zhipu AI, ble etablert i 2019 ved universitetet i Tsinghua i Beijing. Selskapet ledes av administrerende direktør Zhang Peng og har på kort tid markert seg som en sentral aktør i det globale teknologikappløpet.

Fokus på utførelse og stabilitet

GLM 5 Turbo representerer den nyeste utviklingen innen store språkmodeller fra Z.ai. Modellen benytter en arkitektur kjent som Mixture of Experts. Dette innebærer at systemet har en total kapasitet på 744 milliarder parametere, men bare aktiverer rundt 40 milliarder av disse for hver enkelt oppgave. Denne metoden sikrer høy ytelse samtidig som ressursbruken holdes nede, noe som resulterer i raskere svar og lavere driftskostnader.

I motsetning til generelle modeller som primært er trent for samtale, er GLM 5 Turbo finjustert for å fungere som en aktiv agent i digitale arbeidsflyter. Den er programmert til å håndtere lange logiske kjeder og komplekse instruksjoner uten å miste sammenhengen. En sentral styrke er evnen til å bruke eksterne verktøy og programvaregrensesnitt med stor nøyaktighet. Dette betyr at modellen kan utføre faktiske oppgaver, som å hente data eller kjøre kode, med dokumentert lavere feilrate enn forgjengeren GLM 4.

Sammenligning av nøkkeltall

For å gi et bilde av hvordan GLM 5 Turbo står seg mot andre ledende modeller, viser tabellen under sentrale tekniske spesifikasjoner og testresultater. Kontekstvinduet er oppgitt i tokens, som er den industristandarden alle modeller benchmarkes mot. En token tilsvarer omtrent tre til fire tegn på norsk, noe som betyr at 200 000 tokens dekker rundt 600 000 til 800 000 tegn sammenhengende tekst.

Egenskap	GLM 5 Turbo	GPT 4o	Claude 3.5 Sonnet
Kontekstvindu	200 000 tokens	128 000 tokens	200 000 tokens
Score på BrowseComp	75,9 poeng	65,8 poeng	67,8 poeng
Pris per million tokens inn	1,2 dollar	5,0 dollar	3,0 dollar
Pris per million tokens ut	5,0 dollar	15,0 dollar	15,0 dollar

Testene ble utført og publisert av OpenAI for å sammenligne ulike modeller i et uavhengig testmiljø. Prisene er basert på offisielle lister fra leverandørene Z.ai, OpenAI og Anthropic.

Ytelse og benchmarks

I tekniske tester viser modellen styrke på områder som krever presisjon. På BrowseComp oppnådde modellen en score på 75,9 poeng, noe som plasserer den foran flere konkurrerende modeller. I ZClawBench, en test utviklet og utført av Z.ai selv for å måle automatisering i OpenClaw-økosystemet, viser modellen høy stabilitet. Ettersom denne testen er egenpublisert av leverandøren, bør resultatene veies mot uavhengige målinger.

Brukernes erfaringer

Modellen har på kort tid blitt enn av de mest omtalte modellene i diverse tech forum. Særlig blant brukere av det populære agent rammeverket OpenClaw som vi har skrevet om tidligere, der utgifter til api-kall er en vesentlig faktor.