[ Norsk · SMB · GDPR · AI Act ]

Vi tester om kunstig intelligens forstår Norge.

Åpen, uavhengig benchmark for hvor godt språkmodeller fungerer på norske SMB-oppgaver: faktura, kontrakter, MVA, lov-referanse, Brønnøysund-data, HR/lønn, kundeservice og Bokmål↔Nynorsk. Alle oppgavene, evalueringen og resultatene er offentlige. Modell-leverandører betaler ikke for å bli evaluert.

Se leaderboardLes metodikkenJSON-API
Topp-20 leaderboard

Total-score, vektet per kategori

Ingen kjøringer ennå

Benchmark er under oppstart. Første kjøring igangsettes fra /admin/kjor.

8 kategorier · Norsk SMB

Det norske SMB-er faktisk gjør hver dag

01
Faktura
Se kategori
02
Kontrakt
Se kategori
03
MVA og skatt
Se kategori
04
Lov-referanse
Se kategori
05
Brønnøysund
Se kategori
06
HR og lønn
Se kategori
07
Kundeservice
Se kategori
08
Bokmål↔Nynorsk
Se kategori
Alle 32 benches i katalogen ›
Hvorfor TenkiBench
01

Norsk-spesifikt

Globale benchmarks misser MVA-regler, lov-§-sitering, Bokmål/Nynorsk, fødselsnummer-format. Vi tester nettopp det.

02

Uavhengig

Modell-leverandører betaler ikke for plassering. Tenki Labs har konsulent-virksomheten som inntektskilde.

03

Åpen

Alle oppgaver, evalueringskode, og resultater er åpne. Kritiser fasit, foreslå forbedringer, fork repo'et.