[ Norsk · SMB · GDPR · AI Act ]

Vi tester om kunstig intelligens
forstår Norge.

Åpen, uavhengig benchmark for hvor godt språkmodeller fungerer på norske SMB-oppgaver: faktura, kontrakter, MVA, lov-referanse, Brønnøysund-data, HR/lønn, kundeservice og Bokmål↔Nynorsk. Alle oppgavene, evalueringen og resultatene er offentlige. Modell-leverandører betaler ikke for å bli evaluert.

Se leaderboard Les metodikken JSON-API

Topp-20 leaderboard

Total-score, vektet per kategori

Ingen kjøringer ennå

Benchmark er under oppstart. Første kjøring igangsettes fra /admin/kjor.

8 kategorier · Norsk SMB

Det norske SMB-er faktisk gjør hver dag

Bokmål↔Nynorsk

Alle 32 benches i katalogen ›

Hvorfor TenkiBench

01

Norsk-spesifikt

Globale benchmarks misser MVA-regler, lov-§-sitering, Bokmål/Nynorsk, fødselsnummer-format. Vi tester nettopp det.

02

Uavhengig

Modell-leverandører betaler ikke for plassering. Tenki Labs har konsulent-virksomheten som inntektskilde.

03

Åpen

Alle oppgaver, evalueringskode, og resultater er åpne. Kritiser fasit, foreslå forbedringer, fork repo'et.