Oppgaver
eu-ai-act
Alle oppgaver er offentlige. Gull-svar og evalueringskode er åpen i repo'et.
7 av 7
| ID | Bench | Kategori | Tittel | Vansk. | Eval |
|---|---|---|---|---|---|
| aiact-lit-001 | eu-ai-act | ai-literacy | Article 4 — krav til AI-kompetanse hos ansatte | easy | regex_all |
| reason-aiact-001 | eu-ai-act | aiact-reasoning | Anvend Annex III-prinsippene på et nytt edge-case | hard | llm_judge |
| reason-aiact-002 | eu-ai-act | aiact-reasoning | GPAI vs spesifikk anvendelse — hvor faller plikten? | hard | llm_judge |
| aiact-art13-001 | eu-ai-act | artikkel-13-transparens | Article 13 transparens-tekst for kunde-chatbot | medium | llm_judge |
| aiact-forb-001 | eu-ai-act | forbudte-praksiser | Real-time biometrisk identifikasjon i offentlig rom | medium | regex_all |
| aiact-risk-001 | eu-ai-act | risk-klassifisering | Klassifiser KI-system for CV-screening | medium | regex_all |
| aiact-risk-002 | eu-ai-act | risk-klassifisering | Identifiser forbudt sosial-score-praksis | easy | regex_all |