CRAFTORY
Tilbage til journal
AI·5. maj 2026·6 min

Hvornår er et AI-API ikke nok — og hvornår er det præcis nok

Det meste af AI-værdien kommer fra at kalde et eksisterende API. Men der er specifikke cases hvor du har brug for fine-tuning, custom modeller eller noget helt tredje. Her er forskellen.

Skrevet af Adrian Sinclair
Hvornår er et AI-API ikke nok — og hvornår er det præcis nok — cover

Når jeg taler med founders om AI-projekter, opstår dette spørgsmål næsten altid: *"Skal vi træne vores egen model, eller bare bruge ChatGPT?"*. Det er det forkerte spørgsmål. Det rigtige er: *"Hvad er det mindste setup der virker for vores use case?"*.

I 90% af tilfældene er svaret: brug et eksisterende API (OpenAI, Anthropic, Replicate). Men der er specifikke cases hvor det ikke er nok. Lad mig forklare forskellen.

Hvad et eksisterende API giver dig

Når du bruger Claude API, GPT API eller en lignende: du sender tekst (eller billede), modtager output, betaler per token.

Fordele: - Tilgængeligt med 1 dags integration - State-of-the-art kvalitet (du arbejder med den nyeste model uden setup) - Skalerer automatisk (ingen infrastruktur at vedligeholde) - Pris-transparent (du ved præcist hvad hver request koster)

Begrænsninger: - Du kan ikke ændre model-adfærd ud over prompts - Latency er hvad providere giver dig (typisk 1-5 sek) - Cost stiger lineært med volumen - Du sender dine data til en tredjepart

For 90% af AI-features dækker dette behovet fuldt.

Hvornår API alene IKKE er nok — 5 scenarier

1. Du har domain-specifik viden modeller ikke har

Eksempel: Du driver en juridisk SaaS med dansk skattelovgivning. GPT-4 ved generelt om dansk lov, men hallucinerer på specifikke paragraffer og 2024-opdateringer.

Løsning A (RAG): Byg en retrieval-pipeline der henter relevante lov-tekster fra din database og inkluderer i konteksten. Dette løser 80% af tilfældene.

Løsning B (fine-tuning): Træn en model på din juridiske corpus. Pris: 50-150K + 10-30K/md i drift. Værd det kun hvis RAG ikke er præcist nok.

2. Du har strenge latency-krav

Eksempel: Du bygger en real-time autocomplete der skal svare under 200ms. GPT-4 har 1-3 sek latency, ikke nok.

Løsning: Brug en mindre, hurtigere model (Claude Haiku, GPT-4o-mini) eller selv-hostet open-source model (Llama 3, Mistral). Pris: hvis du går selv-hostet, regn med 10-30K/md i GPU-hosting + ekstra dev-tid.

3. Du har ekstreme volumen-krav

Eksempel: Du klassificerer 10 millioner produkter om dagen. API-cost ved den volumen vil være 200-500K kr./md.

Løsning: Selv-hostet model. Investering 100-300K + 20-50K/md drift. Break-even point: ~5M API-kald/md.

4. Du har strenge data-residency krav

Eksempel: Du behandler PII (personhenførbare oplysninger) der skal blive i EU eller specifikt i Danmark.

Løsning: Brug en EU-region API (OpenAI Azure EU, Anthropic AWS Frankfurt) eller selv-hostet model. Anthropic, Azure og AWS tilbyder GDPR-compliant data-håndtering. Selv-hostet er kun nødvendigt hvis du har strenge audit-krav.

5. Du bygger noget der kræver multimodal kontrol

Eksempel: Du har en custom mockup-renderer der placerer AI-genererede billeder på lifestyle-baggrunde med præcis pixel-kontrol.

Løsning: Kombiner API-baseret billedgenerering (Replicate, Stable Diffusion API) med din egen renderer-pipeline. Dreamwall Imaginator bruger denne arkitektur.

Beslutnings-træ

Stil disse spørgsmål i denne rækkefølge:

  • Kan API alene løse use casen? Ja → brug API. Stop her.
  • Hallucinerer det for ofte? Ja → tilføj RAG-lag.
  • Er latency stadig for høj? Ja → vurder mindre model eller selv-hosted.
  • Er kost ved skalering for høj? Ja → vurder selv-hosted ved >5M kald/md.
  • Har du data-residency krav? Ja → EU-region eller selv-hosted.

For 90% af AI-features stopper du ved spørgsmål 1 eller 2.

Hvad vi anbefaler i 2026

For startups og SMB'er: start altid med API alene (Claude eller GPT). Det er den hurtigste vej til at finde ud af om featuren overhovedet leverer værdi. Optimér først efter du har bevis på at brugerne bruger den.

For etablerede virksomheder med specifikke krav: kombinér API + RAG + cost-control. Det dækker 95% af use cases.

For enterprise eller specialiserede use cases: hybrid setup (API til standard tasks, selv-hosted til specifikke opgaver). Det er det mest komplekse, og kun værd det når volumen og data-krav retfærdiggør det.

Hvis du står med valget: book en uforpligtende scope-snak — vi kigger på din specifikke use case og siger ærligt hvilken arkitektur der giver mening.

Læs videre

— Journal

Få nye artikler direkte i indbakken

1-2 mails om måneden. Ingen spam. Frameld dig når som helst.

— Vil du tale om det?

Skal vi bygge sammen?

20 minutter, ingen forpligtelse. Vi finder ud af om der er match.