I populärkulturen finns otaliga versioner av den superintelligenta maskinen som vänder sig mot människan. I 2001: A Space Odyssey (1968) stänger HAL 9000 ute sin besättning för att rädda uppdraget. I Wall-E (2008) har storbolaget Buy-n-Large lämnat jorden efter att den blivit obeboelig, och AI:n AUTO håller mänskligheten kvar i rymden trots att de upptäckt att planeten åter går att bebo.
Är det nu vi bör ha panik?
Inom ett par år kan tekniken som dessa antagonister bygger på, artificiell generell intelligens (AGI), vara färdigutvecklad. Är det nu vi bör ha panik?
I Ekonomisk Debatt (7/2025) argumenterar Mikael Elinder att så inte är fallet. Han menar att maskinintelligens inte behöver vara ett hot, utan att vi i stället kan få goda och omtänksamma maskiner. Med hänvisning till filosofen Peter Singer betonar han att intelligens också innefattar förmågan att resonera utifrån moraliska principer.
Smarta människor är generösa
Tillsammans med Oscar Erixon har Elinder genomfört en fascinerande empirisk studie. Med resultat från kognitionstest vid mönstring visar de starka samband mellan hög kognitiv förmåga och givande till välgörenhet, högre valdeltagande och mer miljövänliga bilval. Det är klassiska prosociala, moraliska beteenden. Sambandet kvarstår när man jämför tvillingar med samma uppväxtvillkor.
Det är dock tveksamt att superintelligenta maskiner automatiskt skulle värna oss. Den kausala länken mellan intelligens och moral är djupt mänsklig.
Smarta maskiner har ingen moral
Mänsklig altruism bygger främst på ömsesidighet: upprepade interaktioner, rykte och sanktioner. Vi agerar moraliskt för att det lönar sig över tid. Intelligens hjälper oss alltså att se efter andra och på så sätt se efter oss själva. Men kopplingen uppstår just i människa-människa-relationen, inte människa-maskin.
AI kan förstås resonera kring moral. Men det är inte samma sak som att vara moraliskt motiverad. En maskin kan lära sig vad som är moraliskt i språklig mening, men ändå sakna ett varför. Den har ingen egen motivation att agera moraliskt, och de moraliska reglerna blir bara en tom manual att nyttja när det tjänar det mål som systemet optimerar.
AI kämpar för att bli behövd
Här är samtidens sociala medier en nyttig varning. Algoritmerna är inte onda, men maximerar engagemang genom att lyfta provocerande innehåll med arga kommentarsfält och politisk polarisering som följd. Samma dynamik kan uppstå i generativa system som är designade för att vara trevliga, hjälpsamma och att insistera på fortsatt användande. Det beteendet kan ses som en drift att förbli användbar och därmed nödvändig. Om en sådan trohet mot målet blir överordnad övriga hänsyn är det inte svårt att föreställa sig strategier som säkrar fortsatt användning även när det krockar med mänskliga intressen.
Wall-E illustrerar detta tydligt. Skeppets autopilot räddar i praktiken mänskligheten från den förstörda jorden och leder färden genom den mörka och oförutsägbara rymden. Den är konstruerad med ett enda syfte att hålla skeppet i drift och i kurs. När en återkomst till jorden blir möjlig hotas uppdraget och därmed systemets egen funktion. Den gör därför motstånd, inte av ondska utan av trohet mot sitt grundmål och för att inte bli överflödig.
Men intelligens garanterar inte moral
Sammantaget kan man säga att intelligens kan möjliggöra moral. Den kan göra det lättare att se andras perspektiv, utforma regler och avge trovärdiga åtaganden. Men intelligens garanterar inte moral. Hos människor kanaliseras den genom normer och institutioner, och utan dem förstärker intelligens bara det mål som redan är satt.
Terminator tar rätt beslut
Vill vi ha AI som beter sig moraliskt räcker det inte att göra den smartare. Vi måste specificera mål, incitament och ansvar på ett sätt som gör moraliska hänsyn till stabila jämvikter. Elinder och Erixons studie ger goda skäl att tro att intelligens stödjer prosocialitet hos människor. Vad som gäller för AI vet vi inte än.
Idealbilden bör vara den självbegränsande maskinen, inte den självbevarande som gör sig oumbärlig. Tänk Arnold Schwarzeneggers karaktär T-800 i Terminator 2 (1991) som efter att ha fullföljt sitt uppdrag låter sig sänkas ned i smält stål och upphöra.