Anthropic vraagt bindende AI-regels terwijl het zelf de krachtigste modellen uitrolt
Dario Amodei pleit voor verplichte veiligheidstests voor frontier AI, terwijl Anthropic zelf Mythos 5 uitrolt. Wat stelt hij concreet voor?
Dario Amodei, CEO van Anthropic, riep woensdag op tot verplichte veiligheidstests voor de krachtigste AI-modellen. Zijn essay 'Policy on the AI Exponential' markeert een opmerkelijke verschuiving: van het vrijwillige transparantiemodel dat de sector tot dusver hanteerde, naar een oproep tot bindende wetgeving. Het moment is niet willekeurig gekozen. Anthropic bereidt een beursgang voor en lanceerde dinsdag Mythos 5, een frontier-model dat externe onderzoekers capabel achten voor autonome cyberaanvallen.
Het FAA-model als blauwdruk
De kern van Amodei's voorstel is een reguleringsstructuur gemodelleerd naar de Federal Aviation Administration. Net zoals vliegtuigen verplicht technische certificering doorlopen vóór commercieel gebruik, zouden frontier AI-modellen verplichte testing en auditing moeten ondergaan. En net zoals de FAA een vliegtuigtype uit de lucht kan halen, moet een toezichthouder de release van een AI-model kunnen blokkeren of terugdraaien als dat een bedreiging vormt voor de publieke veiligheid.
Amodei schetst vier risicocategorieën waarop deze testing zich moet richten: cybersecurity, biowapens, verlies van menselijke AI-controle, en geautomatiseerde R&D. Alle vier betreffen scenario's waarbij een geavanceerd model schade op systeemniveau kan veroorzaken, niet individuele misbruiksituaties maar structurele risico's die pas zichtbaar worden als ze al zijn ingetreden.
De testing zelf moet worden uitgevoerd door onafhankelijke derde partijen, niet door de bedrijven die de modellen bouwen. Dat is het cruciale verschil met de huidige praktijk, waarbij safety-evaluaties grotendeels intern plaatsvinden of berusten op vrijwillige toezeggingen.
De paradox
Hier begint de spanning. Anthropic positioneert zich vanaf de oprichting als het veiligheidsbewuste alternatief binnen de frontier AI-sector, maar het brengt tegelijkertijd de modellen uit die het meest dringend regulering vereisen. Mythos 5, gelanceerd op dinsdag, is een restricted frontier-model dat Anthropic beschikbaar stelt aan cybersecurity-organisaties en overheidspartners. Het Britse AI Security Institute beoordeelde het model als capabel voor het autonoom uitvoeren van complexe cyberaanvallen.
Amodei formuleert het tempo van de ontwikkeling zelf scherp: "AI is advancing at a lightning pace, in only four years, AI models have gone from barely being able to write a coherent line of code to writing most of the code at major AI companies."
De logica van Anthropic lijkt te zijn: als deze modellen toch worden gebouwd, dan beter door een partij die tegelijkertijd het raamwerk bepleit om ze in te dammen. Critici lezen dat anders: een bedrijf dat regulering vraagt voor een technologie die het zelf al heeft uitgerold, bepaalt mede de voorwaarden van die regulering. De vraag is wie daar het meest van profiteert.
Van vrijwillig naar verplicht
Tot dusver draaide AI-governance grotendeels op vrijwillige transparantie. Grote labs, waaronder Anthropic, Google DeepMind en OpenAI, ondertekenden in 2023 vrijwillige toezeggingen aan het Witte Huis. De praktische handhaving bleef echter beperkt. Geen enkele toezichthouder beschikt momenteel over de bevoegdheid om een model terug te roepen, en derde-partij audits zijn geen formeel vereiste.
Amodei stelt dat dit tijdperk voorbij is. Zijn essay gaat vergezeld van een concreet wetgevingsvoorstel voor frontier model testing en een apart beleidskader voor banenverdringing, een onderwerp dat hij expliciet benoemt als structureel vraagstuk dat sectorbreed aandacht verdient.
Wie zal weerstand bieden? Technologiebedrijven met minder uitgesproken safety-budgetten hebben er financieel belang bij dat de lat niet te hoog wordt gelegd. Wie al geïnvesteerd heeft in uitgebreide interne veiligheidsinfrastructuur, zoals Anthropic, heeft een competitief voordeel bij het instellen van complianceverplichtingen die kleinere spelers onevenredig zwaar treffen. Dat mechanisme is in gereguleerde sectoren niet onbekend: gevestigde partijen steunen soms regulering die toetreding bemoeilijkt.
Richting IPO
De timing verbindt twee verhaallijnen die los lijken maar dat niet zijn. Een beursgang vraagt om een heldere positionering ten opzichte van reguleringsrisico. Een bedrijf dat actief meewerkt aan het formuleren van wetgeving, en zichzelf als betrouwbaar tussenpersoon tussen overheid en technologie positioneert, verlaagt haar eigen onzekerheidsrisico. Institutionele beleggers waarderen dat.
Tegelijkertijd stelt de lancering van Mythos 5, met zijn vermogens op het gebied van cyberoperaties, de governance-vraag centraal: wie beslist wanneer een model te gevaarlijk is voor publieke toegang? Amodei's antwoord is: een onafhankelijke toezichthouder, met wettelijke bevoegdheden en externe auditcapaciteit.
Wat volgt
Anthropic publiceert naast het essay ook het concrete wetgevingsvoorstel voor frontier model testing en het aparte beleidskader voor banenverdringing. Die documenten bepalen de volgende fase van het debat: van principiële oproep naar wetgevende tekst.
Bronnen: Dario Amodei, UK AI Security Institute
Dit artikel is uitsluitend bedoeld ter informatie en vormt geen financieel, beleggings- of fiscaal advies. Today in Finance is geen beleggingsonderneming en beschikt niet over een vergunning als bedoeld in de Wet op het financieel toezicht (Wft). Raadpleeg altijd een gekwalificeerd financieel adviseur voordat je financiële beslissingen neemt. Today in Finance is niet aansprakelijk voor beslissingen genomen op basis van deze informatie.