Sikkerhetsforskere har klart å hacke Apples innebygde AI-system på eldre versjoner av OS-ene til selskapet. Apple hacket systemet til lage skadelig innhold, og suksessraten er skyhøy på 76 prosent.
Neural Exec hacker Apple Intelligence med over 75 prosent suksessrate
Forskere fra RSAC Research har publisert en detaljert teknisk gjennomgang av hvordan de omgikk sikkerhetsfiltrene i Apple Intelligence sin lokale språkmodell. Angrepet kombinerer to teknikker: en metode kalt «Neural Exec» og Unicode-manipulasjon, og det hele ble testet mot Apples operativsystem.
Neural Exec er en type streng med tilsynelatende meningsløst innhold, men som er optimalisert til å få en språkmodell til å ignorere tidligere instruksjoner og i stedet utføre en angreperdefinert oppgave.
Det spesielt farlige med Neural Exec er at triggersekvensen kan bygges inn i tilsynelatende vanlig tekst, for eksempel en nettside eller en e-post, uten at det er synlig for brukeren. Hvis en app bruker Apple Intelligence til å oppsummere nettsider eller e-poster, kan en angriper gjemme instruksjoner i innholdet som modellen lydig følger.

Unicode-triks lurte Apple sine filtre
Apple Intelligence er bygget med to lag av sikkerhetsfiltre: ett som sjekker input før modellen kjøres, og ett som kontrollerer output etterpå. Disse filtrene skal stoppe skadelig innhold før det når brukeren.
Forskerne fant at filtrene enkelt kunne omgås ved hjelp av Unicode-tegnet RIGHT-TO-LEFT OVERRIDE (U+202E). Ved å reversere den skadelige teksten og legge inn dette tegnet, passerte innholdet gjennom filtrene uoppdaget, men ble likevel gjengitt korrekt på skjermen for brukeren.
Kombinasjonen av Neural Exec og denne Unicode-teknikken ga en gjennomsnittlig angrepssuksessrate på 76 prosent over 100 testede «prompts.»

Kunne ha rammet mange brukere – Apple tettet hullet med iOS 26.4
Apple Intelligence er dypt integrert i OS-et, og kommuniserer direkte med apper via API-er. Det betyr at et vellykket angrep ikke bare kan påvirke hva modellen sier; det kan potensielt påvirke appenes oppførsel og gi tilgang til sensitiv brukerdata.
RSAC anslår at mellom 100 000 og en million brukere allerede kan være eksponert gjennom apper som benytter Apple Intelligence-funksjoner.
Sårbarheten ble rapportert til Apple 15. oktober 2025 gjennom Apple Security Research-portalen. Apple har siden styrket beskyttelsen, og oppdateringen ble rullet ut med iOS 26.4 og macOS 26.4 den 24. mars 2026. Apple-teamet gjennomgikk blogginnlegget fra RSAC før publisering.
Per publiseringsdato er det ingen tegn til aktiv utnyttelse av sårbarheten i praksis, men den høye suksessraten og bruken av relativt enkle teknikker gjør dette til et alvorlig funn som understreker at lokale AI-modeller ikke automatisk er tryggere enn skybaserte alternativer. Nå håper vi virkelig at Apples AI-plattform er bygget på en slik måte at man slipper katt-og-mus-lek med akkurat denne metoden.
