SÄ byggde vi in sÀkerhet i skrÀddarsydda agenter
Hoppsan! Det verkar som om din annonsblockerare hindrar videon frÄn att spelas upp.
Titta pÄ den pÄ YouTube
En avgörande del av lanseringen av skrÀddarsydda agenter var att se till att denna nya typ av AI-arbetsflöde var sÄ sÀker som möjligt för vÄra kunder.
De flesta AI-agenter idag Àr utformade för en enskild anvÀndare med en relativt enkel uppsÀttning behörigheter som Àr kopplade till just den anvÀndaren. Agenter i en miljö med samarbete behöver dock fungera pÄ andra sÀtt. Att ge dem behörighet att göra vad som helst Àr farligt, och nÀr de inte har behörighet att göra nÄgonting Àr de sÀllan till nÄgon nytta.
NÀr det gÀller vÄra skrÀddarsydda agenter har vi varit noggranna med att försöka hitta en balans mellan bÄda dessa aspekter. De ska ha tillrÀcklig Ätkomst i miljöer för samarbete för att kunna vara precis sÄ hjÀlpsamma som krÀvs (t.ex. genom att tilldela en uppgift), men det ska som standard finnas strikta begrÀnsningar som sÀkerstÀller att agenten inte kan utföra farliga ÄtgÀrder (t.ex. radera allt innehÄll). Under Ärens lopp har vi utvecklat avancerade behörighets- och styrningsfunktioner som hjÀlper vÄra kunder att hantera sina arbetsytor. Vi har Àven utnyttjat samma strukturer för att ge vÄra anvÀndare detaljerad kontroll över sina agenter, sÄ att de kan arbeta sÄ sÀkert som möjligt i arbetsytorna.
Kontroll som standard
SkrĂ€ddarsydda agenter anvĂ€nder en sĂ€kerhetsmodell dĂ€r man börjar frĂ„n noll, vilket innebĂ€r att agenterna inledningsvis saknar Ă„tkomst till de flesta resurser â de har alltsĂ„ inga behörigheter att lĂ€sa, skriva eller interagera med nĂ„gonting.
Denna strategi stÄr i medveten kontrast till mÄnga personliga AI-hjÀlpmedel, som ofta börjar med omfattande Ätkomst och krÀver att anvÀndarna ser till att sÀkerhetsinstruktionerna inte hamnar i skymundan. Vi vill inte överlÄta sÀkerheten till modellens beslutsfattande. IstÀllet ville vi att sÀkerheten skulle vara inbyggd i Ätkomstkontrollen och det deterministiska lagret.
PÄ sÄ sÀtt har vi kunnat ge anvÀndarna detaljerade instÀllningsmöjligheter sÄ att de kan fatta rÀtt sÀkerhetsbeslut för sina specifika anvÀndningsfall, samtidigt som avancerade anvÀndare kan utnyttja möjligheten att skapa otroligt kapabla autonoma agenter.
Behörigheter pÄ resursnivÄ
Att ha de minst tillÄtande behörigheterna som standard Àr utmÀrkt, men det Àr viktigt att anvÀndarna enkelt kan bygga upp och förstÄ vilka behörigheter de behöver för en app eller ett program.
HÀr Àr nÄgra som Àr vÀrda att nÀmna:
Behörigheter pÄ sidnivÄ: AnvÀndarna kan bevilja Ätkomst att visa eller redigera specifika sidor, inte bara allmÀn Ätkomst till arbetsytan.
Direktintegration med Slack: Genom att erbjuda en direktintegration med Slack kan vi tillhandahÄlla detaljerade behörigheter som Àr lÀtta att konfigurera, vilket inte Àr möjligt med MCP.
E-post: Du kan vÀlja om du vill bekrÀfta innan e-postmeddelanden skickas.
MCP-integrationer: NÀr du anvÀnder en MCP-integration Àr den inte resursbaserad, men du kan ange vilka verktyg som ska vara tillgÀngliga och om du vill begÀra tillstÄnd eller alltid tillÄta vissa typer av ÄtgÀrder.
SÀkerhetsÄtgÀrder och varningar
Vi var ocksÄ tvungna att tÀnka pÄ oförutsedda beteenden under körning, nÀr agenten faktiskt utför sitt arbete. HÀr har vi anvÀnt en sÀkerhetsstrategi med flera lager, vilket innebÀr behörighetskontroller i kombination med ÄtgÀrder mot promptinjektioner under körning.
Skydd mot promptinjektioner: Promptinjektioner Ă€r en av de största och mest vĂ€lkĂ€nda utmaningarna för AI-agenter. Ăven om detta fortfarande Ă€r ett olöst problem utformar vi inte vĂ„rt system utifrĂ„n antagandet att alla promptinjektioner kommer att upptĂ€ckas (Ă€ven om vi upptĂ€cker mĂ„nga av dem). IstĂ€llet har vi utformat systemet sĂ„ att det innehĂ„ller flera lager av sĂ€kerhetskontroller som blockerar effekterna av promptinjektioner, samtidigt som vi lĂ€gger sĂ€rskild vikt vid mĂ€rkning och övervakning av externa data för att upptĂ€cka potentiella attacker. Om nĂ„got verkar misstĂ€nkt eller om agenten utför Ă„tgĂ€rder som tyder pĂ„ en potentiell attack kan vi stoppa agenten och be anvĂ€ndaren om bekrĂ€ftelse.
Varningssystem: NÀr agenten Àr pÄ vÀg att göra nÄgot som kan innebÀra en risk pausar den och frÄgar anvÀndaren först. Hur detta gÄr till beror pÄ om anvÀndaren konfigurerar eller kör agenten. NÀr vi konfigurerar en agent som kan utföra riskfyllda ÄtgÀrder visar vi anvÀndarna en rad popup-fönster, som kan handla om allt frÄn en enkel bekrÀftelse till att godkÀnnande mÄste erhÄllas frÄn administratören för arbetsytan. NÀr agenten utför en riskfylld ÄtgÀrd under körning tvingar vi den att bekrÀfta ÄtgÀrden med en Àgare för den skrÀddarsydda agenten. Detta arbete Äterspeglar vÄrt mÄngfacetterade tillvÀgagÄngssÀtt nÀr det gÀller behörigheter och sÀkerhet pÄ hela vÄr plattform.
Korrigering (dvs. en knapp för att radera): Om en agent rÄkar göra ett misstag, till exempel genom att publicera ett felaktigt meddelande i Slack, kan agentens Àgare radera det meddelandet. Det lÄter enkelt, men det Àr viktigt att ge anvÀndarna möjlighet att ÄtgÀrda eventuella skador, inte bara förhindra dem.
SÄ har vi utvecklat vÄr behörighetsmodell
För att ta fram den hÀr modellen körde vi ett omfattande alfatestprogram, bÄde internt inom Notion och externt tillsammans med kunder. Vi ville sÀrskilt utsÀtta sÀkerhetssystemet för ett stresstest för att se hur det fungerade i praktiken nÀr belastningen ökade. Vid slutet av vÄr alfatestperiod hade Notion mer Àn 3 000 skrÀddarsydda agenter, och vÄra alfakunder hade skapat mer Àn 25 000.
Vi lĂ€rde oss nĂ„gra saker vĂ€ldigt snabbt. Till exempel uppmuntrades anvĂ€ndarna i tidiga interna versioner av skrĂ€ddarsydda agenter att vara alltför tillĂ„tande utan att de förstod de potentiella konsekvenserna. AnvĂ€ndarna gav agenterna omfattande Ă„tkomst till Slack, och vid flera tillfĂ€llen publicerade dessa agenter till och med meddelanden i #general (agenten vet ju att varje Slack-arbetsyta har en #general-kanal), den företagsomfattande kanalen med hundratals deltagare. Det var helt klart inte anvĂ€ndarnas avsikt. Det var detta som fick oss att införa en ny anpassad behörighet för âlĂ€s och svaraâ i Slack, som gör det möjligt för agenter att svara direkt i de trĂ„dar dĂ€r de uttryckligen har blivit utlösta. Vi ser det som vĂ„r uppgift att införa behörigheter som dessa, som gör det möjligt för anvĂ€ndarna att utföra sitt arbete pĂ„ ett sĂ€kert sĂ€tt, istĂ€llet för att tvinga dem att âtillĂ„ta alltâ.
Detta ledde ocksÄ till att vi medvetet valde att utveckla egna integrationer istÀllet för att enbart förlita oss pÄ MCP:er. Som redan nÀmnts Àr de flesta MCP:er idag frÀmst utformade för anvÀndningsfall med en anvÀndare, vilket innebÀr att de i regel inte har inbyggt stöd för resursbaserade behörigheter eller utlösare. Genom att bygga egna integrationer fick vi möjlighet att tillÀmpa vÄr behörighetsmodell utan att det medförde extra arbete för vÄra kunder.
En sak som vi Àr sÀrskilt stolta över Àr att genom denna process har vÄrt eget sÀkerhetsteam blivit en av de mest aktiva interna anvÀndarna av skrÀddarsydda agenter. De har till exempel utvecklat en agent vid namn Scruff som ska prioritera och komplettera sÀkerhetsvarningar, och de anvÀnder agenter för automatisering av applikationssÀkerhet, generering av kodkorrigeringar och körning av motstridiga tester. Det har varit ett verkligt samarbete mellan vÄrt AI-team och vÄrt sÀkerhetsteam.
Vad hÀnder hÀrnÀst?
Lanseringen var bara början, och vi satsar stort pÄ förbÀttrade sÀkerhets- och skyddsÄtgÀrder i takt med att vÄra produkter och hela branschen utvecklas. Betaperioden för vÄra skrÀddarsydda agenter under de kommande mÄnaderna kommer ocksÄ att hjÀlpa oss att fortsÀtta utvecklas tillsammans med vÄra kunder.
Under de kommande veckorna och mÄnaderna rÀknar vi med att ta itu med följande:
Äterinföra bredare behörighetsomrÄden som krÀver godkÀnnande av administratören för arbetsytan för avancerade anvÀndningsfall
utöka möjligheterna till detaljerade behörigheter till externa integrationer som bygger pÄ Workers-plattformen
övervÀga ytterligare behörighetslÀgen för olika anvÀndningsfall nÀr fler sÀkerhetsÄtgÀrder har införts
Vi befinner oss fortfarande i den inledande fasen av utvecklingen av denna teknik, och vi tar gÀrna emot feedback frÄn gemenskapen om hur vi kan förbÀttra den.

