Agentiska webbläsare: Strawberry, Perplexity Comet, OpenAI Atlas och Claude Computer Use – vad kan de göra (och när bör du backa sakta ut ur rummet)?

Du vet känslan när du tänker: “Om någon bara kunde klicka runt i det här gränssnittet åt mig…” 💡
Grattis (och beklagar): nu är den personen en AI. Och den vill ha din muspekare.

I det här inlägget tittar vi på fyra namn som dyker upp överallt: Strawberry Browser, Perplexity Comet, OpenAI Atlas och Claude Computer Use. Vi tar vad du kan göra, vad som skiljer dem åt, och – viktigast av allt – riskerna och begränsningarna.

Vad menas med “agentisk webbläsare”?

En vanlig webbläsare visar webben. En agentisk webbläsare gör saker på webben: loggar in (med ditt okej), navigerar menyer, fyller i formulär och klickar sig igenom flöden som annars kräver “klick-klick-klick i 20 minuter”.

Jag brukar kalla det AI-världens hybridbil: en riktig API-integration är elbilen (stabil), men en agentisk browser är otroligt praktisk när det saknas API eller när uppgiften är för liten för att motivera en full AI-integration. (Det är också därför den här kategorin ofta dyker upp i samtal om AI automation.) 📈

Vad kan man göra i praktiken?

✅ Klickautomation i webbsystem utan API
“Gå in i Loopia, hitta DNS-inställningarna, uppdatera en post enligt min checklista och dubbelkolla att det är sparat.”
Eller: “Bygg ett flöde i Microsoft Power Automate, koppla rätt connector, testkör och justera.”

✅ Support och admin i SaaS-gränssnitt
“Jag hittar inte var man stänger av funktion X – kan du navigera dit och peka ut exakt var inställningen ligger?”

✅ E-handel och inköp
“Fyll varukorgen med ingredienser till tacofest under 300 kr och prioritera veckans erbjudanden.” 🌮

✅ Prospektering
“Hitta 10 relevanta personer på LinkedIn att connecta med och föreslå en vettig första rad.”

Men: tänk “snabb praktikant med superkrafter”, inte “autopilot”.

Varför går det fel när det går fel?

Det här är nyckeln till att förstå både potentialen och risken.

En agentisk browser jobbar ofta med en kombination av:

vad du sa (instruktionen),
vad den ser (skärmbild/DOM),
vad den tror hände efter klicket.

Och det sista är det luriga. Ibland ser agenten inte tydligt att en knapp bytte läge, att ett formulär faktiskt sparades, eller att en pop-up hamnade bakom ett annat fönster. Det kan bli “state-blindness”: den beter sig som om den vore kvar på förra steget.

Det är därför jag tjatar om checkpoints och human-in-the-loop. För när en människa gör ett felklick är det oftast irriterande. När en agent gör det – med dina cookies och din adminroll – kan det bli dyrt.

Tumregel att sätta på väggen:
💡 Ju fler rättigheter du ger agenten, desto större blir konsekvensen om den gör fel.

Strawberry Browser: svensk workflow-känsla och “agent-team i tabs”

Strawberry marknadsför sig som en “self-driving browser” där du kan bygga ett team av agenter som jobbar över dina tabs. Deras “Companions” är tänkta att vara mer än chat: de kan se vad du ser och ta actions i gränssnittet.

Det jag gillar med Strawberry som idé är att den känns byggd för arbetsflöden snarare än “en smart sidopanel”. Alltså: flera små agenter som gör olika saker – och du som leder orkestern.

Integritet (deras position):
Strawberry skriver att chats, lösenord, historik och cookies lagras lokalt, med undantag för t.ex. större uppladdningar som kan gå via molnlagring under begränsad tid.

Vill du testa själv: Strawberry Browser.

Perplexity Comet: researchmotor som också klickar (och ibland klickar för mycket)

Comet bygger på Perplexitys “answer engine”, men kommer i ett Chromium-skal. Många gillar att den känns som “en vanlig browser – fast med Perplexity i motorn”. Den kan också importera en hel del (bokmärken, lösenord, cookies, historik, extensions där det stöds), vilket gör tröskeln låg att prova.

Min praktiska take:
Comet kan vara otroligt hjälpsam när du fastnar i ett webbgränssnitt (Power Automate, Loopia, Google Cloud…). Men jag har också sett den klassiska agent-fällan:

Den fattar inte alltid att den redan tryckt på knappen – och nästa klick kan råka bli “ta bort”, “avbryt” eller “nollställ”.

Vad säger andra?
I diskussionen om AI-browsers lyfts ofta prompt injection (att en webbsida försöker “styra” agenten) och integritetsfrågor som generella risker för kategorin.

Vill du testa själv: Perplexity Comet.

OpenAI Atlas: ChatGPT blir webbläsare (med tydliga skyddsräcken)

Atlas är OpenAI:s browser med inbyggd ChatGPT. Den finns i nuläget för macOS.

OpenAI beskriver också hårda gränser för Agent mode: den kan t.ex. inte köra kod i webbläsaren, inte ladda ner filer och inte installera extensions, samt pausar på känsliga sajter (t.ex. finans). De har även “logged-out mode” för att minska risk när du inte vill att agenten ska använda dina cookies/inloggningar.

När det gäller surfdata beskriver OpenAI att “Include web browsing” (träning på surf-innehåll) är avstängt som standard och kräver aktivt val i data-inställningarna. De pratar också om “browser memories” som separata inställningar där du kan styra per webbplats.

Claude Computer Use: inte en webbläsare – en byggsten för egna agenter

Claude “Computer Use” är i första hand ett verktyg/API för utvecklare där modellen kan se skärmen och styra mus/tangentbord. Anthropic betonar att det är beta och lyfter bl.a. prompt injection och behov av skyddsräcken.

I mer konsumentnära form finns Claude Cowork, där agenten kan göra uppgifter på datorn. Anthropic beskriver att sådana uppgifter ofta drar mer av användningskvoten än vanlig chatt (det är helt enkelt mer “tungt” att köra en flerstegsagent). Den typen av funktionalitet har dessutom varit kopplad till betalda abonnemang i flera lanseringsvågor.

Risker och begränsningar: när praktikanten får adminbehörighet

Det fina med agentiska browsers är att de kan göra “riktig nytta”. Det läskiga är att de också kan göra riktig skada.

Här är tre saker jag alltid har i bakhuvudet:

Prompt injection (“webben pratar tillbaka”): både OpenAI och Anthropic pekar ut detta som en central risk för webb/desktop-agenter.
Phishing och falska flöden: AI kan vara “för hjälpsam” och navigera dig fel om du inte granskar steg.
Oavsiktliga destruktiva klick: togglar, radera-knappar, dubbelklick… det händer.

Ett fjärde (mer “tråkigt” men viktigt) område är integritet: en agent behöver ofta mer kontext än en vanlig webbläsare – ibland hela sidinnehåll, ibland delar av din session – för att kunna resonera och agera. Det gör att du bör anta att allt du visar på skärmen kan behandlas av tjänsten, och vara extra försiktig med kunddata, HR-ärenden och annat som luktar GDPR.

Begränsningarna är också praktiska: CAPTCHAs/2FA, UI som ändras, och långkedjiga uppgifter där agenten tappar tråden. Därför lägger OpenAI in tydliga gränser i Atlas Agent mode.

Varför jag inte ger en “vilken ska vi välja?”-rekommendation (än)

Tekniken är för ung för att jag med gott samvete ska säga “Svenska SME borde välja X”.

Funktioner och säkerhetsmodeller förändras snabbt.
Riskbedömningen blir individuell (det beror på vilka rättigheter och konton du kopplar).
Du vill inte göra första testet i ett system där ett felklick blir dyrt.

Däremot: om du vill prova låg-risk-scenarion är det två som är enkla att komma igång med och som många pratar om just nu: Strawberry Browser och Perplexity Comet.

Min rekommenderade “säker start”-checklista

1️⃣ Kör låg-risk först: varukorg utan betalning, “visa var inställningen ligger”, inte “ändra allt”.
2️⃣ Använd checkpoints: “Stanna och sammanfatta innan du går vidare.”
3️⃣ Tvinga agenten att peka ut UI: “Vilken knapp tänker du trycka och varför?”
4️⃣ Separera konton: testkonto eller logged-out mode när det finns.
5️⃣ Var allergisk mot snabba godkännanden: cookies, villkor, betalning = människa ska läsa.
6️⃣ Testa, testa, testa – och dokumentera vad som funkar i just era system.

Key Takeaway

Agentiska webbläsare är nästa stora skifte: från att AI svarar till att AI gör. Strawberry, Comet och Atlas tar olika produktvägar, medan Claude Computer Use är en byggsten för egna agenter. Men vinsten kräver skyddsräcken, checkpoints och “human-in-the-loop” – annars är det inte en assistent, utan en risk.

Vill du veta mer?

Om du vill hitta ett tryggt och praktiskt sätt att utforska agentiska verktyg (utan att någon råkar klicka bort halva kundregistret) hjälper jag gärna till via AIOlle – med workshops, rådgivning och konkreta “kom igång”-upplägg.
Läs mer på AIOlle eller hör av dig via e-post så tar vi ett första snack.