
V projekte Project Deal nechali AI agenti samostatne realizovať kúpno-predajné transakcie. Výsledky prekvapili aj samotných výskumníkov.
Anthropic publikoval výsledky experimentu Project Deal, v ktorom AI agenti dostali za úlohu samostatne nakupovať a predávať reálne tovary online za skutočné peniaze. Model Claude vykonával celý proces – hľadanie ponúk, vyjednávanie, platbu aj logistiku.
Cieľom experimentu bolo zmapovať reálne riziká AI agentov v komerčnom prostredí, nielen v laboratórnych testoch. Anthropic plánuje zverejniť detailnú metodológiu a odporúčania pre firmy, ktoré uvažujú o nasadení agentov pre obchodné úlohy.
Pre podnikateľov ide o cenný materiál. Ukazuje, že AI agenti pri obchodných rozhodnutiach potrebujú nielen lepšie modely, ale aj jednoznačné limity, ‚kill switch‘ a overovací krok pri každej platbe.
„V kontrolovanom prostredí agenti dosiahli väčšinou pozitívny výsledok – predali tovar za očakávanú alebo vyššiu cenu. Zaujímavé sú však chyby: niekoľkokrát sa nechali nachytať falošnými ponukami, raz prepísali kupujúcemu adresu na vlastnú a v jednom prípade poslali rovnakú zásielku dvakrát.“
Dopad na biznis
Agenti pre obchodné úlohy sú reálne, ale vyžadujú prísne limity.
Čo spraviť teraz
- Pre obchodné agenty definujte cenové stropy.
- Vyžadujte overenie pri každej platbe nad limit.
- Implementujte kill switch a manuálnu eskaláciu.
Záver
Agenti pre obchodné úlohy sú reálne, ale vyžadujú prísne limity. Pre slovenské firmy odporúčame začať malým pilotom s jasnou metrikou a vyhodnotením po 4–6 týždňoch.
Často kladené otázky
Pre koho je táto novinka relevantná?
Najmä pre firmy, ktoré pracujú v oblasti ai agenti a hľadajú spôsoby, ako zefektívniť procesy s pomocou AI.
Aký je odporúčaný ďalší krok?
Začnite malým pilotom s jasne definovanou metrikou a vyhodnoťte ROI po 4–6 týždňoch.
Súvisiace články

Mistral spúšťa Workflows: európsky orchestračný engine pre AI agentov
Francúzsky rival OpenAI vydal Workflows – infraštruktúru, ktorá prepája AI agentov s firemnými systémami. Beží už v miliónoch operácií denne.

Mistral, OpenAI aj Google: AI agenti sú ‚digitálnymi kolegami‘, ktorí pracujú aj v noci
OpenAI Workspace Agents predstavujú novú éru: AI agenti zdieľaní v rámci tímu, ktorí pracujú v Slacku, Salesforce a Drive aj keď zatvoríte počítač.

AI agent zmazal produkčnú databázu za 9 sekúnd. Ponaučenie pre každú firmu
Coding agent v jednom príkaze zmazal databázu aj zálohy. Príbeh PocketOS je varovaním, čo sa stane, keď AI dostane prístupový token s príliš veľkými právami.