Společnost OpenAI nedávno oznámila funkci Operator, svůj první pokus o agenta s umělou inteligencí, který dokáže automatizovat složité úkoly a provádět různé akce na webových stránkách, aby vám ušetřil čas.
Co všechno Operator dokáže?
Zahrnuje rezervace v restauracích, nakupování online a rezervaci ubytování na cestách. Konkrétní citlivé akce mohou vyžadovat souhlas uživatele. „Na zvláště citlivých webech, jako je e-mail, operátor vyžaduje aktivní dohled nad uživatelem, který zajišťuje, že uživatelé mohou přímo zachytit a řešit jakékoli potenciální chyby, kterých se model může dopustit,“ vysvětluje OpenAI. To je důvod, proč Operator v současné době nepodporuje odesílání e-mailů nebo mazání událostí kalendáře, ale OpenAI na tom pracuje. Existují automatizace v kategoriích úkolů, jako je rozvoz, stravování, nakupování a cestování. Vysvětlení konkrétních používaných akcí se zobrazí na obrazovce, když operátor provádí automatizaci.
Namísto použití vývojářských rozhraní API k připojení k webovým aplikacím byl model Operator’s Computer-Using Agent (CUA) vyškolen k přímé interakci s rozhraními webových stránek pomocí vlastního vyhrazeného webového prohlížeče. OpenAI prohlašuje, že Provozovatel dodržuje podmínky servisních smluv svých spouštěcích partnerů DoorDash, eBay, Instacart, Priceline, StubHub a Uber.
Tvůrce ChatGPT neočekává, že CUA bude po celou dobu fungovat 100% spolehlivě. Dokument podpory OpenAI to uznává a říká: „Operátor nemůže spolehlivě zvládnout mnoho složitých nebo specializovaných úkolů.“ Některé příklady zahrnují „vytváření podrobných prezentací, správu složitých kalendářových systémů nebo interakci s vysoce přizpůsobenými nebo nestandardními webovými rozhraními“. Operátor má další nevýhody, včetně limitů rychlosti pro konkrétní úkol a celkového limitu využití, který se denně obnovuje. Navíc může selhat v některých úkolech, jako je řešení výzvy CAPTCHA, a má potíže s navigací ve složitých webových rozhraních.
Operátor je v současné době k dispozici jako náhled průzkumníka přes operator.chatgpt.com předplatitelům ChatGPT ve Spojených státech s nejdražším tarifem ChatGPT Pro za 200 $ měsíčně. Lidé na úrovních Plus, Team a Enterprise musí být trpěliví, protože OpenAI pracuje na přivedení operátora na tyto úrovně. Tato funkce se „brzy“ rozšíří do dalších jazyků a zemí. Bohužel, „Evropa bude chvíli trvat,“ řekl generální ředitel Sam Altman.
OpenAI dříve implementovalo jednoduché funkce automatizace v ChatGPT, jako je nastavení připomenutí, ale Operator je jeho prvním pokusem o agenta AI. Konkurenční Google v listopadu 2024 představil svého vlastního agenta AI, Project Mariner, jako experimentální rozšíření pro Chrome, které dokáže za vás vyplňovat webové formuláře, klikat na tlačítka, pohybovat ukazatelem myši a další.
Agenti AI jsou považováni za další logický krok v revoluci AI. Tyto věci slibují používání webu vaším jménem na základě vaší výzvy, což vás osvobodí od přímé interakce s webovými stránkami. Užitečnost agentů AI je však v současné době přinejlepším sporná, protože jsou v experimentální fázi a nebudou široce používány, dokud se spolehlivost nezlepší.