去年 (2024年)年末あたりから「browser-use」の文字がXのタイムラインに流れ出し、試したところなかなか面白かったので、今回ご紹介したい。一言で言えば「LLMとWebブラウザを使ったタスク処理」だが、一体何ができるか!?について、順に解説したい。
Atlasは、基盤にChromium互換のエンジンを採用したWebブラウザ。同社は「ブラウザを単に検索や閲覧のためのツールではなく、AIとともに考え、書き、行動できる場所として再構築する」と説明している。ChatGPTにブラウザ機能を融合し、ユーザーがウェブを巡り ...
さらに、ユーザーの作業をChatGPTが代行してくれるAIエージェント機能も用意。たとえばレシピをChatGPTに渡すと、必要な食材を探し、購入して自宅に配送するといった作業をChatGPTが代わりに操作して進めてくれる。 ただし、安全性の面から、Webブラウザ内でのコード実行やファイルの ...