– AI ManiaX –

“Thinking with AI, building with AI.”

ChatGPTとは別物だった。OpenClawを使って初めてわかったAIエージェントの衝撃

このところ話題のOpenClaw、連休で一気に試してみた

このところ、AIエージェント界隈で「OpenClaw(旧ClawBot)」という名前をよく見かけるようになった。気になりながらもなかなか手が出せずにいたが、この連休を使って一気に環境構築まで持っていくことにした。

結論から言う。ChatGPTやClaudeとは、根本的に別物だった。

質問して答えをもらうツールではない。設計して、育てて、運用するシステムだ。その体験談を、技術者向けではなくビジネスパーソン向けに整理してみる。


そのOpenClaw、実は今まさに動いている

記事を書いているこのタイミングで、OpenClaw界隈はさらにホットな展開を迎えている。

作者のピーター・シュタインベルガー氏は「会社を大きくすることより世界を変えたい」と語り、バレンタインデーにOpenAIへの合流を発表した。OpenClaw自体はオープンソース財団として独立し、引き続き誰でも使える形で存続する。

もともとClawdBot、次いでMoltBotと名前を変えてきたこのプロジェクトが「OpenClaw」になった経緯も興味深い。Anthropicから商標上の警告を受けて改名を余儀なくされ、その後OpenAIのサム・アルトマンに「この名前でいいか」と確認を取った上で決定したという、なんとも象徴的なエピソードがある。

AIエージェントの主導権争いが、名前一つにも表れている。


まず「AIエージェント」と「AIチャット」は別物だ

ChatGPTは「聞いたら答えてくれる」ツールだ。優秀な検索エンジンに近い。

AIエージェントは違う。**「指示を受けて、自律的に動き続けるシステム」**だ。

人間が画面を開いて質問しなくても、設定した通りに動く。スケジュールで動く。外部のサービスと連携して動く。そしてその結果を、指定した場所に通知してくる。

この違いを頭で理解するのは簡単だ。でも体感するまでには、いくつかの壁があった。


最初の壁:いきなり詰まった

最初、Headless環境(常時稼働するサーバー環境)から構築しようとした。が、これが詰まった。設定の複雑さ、環境依存の問題、思ったように動かない。

そんなわけでまずは仕方なく手元のMacBook Pro M1でローカル構築する方針に切り替えた。
これが今の状態だ。

ただしローカル運用には制約がある。MacBookがスリープすると、AIも無反応になる。 リアルタイム応答させたければ、PCを常時起動し続けるしかない。

これは運用としては現実的ではないので、最終的にはHeadless環境に戻す予定だ。
リモートサーバにSSH接続しての利用AIを設定の際、ブラウザが開けず、ChatGPTサブスクの連携はできず、API課金となってしまうが、一度MacBookProで設定したサブスクリプションのトークン情報をHeadless環境に持ち込める可能性もある。これは今後検証していく。

詰まって迂回して、現在地がある。 それがリアルな進捗だ。


第二の壁:Discord連携の設定

OpenClawはDiscordと連携させることで、スマホからでもAIエージェントに指示を出せるようになる。

この設定がなかなか手こずった。チャンネルの設計、権限の設定、通知の振り分け。ChatGPTを使う感覚とは全然違う「システム設計」の領域に踏み込む必要があった。

ただ、乗り越えた先に待っていたものがあった。


「KITT入力中」が見えた瞬間

Discordにテスト送信をした。すると画面に表示された。

「KITT入力中……」

自分が設定したキャラクター名が、Discordの向こうで考えている。それが画面に見えた。

技術的には当たり前の動作かもしれない。でもその瞬間、「あ、本当に動いている」という感覚が来た。ChatGPTのWeb画面で使うのとは明らかに違う体験だった。自分専用のAIアシスタントが、別の場所で動いている。 そのリアリティがあった。

もちろん文字起こしもできる。(これは別に他AIアシスタントでもできることで目新しさはないが)


指示だけでスキルを自作できた

動作確認ができたところで、試しにスキルを自作してみた。スキルとは、エージェントに新しい能力を追加する拡張機能のようなものだ。

作ったのは「Amazonの特定カテゴリの売上ランキングを取得して、Discordに通知する」というスキルだ。

コードは書いていない。エディタも開いていない。コマンドプロンプトも触っていない。完全に指示だけで作った。

従来であれば、スクリプトを書いて、エディタで編集して、コマンドラインで実行して、エラーが出たら修正して——という工程が必要だった。OpenClawはそのすべてを内側でやってくれる。人間がやることは「何をしてほしいか」を伝えるだけだ。

するとChromeブラウザが自動で起動し、Amazonのランキングページを取得し、上位10位の結果がDiscordに通知されてきた。さらに定期実行(Cron)の登録まで指示だけで完結した。 毎日決まった時間に自動でランキングを取得してDiscordに通知する仕組みが、会話だけで出来上がった。

EC担当者、マーケター、商品リサーチをしている人なら、この応用範囲はすぐにイメージできるはずだ。「これ、自分の業務で使えるな」という感覚が来た瞬間だった。


AIが自分の環境を自己管理した

さらに驚いたことがある。

OpenClawの設定情報は内部的にGitで管理されている。これをAWSのS3にバックアップするよう指示してみた。

バケットの作成やIAMの権限設定は人間がやる必要がある。そこは当然だ。でもエディタもターミナルも開かずに、スクリプトの作成、実行、テストまで、指示だけで完結した。

AIエージェントが、自分自身の環境を守る仕組みを自分で構築した。これはもう「ツールを使う」という感覚ではない。「システムを育てる」という感覚に近い。


OpenClawを賢く使うコツ、今のところの結論

体験を通じて見えてきたことをまとめる。
ChatGPTやGeminiではスレッドを分けて複数の話題で文脈が壊れないようにひとつのテーマを一つのスレッドで会話した方がよいが、それはOpenClawも同様である。管理画面はChat画面がひとつしかなく、スレッドも分けられない。そこでOpenClawのブラウザチャットは管理用として使うものとして、
Discordメインで会話するのが良さそうだ。

したがって、以下の運用が好ましい。

部屋を分ける。 Discordのチャンネルやスレッドをテーマ別に分けることで、AIの文脈管理が最適化される。なんでも一つの部屋で話しかけると、精度が落ちる。

指示の型を固定する。 目的・制約・期限を短く明示する習慣をつけると、エージェントの動きが安定する。

設定は指示で変えられる。 これが一番の驚きだった。設定画面をいじるのではなく、会話で自分好みに育てられる。

「会話AIとして使う」から「運用OSとして設計する」へ。 この発想の転換が、OpenClawを使いこなす本質だと思っている。

私は結果の通知用と私から指示用でDiscordのスレッドを分けた。


まだ完成形ではない

現時点ではMacBook Pro上でのローカル運用だ。常時稼働の問題は解決していない。Headless化はこれからの課題だ。Headless化が実現したら、またレポートするつもりだ。

OpenClawは質問して答えをもらうツールではなく、設計して育てて運用するシステムだ。そのリアルな入口を、私たちは今歩いているが、OpenClawで何ができるのか、業務を含めてAIエージェントやAIアシスタントがどう変わっていくのかをイメージして、準備しておく必要がある。


そして、これはもっと大きな話かもしれない

最後に少し先の話をしておきたい。

OpenClawのようなAIエージェントフレームワークは、今はまだ「個人が使う便利ツール」の文脈で語られることが多い。でも本質的な構造を見ると、話はもっと大きい。

Physical AI——物理世界と連携するAIシステム——を構成するツールになり得る。

Physical AIの世界では、既にROS2(Robot Operating System 2)が事実上の標準基盤として確立されつつある。自動運転、工場自動化、ロボティクス、その多くがROS2の上で動いている。

もちろん人間が連携しなければならない外部連携部分は残るが、今後OpenClawのようなAIエージェントフレームワークは、そのROS2と連携する形で、自律システムにおける動作レイヤーとして必要なコンポーネントになるだろう。

センサーからの情報をもとに状況を判断し、適切なタイミングで人間に通知し、次のアクションを自律的に実行する。その「意図を解釈して動作に落とし込む」層が、今まさに求められている。

わかりやすい例で言えば、自動運転車に「海沿いを走りながら観光地を巡ってほしい」と指示するだけで、ルートの最適化、混雑の回避、立ち寄りスポットの選定まで自律的にこなす——そういう世界だ。目的地を入力するのではなく、「体験」を指示する。 AIエージェントがその意図を解釈して、最適な動作に落とし込む。

その裏側では、カメラやLiDARといったセンサーからの情報を常時受け取りながら、状況を判断し、必要な時だけ人間に通知し、次のアクションを実行し続けている。この「常時稼働・自律判断・適切なタイミングで通知」という構造は、OpenClawで体験したこととアーキテクチャの思想として本質的に同じだ。

今はMacBookの上でAmazonランキングを取得しているだけかもしれない。でも同じ発想が、いずれ現実世界を動かすシステムの一部になる。 そんな未来を感じている。