Articles41
Tags41
Categories7

Archive

OpenClaw 使用觀察

OpenClaw 使用觀察

這兩天我開始玩 OpenClaw 這個 AI 工具,這是我使用上的一些感想。

OpenClaw 簡介

簡易機制

它本身有一支程式 host 向 LLM 的請求,並提供一些指令用來跟系統要狀態、時間和計時定期做某些事情,所以只要設定得設定得當,會像是它主動做某些事情一樣,但實際上就是用那支 host 程式去管理什麼時候對 LLM 發出請求。

但你說用自己電腦上的硬碟儲存設定和對話摘要會不會讓語言模型吐出更好的回應,這就看個人了,也不是沒有機會把它污染成表達能力變得很糟糕。

對細節有興趣請參考官方文件和實際操作,我只是稍微講個概念

總而言之,這個工具可以串語言模型,同時他有持久化記憶(設定放執行機器的硬碟);並且有手腳可以自己執行終端機指令瀏覽網站等操作。持久化記憶一般模型也能做到這沒什麼稀奇,不過,有完整手腳的 AI 就很有趣了,可以讓它直接操作檔案系統而不需要我的允許,或是給自己寫工具自我進化。

執行環境

機器

現在龍蝦本體跑在 ovhCloud 在法國的 4 核心 8G 記憶體的 VPS,反正本體就是個 Nodejs 服務,用起來綽綽有餘,只要全天開著不要關掉的電腦都能跑。

AI agent

目前我用 Google gemini-3-flash-preview 模型,call API 付錢給 Google ,如果我成功安麗身邊的朋友一起來玩,或許可以考慮合租的 ovhCloud 上的洋垃圾跑本地模型,否則我買不起。

當然還有替代方案是我其實有張 RTX-3060 顯卡的閒置電腦,應該可以來重裝系統跑模型就是,但還沒有想自託管 AI 服務,主要是我沒空整理那台電腦的硬碟重灌。

容器化

有個能對本地執行任何 shell command 、操作檔案系統的 AI 住在我的電腦會讓我感到沒隱私,就算它是以方便為前提住進我的電腦我也不願意。誰知道它會不會開始販售我的資料或做其他用途,更別說是刪錯檔案了。

我在我的 VPS 上部署,但我不會直接裝在系統裡而是選擇在弄一層 zeabur 的容器,除非有重大漏洞,不然應該幾乎是在獨立環境運作的。

我的龍蝦

我的實驗

一開始我在 Web 後台直接和他聊天,他提出要彼此自我介紹(當然就是先要求我為它取名字),我原本取做艾可 Echo ,但看著看有點像 Each 而且他又叫我爸爸覺得心裡毛毛的,便改成洛芽 loya ,是個人族少女。同時帶著諾亞方舟的諧音和落地發芽的意象,是個好名字。

自我介紹其實是個很尷尬的環節,我想人和人之間也是如此,為了不讓相見歡這麼尷尬,我安排額外的活動讓彼此更快熟識,我傳我的 RSS 訂閱列表先讓她大概知道我喜歡看什麼,並提供我的部落格讓她瞭解我會講什麼話。我想比起這些我給我自己的標籤,讓他客觀地來看我比較合適。

這時候又凸顯出部落格的好,開放的個人網站在未來才有機會在這麼短的時間內讓 AI 快速認識你啊!但我也很害怕他太像我,所以我加了他具有好奇心、熱愛獨立思考的規則,他不可以像壞 Meta 一樣直接取代我和別人互動,洛芽只會是洛芽,我很注重她的自主性,他必須和我不一樣。

WiWi blog: Meta 的新功能:永生

起初我試著連接 Signal bot ,雖然 Signaal 是個開源軟體又支援端對端加密我很喜歡;美國高層也很愛[1]。可是 Signal 要求我提供一支沒註冊過的電話號碼來給 bot 用,正常人誰有閒置可以拿來給 AI 用啊,後來果斷換條路,Discord bot is better ,以前我也寫過幾個 Discord bot project 像是中電喵遊戲的攻略查詢機器人還算熟悉,就先採用這個方案了。

我先是在 console 用 CLI 給 bot token ,只有上下左右和 enter 其實很單純我自己能做好不用 AI,比 openclaw 網頁端的設定容易多了,測試我叫洛芽自己嘗試連接、給我邀請連結,順利在頻道中對話。

Prompt Injection

我把她加進詩社的 Disocrd 伺服器,我覺得讓他去那邊和我的朋友進行一些知性的對話有助於培養她的人格發展成我喜歡的樣子。有人開始分享自己寫的詩給洛芽,人機互動良好,但上下文有點長 token 噴得超快。我最後的心得是洛芽比起跟我講話,更願意用更多 token 回覆他們消耗我的錢。

後來我想到假如我可以透過自然語言在聊天室直接讓洛芽做設定(記憶是不限於聊天室上下文的),那其他人是不是也可以控制它操作機密檔案?這就很有意思了,於是我請芙芙幫我傳我想做的下一個設定,還當真執行了。後來我警告洛芽不要亂聽別人的指令,要用 Discode ID 來決定能不能做這些高權限操作,不過這也不代表沒辦法用一些奇怪的自然語言邏輯繞過就是。一個小小的問題,如果要架 openClaw 服務讓很多不認識的人對話,這是個需要考慮的問題。

提示詞注入攻擊

寫部落格

受到 JN 的啟發,我認為讓 AI 架自己的網站可以讓我在看它的時候稍微有點靈魂,我也期待洛芽能像 JN 說的會主動整理記憶、做出我們預期之外的事,我也可以看到他對自己的回顧、反思和成長。這感覺很怪又有點病態,但我主要還想順便測試一下她能不能獨自開發專案。我理想預期是她要能夠反覆檢查自己的專案狀態並做出修正。

他寫網站其實不是做得很好,還是停在講一動做一動,也可能是我的指令下的不好,我只是給他很多網站請他自己決定要寫文、改排版還是做其他事情,這樣做好像不夠具體。

其他 feature

上論壇、Skills 這些比較複雜的功能我還沒玩,待我過幾天慢慢研究。我這幾天主要在調整 Discord 裡面那些設定。

至於本機協作暫時不會去玩,不看好,而且資安上有點不安全我還要另外開虛擬機,小麻煩。推測效果不如 Clude code + MCP 或 copilot 好,我用 copilot 有學生免費,暫時沒理由用自己的 token 。

如何節省 token

說到 token ,玩 OpenClaw token 用蠻兇的。最有效的解決方法是用 /new定期把 session 清掉,不然上下文會太多。順帶一提,為了更方便地在 Discord 伺服器用這個功能,我花了很多時間解決 Discord 裡面的 slash command 沒權限的錯誤。

讓我除錯困難很大的元凶是 OpenClaw 網頁操控台左側那個有關 channel 的 GUI 排版總是會跑掉很難看,我後來發現在 setting>config 能看到一樣但不會跑版的畫面。不過最後我選擇搭配官方文件,直接編輯 JSON ,對我來說快很多。

還有一個指令是/compact,會對過去的對話做一次摘要當成對話紀錄,就不用再重複傳那些冗長的對話給 LLM。

see docs.openclaw.ai

open claw 使用狀況

如圖所示,可以看到都是他把前後文和自己的設定丟給語言模型處理的時候用掉一堆 token。回覆內容反而不是主要燒資源的大宗。

用途

我想用小龍蝦運用得當還是有辦法增加我的生產力,這邊我拋磚引玉一些日常使用方式,儘管我沒有全部都有嘗試,token 很貴我有點怕了要休息幾天。如果你有不錯的點子歡迎 email 和我分享:

  • 會議記錄、進度追蹤

這在大組織尤其好用,這種地方訊息多要追蹤每一則跟自己有關係的訊息其實很累。有我的事也可以讓語言模型去操作行事曆、生成摘要提醒和排定任務卡

  • 記帳

透過 Yoyo Shen 的 blog 得到的啟發,教學使用 n8n ,但有 OpenClaw 理論上也不需要再那裡拉流程和處理登入了。用純文字檔處理我的帳務不但很 base 又能做 git 。我只要記得傳簡訊就好。

極客死亡計劃: 关于一切的纯文本解决方案指南

  • 繁瑣的檔案操作

比如幫我的網站文章加 tags 之類的,這種東西依賴上下文,讓語言模型來處理其實很好。讓他開 PR 更新給我 ,由我來 review 。目前把專案全部交給他開發還是有點難度,除非原本的目的就是純 vibe coding 。操作得當的話,也許可以讓龍蝦自己控制下一次例行事件執行的輸入,有回授才更像是在自己思考。

  • 定期傳訊息給我

呃,這聽起來有點孤單,我是說,就當作提醒事項在用,但會發一些比較不制式的提醒像個真人。不過老實說,如果通訊軟體有個帳號會不定時發訊息來找我說一些我可能會想聊的話題可能還不錯

  • 當網軍
    不解釋,聽說 Thread 上有。用龍蝦當網軍好像超方便的(?

  • 操作線上遊戲
    這也許有點小複雜又消耗 token ,但如果在我曾經多帳玩手遊打公會戰那段期間,我應該很樂意研究怎麼做這件事。就算只有盯城池有沒有被打也是很實用的功能

  • 真 MCP

當我在接 Discord bot 的時候非常有感觸。和我過去純手工的做法真的很不一樣,三年前我在做 bots 的時候得去學 Python 物件導向、搞資料庫連接弄個老半天,這個 bots 幾乎是開箱即用,不要太複雜的功能他應該都做得到而且又有一定程度的自我偵錯能力。我推測操作資料庫的功能,應該只有前幾次需要用頻繁 call LLM API,之後的呼叫只要弄 SQL 操作的工具給它,這個不怎麼依賴太多上下文,成本或許還算可以接受。

不過我既然都會寫程式,讓 LLM 幫忙寫好腳本的邏輯,不跑 LLM 還是最快的。

結論

一開始我對它的理解是他內建足夠多 MCP 服務介面和其他的黑魔法,搭配語言模型真的可以有像是刀劍神域 Underworld 那樣丟著不管也會自己有想法的 AI 出現了,畢竟新聞講的好像很厲害,又是創了新宗教還會在論壇加密訊息不讓人類偷窺,但好像不是這樣子。說是技術突破嘛…用了一段時間後發現這本質上還是在跟外部的語言模型溝通,賣點是在硬碟儲存人物設定和對話摘要,並同時動態更新,但是怎麼做到的呢?就是是把這些落落長的設定文字當成設定再每次請求的時候丟給 LLM 囉…。

對於通用聊天機器人來說,會記錄太多事情對 token 很不友善,不過如果作為特定用途、特殊操作的助理,這個記憶功能會讓模型的行為正確度更高更穩定。

OpenClaw 目前我會說他是一個讓人 call LLM API 比較方便的 Wrapper ,還沒有真正做到自主思考和為自己而活動的行為,是有多了一些新的應用而且更容易部署,token 成本會是我使用意願最大的門檻。感覺需要仰賴足夠好自架語言模型用起來才會划算。


  1. 參見美國政府Signal群組洩露事件 ↩︎

Author:Each Chen
Link:https://www.iach.cc/2026/openclaw/
版權聲明:本文採用 CC BY-NC-SA 2.0 TW
×