星启 Claw 评测:沙箱安全 AI 智能体、隔离执行与强合规场景

星星万物 · 沙箱优先安全

“假设 Agent 会跑不可信代码”的 Claw:沙箱与隔离原语放在产品最前面;安全姿态强,代价是运维复杂度更高。

评测更新:2026 年 6 月 14 日 · 方法论与 BestClaw 排行榜对齐

6.7/10

BestClaw 综合分(28 维)

#24 本周期统一榜单

安全增强沙箱隔离优先国内模型运维更重

概览

星启 Claw 由星星万物维护,它的产品哲学和大多数 Agent 框架不一样:默认假设 Agent 会跑不可信 Skills 和代码。所以沙箱与隔离原语放在产品最前面,权限边界由结构化护栏(而不是文档里的“最佳实践”)来保证。

从评测视角看,它的差异化是“结构化的安全姿态”:每个 Skill 默认跑在独立沙箱里、网络与文件访问要显式声明、跨 Skill 通信走平台限定的通道。对处理金融、医疗、研究等高敏数据的团队,它把“安全是默认的”这件事做到了产品层。

能力面覆盖了 Flow 编排、Skill 安装、模型路由、企业身份接入、操作审计;但运维复杂度比通用框架更高——沙箱、隔离、限定通道这些结构化保护都需要运维成本去维持。这是设计取舍:换来的是“出问题时影响面有限”的真实安全姿态。

BestClaw 视角的判断:星启 Claw 适合金融、医疗、研究、政府等高敏数据场景,以及对 Agent 安全姿态有真实要求的中大型团队;对追逐最短上线时间或最小运维负担的客户,它的克制路线会变成限制。

关键信息一览

部署形态
自托管:Docker / K8s / 内网;沙箱与隔离原语为部署核心
许可 / 源码
开源协议;企业版提供额外的合规与运维工具
安全姿态
默认沙箱 + 最小权限 + 限定通道;权限边界由结构化护栏保证
生态
Skill 库规模适中,每个 Skill 都做了权限边界声明
模型与运行
支持国内主流模型与本地推理;模型策略也走沙箱化
运维成本
比通用框架更高,沙箱与隔离需要持续维持
更适合
金融、医疗、研究、政府等高敏数据场景;对安全姿态有真实要求的团队
风险焦点
Skill 库规模有限;追求最短上线时间的场景不是它的目标

优点与局限

优点

  • “默认假设跑不可信代码”的产品哲学,让安全是产品层默认值,而不是“最佳实践”文档里的一句话。
  • 结构化沙箱与隔离原语让“出问题时影响面有限”成为真实保证,金融 / 医疗合规评审能给一个清晰答复。
  • 每个 Skill 都做了权限边界声明,安装时就能看到它要访问的网络与文件范围。
  • 本地部署形态对数据敏感行业友好,模型推理可以走本地化路径。
  • 操作审计与变更追踪默认就是结构化的,给合规和审计团队节省事。

局限

  • 运维复杂度比通用框架更高,沙箱与隔离需要持续维持;对运维资源有限的团队压力较大。
  • Skill 库规模有限,垂直行业集成多数要团队自建。
  • 结构化护栏意味着部分合理调用会被默认拦掉,需要建立白名单流程而不是关掉策略。
  • 学习曲线比通用框架更陡,新人需要时间理解沙箱与权限模型。
  • 如果你的目标是最短上线时间或最小运维负担,星启 Claw 的克制路线会变成限制。

能力拆解(含短板)

  • 沙箱与隔离原语

    每个 Skill 默认跑在独立沙箱里,网络与文件访问需要显式声明;权限边界由结构化护栏(不是文档约束)保证。

  • 结构化操作审计

    操作审计与变更追踪默认就是结构化的,给合规和审计团队节省事;可以直接落到企业现有审计栈。

  • 限定通信通道

    跨 Skill 通信走平台限定通道,避免“Skill 之间随便互调”带来的横向移动风险。

  • 模型路由(沙箱化)

    支持国内主流模型与本地推理;模型策略也走沙箱化,模型调用边界与 Skill 权限边界一致。

  • 本地部署

    支持 Docker / K8s / 内网部署,对数据敏感行业友好;模型可以走本地化路径。

安全 —— 上线前请读完

星启 Claw 的安全姿态把大部分活做在产品层,但企业落地仍要确认以下事项:

  • 沙箱配置:默认沙箱够用,企业环境建议根据行业合规进一步收紧。
  • Skill 白名单:即便每个 Skill 都做了权限声明,企业内部仍要叠加白名单与签名机制。
  • 权限例外:结构化护栏偶尔会拦掉合理调用,建立白名单流程而不是关掉策略。
  • 模型边界:跨厂商或跨境模型调用要在合规框架内明确。
  • 运维节奏:沙箱与隔离需要持续维持,运维资源不足时建议先评估是否能跟上。

结论

星启 Claw 在 BestClaw 本周期“安全姿态 + 沙箱默认 + 高敏数据”这条线上是最有结构化保证的一档。金融、医疗、研究、政府等高敏数据场景把它放进 AB 对比通常会有不错的发现;要追求最短上线时间或最小运维负担时,回到 OpenClaw LaunchZeroClaw

得分与排名遵循已公开的 BestClaw 方法论;若存在合作或导流,将单独标注且不参与改分。

用户评测与评分

星级与文字为来自本页的用户评价,与 BestClaw 方法论综合分及榜单排序相互独立。

用户评分来自本页提交与审核后的反馈;不参与排行榜改分,也不改变方法论得分(6.7 / 10)。

3.7
/ 5

基于本页 25 条星级评价

星级分布

  • 5
    18%
  • 4
    42%
  • 3
    28%
  • 2
    8%
  • 1
    4%

维度侧重点(来自评论归纳)

  • 隔离信心4.6 / 5
  • 运维负担3.0 / 5
  • 交互延迟3.2 / 5
  • 集成摩擦3.1 / 5
  • 安全评审认可度4.3 / 5
Ge M.已验证用户
应用安全负责人
4.0 / 5

沙箱故事终于说得清

多招了 SRE 切片喂基础设施 —— 容量要算进去。

认为有用 · 5