- 添加 `FileReadTool`,支持文件内容读取与安全验证 - 引入 `hasToolMessages` 逻辑,优化工具历史上下文处理 - 修改工具选项逻辑,支持禁用工具时的动态调整 - 增加消息序列化逻辑,优化 Redis 序列管理与数据同步 - 扩展测试覆盖,验证序列化与工具调用场景 - 增强 Docker Compose 脚本,支持应用重置与日志清理 - 调整工具调用超时设置,提升运行时用户体验
6.9 KiB
Executable File
6.9 KiB
Executable File
Agent Runtime Server (ARS) · Laravel + Octane + Docker
自建可部署的 Agent Runtime Server。愿景:兼容大部分 Agent 模型、随时在 Web 终端输入指令/查看日志、断开后任务继续执行,重新连入能续上会话。
“输入 prompt 就能离开工位,路上/手机继续 approve 和观察”。
🎯 愿景与思路(摘录)
- 兼容多数 Agent 模型,提供可观测的运行日志。
- Web 终端可随时输入/查看;断线不中断,重连可续。
- 面向开源生态,避免被单一厂商闭锁;先做最小实现,再逐步拆分组件。
🏗️ 当前架构概览
- 运行:Docker Compose,FrankenPHP + Laravel Octane。
- 存储:PostgreSQL(主存储),Redis(可选,用于 SSE 推送);messages.payload 提供表达式索引以加速 run/cancel 查询。
- 鉴权:JWT(无状态),API 路由均在
/api/*。 - 会话/消息模型:
chat_sessions(session_id UUID, session_name, status OPEN|LOCKED|CLOSED, last_seq, last_message_id, timestamps)messages(message_id UUID, session_id, role USER|AGENT|TOOL|SYSTEM, type, content, payload jsonb, seq, reply_to, dedupe_key)- 约束:
unique(session_id, seq)、unique(session_id, dedupe_key);append 行锁 + 事务,seq 单调递增。
- 实时:SSE
/api/sessions/{id}/sse,backlog 先补历史(按 seq),再监听 Redissession:{id}:messages渠道;发现 seq gap 会回补并提供心跳。 - Agent Run 编排(MVP-0):user.prompt 后自动触发 RunDispatcher →
run.status=RUNNING→ AgentRunJob(HttpProvider,未配置 endpoint 时回退 DummyProvider)→agent.message+run.status=DONE/FAILED/CANCELED落库;同 trigger_message 幂等、同会话只允许一个 RUNNING,终态/消息均去重,取消可保证不写 agent.message。 - 队列监控:Horizon(本地默认开放
/horizon,非 local 环境默认拒绝访问)。
🚀 快速启动
# 构建并启动
docker compose build
docker compose up -d app horizon pgsql redis
# 首次迁移(仅需一次)
docker compose exec app php artisan migrate
# 运行 Feature 测试
docker compose exec app php artisan test --testsuite=Feature
# 队列(AgentRunJob):开发可用同步队列,或用 Horizon
# 同步:.env / phpunit.xml 中 QUEUE_CONNECTION=sync
# Horizon:docker compose up -d horizon(需 composer install 安装 laravel/horizon,QUEUE_CONNECTION=redis)
Agent Provider 配置(可选)
config/agent.php 读取以下环境变量(默认值已内置),用于控制 HTTP 调用、OpenAI 直连以及队列重试:
AGENT_PROVIDER_ENDPOINT:自定义 HTTP Provider 入口(为空时回退 Dummy 或 OpenAI 适配器)AGENT_PROVIDER_TIMEOUT(默认 30):Provider HTTP 请求超时时间(秒)AGENT_PROVIDER_CONNECT_TIMEOUT(默认 5):Provider 连接超时时间(秒)AGENT_PROVIDER_RETRY_TIMES(默认 1):建立流前的重试次数(仅连接失败/429/5xx 且尚未产出事件时重试)AGENT_PROVIDER_RETRY_BACKOFF_MS(默认 500):重试退避(毫秒,指数退避)AGENT_OPENAI_BASE_URL(默认 https://api.openai.com/v1):OpenAI-compatible Chat Completions 基础地址AGENT_OPENAI_API_KEY:OpenAI API Key(为空则使用 DummyProvider)AGENT_OPENAI_ORGANIZATION:OpenAI Organization header,可选AGENT_OPENAI_PROJECT:OpenAI Project header,可选AGENT_OPENAI_MODEL(默认 gpt-4o-mini):模型名称AGENT_OPENAI_TEMPERATURE(默认 0.7):采样温度AGENT_OPENAI_TOP_P(默认 1.0):Top-p 采样AGENT_OPENAI_INCLUDE_USAGE(默认 false):是否请求流式返回 usage 统计AGENT_RUN_JOB_TRIES(默认 1):AgentRunJob 队列重试次数AGENT_RUN_JOB_BACKOFF(默认 3):AgentRunJob 重试退避秒数AGENT_RUN_JOB_TIMEOUT(默认 360):AgentRunJob 超时时间(秒)- 工具调用(子 Run 模式):
AGENT_TOOL_MAX_CALLS_PER_RUN(默认 1):单个父 Run 允许的工具调用次数上限(超过直接失败)AGENT_TOOL_WAIT_TIMEOUT_MS(默认 15000):等待子 Run 写入tool.result的超时时间(毫秒)AGENT_TOOL_WAIT_POLL_MS(默认 200):等待工具结果时的轮询间隔(毫秒)AGENT_TOOL_TIMEOUT_SECONDS(默认 15):单个工具执行的预期超时时间(超过会记为 TIMEOUT)AGENT_TOOL_RESULT_MAX_BYTES(默认 4096):工具结果最大保存字节数(超出会截断)AGENT_TOOL_CHOICE(默认 auto):OpenAI tool_choice 传参策略AGENT_TOOL_JOB_TRIES/AGENT_TOOL_JOB_BACKOFF/AGENT_TOOL_JOB_TIMEOUT:ToolRunJob 队列重试/退避/超时设置
🔑 API 能力一览(MVP-1.1 + Archive/GetMessage/SSE)
- 会话:
POST /api/sessions,GET /api/sessions(分页/状态/关键词),GET /api/sessions/{id},PATCH /api/sessions/{id}(重命名/状态,CLOSED 不可重开),POST /api/sessions/{id}/archive(幂等归档→CLOSED)。 - 消息:
POST /api/sessions/{id}/messages(幂等 dedupe_key,CLOSED/LOCKED 门禁),GET /api/sessions/{id}/messages(after_seq 增量),GET /api/sessions/{id}/messages/{message_id}(校验 session_id)。 - 实时:
GET /api/sessions/{id}/sse?after_seq=123,SSE 事件 id 为 seq;Last-Event-ID优先于 query;gap 会回补,定期心跳保活。 - Agent Run:user.prompt 自动触发;或
POST /api/sessions/{id}/runs {trigger_message_id}手动触发,写入run.status/agent.message,幂等去重,失败会写error(含 retryable/http_status/provider/latency_ms)。
详细字段/示例:docs/ChatSession/chat-session-api.md,OpenAPI:docs/ChatSession/chat-session-openapi.yaml。用户管理/鉴权文档:docs/User/user-api.md。
🔒 状态与门禁规则
OPEN:正常追加。LOCKED:拒绝role=USER && type=user.prompt。CLOSED:拒绝追加,例外role=SYSTEM && type in [run.status, error]。- 幂等:同一 session + dedupe_key 返回已有消息(同 message_id/seq);run.status 与 agent.message 均通过 dedupe_key 防重复。
🔌 开发/验证
- 迁移:
docker compose exec app php artisan migrate - 测试:
docker compose exec app php artisan test --testsuite=Feature - cURL 示例(需 Bearer TOKEN):
# 归档
curl -X POST http://localhost:8000/api/sessions/{sid}/archive -H "Authorization: Bearer $TOKEN"
# 单条消息
curl http://localhost:8000/api/sessions/{sid}/messages/{mid} -H "Authorization: Bearer $TOKEN"
# SSE(断线续传:可带 Last-Event-ID)
curl -N http://localhost:8000/api/sessions/{sid}/sse?after_seq=0 \
-H "Authorization: Bearer $TOKEN" -H "Accept: text/event-stream"
📌 后续演进(规划)
- Agent Loop/Tools/Policy Engine/Context Store 解耦与插件化。
- 更丰富的前端控制台:日志流、工具审批、移动端友好。
- 兼容多家模型/工具 SDK,保持开放生态。