V2.2.0: External Trace + 项目清理 External Trace — 推理链推断: trace_reasoning(): 短语级拆分 → 推理链推断 → 诚实双重标注 ReasoningStep/ReasoningChain 数据模型 CLI –trace-type external –model-name 参数 HTML 推理路径可折叠面板, 可靠性颜色条 16 个新测试 修复: package-data 缺失 3 个 YAML 配置文件 (attack/conscience) 用户 pip install 后 attack 和 conscience 功能找不到配置 项目清理: 删除 8 个过时文件 (setup.py/MANIFEST.in/requirements.txt 等) .gitignore 补全生成文件 CONTRIBUTING.md 安装命令统一 版本: 0.2.1 → 2.2.0 | 测试: 465 → 481
V2.2.0: External Trace + 项目清理
External Trace — 推理链推断:
修复:
项目清理:
版本: 0.2.1 → 2.2.0 | 测试: 465 → 481
AI 的输出不可信。让我们审查它。
为什么 · 快速开始 · HTML 报告 · TrustEngine · 工作原理 · English
你让 AI 写一个登录处理函数。它自信地返回了代码:
┌─────────────────────────────────────────────────────┐ │ AI 说:"这是一个安全的登录实现。" │ │ │ │ def login(username, password): │ │ query = "SELECT * FROM users " │ │ query += "WHERE name='" + username + "'" │ │ query += " AND password='" + hash(password) │ │ return db.execute(query) │ │ │ │ 看起来没问题,对吧? │ └─────────────────────────────────────────────────────┘
TrustEngine 不这么认为。 两个 AI 模型交叉审查了这段代码。第三个扮演反对者。它们发现了这些问题:
┌──────────────────────────────────────────────────────────┐ │ TrustReport — REJECT(置信度 32/100) │ │ │ │ > [CRITICAL] SQL 注入 — username 在第 3 行被直接拼接 │ │ 进查询字符串 │ │ "攻击者输入 ' OR 1=1 -- 即可绕过认证" │ │ │ │ > [HIGH] 不安全的哈希 — hash() 不是密码学哈希函数。 │ │ 请使用 bcrypt 或 argon2。 │ │ │ │ > [MEDIUM] 缺少频率限制 — 10 分钟内即可暴力破解。 │ │ 添加指数退避机制。 │ │ │ │ > [!] UNCERTAIN: 会话续期的竞态条件 — │ │ 两个审查者意见不一致。建议人工复核。 │ │ │ │ 审查者:GPT-4o + Claude 3.5 Sonnet + Opponent │ │ 证据链:a1b2c3...(SHA-256,可验证) │ │ │ │ Powered by ai-flow-architect │ └──────────────────────────────────────────────────────────┘
我们给 AI 配备了一个对手。 两个大脑从不同角度审查同一份输出。当它们意见不一致时,不确定性会被写入报告——而不是被掩盖。你得到的是一份可验证、可分享的审计报告,而不是一个黑箱答案。
体验交互式 Playground — 查看真实的 AI 输出审计。无需安装,无需 API Key。
pip install ai-flow-architect[html]
设置一个 API Key——或两个以实现跨提供商交叉验证(推荐):
export OPENAI_API_KEY="sk-..." # 必需 export ANTHROPIC_API_KEY="sk-ant-..." # 可选,用于更强的审计
一行命令审计任何内容:
# 审计一个文件,指定关注点 ai-flow audit login.py -r "检查 SQL 注入、认证绕过和频率限制" # 导出为可分享的 HTML 报告 ai-flow audit login.py -r "安全审计" --html -o report.html # 从其他工具管道输入 cat generated_code.py | ai-flow audit -r "验证正确性"
# 或使用 Python SDK——三行代码 from ai_flow_architect import TrustEngine engine = TrustEngine() report = engine.audit( requirement="带频率限制的安全用户认证", ai_output=ai_generated_code, ) print(report.summary()) # "REJECT (32/100): 3 findings, 2 uncertain"
使用 --html 导出自包含的 HTML 报告。发送给你的团队,发布到 Issue 里。每一次分享都是一次 AI 没能逃过的审计。
--html
ai-flow audit contract.pdf -r "检查不公平条款" --html -o contract-audit.html
报告包含彩色编码的发现项、标注模型的审查者投票、可折叠的证据链,以及透明的成本明细。无需外部 CSS、无需 JavaScript 框架、无需服务器——一个文件,随处可用。
TrustEngine 是独立的审计层。零状态。零交互。纯粹验证。
report.verdict # "pass" | "review" | "reject" report.confidence # 0-100 report.findings # 具体的发现项,含严重度和证据 report.uncertainty # 引擎承认无法确认的内容 report.evidence_chain # SHA-256 哈希 + 时间戳,完全可验证
ai-flow audit ...
ai-flow audit ... --html -o report.html
ai-flow audit ... --json
ai-flow audit ... --markdown
TrustEngine().audit(...)
agent.run()
engine.audit()
crew.kickoff()
client.create()
.github/workflows/audit-pr.yml
你:「这个 AI 输出可信吗?」 | v +--------------------------+ | Brain #2(主审计) | 跨模型审查。 | 模型:GPT-4o | 多个审查者独立投票。 +-----------+--------------+ | v +--------------------------+ | Opponent Brain | 5 种对抗性视角从各个角度 | "魔鬼代言人" | 挑战输出。 +-----------+--------------+ | v +--------------------------+ | 不确定性计算 | 综合审查者分歧 + | | 对抗性盲区,得出单一分数。 +-----------+--------------+ | v +--------------------------+ | 证据链 | 所有发现项哈希 + 时间戳。 | SHA-256,可验证 | 证明发现了什么、何时发现。 +-----------+--------------+ | v TrustReport — 不是猜测,是审计。
核心洞察:单个模型无法发现自己的盲区。两个在不同数据上训练的模型,加上一个主动尝试破坏输出的对抗性对手,可以捕捉到任何一个单独会遗漏的问题。
一个 API Key 就够了。 如果你只提供 OPENAI_API_KEY,引擎会自动降级使用 gpt-4o-mini 作为辅助审查者。跨提供商(OpenAI + Anthropic)能给出最强结果,因为两个模型的失败模式不同。
OPENAI_API_KEY
gpt-4o-mini
TrustEngine 用于审计已有的 AI 输出。FlowArchitect 从一开始就在审计下构建输出。适用于”生成后再审查”还不够的场景——你需要对手在规划阶段就参与进来。
from ai_flow_architect import FlowArchitect async def main(): architect = FlowArchitect(config={"brain1": "gpt-4o"}) result = await architect.run("设计一个用户管理系统") # Brain #1 规划 → Opponent 挑战 → 你批准 → Experts 执行 → Brain #2 审计
→ FlowArchitect 完整文档
ai-flow-architect/ ├── src/ai_flow_architect/ │ ├── engine/ # TrustEngine — 独立审计层 │ │ ├── trust_engine.py # 核心审计接口 │ │ ├── trust_report.py # TrustReport 数据结构 + 序列化(JSON/MD/HTML) │ │ └── audit_context.py # 项目元数据的审计上下文 │ ├── brains/ │ │ ├── brain_one.py # Brain #1:需求分析 + 蓝图生成 │ │ ├── brain_two.py # Brain #2:质量仲裁(跨模型) │ │ └── brain_opponent.py # Opponent Brain:5 种对抗性审查风格 │ ├── core/ │ │ ├── architect.py # 三阶段编排 + 用户批准循环 │ │ ├── scheduler.py # 串行执行 + 4 种 token 节省机制 │ │ ├── context.py # 会话 CRUD + 历史压缩 │ │ └── cache.py # CRUD + TTL + 命中统计 │ ├── experts/ # 专家团队:creative, evaluator, programmer, reviewer │ ├── utils/ │ │ ├── llm_client.py # 统一 LLM 客户端(8 个提供商) │ │ ├── token_counter.py # Token 计数 + 成本估算 │ │ ├── compressor.py # 上下文压缩(4 种策略) │ │ └── validator.py # 输入验证 │ └── templates/ │ └── report.html # --html 导出的 Jinja2 模板 ├── tests/unit/ # 186 个单元测试 ├── docs/ │ ├── flow-architect.md │ ├── getting_started.md │ └── sample-report.html # TrustReport 示例(浏览器打开查看) ├── .env.example ├── pyproject.toml └── models.yaml # 提供商 + 模型配置
pip install ai-flow-architect
/personas
ai-flow audit
--json
--markdown
欢迎贡献。如果你用我们兼容列表之外的提供商测试过引擎,仅这一项就是有价值的 PR。
git clone https://github.com/wdnmd1265/ai-flow-architect.git cd ai-flow-architect pip install -e ".[html]" pytest tests/unit/ -v # 186 个测试
Apache License 2.0 — 版权所有 2026 盛鑫
AI 生成。AI 挑战。你来决定。这就是我们解决幻觉的方式。
全网首发开源生态,把ai幻觉透明化
AI 的输出不可信。让我们审查它。
为什么 · 快速开始 · HTML 报告 · TrustEngine · 工作原理 · English
让你警觉的那一刻
你让 AI 写一个登录处理函数。它自信地返回了代码:
TrustEngine 不这么认为。 两个 AI 模型交叉审查了这段代码。第三个扮演反对者。它们发现了这些问题:
我们给 AI 配备了一个对手。 两个大脑从不同角度审查同一份输出。当它们意见不一致时,不确定性会被写入报告——而不是被掩盖。你得到的是一份可验证、可分享的审计报告,而不是一个黑箱答案。
快速开始
设置一个 API Key——或两个以实现跨提供商交叉验证(推荐):
一行命令审计任何内容:
HTML 报告
使用
--html导出自包含的 HTML 报告。发送给你的团队,发布到 Issue 里。每一次分享都是一次 AI 没能逃过的审计。报告包含彩色编码的发现项、标注模型的审查者投票、可折叠的证据链,以及透明的成本明细。无需外部 CSS、无需 JavaScript 框架、无需服务器——一个文件,随处可用。
TrustEngine
TrustEngine 是独立的审计层。零状态。零交互。纯粹验证。
输出格式
ai-flow audit ...ai-flow audit ... --html -o report.htmlai-flow audit ... --jsonai-flow audit ... --markdown集成方式
ai-flow audit ...TrustEngine().audit(...)agent.run()+engine.audit()crew.kickoff()+engine.audit()client.create()+engine.audit().github/workflows/audit-pr.yml对比
工作原理
核心洞察:单个模型无法发现自己的盲区。两个在不同数据上训练的模型,加上一个主动尝试破坏输出的对抗性对手,可以捕捉到任何一个单独会遗漏的问题。
一个 API Key 就够了。 如果你只提供
OPENAI_API_KEY,引擎会自动降级使用gpt-4o-mini作为辅助审查者。跨提供商(OpenAI + Anthropic)能给出最强结果,因为两个模型的失败模式不同。高级:FlowArchitect
TrustEngine 用于审计已有的 AI 输出。FlowArchitect 从一开始就在审计下构建输出。适用于”生成后再审查”还不够的场景——你需要对手在规划阶段就参与进来。
→ FlowArchitect 完整文档
项目结构
路线图
pip install ai-flow-architect/personas)ai-flow audit支持--html、--json、--markdown参与贡献
欢迎贡献。如果你用我们兼容列表之外的提供商测试过引擎,仅这一项就是有价值的 PR。
许可证
Apache License 2.0 — 版权所有 2026 盛鑫
AI 生成。AI 挑战。你来决定。这就是我们解决幻觉的方式。