YILab
AI Agent 工程服务能力陈述
项目案例  ·  资质证明  ·  合作背景
服务类型 企业 AI Agent 系统开发 · 驻厂部署工程(FDE)
目标场景 药物警戒(PV)文档智能 · eCTD 监管提交 · GxP 合规工作流
注册主体 YILAB  ·  安大略省注册企业(BIN: 1001616035)
文件用途 项目背景说明 · 能力证明 · 投标参考
2026 年 5 月
consult@yilab.tech
github.com/YiAgent
yilab.tech
关于 YILab

YILab 是依据加拿大《商业名称法》(Business Names Act)在安大略省正式注册的企业(BIN: 1001616035),专注企业级 AI Agent 系统的架构设计、工程开发与驻厂集成。服务模式分为两类:Agent 系统定制开发——从需求分析、系统设计到生产部署的全程参与;及驻厂部署工程(FDE)——工程师驻场入驻客户技术团队,在其内部受控环境完成系统部署、集成与运维移交。

核心工程实践集中于受监管行业的合规文档处理、企业级 RAG 知识检索、有界 Agentic 工作流与多 Provider LLM 稳定性设计。系统设计以可审计、可回滚、Human-in-the-Loop 为基本原则,在技术路线上与合规 Agent(Pharmacovigilance / ICSR narrative)、监管文档提取(eCTD)及 GxP 受控环境部署等场景的需求高度契合。持有 Anthropic Claude Certified Architect – Foundations (CCA-F) 官方认证,参与 Anthropic Partner Network

认证与资质
负责人简介
王乙  Yi Wang
创始人 · 企业级 AI Agent 系统架构师  ·  加拿大独立开发者

加拿大 York University Lassonde 工程学院(计算机科学)学术背景,专注企业级 AI Agent 系统的架构设计与工程实现。在受监管行业的合规文档处理、有界 Agentic 工作流、RAG 知识检索与多 Provider LLM 稳定性工程方面有系统性的实践积累,独立主导或合作参与多套生产级 Agent 系统的架构与开发,相关项目均已在真实业务场景中落地运行。

持有 Anthropic 官方 Claude Certified Architect – Foundations (CCA-F) 认证,参与 Anthropic Partner Network;开发的 OpenCI 工作流库上架 GitHub Marketplace,维护至 v3.1.18;向知名 AI 智能体开源项目 OpenClaw(龙虾智能体)提交 multi-provider failover 可靠性修复并完成合并(PR #2143);参与 Morphace(Next36 · VentureLab 投资初创)的 Agent 系统架构与开发;SREDSimplify 与 KPMG 顾问合作,在加拿大合规税务场景完成 Agent SaaS 的上线验证。

核心服务能力
合规文档智能
将非结构化法规/监管文档(PDF · 混合表格 · 自由文本)自动转化为结构化可查询数据,所有抽取结果附溯源引用与全程审计日志,直接支持 eCTD 模块提取、ICSR narrative 生成、SOP 合规性核查等高价值场景。
有界 Agentic 工作流
为企业提供具备完全可审计性与确定性执行保证的多步 Agent 流水线,内置 Human-in-the-Loop 专家复核门控、checkpoint 断点续传与 allowlist 守卫执行机制,满足 GxP 受控变更管理与监管提交前强制人工复核的合规要求。
RAG 企业知识库
面向高密度法规/技术文档的生产级 RAG 全链路交付——从分块策略设计、混合检索调优到 cross-encoder 重排序与评测体系(faithfulness / MRR / NDCG),支持 SOP、药典、监管法规的智能问答与精准溯源检索。
多 Provider LLM 可靠性
Anthropic / AWS Bedrock / Google Vertex AI / Azure OpenAI 多 provider 统一抽象,内置 failover、auth 轮转与可观测性,保障生产级 SLA。
驻厂部署工程(FDE)
入驻客户内部环境,完成 Agent 系统全栈部署与系统集成,严格遵循客户 IT 安全策略(数据不出域、私有化部署、GxP 受控变更记录),交付范围涵盖完整技术移交文档与团队培训赋能,确保客户团队具备独立运维能力。
多租户安全与数据隔离
以 PG row-level security、PII 过滤(Presidio)与 prompt injection 主动防御为核心,构建企业级多租户数据隔离层,安全架构设计基准可直接对标受监管行业的数据隐私合规与 GxP 受控环境部署审查要求。
本地模型部署与微调
支持开源(Llama / Qwen / DeepSeek)与商业模型的私有化部署(数据不出域),提供领域微调(LoRA / full fine-tune)与推理性能优化(量化 / vLLM / TensorRT-LLM)全链路工程能力,满足药企对数据主权、模型可控性与监管审查的合规要求。
评测体系与质量保障
建立 faithfulness / context precision / QWK / macro-F1 等多维度量化评测框架,配套 SWE-bench 等四类基准回归与对照实验纳入 CI nightly,确保 Agent 系统在生产环境的输出质量持续可控、能力退化与成本异常可被及时发现。
代表性项目案例
SREDSimplify
sredsimplify.com ↗
合规文档智能 Agent SaaS — 加拿大 SR&ED 监管税务申报场景  ·  与 KPMG 顾问合作开发
项目背景与业务痛点
加拿大 SR&ED 税收抵免申报涉及大量非结构化政策/法规文档(PDF + 表格混合),企业需人工完成资格判定、证据整理与 T661 申报表草拟,全流程耗时 2–4 周,且易因证据不充分导致审查被拒。本项目由 YILab 与 KPMG 顾问合作推进——KPMG 提供 SR&ED 领域合规专业知识与真实场景验证,YILab 负责 Agent 系统的架构设计与工程实现,将申报流程整合为可追踪、可复核的多步工作流。
解决方案架构
文档解析管道:语义分块 + 混合 BM25/dense 检索 + cross-encoder 重排序三层架构,处理非结构化法规文本(PDF + 表格 + 自由文本),关键字段结构化提取准确率 ≥ 91%,所有抽取结果附溯源引用。

Workflow Runtime:自研 runtime 抽象 4 类节点(gather / validate / generate / review),checkpoint 断点续传 + SSE 实时事件流,每个工具调用在 allowlist 守卫下执行,全程操作可审计。

Human-in-the-Loop:在资格判定、证据采信、草稿定稿三个关键决策节点插入专家复核门控,Agent 输出须经审阅方可进入下一阶段,支持注释回填与版本对比。

安全架构:PG row-level security + customer_id 二次校验租户隔离;Presidio PII 过滤;prompt injection 防御层;自建 MCP cra-rag server + 6 个 connector,OAuth token 按 customer_id 隔离。

本地模型部署(Ollama):针对客户财务/税务数据敏感性,提供 Ollama 本地推理作为云端 LLM 的私有化替代——客户可选择将 Llama 3 / Qwen / DeepSeek 等开源模型部署在自有服务器或客户内网,数据不出域;通过统一的 provider 抽象层与云端 Claude / Bedrock 同一套调用接口对齐,无需修改业务代码即可在公有云与私有部署之间切换,满足审计、合规与离线运行场景的要求。
项目成果与量化指标
关键字段结构化提取准确率 ≥ 91%,覆盖 470+ 自动化测试用例,QWK / macro-F1 双指标评测体系,全流程操作可审计追溯,多租户生产环境稳定运行。
向药企场景的架构可迁移性
SREDSimplify 的核心架构——非结构化法规文档解析 + 结构化字段抽取 + Human-in-the-Loop 决策门控 + 全程审计——与药企监管场景在工程范式上同构,可直接迁移:SR&ED 政策法规 → ICH/GVP 指南与 FDA GuidanceT661 申报表 → eCTD 模块 1–5 结构化字段资格判定(合规性认定)→ ICSR 因果关系评估(causality assessment)KPMG 顾问复核节点 → QA/医学事务专家复核节点。所有溯源引用、版本化配置、审计日志等关键合规机制无需重写,仅需替换领域知识库与提示词模板即可在 PV / eCTD 场景复用。
Morphace
morphace.com ↗
AI Agent 驱动的个性化护肤平台  ·  加拿大 Next36 · VentureLab 投资初创  ·  联合开发
项目背景与合作背景
Morphace 是加拿大知名创业加速器 Next36 · VentureLab 投资孵化的 AI 护肤科技初创公司,由多伦多大学(生物电子界面,Co-founder & CEO Jia Xi (Gia) Chen, Ph.D.)与斯坦福大学(生物医学工程,Co-founder & CSO Tianhao Chen, Ph.D.)博士联合创立,将生物医学专业知识与 AI 技术结合,面向护肤个性化诊断与产品推荐场景。YILab 作为核心工程合作方,负责 Agent 系统的架构设计与工程开发,将创始团队的生物医学专业知识转化为可规模化部署的 AI 驱动应用。
解决方案架构
用户表型分析 Agent:多轮对话驱动的结构化皮肤状态采集工作流(肤质类型 / 问题分类 / 环境因子),结合创始团队的生物医学专业知识框架,将非结构化用户输入转化为可查询的表型特征向量,支撑个性化推荐的精准召回。

成分知识库 RAG:构建涵盖活性成分、配方相容性与皮肤科研究文献的专业知识库,采用语义分块 + 混合检索 + 重排序全链路,为推荐引擎提供有科学溯源的成分配比依据。

个性化推荐工作流:有界多步 Agent 流水线,覆盖表型采集 → 成分匹配 → 推荐生成 → 专家审阅全链路,关键推荐节点引入 Human-in-the-Loop 专业师复核门控,确保输出质量与科学性。

领域模型微调:基于创始团队整理的护肤/皮肤科领域语料(活性成分百科 · 配方相容性矩阵 · 表型-推荐配对数据),对开源基座模型进行 LoRA 微调,专门优化模型在成分识别、肤质判别与推荐解释上的领域表现;微调流程纳入 W&B 实验追踪与版本化,配套 faithfulness / 推荐一致性等定制评测集对比基座模型与微调版本,确保上线版本可量化优于通用模型。

vLLM 高吞吐推理部署:微调模型通过 vLLM 部署为统一推理服务(PagedAttention + continuous batching),相较原生 transformers 吞吐量显著提升、P95 延迟大幅下降,单 GPU 即可支撑前端实时对话工作流的并发需求;推理服务以 OpenAI 兼容接口对外暴露,与现有 Agent 框架无缝集成,并支持按租户/版本动态切换微调权重。
企业级 Agentic CI/CD 流水线框架 — GitHub Marketplace 上架,v3.1.18 生产可用
项目背景
面向企业设计并发布的 Agentic CI/CD 工作流库,将 Claude 嵌入 PR review、CI 分析、部署观测、Issue 运维各阶段,架构决策全程以供应链安全、最小权限与操作可审计为基准,与 GxP 受控变更管理的合规要求在设计层面形成对应。
关键架构决策
4 阶段 Agentic Pipeline:Ingest → Enrich → Agent → Execute,将 Claude 决策域限定在已验证的结构化输入上;allowlisted guarded execution 确保每次 Agent 操作均可审计、可回滚。

供应链安全:191 个第三方依赖全部 SHA 钉定 + CI 强制零违规校验;permissions:{} 最小权限;step-security/harden-runner 网络出口封锁。

多 Provider 统一抽象:Anthropic / AWS Bedrock / Google Vertex AI / Microsoft Foundry 统一切换,内置多 provider failover 与 MCP server 配置,15 个内置 AI skill。
项目规模
12 条可复用 workflow、76 个 composite/atomic action、129 条单元测试,经 17 次正式 release 迭代,当前稳定版本 v3.1.18,已上架 GitHub Marketplace。
自主 Agentic 运维系统 — 覆盖 Issue 全生命周期管理,含四类行业标准基准评测体系
项目背景
面向软件工程团队设计并开发的自托管 GitHub 自主运维 Agent,覆盖 Issue triage / reproduce / fix / review / chat 各阶段,核心目标是在生产环境中系统验证有界工作流、运行时沙箱隔离与量化评测三类关键能力,形成在大规模自主 Agent 场景中的工程实践积累。
关键技术实现
有界工作流:LangGraph + DeepAgents 编排 4 条 bounded workflow,统一 input schema、3–8 轮调用上限、120 s timeout 与节点级 fallback,将开放式 Agent 失控风险收敛到可验证范围。

量化能力验证:同模型同 budget 的 harness vs. 无 harness 对照实验——引入 harness 后 pass rate 提升约 10%,单次 token 消耗从约 2M 降至约 70K(减少 96.5%)。

四类基准评测:SWE-bench(Fix)、SWT-bench(Triage)、Martian Code Review(Review)、SWE QA(Chat)回归报告,能力退化与 token 成本纳入 CI nightly regression。
关键指标
同模型同预算对照实验:引入 harness 后 pass rate 提升约 10%,单次 token 消耗从约 2M 降至约 70K(减少 96.5%);四类基准(SWE-bench / SWT-bench / Martian Code Review / SWE QA)纳入 CI nightly regression。
企业 RAG 知识库平台 — 面向高密度法规与技术文档的智能检索与知识问答系统
项目背景与业务目标
为技术决策团队构建面向高密度文档场景的企业级知识问答平台,覆盖 LLM 推理、RAG 全链路架构、有界 Agent 设计与 prompt engineering,支撑复杂技术知识的持续沉淀与高精度检索,并通过可公开访问的结构化文档平台完成从知识组织到检索交付的完整产品化交付验证。
关键技术实现
RAG 全链路:文档分块策略(fixed-size / recursive / semantic / late chunking)、HNSW 向量索引调优、IVF-PQ 压缩、混合 BM25/dense 检索、cross-encoder 重排序;评测框架覆盖 faithfulness、context precision/recall、MRR、NDCG。

平台工程:Docusaurus + MDX + 自研 remark 插件;Python API 后端;Docker + GitHub Actions CI/CD;zh-Hans i18n;Vercel 部署,141+ commits 持续演进。
合作模式与合规保障
数据主权承诺
支持完全私有化部署,所有数据与模型权重不出客户网络边界;项目启动前签署 NDA 与数据处理协议(DPA),开发与部署过程严格遵循客户既定的数据分类与访问控制策略。
GxP 合规对齐
系统设计遵循 GAMP 5 软件分类框架,明确风险等级与验证范围;交付 IQ / OQ / PQ 验证文档与测试脚本,变更记录、电子签名、审计追溯满足 21 CFR Part 11 电子记录与电子签名要求。
审计与可追溯性
全操作链路审计日志(用户操作 · Agent 决策 · 模型调用 · 数据访问),版本化配置管理与 Git-based 变更评审;关键决策节点强制 Human-in-the-Loop 复核门控,确保每一次自动化输出均可被独立验证与回溯。
交付模式
支持 驻厂部署工程(FDE)远程交付 两种模式,交付物包含完整技术移交文档(架构图 · 接口规范 · 运维手册)、SOP 模板与团队培训赋能,确保客户团队具备独立运维与二次开发能力。
联系方式
欢迎进一步沟通 期待就您的 AI Agent 系统需求展开深入交流——
无论是技术方案咨询、概念验证(PoC)合作,还是驻厂部署评估,均可通过以下方式联系。