Production-ready / 私有化

GSAI · 2026 · 06 · 0024

AI Solution Brief

把企业散落的知识,变成可问、可信、可追溯的私有 AI 专家

基于 RAG 架构整合 Confluence / SharePoint / Notion / 共享盘 / 业务库等多源数据,提供私有化部署 + 答案全量可追溯 + 权限继承的企业知识问答平台。让员工像问专家一样问公司。

预约方案沟通了解技术架构

10 分钟阅读 · v1.0 · 更新于 2026 年 6 月

92.4%

检索准确率

Top-3 Hit · 混合检索

< 2.5s

端到端响应

P95 ≤ 4.0s

-68%

专家咨询量

上线 90 天对比

100%

答案引用率

每条回答可溯源

知识库 RAG · Live

实时索引

数据源

Confluence

Wiki · 8.2K

SharePoint

文档 · 21.0K

Notion

团队 · 4.6K

共享盘

PDF/Word · 56.0K

业务库

MySQL · 32.4K

工单系统

Ticket · 2.2K

6 源 · 12.4 万文档

RAG Hub

Pipeline

01 Parse02 Chunk03 Embed04 Retrieve05 Generate

回答 · 带引用

Q: 新员工怎么申请 VPN?

A: IT 服务台 → 提交《远程访问申请》→ 主管批准 → 自动开通

[1][2]

Q: Q3 销售返点政策?

A: 标准客户 3-5% · 战略客户最高 8%,详见返点矩阵

[1][2][3]

Q: 客户合同里能加这条款吗?

A: 可加。参照模板第 14.2 条 · 已通过 2024 法务评审

[1][2]

100% 可溯源

Top-3 命中

92%

响应 P50

引用/答

00/BACKGROUND

企业知识管理,正在从「文档堆」走向「专家系统」

过去 20 年,企业把知识塞进 Wiki、SharePoint、共享盘 —— 但搜得到 ≠ 用得上。员工依然问老员工、问群,90% 的内部知识在工具里安静地积灰。RAG(Retrieval-Augmented Generation)把检索能力和大模型理解能力组合起来,让企业知识第一次具备「被问答」的能力。

知识载体PDF / Word / PPT / Excel / Confluence / 邮件 / 聊天

现状流程全文搜索 + 人工筛选 + 老员工兜底

失败模式搜不到 / 搜错 / 看不懂 / 没人讲

我们的目标可问答 + 可追溯 + 可治理

01/PROBLEM

企业知识管理的 4 个老问题,通用大模型解决不了

ChatGPT / 通义 / 文心一类通用模型对企业私有知识完全不了解,但回答时不会承认。在法务、合规、技术决策场景下,这种'自信的胡说'是致命的。

P-01 · Pain

知识散在十几个系统里

一个完整流程的资料可能横跨 Confluence(规范)+ SharePoint(模板)+ 群文件(变更)+ 老员工记忆(隐性知识)。单点搜索找不全,跨系统搜索找不到。新员工 onboarding 要踩 3 个月的坑。

P-02 · Pain

老员工是搜索引擎,流失即知识流失

流程怎么走、客户为什么这么对接、上次那个 bug 怎么 fix —— 都在几个老员工脑子里。一个人离职,带走的不只是经验,还有公司的'问答能力'。

P-03 · Pain

通用大模型会自信地胡说

通用模型对企业私有知识一无所知,但回答时不会承认 —— 它会'幻觉'出听起来合理但完全错误的内容。一旦真信了,合规、客户、决策风险全都来。

P-04 · Pain

私有数据上云是合规死区

客户数据、合同、技术方案、人员档案不能上公有云。但内部又确实需要 AI 能力 —— 这两条诉求过去几乎不可调和,现在必须有第三条路。

Industry

通用 · 不限行业

Volume

10 万 - 数百万文档

Current flow

全文搜索 + 找人问

Goal

私有化 RAG + 可追溯

02/SCENARIOS

一套架构,五个能直接落地的场景

RAG 不是一个 chatbot,是企业知识层的基础设施。下面 5 个场景是同一套底座可以串起来的典型落地点。

S-01

员工 onboarding 助手

HR · 新员工

onboarding 文档 + 制度手册 + 流程图全部喂进 RAG,新员工'问公司'得到答案

Metric

平均上手时间 -60%

S-02

IT / 流程自助问答

全员

报销怎么报、VPN 怎么连、设备申请走哪个流程 — 不再为日常问题占用 IT 资源

Metric

IT 工单量 -55%

S-03

销售知识助手

售前 · BD

产品手册 + 标准回答 + 竞品对比 + 历史案例,售前现场问答现拿现用

Metric

首响应时间 -70%

S-04

客户支持 Tier-1 自动应答

客服

接入工单系统,客户问题先由 RAG 起草答案,人工审核 / 直接回复

Metric

工单解决率 +40%

S-05

法务 / 合规知识查询

法务 · 合规

合同模板 + 历史判例 + 法规库,问'这条款 OK 吗'得到引用具体条文的回答

Metric

合规审查耗时 -50%

03/CAPABILITIES

三大核心能力,逐一可视化拆解

从员工'问'到系统'答',从答案到来源,从权限到审计 —— 我们把 RAG 的三个最高价值环节拆开,让每一步都可以被看见、被验证、被追责。

请问:Q3 销售返点政策怎么算? RAG

AI 回答可信度 87%

标准客户 3-5% 返点 ^[1],战略客户最高 8% ^[2]。详见返点矩阵 v2026.Q3 ^[3]。

引用来源 (3)

[1]Confluence · 销售返点制度2026.06

[2]SharePoint · 战略客户清单2026.05

[3]Notion · 返点矩阵 v2026.Q32026.07

12下一步:起草客户邮件

Top-3 命中

92.4%

平均响应

2.1s

C-0103-A · Q&A + Citation Chain

跨源问答 + 100% 引用回答

每条事实都可点开看原文

员工用自然语言提问,系统在 Confluence / SharePoint / Notion / 共享盘等多源中做混合检索,LLM 生成回答时强制每个事实点带 [n] 引用,可悬浮看原文。低置信度查询自动降级为'未找到'而不是'编一个'。

跨源混合检索(Confluence + SharePoint + Notion + 共享盘 + 业务库)
100% 强制引用,每条事实点带 [n] 引用 chip
引用悬浮显示原文段落 + 文档路径 + 最后更新时间
答案置信度评分(retrieval quality + LLM 自评)
反馈闭环(👍 👎)注入持续学习,周度迭代

查询:EVA 估值法详解 filters: dept=fin

01 · BM25 全文检索

1财务规范-EVA章节hit 0.84

2估值方法论hit 0.71

3案例-EVA法应用hit 0.66

02 · 向量检索(BGE-M3)

1财务规范-EVA章节sim 0.89

2估值方法论sim 0.76

3案例-EVA法应用sim 0.71

03 · 合并去重45 候选

04 · Cross-Encoder Rerank+24pp

①EVA 模型详解

0.96

②财务规范-EVA章节

0.91

③案例-EVA法应用

0.84

Rerank 精度提升

+24pp

幻觉率

< 2%

C-0203-B · Hybrid Retrieval + Rerank

混合检索 + Cross-Encoder 重排

看得见的召回管线,而不是黑盒

一次查询并行打 BM25 全文检索和向量语义检索,候选合并去重后由 Cross-Encoder 重排校准相关性。诊断面板可视化每一步的 hit 分、score、过滤项,任何一次召回失败都能定位到具体环节。

BM25 关键词检索 + BGE-M3 向量语义检索并行
Cross-Encoder 重排,Top-K 精度 +24pp
多语言 Embedding 中英术语对齐,跨语言可问可答
元数据过滤(部门 / 时间 / 权限 / 文档类型)
召回诊断面板,可回放每一次查询的全过程

权限继承面板

员工 A · 销售部

12,400

可见文档

✓Confluence:营销

✗Confluence:法务

✓SharePoint:Sales

✗SharePoint:Legal

✓Notion:客户线索

员工 B · 法务部

8,200

可见文档

✗Confluence:营销

✓Confluence:法务

✗SharePoint:Sales

✓SharePoint:Legal

✗Notion:客户线索

审计日志 · 最近 1h共 47 条

14:32用户 A客户名单答 · 引用 2 篇

14:28用户 B合同模板 v3.1答 · 引用 3 篇

14:21用户 C薪酬清单越权拦截

14:18用户 A客户支持流程反馈 👍

越权事件

审计覆盖

100%

C-0303-C · ACL Inheritance + Audit

权限继承到字段 + 全量审计

数据不出企业,谁问了什么都留痕

RAG 从源系统(Confluence Space / SharePoint Site / Notion Workspace)实时继承 ACL,用户在 RAG 里看到的内容严格等于他在源系统里能看到的;越权访问自动拦截 + 告警;所有问答全量留痕,可追溯到用户 / 问题 / 引用文档 / 模型版本。

源系统 ACL 实时继承(Confluence / SharePoint / Notion)
部门 / 角色 / 字段级细粒度权限
全量问答审计,可追溯到用户 / 文档 / 模型版本
越权访问自动拦截 + 实时告警
合规导出(等保三级 / GDPR / ISO 27001)

03/ARCHITECTURE

一条可解释、可演进的 RAG 管线 + 私有化部署架构

我们坚持把 RAG 当作管线而不是黑盒:每一步都有明确职责、明确输入输出、明确兜底策略。下面是 5 层架构 + 5 阶段处理管线。

5 阶段处理管线

从文档拉取到答案返回,管线每一步都可观测、可干预、可回放。任何一步质量下降都能定位到具体环节。

Ingestion · 多源拉取

实时增量同步

通过原生 connector 拉取 Confluence / SharePoint / Notion / 共享盘 / 业务库等多源数据,支持全量初始化 + 增量同步 + Webhook 推送,文档生命周期与源系统对齐。

Confluence APIGraph APINotion APIS3 / FTPWebhook

输出归一化文档对象 + 元数据 + 权限继承标签

Parsing & Chunking · 结构化解析

语义分块

PDF / Word / PPT / Excel / 扫描件等异构文档统一解析为结构化对象;分块不是固定字数切,而是按章节、段落、表格等语义边界切,保留上下文。

PaddleOCRUnstructuredMarkdown 化语义分块

输出带语义边界的 chunk + 章节路径 + 元数据

Embedding & Indexing · 向量化

多语言 + 业务调优

多语言 Embedding 模型(BGE-M3 / text-embedding-3),覆盖中英文及垂直业务术语;chunk + 元数据存入向量库,同时建 BM25 全文索引,为混合检索做准备。

BGE-M3Milvus / QdrantBM25倒排索引

输出向量 + 全文双索引 + 元数据图谱

Retrieval & Rerank · 混合检索

Hybrid + Cross-Encoder

查询同时打向量检索 + BM25 全文,候选合并后通过 Cross-Encoder 重排;支持元数据过滤(部门 / 时间 / 权限)和查询改写。

Vector SearchBM25Cross-Encoder Rerank元数据 filter

输出Top-K 高相关 chunk + 召回解释

Generation & Citation · 生成与引用

强制引用 + 幻觉过滤

LLM 基于检索结果生成回答,强制每个事实点引用 chunk 来源;Self-RAG 校验回答是否被检索支撑;不确定时返回'未找到'而不是'编一个'。

DeepSeek / Qwen / LlamaSelf-RAG引用强制置信度评分

输出可追溯回答 + 来源引用 + 置信度

5 层架构

五层各司其职、可独立替换演进。任何一层都可以从云服务切到自部署,从 SaaS 模型切到自训练模型。

应用层

Web 问答 · 企业微信 / 钉钉 / Slack 集成 · Open API · 管理后台

生成层

LLM 推理 · 强制引用 · Self-RAG 校验 · 答案置信度 · 幻觉过滤

检索层

Vector DB(Milvus / Qdrant)· Hybrid Search · Cross-Encoder Rerank · 元数据过滤

处理层

PDF / Word / PPT / Excel 解析 · OCR · 语义分块 · 多语言 Embedding(BGE-M3)

接入层

Confluence / SharePoint / Notion / S3 / MySQL / 飞书 · 实时增量同步 · Webhook

04/SCENARIOS IN ACTION

三个代表性场景,看 RAG 在企业里实际跑起来是什么样

下面是三个代表性场景化呈现(已抽象与脱敏),帮助你判断在自己组织里 RAG 能解决什么、落地后是什么样。

法律服务

中型律所 · 合规与判例库

接入 12 万份历史合同 + 法规条文 + 行业判例。律师问'这条款在 X 行业有没有过判例支持',RAG 返回具体判例号 + 关键引文 + 风险等级,审查耗时从平均 4 小时压到 2.2 小时。

首轮审查耗时

-45%

引用率

100%

条款查全率

+38%

高端制造

制造业集团 · 工艺与设备文档库

8 万份工艺规范 + 设备说明书 + 故障案例。一线工程师扫码即问'这台设备报 E-217 怎么处理',RAG 拿出处置 SOP + 历史案例 + 责任人。新工程师 onboarding 周期从 90 天压至 35 天。

Onboarding 周期

-61%

故障平均解决时间

-42%

重复求助率

-58%

互联网 / SaaS

中型 SaaS 公司 · 全员 IT 自助

把 IT 制度、流程、常见问题、历史工单全部喂入。员工在飞书内 @RAG 助手问'换电脑怎么走流程',RAG 一次答清楚 + 自动起草 OA 申请。月均 IT 工单从 1200 单降到 540 单。

IT 工单量

-55%

首响应时间

30s → 即时

员工满意度

+22 NPS

上述场景为代表性呈现,实际项目数据按合作客户脱敏后另行交付。

05/SECURITY

数据不出企业,权限继承到字段

RAG 是企业的'神经中枢',它的安全性等于企业数字资产的安全性。我们把安全设计放在和功能同等优先级,而不是上线后补丁。

S-01

私有化部署

支持完全私有云 / 混合云 / 国产化适配(信创 · 鲲鹏 · 飞腾)。所有处理、向量库、模型推理都在企业内网完成,数据全程不出企业。

S-02

权限继承

从源系统(Confluence / SharePoint / Notion)继承 ACL,RAG 不会让人看到他在源系统里看不到的内容;支持部门 / 角色 / 字段级权限。

S-03

审计与可追溯

所有问答全量留痕,可追溯到具体用户 / 问题 / 引用文档 / 模型版本。每条回答的引用链都可点开看原文。

S-04

全链路加密

传输 TLS 1.3,存储 AES-256;向量库与文档库独立加密;支持企业 KMS 接入,密钥不出企业。

S-05

合规支持

等保三级 / GDPR / ISO 27001 / 金融行业监管要求全面支持;提供合规检查清单与渗透测试报告。

S-06

模型隔离

可选 100% 自部署 LLM(DeepSeek / Qwen / Llama),不依赖任何第三方 API;模型与检索全部在企业内运行,无外发请求。

如果你有一个还没解决的具体场景，我们一起看看 AI 是不是合适的解法。

我们会和你一起把场景拆开，判断这个问题是否值得用 AI 来做、用哪一种 AI 做最划算，并在 5 个工作日内给你一份可落地的初步方案与报价。

商务邮箱

contact@boilingwater.cn

公司地址

深圳市龙岗区京基御景时代大厦南塔 10 层

把企业散落的知识,变成可问、可信、可追溯的私有 AI 专家

10 分钟阅读 · v1.0 · 更新于 2026 年 6 月

92.4%

检索准确率

Top-3 Hit · 混合检索

< 2.5s

端到端响应

P95 ≤ 4.0s

-68%

专家咨询量

上线 90 天对比

100%

答案引用率

每条回答可溯源

企业知识管理,正在从「文档堆」走向「专家系统」

把企业散落的知识,变成 可问、可信、可追溯 的私有 AI 专家

企业知识管理,正在从「文档堆」走向「专家系统」

企业知识管理的 4 个老问题,通用大模型解决不了

知识散在十几个系统里

老员工是搜索引擎,流失即知识流失

通用大模型会自信地胡说

私有数据上云是合规死区

一套架构,五个能直接落地的场景

员工 onboarding 助手

IT / 流程自助问答

销售知识助手

客户支持 Tier-1 自动应答

法务 / 合规知识查询

三大核心能力,逐一可视化拆解

跨源问答 + 100% 引用回答

混合检索 + Cross-Encoder 重排

权限继承到字段 + 全量审计

一条可解释、可演进的 RAG 管线 + 私有化部署架构

5 阶段处理管线

5 层架构

三个代表性场景,看 RAG 在企业里实际跑起来是什么样

中型律所 · 合规与判例库

制造业集团 · 工艺与设备文档库

中型 SaaS 公司 · 全员 IT 自助

数据不出企业,权限继承到字段

私有化部署

权限继承

审计与可追溯

全链路加密

合规支持

模型隔离

更多滚水科技解决方案

AI 金融文件自动化

AI 订单识别 OCR

AI 安防识别系统

如果你有一个还没解决的具体场景，我们一起看看 AI 是不是合适的解法。

把企业散落的知识,变成 可问、可信、可追溯 的私有 AI 专家

企业知识管理,正在从「文档堆」走向「专家系统」

企业知识管理的 4 个老问题,通用大模型解决不了

知识散在十几个系统里

老员工是搜索引擎,流失即知识流失

通用大模型会自信地胡说

私有数据上云是合规死区

一套架构,五个能直接落地的场景

员工 onboarding 助手

IT / 流程自助问答

销售知识助手

客户支持 Tier-1 自动应答

法务 / 合规知识查询

三大核心能力,逐一可视化拆解

跨源问答 + 100% 引用回答

混合检索 + Cross-Encoder 重排

权限继承到字段 + 全量审计

一条可解释、可演进的 RAG 管线 + 私有化部署架构

5 阶段处理管线

5 层架构

三个代表性场景,看 RAG 在企业里实际跑起来是什么样

中型律所 · 合规与判例库

制造业集团 · 工艺与设备文档库

中型 SaaS 公司 · 全员 IT 自助

数据不出企业,权限继承到字段

私有化部署

权限继承

审计与可追溯

全链路加密

合规支持

模型隔离

更多滚水科技解决方案

AI 金融文件自动化

AI 订单识别 OCR

AI 安防识别系统

如果你有一个还没解决的具体场景，我们一起看看 AI 是不是合适的解法。

把企业散落的知识,变成可问、可信、可追溯的私有 AI 专家

把企业散落的知识,变成可问、可信、可追溯的私有 AI 专家