GSAI · 2026 · 06 · 0024
AI Solution Brief把企业散落的知识,变成 可问、可信、可追溯 的私有 AI 专家
基于 RAG 架构整合 Confluence / SharePoint / Notion / 共享盘 / 业务库等多源数据,提供 私有化部署 + 答案全量可追溯 + 权限继承 的企业知识问答平台。让员工像问专家一样问公司。
企业知识管理,正在从「文档堆」走向「专家系统」
过去 20 年,企业把知识塞进 Wiki、SharePoint、共享盘 —— 但搜得到 ≠ 用得上。员工依然问老员工、问群,90% 的内部知识在工具里安静地积灰。RAG(Retrieval-Augmented Generation)把检索能力和大模型理解能力组合起来,让企业知识第一次具备「被问答」的能力。
企业知识管理的 4 个老问题,通用大模型解决不了
ChatGPT / 通义 / 文心一类通用模型对企业私有知识完全不了解,但回答时不会承认。在法务、合规、技术决策场景下,这种'自信的胡说'是致命的。
知识散在十几个系统里
一个完整流程的资料可能横跨 Confluence(规范)+ SharePoint(模板)+ 群文件(变更)+ 老员工记忆(隐性知识)。单点搜索找不全,跨系统搜索找不到。新员工 onboarding 要踩 3 个月的坑。
老员工是搜索引擎,流失即知识流失
流程怎么走、客户为什么这么对接、上次那个 bug 怎么 fix —— 都在几个老员工脑子里。一个人离职,带走的不只是经验,还有公司的'问答能力'。
通用大模型会自信地胡说
通用模型对企业私有知识一无所知,但回答时不会承认 —— 它会'幻觉'出听起来合理但完全错误的内容。一旦真信了,合规、客户、决策风险全都来。
私有数据上云是合规死区
客户数据、合同、技术方案、人员档案不能上公有云。但内部又确实需要 AI 能力 —— 这两条诉求过去几乎不可调和,现在必须有第三条路。
一套架构,五个能直接落地的场景
RAG 不是一个 chatbot,是企业知识层的基础设施。下面 5 个场景是同一套底座可以串起来的典型落地点。
员工 onboarding 助手
onboarding 文档 + 制度手册 + 流程图全部喂进 RAG,新员工'问公司'得到答案
IT / 流程自助问答
报销怎么报、VPN 怎么连、设备申请走哪个流程 — 不再为日常问题占用 IT 资源
销售知识助手
产品手册 + 标准回答 + 竞品对比 + 历史案例,售前现场问答现拿现用
客户支持 Tier-1 自动应答
接入工单系统,客户问题先由 RAG 起草答案,人工审核 / 直接回复
法务 / 合规知识查询
合同模板 + 历史判例 + 法规库,问'这条款 OK 吗'得到引用具体条文的回答
三大核心能力,逐一可视化拆解
从员工'问'到系统'答',从答案到来源,从权限到审计 —— 我们把 RAG 的三个最高价值环节拆开,让每一步都可以被看见、被验证、被追责。
标准客户 3-5% 返点 [1],战略客户最高 8% [2]。详见返点矩阵 v2026.Q3 [3]。
跨源问答 + 100% 引用回答
每条事实都可点开看原文
员工用自然语言提问,系统在 Confluence / SharePoint / Notion / 共享盘等多源中做混合检索,LLM 生成回答时强制每个事实点带 [n] 引用,可悬浮看原文。低置信度查询自动降级为'未找到'而不是'编一个'。
- 跨源混合检索(Confluence + SharePoint + Notion + 共享盘 + 业务库)
- 100% 强制引用,每条事实点带 [n] 引用 chip
- 引用悬浮显示原文段落 + 文档路径 + 最后更新时间
- 答案置信度评分(retrieval quality + LLM 自评)
- 反馈闭环(👍 👎)注入持续学习,周度迭代
混合检索 + Cross-Encoder 重排
看得见的召回管线,而不是黑盒
一次查询并行打 BM25 全文检索和向量语义检索,候选合并去重后由 Cross-Encoder 重排校准相关性。诊断面板可视化每一步的 hit 分、score、过滤项,任何一次召回失败都能定位到具体环节。
- BM25 关键词检索 + BGE-M3 向量语义检索并行
- Cross-Encoder 重排,Top-K 精度 +24pp
- 多语言 Embedding 中英术语对齐,跨语言可问可答
- 元数据过滤(部门 / 时间 / 权限 / 文档类型)
- 召回诊断面板,可回放每一次查询的全过程
权限继承到字段 + 全量审计
数据不出企业,谁问了什么都留痕
RAG 从源系统(Confluence Space / SharePoint Site / Notion Workspace)实时继承 ACL,用户在 RAG 里看到的内容严格等于他在源系统里能看到的;越权访问自动拦截 + 告警;所有问答全量留痕,可追溯到用户 / 问题 / 引用文档 / 模型版本。
- 源系统 ACL 实时继承(Confluence / SharePoint / Notion)
- 部门 / 角色 / 字段级细粒度权限
- 全量问答审计,可追溯到用户 / 文档 / 模型版本
- 越权访问自动拦截 + 实时告警
- 合规导出(等保三级 / GDPR / ISO 27001)
一条可解释、可演进的 RAG 管线 + 私有化部署架构
我们坚持把 RAG 当作管线而不是黑盒:每一步都有明确职责、明确输入输出、明确兜底策略。下面是 5 层架构 + 5 阶段处理管线。
5 阶段处理管线
从文档拉取到答案返回,管线每一步都可观测、可干预、可回放。任何一步质量下降都能定位到具体环节。
通过原生 connector 拉取 Confluence / SharePoint / Notion / 共享盘 / 业务库等多源数据,支持全量初始化 + 增量同步 + Webhook 推送,文档生命周期与源系统对齐。
PDF / Word / PPT / Excel / 扫描件等异构文档统一解析为结构化对象;分块不是固定字数切,而是按章节、段落、表格等语义边界切,保留上下文。
多语言 Embedding 模型(BGE-M3 / text-embedding-3),覆盖中英文及垂直业务术语;chunk + 元数据存入向量库,同时建 BM25 全文索引,为混合检索做准备。
查询同时打向量检索 + BM25 全文,候选合并后通过 Cross-Encoder 重排;支持元数据过滤(部门 / 时间 / 权限)和查询改写。
LLM 基于检索结果生成回答,强制每个事实点引用 chunk 来源;Self-RAG 校验回答是否被检索支撑;不确定时返回'未找到'而不是'编一个'。
5 层架构
五层各司其职、可独立替换演进。任何一层都可以从云服务切到自部署,从 SaaS 模型切到自训练模型。
三个代表性场景,看 RAG 在企业里实际跑起来是什么样
下面是三个代表性场景化呈现(已抽象与脱敏),帮助你判断在自己组织里 RAG 能解决什么、落地后是什么样。
中型律所 · 合规与判例库
接入 12 万份历史合同 + 法规条文 + 行业判例。律师问'这条款在 X 行业有没有过判例支持',RAG 返回具体判例号 + 关键引文 + 风险等级,审查耗时从平均 4 小时压到 2.2 小时。
制造业集团 · 工艺与设备文档库
8 万份工艺规范 + 设备说明书 + 故障案例。一线工程师扫码即问'这台设备报 E-217 怎么处理',RAG 拿出处置 SOP + 历史案例 + 责任人。新工程师 onboarding 周期从 90 天压至 35 天。
中型 SaaS 公司 · 全员 IT 自助
把 IT 制度、流程、常见问题、历史工单全部喂入。员工在飞书内 @RAG 助手问'换电脑怎么走流程',RAG 一次答清楚 + 自动起草 OA 申请。月均 IT 工单从 1200 单降到 540 单。
上述场景为代表性呈现,实际项目数据按合作客户脱敏后另行交付。
数据不出企业,权限继承到字段
RAG 是企业的'神经中枢',它的安全性等于企业数字资产的安全性。我们把安全设计放在和功能同等优先级,而不是上线后补丁。
私有化部署
支持完全私有云 / 混合云 / 国产化适配(信创 · 鲲鹏 · 飞腾)。所有处理、向量库、模型推理都在企业内网完成,数据全程不出企业。
权限继承
从源系统(Confluence / SharePoint / Notion)继承 ACL,RAG 不会让人看到他在源系统里看不到的内容;支持部门 / 角色 / 字段级权限。
审计与可追溯
所有问答全量留痕,可追溯到具体用户 / 问题 / 引用文档 / 模型版本。每条回答的引用链都可点开看原文。
全链路加密
传输 TLS 1.3,存储 AES-256;向量库与文档库独立加密;支持企业 KMS 接入,密钥不出企业。
合规支持
等保三级 / GDPR / ISO 27001 / 金融行业监管要求全面支持;提供合规检查清单与渗透测试报告。
模型隔离
可选 100% 自部署 LLM(DeepSeek / Qwen / Llama),不依赖任何第三方 API;模型与检索全部在企业内运行,无外发请求。
Related solutions
更多滚水科技解决方案
覆盖 AI、金融文档、OCR、安防、IoT 与会员运营等场景,按行业组合落地。
如果你有一个还没解决的具体场景,我们一起看看 AI 是不是合适的解法。
我们会和你一起把场景拆开,判断这个问题是否值得用 AI 来做、用哪一种 AI 做最划算,并在 5 个工作日内给你一份可落地的初步方案与报价。