← AI 百科

RAGFlow:给行业资料做知识库问答和客服机器人的开源 RAG 引擎

Skills/工作流 · GitHub项目
一句话:RAGFlow 是一个面向企业资料问答的开源 RAG 引擎,适合把 PDF、Word、网页、表格、业务手册变成可追溯来源的 AI 问答系统。它很适合做行业包里的"知识库客服底座",例如口腔诊所项目咨询、房产中介房源问答、教育机构课程答疑。

它是什么

RAGFlow 解决的是"AI 回答必须基于你自己的资料,并且能给出处"的问题。你把行业资料上传进去,它会做解析、切分、索引、检索,再让大模型基于命中的资料回答问题。对需要客服、销售、顾问、助教统一话术的行业很有价值。

适合干什么

  • 口腔诊所:上传项目介绍、术前术后说明、价格范围、常见问题,让客服机器人回答咨询
  • 房产中介:上传楼盘资料、户型图说明、交通配套、交易流程,生成房源问答助手
  • 教育培训:上传课程大纲、报名规则、作业说明、老师介绍,做课程顾问问答
  • 企业内训:上传 SOP、制度、产品文档,让员工用自然语言查资料

不适合干什么

  • 不适合只想做一个简单聊天窗口的人,Typebot 或 LibreChat 更轻
  • RAGFlow 对内存、磁盘、模型 API 和文档质量都有要求,部署比普通 CMS 重
  • 不要把医疗诊断、法律定论、投资建议完全交给机器人,行业包必须加免责声明和人工转接

普通人怎么用

  • 先上传几份有代表性的文档,测试基础问答效果
  • 问几个你知道标准答案的问题,检验回答是否准确、是否有依据
  • 文档量不大时可以先手动整理测试,验证流程通顺后再批量导入

进阶用户怎么用

  • 针对不同类型文档(表格、长文、多栏PDF)测试解析效果,必要时预处理成更适合检索的格式
  • 调整文档切分粒度和检索参数,找到准确率和响应速度的平衡点
  • 设计好"检索不到答案时如何回应"的策略,避免模型在没有依据的情况下编造

常见误区

  • 以为上传的文档越多效果越好,实际上文档质量和结构清晰度比数量更重要
  • 复杂格式的文档(扫描件、复杂表格)不做预处理直接导入,解析效果可能很差

和相似工具的区别

  • 和 Dify 比:RAGFlow 更偏深度文档解析和企业知识库;Dify 更偏应用编排和多模型工作流。
  • 和 AnythingLLM 比:RAGFlow 更适合复杂资料和可追溯问答;AnythingLLM 更轻、更适合个人或小团队。
  • 和 Qdrant 比:RAGFlow 是完整 RAG 应用;Qdrant 是底层向量数据库。

入门步骤

  • 按一键使用步骤部署
  • 上传测试文档
  • 用已知答案的问题验证问答准确率