说实话,你们觉得 RAG 真的好使吗?这种情况应该怎么优化?
尝试了使用 Langchain 和其他几种开源的方案搭建 RAG 系统,效果都感觉差强人意。比如我有一个关于消防安全的制度文档,我想检索发生消防安全事故时的处置流程,用了混合检索和 rerank ,还是会检索到其他跟消防安全事故相关,但不是处置流程的分片。即使是找到了最准确的分片,但是因为分片的前面部分还包含了是消防安全但不是处置流程的其他内容,到了 LLM 这里,LLM 全都一股脑的把分片里的所有内容都拼成答案输出出来了。
xiaohack博客专注前沿科技动态与实用技术干货分享,涵盖 AI 代理、大模型应用、编程工具、文档解析、SEO 实战、自动化部署等内容,提供开源项目教程、科技资讯日报、工具使用指南,助力开发者、AI 爱好者获取前沿技术与实战经验。
尝试了使用 Langchain 和其他几种开源的方案搭建 RAG 系统,效果都感觉差强人意。比如我有一个关于消防安全的制度文档,我想检索发生消防安全事故时的处置流程,用了混合检索和 rerank ,还是会检索到其他跟消防安全事故相关,但不是处置流程的分片。即使是找到了最准确的分片,但是因为分片的前面部分还包含了是消防安全但不是处置流程的其他内容,到了 LLM 这里,LLM 全都一股脑的把分片里的所有内容都拼成答案输出出来了。