Refa: HTTP API update dataset / test cases / docs (#7564)
What problem does this PR solve?
This PR introduces Pydantic-based validation for the update dataset HTTP API, improving code clarity and robustness. Key changes include:
- Pydantic Validation
- Error Handling
- Test Updates
- Documentation Updates
- fix bug: #5915
Type of change
- Bug Fix (non-breaking change which fixes an issue)
- Documentation Update
- Refactoring
English | 简体中文 | 繁体中文 | 日本語 | 한국어 | Bahasa Indonesia | Português (Brasil)
Document | Roadmap | Twitter | Discord | Demo
💡 RAGFlow 是什么?
RAGFlow 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。
🎮 Demo 试用
请登录网址 https://demo.ragflow.io 试用 demo。
🔥 近期更新
🎉 关注项目
⭐️ 点击右上角的 Star 关注 RAGFlow,可以获取最新发布的实时通知 !🌟
🌟 主要功能
🍭 “Quality in, quality out”
🍱 基于模板的文本切片
🌱 有理有据、最大程度降低幻觉(hallucination)
🍔 兼容各类异构数据源
🛀 全程无忧、自动化的 RAG 工作流
🔎 系统架构
🎬 快速开始
📝 前提条件
🚀 启动服务器
确保
vm.max_map_count
不小于 262144:克隆仓库:
进入 docker 文件夹,利用提前编译好的 Docker 镜像启动服务器:
服务器启动成功后再次确认服务器状态:
出现以下界面提示说明服务器启动成功:
在你的浏览器中输入你的服务器对应的 IP 地址并登录 RAGFlow。
在 service_conf.yaml.template 文件的
user_default_llm
栏配置 LLM factory,并在API_KEY
栏填写和你选择的大模型相对应的 API key。好戏开始,接着奏乐接着舞!
🔧 系统配置
系统配置涉及以下三份文件:
SVR_HTTP_PORT
、MYSQL_PASSWORD
、MINIO_PASSWORD
等。请务必确保 .env 文件中的变量设置与 service_conf.yaml.template 文件中的配置保持一致!
如果不能访问镜像站点 hub.docker.com 或者模型站点 huggingface.co,请按照 .env 注释修改
RAGFLOW_IMAGE
和HF_ENDPOINT
。如需更新默认的 HTTP 服务端口(80), 可以在 docker-compose.yml 文件中将配置
80:80
改为<YOUR_SERVING_PORT>:80
。把文档引擎从 Elasticsearch 切换成为 Infinity
RAGFlow 默认使用 Elasticsearch 存储文本和向量数据. 如果要切换为 Infinity, 可以按照下面步骤进行:
停止所有容器运行:
Note:
-v
将会删除 docker 容器的 volumes,已有的数据会被清空。设置 docker/.env 目录中的
DOC_ENGINE
为infinity
.启动容器:
🔧 源码编译 Docker 镜像(不含 embedding 模型)
本 Docker 镜像大小约 2 GB 左右并且依赖外部的大模型和 embedding 服务。
🔧 源码编译 Docker 镜像(包含 embedding 模型)
本 Docker 大小约 9 GB 左右。由于已包含 embedding 模型,所以只需依赖外部的大模型服务即可。
🔨 以源代码启动服务
安装 uv。如已经安装,可跳过本步骤:
下载源代码并安装 Python 依赖:
通过 Docker Compose 启动依赖的服务(MinIO, Elasticsearch, Redis, and MySQL):
在
/etc/hosts
中添加以下代码,目的是将 conf/service_conf.yaml 文件中的所有 host 地址都解析为127.0.0.1
:如果无法访问 HuggingFace,可以把环境变量
HF_ENDPOINT
设成相应的镜像站点:启动后端服务:
安装前端依赖:
启动前端服务:
以下界面说明系统已经成功启动:
开发完成后停止 RAGFlow 服务 停止 RAGFlow 前端和后端服务:
📚 技术文档
📜 路线图
详见 RAGFlow Roadmap 2025 。
🏄 开源社区
🙌 贡献指南
RAGFlow 只有通过开源协作才能蓬勃发展。秉持这一精神,我们欢迎来自社区的各种贡献。如果您有意参与其中,请查阅我们的 贡献者指南 。
🤝 商务合作
👥 加入社区
扫二维码添加 RAGFlow 小助手,进 RAGFlow 交流群。