可控开源社区

GitLink极速下载/hajimi

关注点赞复刻(Fork)

目录

Eric-Terminal

日志输出

9个月前777次提交

.githubUpdate main.yml1年前
app日志输出9个月前
hajimiUIDelete LoginView.vue9个月前
page去除了#296拉取的更改内容/新增了token统计功能9个月前
wikidocs: 添加Render部署文档10个月前
.envfeat: Enable AI thinking process via .env configuration9个月前
.gitattributes修复: ps1脚本的编码格式保证10个月前
.gitignorestyle: 使用 ruff 进行格式统一，并清洗了部分代码冗余10个月前
.python-versionSupport uv for package management1年前
Dockerfile修改教程1年前
LICENSE添加CC BY-NC 4.0许可证1年前
README.mdMerge branch 'main' of https://github.com/wyeeeee/hajimi10个月前
Windows双击这里运行.ps1修复: ps1脚本的编码格式保证10个月前
Windows备用脚本.bat修复bat启动脚本, 新增增强版ps脚本, 改进自动启动浏览器流程10个月前
Win中首先应当去使用_双击这里运行_来启动_除非你的系统过旧真的没有自带PowerShell修复bat启动脚本, 新增增强版ps脚本, 改进自动启动浏览器流程10个月前
env.ps10.1.61年前
pyproject.tomlstyle: 使用 ruff 进行格式统一，并清洗了部分代码冗余10个月前
requirements.txt快速模式适配1年前
update.md1.0.111个月前
uv.lockUpdate dependency and dockerfile1年前
version.txt更新版本号9个月前

🚀 HAJIMI Gemini API Proxy

这是一个基于 FastAPI 构建的 Gemini API 代理，旨在提供一个简单、安全且可配置的方式来访问 Google 的 Gemini 模型。适用于在 Hugging Face Spaces 上部署，并支持openai api格式的工具集成。

项目采用动态更新，随时会有一些小更新同步到主仓库且会自动构建镜像，如果反馈的bug开发者说修了但是版本号没变是正常现象，记得勤更新镜像哦

错误自查

遇到问题请先查看以下的 错误自查 文档，确保已尝试按照其上的指示进行了相应的排查与处理。

错误自查

使用文档

Claw Cloud部署的使用文档（免费，手机电脑均可使用）感谢@IDeposit编写
huggingface 部署的使用文档（免费，手机电脑均可使用）
termux部署的使用文档（手机使用）感谢 @天命不又编写
Render 部署的使用文档 (免费，手机电脑均可使用，但可能需要绑信用卡) 感谢 @LSR 编写
windows 本地部署的使用文档
vertex模式的使用文档
~~zeabur部署的使用文档(需付费) 感谢墨舞ink编写~~（已过时且暂时无人更新，欢迎提交pull requests）

更新日志

v1.0.2
- 修复 400 错误
v1.0.1
- 新增清除失效密钥功能
- 新增输出有效秘钥功能

✨ 主要功能：

🔑 API 密钥轮询和管理

📑 模型列表接口

💬 聊天补全接口：

提供 /v1/chat/completions 接口，支持流式和非流式响应，支持函数调用，与 OpenAI API 格式兼容。
支持的输入内容: 文本、文件、图像
自动将 OpenAI 格式的请求转换为 Gemini 格式。

🔒 密码保护（可选）：

通过 PASSWORD 环境变量设置密码。
提供默认密码 "123"。

🧩 服务兼容

提供的接口与 OpenAI API 格式兼容,便于接入各种服务

⚙️ 功能配置

方式 1 : 通过网页前端进行配置
方式 2 : 根据配置文档中的注释说明，修改对应的变量

⚠️ 注意事项：

强烈建议在生产环境中设置 PASSWORD 环境变量，并使用强密码。
根据你的使用情况调整速率限制相关的环境变量。
确保你的 Gemini API 密钥具有足够的配额。

💡 特色功能：

🎭 假流式传输

作用： 解决部分网络环境下客户端通过非流式请求 Gemini 时可能遇到的断连问题。默认开启。
原理简述： 当客户端请求流式响应时，本代理会每隔一段时间向客户端发出一个空信息以维持连接，同时在后台向 Gemini 发起一个完整的、非流式的请求。等 Gemini 返回完整响应后，再一次性将响应发回给客户端。
注意： 如果想使用真的流式请求，请关闭该功能

⚡ 并发与缓存

作用： 允许您为用户的单次提问同时向 Gemini 发送多个请求，并将额外的成功响应缓存起来，用于后续重新生成回复。
注意： 此功能默认关闭 。只有当您将并发数设置为 2 或以上时，缓存才会生效。缓存匹配要求提问的上下文与被缓存的问题完全一致（包括标点符号）。此外，该模式目前仅支持非流式及假流式传输

Q: 新版本增加的并发缓存功能会增加 gemini 配额的使用量吗？

A: 不会。因为默认情况下该功能是关闭的。只有当你主动将并发数 CONCURRENT_REQUESTS 设置为大于 1 的数值时，才会实际发起并发请求，这才会消耗更多配额。

Q: 如何使用并发缓存功能？

A: 修改并发请求数，使其等于你想在一次用户提问中同时向 Gemini 发送的请求数量（例如设置为 3）。

这样设置后，如果一次并发请求中收到了多个成功的响应，除了第一个返回给用户外，其他的就会被缓存起来。

🎭 伪装信息

作用： 在发送给 Gemini 的消息中添加一段随机生成的、无意义的字符串，用于”伪装”请求，可能有助于防止被识别为自动化程序。默认开启。
注意： 如果使用非 SillyTavern 的其余客户端 (例如 cherryStudio )，请关闭该功能

🌐 联网模式

作用： 让 Gemini 模型能够利用搜索工具进行联网搜索，以回答需要最新信息或超出其知识库范围的问题。
如何使用：

在客户端请求时，选择模型名称带有 -search 后缀的模型（例如 gemini-2.5-pro-search，具体可用模型请通过 /v1/models 接口查询）。

🚦 速率限制和防滥用：

通过环境变量自定义限制：
- MAX_REQUESTS_PER_MINUTE：每分钟最大请求数（默认 30）。
- MAX_REQUESTS_PER_DAY_PER_IP：每天每个 IP 最大请求数（默认 600）。
超过速率限制时返回 429 错误。

📡 API 接口说明

模型列表接口

GET /v1/models - 获取可用模型列表
GET /models - 获取可用模型列表（兼容旧版本）

聊天补全接口

POST /v1/chat/completions - 聊天补全接口，支持流式和非流式响应
POST /chat/completions - 聊天补全接口（兼容旧版本）

Vertex 模式接口

GET /vertex/models - 获取 Vertex 模型列表
POST /vertex/chat/completions - Vertex 聊天补全接口

AI Studio 模式接口

GET /aistudio/models - 获取 AI Studio 模型列表
POST /aistudio/chat/completions - AI Studio 聊天补全接口

⚙️ 配置选项

项目支持多种配置方式，可以通过环境变量进行配置：

基础配置

PASSWORD - API访问密码，默认为”123”
WEB_PASSWORD - 网页配置密码，默认与PASSWORD相同
GEMINI_API_KEYS - Gemini API密钥，多个密钥用逗号分隔
FAKE_STREAMING - 是否启用假流式传输，默认为true
STORAGE_DIR - 配置持久化存储目录
ENABLE_STORAGE - 是否启用配置持久化存储，默认为false

并发与缓存配置

CONCURRENT_REQUESTS - 并发请求数，默认为1
INCREASE_CONCURRENT_ON_FAILURE - 失败时增加的并发数，默认为0
MAX_CONCURRENT_REQUESTS - 最大并发请求数，默认为3
CACHE_EXPIRY_TIME - 缓存过期时间（秒），默认为21600（6小时）
MAX_CACHE_ENTRIES - 最大缓存条目数，默认为500
CALCULATE_CACHE_ENTRIES - 计算缓存键时使用的消息数量，默认为6
PRECISE_CACHE - 是否使用精确缓存，默认为false

Vertex AI 配置

ENABLE_VERTEX - 是否启用Vertex AI，默认为false
GOOGLE_CREDENTIALS_JSON - Google凭证JSON
ENABLE_VERTEX_EXPRESS - 是否启用Vertex Express模式，默认为false
VERTEX_EXPRESS_API_KEY - Vertex Express API密钥

联网搜索配置

SEARCH_MODE - 是否启用联网搜索模式，默认为false
SEARCH_PROMPT - 联网搜索提示语

安全配置

RANDOM_STRING - 是否启用随机字符串伪装，默认为true
RANDOM_STRING_LENGTH - 随机字符串长度，默认为5
MAX_EMPTY_RESPONSES - 最大空响应重试次数，默认为5

速率限制配置

MAX_RETRY_NUM - 请求时的最大总轮询key数，默认为15
MAX_REQUESTS_PER_MINUTE - 每分钟最大请求数，默认为30
MAX_REQUESTS_PER_DAY_PER_IP - 每天每个IP最大请求数，默认为600
API_KEY_DAILY_LIMIT - 每个API密钥每天使用限制，默认为100

模型过滤配置

BLOCKED_MODELS - 屏蔽的模型列表，用逗号分隔
WHITELIST_MODELS - 白名单模型列表，用逗号分隔
WHITELIST_USER_AGENT - 白名单User-Agent列表，用逗号分隔

其他配置

PUBLIC_MODE - 公益站模式，默认为false
DASHBOARD_URL - 前端地址
ALLOWED_ORIGINS - 允许的跨域源列表，用逗号分隔

🚀 部署方式

Hugging Face Spaces 部署

Fork本项目到你的GitHub账户
在GitHub Actions中构建Docker镜像
在Hugging Face Spaces中创建新的Docker空间
配置环境变量（PASSWORD和GEMINI_API_KEYS为必需）
部署并访问前端界面

Claw Cloud 部署

注册Claw Cloud账户
登录Claw Cloud控制台
进入APP Launchpad并创建新应用
使用镜像地址 ghcr.io/wyeeeee/hajimi:latest
配置环境变量
部署应用并获取访问地址

Vertex AI 部署

在Google Cloud Platform中创建服务账户
获取服务账户的JSON凭证文件
在项目中启用Vertex AI API
配置环境变量 ENABLE_VERTEX=true 和 GOOGLE_CREDENTIALS_JSON
部署应用

本地部署

克隆项目代码
安装依赖：pip install -r requirements.txt
配置环境变量
运行应用：uvicorn app.main:app --host 0.0.0.0 --port 7860

📚 更多文档

配置文档 - 详细的配置选项说明
错误自查 - 常见问题和解决方案
Hugging Face部署指南 - 详细的Hugging Face部署教程
Claw Cloud部署指南 - 详细的Claw Cloud部署教程
Vertex模式指南 - Vertex AI配置和使用指南

关于

javascript python vue

21.8 MB

邀请码

Gitlink（确实开源）

加入我们
官网邮箱：gitlink@ccf.org.cn

QQ群

QQ群

公众号

公众号

版权所有：中国计算机学会技术支持：开源发展技术委员会
京ICP备13000930号-9 京公网安备 11010802047560号