MakeFilm - AI 驱动的视频创作工作流

MakeFilm 是一个基于 AI 的自动化视频创作系统，实现从视频/音频到故事会风格原创视频的完整转换。

🆕 最新更新 (2026-05-03)

📊 项目总结

MakeFilm 项目是一个完整的 AI 驱动视频创作工作流，目前已实现从视频下载、语音转录、AI 故事创作到分镜生成的全流程自动化。

项目核心成果：

✅ 完整工作流实现：从视频/音频输入到故事板输出的端到端自动化
✅ AI 内容创作：集成 DeepSeek 进行故事创作、剧本改编和分镜生成
✅ 视觉资产工作流：V5 版本引入角色形象预生成、场景氛围预生成
✅ MECE 项目结构：采用相互独立、完全穷尽的原则组织代码和文档
✅ 多版本迭代：从 V1 到 V5 持续优化，支持 104+ 场景、14+ 分钟视频生成

技术栈：

Node.js 18+ (核心工作流)
Python 3.8+ (Whisper 语音转录)
DeepSeek AI (内容生成)
Google Vids/Veo 3.1 (视频生成)

📹 已生成视频示例

本项目已成功生成以下两段视频（均添加了 Dissolve 转场效果）：

视频	内容	文件
第一段	镜头 01-10（带转场）	`1、女方的套路比较老旧，男生这个新套路大01-10个镜头(加转场).mp4`
第二段	镜头 11-20（带转场）	`1、女方的套路比较老旧，男生这个新套路大11-20个镜头(加转场).mp4`

💡 提示：以上视频是通过 Google Vids 生成，并添加了 Dissolve（溶解）转场效果，确保镜头之间过渡平滑自然。

视觉资产驱动的视频制作工作流（V5 全新升级）

我们已从直接视频生成升级为视觉资产先行的工作流，确保角色一致性和视觉质量。

核心改进：

✅ 角色形象预生成：使用 Google Vids Image 生成标准角色形象
✅ 场景氛围预生成：先生成场景氛围参考图，确保风格统一
✅ 道具图像预生成：为关键道具生成参考图像
✅ 人物一致性：基于预生成图片，确保所有视频镜头人物一致
✅ 中文文字保证：所有画面文字均为中文
✅ 中国人物特征：所有角色均为中国面孔

工作流程四步走：

生成角色形象图片 → 使用 Google Vids “Generate an image” 为每个角色生成标准形象
生成场景氛围图片 → 为关键场景生成氛围参考图
生成道具参考图片 → 为重要道具生成参考图像
基于图片生成视频 → 使用 Veo 3.1 生成视频，通过 Ingredients 上传角色图片作为参考

⚠️ 重要提示：Google Vids 必须使用中文普通话对白

所有对白必须使用中文普通话
严禁参杂英文或其他语言
确保语音合成和字幕都是标准中文
所有画面中的文字必须是中文

备选方案（如遇网络限制）：

方案 2：图片保存到本地 → 通过本地上传方式使用
方案 3：在视频提示词中嵌入详细角色特征描述 → 生成视频
详见故障排除部分的 “网络限制解决方案”

🎮 项目玩法（快速上手）

玩法一：视觉资产驱动的完整工作流（推荐 V5）

适用场景：制作高质量短片，确保角色一致性和视觉统一

# 1. 启动自动桥接（监控 Kedou 下载）
node src/core/kedou_bridge.js

# 2. 在 Kedou 中设置下载目录为: D:\MakeFilm\downloads
# 3. 在 Kedou 中粘贴视频链接下载
# 4. 自动检测 → 自动转录 → 自动创作 → 自动生成分镜

# 5. 在 Google Vids 中执行三步走：
#    Step 1: 生成角色形象图片（使用 Generate an image）
#    Step 2: 生成场景氛围图片（使用 Generate an image）
#    Step 3: 基于图片生成视频（使用 Veo 3.1 + Ingredients）

流程：下载视频 → 提取音频 → 语音转录 → AI创作故事 → 生成剧本 → 制作分镜 → 生成角色图片 → 生成场景图片 → 基于图片生成视频

视觉资产文件位置：

output/<项目>/storyboard/visual_assets_description.json - 角色和场景视觉描述
output/<项目>/reference/characters/ - 生成的角色形象图片
output/<项目>/reference/scenes/ - 生成的场景氛围图片

目录说明：

D:\MakeFilm\downloads - Kedou 下载目录（需在 Kedou 中设置）
D:\MakeFilm\input - 自动处理的输入目录
projects/output/<项目>/ - 生成的故事、剧本、分镜等输出

玩法二：半自动精细创作

适用场景：有特定创意需求，需要人工干预调整

# 1. 准备素材
node src/core/project_manager.js create 我的项目
# 将视频放入 input/我的项目/video/

# 2. 分段处理（可在任意阶段人工调整）
node src/core/process_project.js 我的项目 --from=transcription  # 只转录
node src/core/process_project.js 我的项目 --from=story          # 从故事开始
node src/core/process_project.js 我的项目 --from=script         # 从剧本开始
node src/core/process_project.js 我的项目 --from=storyboard     # 从分镜开始

# 3. 人工调整（在 output/我的项目/ 中编辑）
# 4. 最后生成视频

玩法三：故事板增强模式

适用场景：已有基础故事板，需要扩展为更丰富的分镜

# 将现有项目的故事板放入对应目录
# 运行故事板生成器（默认使用V4增强版）
node src/workflow/storyboard/generate_storyboard.js 我的项目

# 自动将 24 场景扩展为 104 场景
# 总时长从 2 分钟扩展到 14+ 分钟
# 充分利用 Google Vids 30 分钟免费额度

V4增强版优势：

场景数量：24 → 104（+333%）
总时长：2分钟 → 14+分钟（+600%）
情感层次：增加”压抑→爆发→余波”三层递进
过渡场景：自动添加平滑转场

玩法四：纯创作模式（无源视频）

适用场景：直接创作原创故事，不基于现有视频

# 1. 创建项目
node src/core/project_manager.js create 原创故事

# 2. 在 projects/input/原创故事/ 中创建 story.txt
# 直接写入你的故事

# 3. 从故事阶段开始处理
node src/core/process_project.js 原创故事 --from=story

📁 项目结构详解

🏗️ MECE 分类原则

MECE: Mutually Exclusive, Collectively Exhaustive
相互独立，完全穷尽

每个目录都有明确单一的职责，不重叠、不遗漏。

MakeFilm/
├── src/                        # 📝 源代码（功能模块）
├── projects/                   # 📂 项目数据（输入/输出/归档）
├── docs/                       # 📚 文档（指南/规范/架构）
├── skills/                     # 🎯 TRAE Skill定义
├── config/                     # ⚙️ 配置文件
├── tests/                      # 🧪 测试（单元/集成/数据）
├── temp/                       # 🗑️ 临时文件（缓存/日志/下载）
└── input/                      # 📥 现有项目数据（保留兼容）

📝 src/ - 源代码目录

作用：存放所有可执行代码，按功能模块划分

src/
├── core/                       # 🎯 核心模块 - 系统入口和主流程
│   ├── project_manager.js      # 项目管理器：创建、查看、管理项目
│   ├── process_project.js      # 项目处理器：执行完整工作流
│   ├── kedou_bridge.js         # Kedou桥接：自动监控下载目录
│   ├── watch_input.js          # 输入监控：监控input目录变化
│   └── downloads_watcher.js    # 下载监控：监控下载进度
│
├── ai-services/                # 🤖 AI服务层 - 所有AI相关服务
│   ├── deepseek/               # DeepSeek文本生成服务
│   │   ├── chat.js             # 聊天接口
│   │   ├── story_creator.js    # 故事创作
│   │   ├── script_adapter.js   # 剧本改编
│   │   └── storyboard_generator.js  # 分镜生成
│   │
│   └── google-vids/            # Google Vids视频生成服务
│       ├── google_vids_generator.js         # 视频生成器
│       ├── google_vids_multi_scene_generator.js  # 多场景生成
│       ├── batch_add_scenes.js              # 批量添加场景
│       └── generate_remaining_scenes.js     # 生成剩余场景
│
├── workflow/                   # 🔄 工作流编排 - 业务流程
│   ├── transcription/          # 🎤 转录流程
│   │   ├── video_transcription.js      # 视频转录主程序
│   │   ├── extract_and_transcribe.py   # 提取并转录
│   │   ├── transcribe_fast.py          # 快速转录
│   │   └── transcribe_with_python.py   # Python转录
│   │
│   ├── story-creation/         # ✍️ 故事创作流程
│   │   ├── story_creator.js            # 故事创作（主版本）
│   │   ├── story_creator_api.js        # API版本
│   │   ├── story_creator_pw.js         # Playwright版本
│   │   ├── script_adapter.js           # 剧本改编（主版本）
│   │   ├── script_adapter_v2.js        # 版本2
│   │   └── script_adapter_v3.js        # 版本3
│   │
│   ├── storyboard/             # 🎬 分镜流程
│   │   ├── storyboard_generator.js      # 分镜生成（旧版）
│   │   ├── storyboard_generator_v2.js   # 版本2
│   │   ├── storyboard_generator_v3.js   # 版本3
│   │   ├── storyboard_generator_v4.js   # 版本4（推荐）
│   │   ├── generate_enhanced_storyboard.js  # 增强版生成器
│   │   ├── convert_storyboard_to_json.js    # 转换为JSON
│   │   ├── fix_storyboard.js                # 修复分镜
│   │   └── test_storyboard.js               # 测试分镜
│   │
│   └── video-production/       # 🎥 视频制作流程
│       ├── video_producer.js    # 视频制作主程序
│       └── deepseek_bridge.js   # DeepSeek桥接
│
├── utils/                      # 🛠️ 工具函数 - 通用工具
│   ├── fix_json.js             # 修复JSON
│   ├── fix_json.py             # Python版JSON修复
│   ├── fix_json_quotes.js      # 修复JSON引号
│   ├── check_chars.js          # 字符检查
│   └── check_line6.js          # 检查第6行
│
└── adapters/                   # 🔌 适配器层 - 外部系统适配
    ├── config.js               # 配置适配
    └── trae-browser/           # TRAE浏览器适配
        └── README.md

使用方式：

# 核心命令
node src/core/project_manager.js create <项目名>
node src/core/process_project.js <项目名>

# 工作流命令
node src/workflow/transcription/video_transcription.js <项目名>
node src/workflow/story-creation/story_creator.js <项目名>
node src/workflow/storyboard/generate_enhanced_storyboard.js

📂 input/ & output/ - 项目数据目录

作用：存放所有项目相关数据，按输入/输出划分

input/                          # 📥 输入数据 - 原始输入
└── <项目名称>/
    ├── video/                  # 视频文件 (.mp4, .mov)
    ├── audio/                  # 音频文件 (.wav, .mp3)
    ├── raw/                    # 原始素材
    └── story.txt               # 可选：直接提供故事

output/                         # 📤 输出数据 - 生成结果
└── <项目名称>/
    ├── transcript/             # 转录输出
    │   └── *_transcript.txt
    ├── story/                  # 故事输出
    │   └── story_*.txt
    ├── script/                 # 剧本输出
    │   └── script_*.txt
    ├── storyboard/             # 分镜输出
    │   ├── storyboard_*.json
    │   └── storyboard_*_enhanced_v4.json
    ├── reference/              # 参考图片
    └── videos/                 # 生成的视频片段

数据流向：

input/  →  src/workflow/  →  output/
(原始数据)  (处理流程)     (生成结果)

📚 docs/ - 文档目录

作用：存放所有项目文档，按类型划分

docs/
├── guides/                     # 📖 使用指南
│   ├── README.md               # 主文档（本文件）
│   └── 项目文档.md             # 中文项目文档
│
├── specs/                      # 📋 规范文档
│   └── (API规范、接口文档等)
│
└── architecture/               # 🏛️ 架构文档
    ├── kedou-MakeFilm联动工作认知.md
    ├── 项目文件MECE分类.md
    └── 文件夹结构说明.md

🎯 skills/ - TRAE Skill 目录

作用：存放 TRAE Skill 定义文件

skills/
├── google-vids/                # Google Vids Skill
│   └── SKILL.md                # 详细工作流文档
│
└── deepseek/                   # DeepSeek Skill
    ├── SKILL.md
    └── README.md

Skill 作用：

定义 TRAE Agent 如何调用特定功能
包含详细的工作流程和最佳实践
提供故障排除指南

⚙️ config/ - 配置目录

作用：存放所有配置文件，按用途划分

config/
├── app/                        # 📱 应用配置
│   ├── package.json            # Node.js 依赖
│   ├── package-lock.json       # 锁定依赖版本
│   └── .gitignore              # Git忽略规则
│
├── env/                        # 🌍 环境配置
│   └── doubao_auth.json        # 豆包认证信息（如需要）
│
└── state/                      # 📊 状态文件
    ├── .kedou_bridge_state.json    # Kedou桥接状态
    └── .watch_state.json           # 监控状态

🧪 tests/ - 测试目录

作用：存放所有测试相关文件

tests/
├── unit/                       # 🔬 单元测试
│   └── test_main.js
│
├── integration/                # 🔗 集成测试
│   └── (流程测试)
│
└── fixtures/                   # 📦 测试数据
    └── videos/
        └── (测试视频文件)

🗑️ temp/ - 临时文件目录

作用：存放临时文件，可随时清理

temp/
├── cache/                      # 💾 缓存文件
├── logs/                       # 📋 日志文件
└── downloads/                  # ⬇️ 下载缓存

🔄 完整工作流程

┌─────────────────────────────────────────────────────────────────────────┐
│                         MakeFilm 完整工作流程                            │
├─────────────────────────────────────────────────────────────────────────┤
│                                                                         │
│  阶段1: 获取素材                                                         │
│  ┌─────────────┐    ┌─────────────┐    ┌─────────────┐                 │
│  │ Kedou下载   │ →  │ 视频文件    │ →  │ 放入input/  │                 │
│  │ 抖音/快手   │    │ .mp4        │    │ 目录        │                 │
│  └─────────────┘    └─────────────┘    └─────────────┘                 │
│                                                                         │
│  阶段2: 语音转录                                                         │
│  ┌─────────────┐    ┌─────────────┐    ┌─────────────┐                 │
│  │ 提取音频    │ →  │ Whisper     │ →  │ 生成逐字稿  │                 │
│  │ .wav        │    │ 语音识别    │    │ .txt        │                 │
│  └─────────────┘    └─────────────┘    └─────────────┘                 │
│       ↓                                                                 │
│  projects/output/<项目>/transcript/                                     │
│                                                                         │
│  阶段3: AI内容创作                                                       │
│  ┌─────────────┐    ┌─────────────┐    ┌─────────────┐                 │
│  │ DeepSeek    │ →  │ DeepSeek    │ →  │ DeepSeek    │                 │
│  │ 故事创作    │    │ 剧本改编    │    │ 分镜生成    │                 │
│  │ story.txt   │    │ script.txt  │    │ storyboard  │                 │
│  └─────────────┘    └─────────────┘    └─────────────┘                 │
│       ↓              ↓              ↓                                   │
│  projects/output/<项目>/story/                                          │
│  projects/output/<项目>/script/                                         │
│  projects/output/<项目>/storyboard/                                     │
│                                                                         │
│  阶段4: 视频制作（人工操作）                                              │
│  ┌─────────────┐    ┌─────────────┐    ┌─────────────┐                 │
│  │ Google Vids │ →  │ 生成场景    │ →  │ 导出视频    │                 │
│  │ 登录账号    │    │ 添加转场    │    │ .mp4        │                 │
│  └─────────────┘    └─────────────┘    └─────────────┘                 │
│       ↑                                                                 │
│  必须在TRAE内置浏览器中操作                                               │
│                                                                         │
└─────────────────────────────────────────────────────────────────────────┘

🛠️ 核心命令详解

项目管理

# 创建新项目
node src/core/project_manager.js create <项目名>

# 查看项目状态
node src/core/project_manager.js status <项目名>

# 列出所有项目
node src/core/project_manager.js list

项目处理

# 完整处理（从转录到分镜）
node src/core/process_project.js <项目名>

# 从指定阶段开始
node src/core/process_project.js <项目名> --from=transcription
node src/core/process_project.js <项目名> --from=story
node src/core/process_project.js <项目名> --from=script
node src/core/process_project.js <项目名> --from=storyboard

# 预览模式（不实际执行）
node src/core/process_project.js <项目名> --dry-run

自动监控

# 监控 Kedou 下载目录（推荐）
node src/core/kedou_bridge.js

# 只运行一次
node src/core/kedou_bridge.js --once

# 监控 input 目录
node src/core/watch_input.js

Kedou 配置说明：

打开 Kedou 设置
设置下载目录为：D:\MakeFilm\downloads
粘贴视频链接开始下载
桥接脚本会自动检测并处理

故事板生成（默认V4增强版）

# 生成故事板（默认使用V4增强版，104场景，14+分钟）
node src/workflow/storyboard/generate_storyboard.js [项目名]

# 示例
node src/workflow/storyboard/generate_storyboard.js 我的项目

# 如需使用旧版本（不推荐）
node src/workflow/storyboard/generate_storyboard.js 我的项目 --version=v1

默认V4增强版特性：

✅ 约 104 个场景（vs 旧版24场景）
✅ 总时长 14+ 分钟（vs 旧版2分钟）
✅ 充分利用 Google Vids 30 分钟免费额度
✅ 更丰富的情感细节和过渡场景

🎬 Google Vids 视觉资产驱动制作详解

前期准备

确保已登录 Google Vids
- 在 TRAE 内置浏览器中访问 https://docs.google.com/videos
- 如未登录，完成登录后告知我
新建项目并命名
- 点击 “New video” 创建新项目
- 使用项目名重命名（点击顶部 “Untitled video”）
准备故事板和视觉资产描述
- 查看项目故事板：output/<项目>/storyboard/
- 查看视觉资产描述：output/<项目>/storyboard/visual_assets_description.json
- 确认角色列表和场景数量

第一步：生成角色形象图片

目的：为每个主要角色生成标准形象，确保视频生成时人物一致性

操作流程：

打开 Image 生成面板
- 在右侧边栏点击 “Generate an image”
- 或使用快捷键

生成小美形象

Prompt: Professional character portrait of a 22-year-old Chinese woman named Xiaomei, fair skin, shoulder-length black straight hair, oval face, big almond eyes with slight sadness, wearing white t-shirt, clean and innocent look, Chinese facial features, realistic style, soft natural lighting, neutral background, high quality, 8k

Aspect ratio: Portrait (推荐)
Style: No style (realistic)
点击 “Create” 生成
下载保存到 output/<项目>/reference/characters/xiaomei_portrait.png

生成阿杰形象

Prompt: Professional character portrait of a 23-year-old Chinese man named A Jie, sharp facial features, narrow scanning eyes, short black hair styled up with gel, slight stubble, wearing black t-shirt, confident but anxious expression, Chinese male features, realistic style, dramatic lighting, neutral background

保存到 output/<项目>/reference/characters/ajie_portrait.png

生成刘哥形象

Prompt: Professional character portrait of a 28-year-old Chinese man named Liu Ge, round face, small cunning eyes, wearing colorful floral Hawaiian shirt, thick gold chain necklace, sleazy confident smile, Chinese male features, realistic style, warm lighting, neutral background

保存到 output/<项目>/reference/characters/liuge_portrait.png

生成龙哥形象

Prompt: Professional character portrait of a 30-year-old Chinese man named Long Ge, completely shaved bald head, square jaw, fierce piercing eyes, muscular build, wearing black tank top, intimidating expression, Chinese tough guy features, realistic style, dramatic lighting, neutral background

保存到 output/<项目>/reference/characters/longge_portrait.png

生成王律师形象

Prompt: Professional character portrait of a 40-year-old Chinese man, Lawyer Wang, gold-rimmed glasses, neat black hair with grey temples, intelligent eyes, wearing dark suit and tie, professional trustworthy expression, Chinese mature professional, realistic style, office lighting, neutral background

保存到 output/<项目>/reference/characters/wang_lawyer_portrait.png

关键要点：

所有角色必须是中国面孔（Chinese facial features）
使用统一的 realistic style
保存所有生成的图片到 reference 目录
这些图片将作为视频生成的参考

第二步：生成场景氛围图片

目的：为关键场景生成氛围参考图，确保场景风格统一

操作流程：

生成出租屋场景（日）

Prompt: A cramped Chinese urban village apartment interior, single room, 15 sqm, afternoon sunlight through small window, worn-out furniture, old desk with laptop, stack of resumes, faded Chinese sticker '逢考必过' on peeling wall, old air conditioner, melancholic atmosphere, realistic cinematic style, warm but dim lighting, desaturated colors

保存到 output/<项目>/reference/scenes/apartment_day.png

生成酒吧场景

Prompt: Crowded Chinese bar interior at night, flashing strobe lights, colorful spotlights, bar counter with bottles, booth seats, dancing crowd, smoke haze, vibrant purple blue pink colors, energetic atmosphere, realistic cinematic style, dynamic lighting

保存到 output/<项目>/reference/scenes/bar_interior.png

生成酒店房间场景

Prompt: Chinese budget hotel room at night, standard double room, double bed with white sheets, bedside lamps with warm lighting, simple furniture, TV on wall, clean but sterile, intimate atmosphere, realistic cinematic style, soft warm lighting

保存到 output/<项目>/reference/scenes/hotel_room.png

生成酒店走廊场景

Prompt: Chinese hotel corridor at night, long hallway with doors on both sides, harsh fluorescent lighting, emergency exit signs with Chinese characters, two groups facing each other in standoff, cold blue-white lighting, tense atmosphere, realistic cinematic style

保存到 output/<项目>/reference/scenes/hotel_corridor.png

生成派出所场景

Prompt: Chinese police station interrogation room, plain walls, metal table and chairs, one-way mirror, harsh fluorescent lighting, official atmosphere, Chinese police signs on wall, realistic cinematic style, cold white grey colors

保存到 output/<项目>/reference/scenes/police_station.png

生成咖啡厅场景

Prompt: Cozy Chinese coffee shop interior, warm natural daylight through large windows, wooden furniture, indoor plants, coffee cups on table, warm golden brown tones, hopeful romantic atmosphere, realistic cinematic style, soft lighting

保存到 output/<项目>/reference/scenes/coffee_shop.png

第三步：生成道具参考图片

目的：为关键道具生成参考图像，确保视频中的道具一致性

操作流程：

识别关键道具
- 查看故事板中的关键道具列表
- 优先生成：手机、文件、武器、食物等关键道具

生成道具图片

使用 “Generate an image” 功能

示例提示词：

A modern Chinese smartphone, black color, large screen, 
realistic product photography, neutral background, high quality

保存道具图片
- 保存到 output/<项目>/reference/props/
- 命名规范：prop_[道具名].png

第四步：基于图片生成视频（首选方案）

目的：使用 Veo 3.1 生成视频，通过 Ingredients 上传角色图片确保人物一致性

首选方案（推荐）：

创建新场景
- 点击 “New scene” 或按 Ctrl+M
- 场景会自动添加到时间线
打开 Veo 视频生成
- 点击 “Generate an AI video clip”
- 在右侧边栏选择 “Veo 3.1”
添加角色参考图片（关键步骤）
- 在提示词输入框下方，点击 “Ingredients” 按钮
- Ingredients 允许上传最多3张本地图片作为参考
- 点击 “Upload” 或从 “Drive and Photos” 选择本地图片
- 推荐组合：
  - 单人场景：角色肖像 + 场景氛围 + 关键道具
  - 双人场景：角色A肖像 + 角色B肖像 + 场景氛围
- 例如：场景1有小美，上传 xiaomei_portrait.png + apartment_day.png + smartphone.png

输入视频生成提示词

STYLE: Cinematic documentary style, realistic and grounded. 
Shot on 35mm film with natural lighting. 
Color palette: muted earth tones, desaturated blues, warm autumn hues. 
Lighting: soft natural light, atmospheric. 
Mood: somber, contemplative, emotionally resonant. 
Camera work: steady shots, shallow depth of field. 
Setting: [具体场景描述]

SCENE: [场景视觉描述，包含镜头角度和运镜]

CHARACTER: [角色名] - [外貌描述，参考上传的图片]

DIALOGUE: [中文普通话对白，严禁参杂其他语言]

Duration: [X] seconds

生成并插入视频
- 点击 “Generate” 按钮
- 等待 30-90 秒生成
- 预览确认无误后点击 “Insert”
- 视频会自动插入到当前场景
重复生成所有场景
- 为每个镜头重复步骤 1-5
- 确保每个场景都上传对应的角色图片
- 保持风格一致性

关键要点：

必须上传角色图片：确保人物一致性
必须使用中文对白：严禁参杂英文
参考场景氛围图：保持色调和光线统一
逐个场景生成：不要批量处理，确保质量

场景生成流程

对于每个场景：

添加场景
- 点击 “New scene” 或按 Ctrl+M
生成视频
- 点击 “Generate an AI video clip”
- 输入提示词（必须使用中文普通话）：

STYLE: Cinematic documentary style, realistic and grounded. 
Shot on 35mm film with natural lighting. 
Color palette: muted earth tones, desaturated blues, warm autumn hues. 
Lighting: soft natural light, atmospheric. 
Mood: somber, contemplative, emotionally resonant. 
Camera work: steady shots, shallow depth of field. 
Setting: [具体场景描述]

SCENE: [场景视觉描述，包含镜头角度和运镜]

DIALOGUE: [中文普通话对白，严禁参杂其他语言]

REFERENCE: [参考图片链接]

Duration: [X] seconds

等待生成
- 点击生成按钮
- 等待 30-90 秒
- 插入到场景
验证
- 播放预览
- 确认无误后继续下一个

添加转场

点击时间线上的场景
点击 “Transition” (Ctrl+Alt+R)
选择 “Dissolve”（推荐）
应用到所有场景对

导出视频

重命名项目（点击顶部 “Untitled video”）
File → Download → MP4 video (.mp4)
等待导出完成

📋 关键要点

语言要求（重要！）

✅ 所有对白必须使用中文普通话
❌ 严禁参杂英文、方言或其他语言
✅ 确保字幕和语音都是标准中文

风格一致性

使用统一的 Style Block
保持 cinematic documentary style
统一的 color palette 和 lighting

充分利用 30 分钟额度

生成更长、更详细的场景
增加场景数量（104+ 场景）
每个场景 8-15 秒

🔧 环境要求

Node.js 18+
Python 3.8+ (用于 Whisper 转录)
TRAE IDE (必需，使用内置浏览器)
Kedou 视频下载工具
Google Vids 账号（已登录）

安装依赖

# 安装 Node.js 依赖
npm install

# 安装 Python 依赖
pip install openai-whisper

🐛 故障排除

问题	解决方案
不是 TRAE 环境	在 TRAE IDE 的 Agent 模式下运行
未找到视频文件	检查文件格式是否正确 (.mp4, .wav 等)
转录失败	检查是否安装 Whisper: `pip install openai-whisper`
AI 服务超时	检查网络连接，重试
Google Vids 未登录	在 TRAE 浏览器中登录并告知我
视频生成失败	检查提示词是否包含非法字符
对白不是中文	确保使用中文普通话，严禁参杂其他语言

Ingredients 使用说明

功能：Ingredients 允许上传最多 3张本地图片 作为视频生成的参考素材

推荐组合：

单人场景：角色肖像 + 场景氛围 + 关键道具
双人场景：角色A肖像 + 角色B肖像 + 场景氛围

操作步骤：

点击 “Ingredients” 按钮
选择 “Upload” 或从 “Drive and Photos” 选择本地图片
最多可上传3张图片
输入视频生成提示词
点击 Generate 生成视频

Google Vids 视频生成限制说明

重要提示：Google Vids 的 AI 视频片段生成功能有月度配额限制。

根据 Google Vids 帮助文档，不同账号类型的限制如下：

账号类型	AI 视频片段限制
个人免费账号	每月最多 50 个视频
AI Expanded Access	每月 200 个视频
AI Ultra Access for Business	每月 1000 个视频
商务标准版/Plus版	每月 600 个视频
企业标准版/Plus版	每月 600 个视频

⚠️ 实际测试发现：

普通用户实际限制：每月仅可免费生成 10 个视频镜头
当达到月度限制时，会显示 “本月您还可再使用 Veo X 次” 或 “您已达到每月用量限额”
配额会在每月初重置
如需更多配额，可升级至 Google Workspace 商务版或企业版

解决方案：

多账号轮换：准备多个 Google 账号，每个账号生成 10 个镜头后切换
分批生成：将132个镜头分多个月生成（需要约13个月）
升级账号：考虑升级至 Google Workspace 商务版或企业版
混合制作：部分镜头使用 Google Vids，部分使用其他视频制作工具

网络限制解决方案（备选）

症状：Ingredients 按钮无效、无法上传图片

解决方案：

方案 1：详细描述法（首选备选）

在视频提示词中完整描述角色外貌特征
参考已生成的角色图片提取关键特征
每个场景都包含完整的角色描述如果以上方案都不可行，使用详细描述法：

在视频生成提示词中完整描述角色外貌特征
参考已生成的角色图片，提取关键特征
每个场景都包含完整的角色描述

角色描述模板：

小美：22岁中国女性，165cm，白皙皮肤，肩长黑色直发，oval脸，大杏眼略带忧伤，穿白色T恤
阿杰：23岁中国男性，175cm，中等肤色，短发用发胶梳起，锐利面部特征，狭长眼睛，穿黑色紧身T恤
刘哥：28岁中国男性，170cm，微胖，圆脸，小眼睛带着狡黠笑容，穿彩色花衬衫，粗金链子
龙哥：30岁中国男性，180cm，肌肉发达，光头，方下巴，凶狠锐利的眼神，穿黑色背心
王律师：40岁中国男性，172cm，金丝眼镜，整齐的短发带灰白鬓角，穿深色西装打领带

📚 相关文档

PROJECT_STRUCTURE.md - 详细项目结构说明
Google Vids Skill - Google Vids 详细指南
DeepSeek Skill - DeepSeek 详细指南
项目文档 - 完整中文文档

📄 许可证

MIT License

👨‍💻 作者

PISC

Happy Filmmaking! 🎬