AI视频生成
1. 介绍
AI视频生成功能基于智谱AI的CogVideoX模型,可以根据文字描述自动生成高质量视频。系统支持多种分辨率、帧率和时长配置,并可自动为生成的视频添加AI旁白配音,适用于产品营销、教育培训、创意设计等场景。
AI视频生成依赖智谱AI的CogVideoX模型服务,使用前请确保已在后台配置文件中正确配置了相关API Key。
2. 功能概览
| 功能 | 说明 |
|---|---|
| 文字生成视频 | 输入文字描述,AI自动生成对应视频 |
| 多分辨率支持 | 720P、1080P、2K、4K 等7种尺寸可选 |
| 帧率选择 | 支持30 FPS 和 60 FPS |
| 时长选择 | 支持5秒和10秒 |
| AI自动配音 | 可自动生成旁白文案并合成配音 |
| 手动配音 | 为已生成的视频手动添加配音 |
| 预设场景 | 提供多种场景的提示词模板 |
| 历史记录 | 自动保存生成历史,支持回放和下载 |
3. 操作界面
页面分为三个区域:
- 左侧 — 参数配置面板:设置视频尺寸、帧率、时长、是否AI合成音效
- 中间 — 预览与输入区域:输入文字描述,预览生成结果,显示生成进度
- 右侧 — 生成历史列表:查看历史生成记录

4. 使用步骤
4.1 配置视频参数
在左侧面板中设置视频参数:
- 视频尺寸:选择分辨率
1280x720(720P) — 适合快速预览1920x1080(1080P) — 常用分辨率(默认)720x1280— 竖版视频1080x1920— 竖版高清1024x1024— 正方形2048x1080(2K) — 超宽屏3840x2160(4K) — 超高清
- 视频帧率:30 FPS(默认)或 60 FPS
- 视频时长:5秒(默认)或 10秒
4.2 选择是否AI合成音效
- 否(默认):AI合成音效功能会先使用大语言模型根据视频描述生成旁白文案,再通过 edge-tts 或 TTS API 合成语音,最后使用 FFmpeg 将视频和语音合并。
- 是:视频生成完成后,AI自动生成旁白文案并合成配音,最终输出带有音频的视频文件
4.3 输入视频描述
在中间区域的文本框中输入视频内容描述。系统提供4种预设场景,点击即可快速填入:
通用演示
- 金色沙滩上的日落
- 雪山与草地的壮丽景色
- 樱花树下的春日场景
产品营销
- 咖啡制作过程特写
- 精致手表展示
- 运动鞋产品展示
教育培训
- 地球自转动画
- 翻书学习场景
- 细胞分裂过程
创意设计
- 赛博朋克风格城市
- 中国水墨画风格山水
- 北极光极光景观
4.4 提交生成任务
点击"生成视频"按钮提交任务。视频生成为异步任务,页面会实时显示等待时间和当前状态:
- 任务提交 — 系统向AI服务发送请求,获取任务ID
- 生成中 — 页面自动轮询任务状态,显示等待计时
- 生成完成 — 视频自动下载到服务器,页面显示预览
视频生成通常需要1~5分钟,请耐心等待。生成期间请勿关闭页面。
4.5 管理历史记录
右侧历史列表展示所有生成记录,支持以下操作:
- 预览:点击播放已完成的视频
- 下载:下载视频文件到本地
- 配音:为已完成的视频添加配音
- 删除:删除不需要的记录

5. 后台配置
在 application-dev.yml(或对应环境配置)中添加视频相关配置:
jeecg:
ai-chat:
ai-model-video:
provider: ZHIPU
model: cogvideox-flash
apiKey: 你的智谱AI API Key
apiHost: https://open.bigmodel.cn/api/paas/v4
timeout: 60
ffmpeg-path: C:/tools/ffmpeg/ffmpeg.exe
edge-tts-path: C:/Users/xxx/AppData/Local/Programs/Python/Python312/Scripts/edge-tts.exe
配置参数说明
| 参数 | 说明 | 必填 |
|---|---|---|
| provider | AI服务供应商,当前支持 ZHIPU | 是 |
| model | 视频生成模型名称 | 是 |
| apiKey | 智谱AI API Key | 是 |
| apiHost | API 访问地址 | 是 |
| timeout | 请求超时时间(秒) | 否,默认60 |
| ffmpeg-path | FFmpeg 可执行文件路径 | 否,已加入PATH可不填 |
| edge-tts-path | edge-tts 可执行文件路径 | 否,已加入PATH可不填 |
如需使用AI合成音效(自动配音)功能,必须安装 FFmpeg 和 edge-tts。
- FFmpeg 下载:https://ffmpeg.org/download.html
- edge-tts 安装:
pip install edge-tts
6. API接口
| 接口 | 方法 | 说明 |
|---|---|---|
/airag/video/submit | POST | 提交视频生成任务,返回任务ID |
/airag/video/query/{taskId} | GET | 查询视频生成任务状态 |
/airag/video/voiceover | POST | 为已完成的视频添加配音 |
/airag/video/prompts | GET | 获取预设场景提示词列表 |
/airag/video/listByUser | GET | 查询当前用户的视频生成历史 |
/airag/video/deleteVideoRecord | DELETE | 删除指定的视频生成记录 |
7. 注意事项
- API费用:视频生成会消耗智谱AI API额度,请关注账户余额
- 生成时间:视频生成为异步任务,通常需要数分钟,分辨率越高耗时越长
- 存储空间:生成的视频文件较大,请确保服务器有足够的磁盘空间
- 配音依赖:AI合成音效功能依赖 FFmpeg 和 edge-tts,请提前安装配置
- 网络要求:需要能访问智谱AI API(
open.bigmodel.cn)
8. 常见问题
Q:视频生成任务长时间未完成?
A:视频生成通常需要1~5分钟。如超过10分钟仍未完成,可能是API服务繁忙,建议稍后重新提交。
Q:生成的视频没有声音?
A:默认生成的是无声视频。如需配音,请在生成时开启"AI合成音效",或在生成完成后手动添加配音。
Q:配音功能提示失败?
A:请检查:
- FFmpeg 是否已正确安装并配置路径
- edge-tts 是否已正确安装并配置路径
- 配置文件中路径是否指向正确的可执行文件
Q:支持哪些视频格式?
A:生成的视频为 MP4 格式,兼容主流播放器和浏览器。
Q:视频文件保存在哪里?
A:原始视频保存在上传目录的 video/ 文件夹下,合成配音后的视频保存在 ai_video/ 文件夹下。