AI视频生成

1. 介绍

AI视频生成功能基于智谱AI的CogVideoX模型，可以根据文字描述自动生成高质量视频。系统支持多种分辨率、帧率和时长配置，并可自动为生成的视频添加AI旁白配音，适用于产品营销、教育培训、创意设计等场景。

AI视频生成依赖智谱AI的CogVideoX模型服务，使用前请确保已在后台配置文件中正确配置了相关API Key。

2. 功能概览

功能	说明
文字生成视频	输入文字描述，AI自动生成对应视频
多分辨率支持	720P、1080P、2K、4K 等7种尺寸可选
帧率选择	支持30 FPS 和 60 FPS
时长选择	支持5秒和10秒
AI自动配音	可自动生成旁白文案并合成配音
手动配音	为已生成的视频手动添加配音
预设场景	提供多种场景的提示词模板
历史记录	自动保存生成历史，支持回放和下载

3. 操作界面

页面分为三个区域：

左侧 — 参数配置面板：设置视频尺寸、帧率、时长、是否AI合成音效
中间 — 预览与输入区域：输入文字描述，预览生成结果，显示生成进度
右侧 — 生成历史列表：查看历史生成记录

4. 使用步骤

4.1 配置视频参数

在左侧面板中设置视频参数：

视频尺寸：选择分辨率
- 1280x720 (720P) — 适合快速预览
- 1920x1080 (1080P) — 常用分辨率（默认）
- 720x1280 — 竖版视频
- 1080x1920 — 竖版高清
- 1024x1024 — 正方形
- 2048x1080 (2K) — 超宽屏
- 3840x2160 (4K) — 超高清
视频帧率：30 FPS（默认）或 60 FPS
视频时长：5秒（默认）或 10秒

4.2 选择是否AI合成音效

否（默认）：AI合成音效功能会先使用大语言模型根据视频描述生成旁白文案，再通过 edge-tts 或 TTS API 合成语音，最后使用 FFmpeg 将视频和语音合并。
是：视频生成完成后，AI自动生成旁白文案并合成配音，最终输出带有音频的视频文件

4.3 输入视频描述

在中间区域的文本框中输入视频内容描述。系统提供4种预设场景，点击即可快速填入：

通用演示

金色沙滩上的日落
雪山与草地的壮丽景色
樱花树下的春日场景

产品营销

咖啡制作过程特写
精致手表展示
运动鞋产品展示

教育培训

地球自转动画
翻书学习场景
细胞分裂过程

创意设计

赛博朋克风格城市
中国水墨画风格山水
北极光极光景观

4.4 提交生成任务

点击"生成视频"按钮提交任务。视频生成为异步任务，页面会实时显示等待时间和当前状态：

任务提交 — 系统向AI服务发送请求，获取任务ID
生成中 — 页面自动轮询任务状态，显示等待计时
生成完成 — 视频自动下载到服务器，页面显示预览

视频生成通常需要1~5分钟，请耐心等待。生成期间请勿关闭页面。

4.5 管理历史记录

右侧历史列表展示所有生成记录，支持以下操作：

预览：点击播放已完成的视频
下载：下载视频文件到本地
配音：为已完成的视频添加配音
删除：删除不需要的记录

5. 后台配置

在 application-dev.yml（或对应环境配置）中添加视频相关配置：

jeecg:
  ai-chat:
    ai-model-video:
      provider: ZHIPU
      model: cogvideox-flash
      apiKey: 你的智谱AI API Key
      apiHost: https://open.bigmodel.cn/api/paas/v4
      timeout: 60
      ffmpeg-path: C:/tools/ffmpeg/ffmpeg.exe
      edge-tts-path: C:/Users/xxx/AppData/Local/Programs/Python/Python312/Scripts/edge-tts.exe

配置参数说明

参数	说明	必填
provider	AI服务供应商，当前支持 ZHIPU	是
model	视频生成模型名称	是
apiKey	智谱AI API Key	是
apiHost	API 访问地址	是
timeout	请求超时时间（秒）	否，默认60
ffmpeg-path	FFmpeg 可执行文件路径	否，如需本地合成语音，需要填写
edge-tts-path	edge-tts 可执行文件路径	否，如需本地合成语音，需要填写

如需使用AI合成音效（自动配音）功能，必须安装 FFmpeg 和 edge-tts。

FFmpeg 下载：https://ffmpeg.org/download.html

edge-tts 安装：前提条件需要有python环境。在命令行执行：pip install edge-tts

6. API接口

接口	方法	说明
`/airag/video/submit`	POST	提交视频生成任务，返回任务ID
`/airag/video/query/{taskId}`	GET	查询视频生成任务状态
`/airag/video/voiceover`	POST	为已完成的视频添加配音
`/airag/video/prompts`	GET	获取预设场景提示词列表
`/airag/video/listByUser`	GET	查询当前用户的视频生成历史
`/airag/video/deleteVideoRecord`	DELETE	删除指定的视频生成记录

7. 注意事项

API费用：视频生成会消耗智谱AI API额度，请关注账户余额
生成时间：视频生成为异步任务，通常需要数分钟，分辨率越高耗时越长
存储空间：生成的视频文件较大，请确保服务器有足够的磁盘空间
配音依赖：AI合成音效功能依赖 FFmpeg 和 edge-tts，请提前安装配置
网络要求：需要能访问智谱AI API（open.bigmodel.cn）

8. 常见问题

Q：视频生成任务长时间未完成？

A：视频生成通常需要1~5分钟。如超过10分钟仍未完成，可能是API服务繁忙，建议稍后重新提交。

Q：生成的视频没有声音？

A：默认生成的是无声视频。如需配音，请在生成时开启"AI合成音效"，或在生成完成后手动添加配音。

Q：配音功能提示失败？

A：请检查：

FFmpeg 是否已正确安装并配置路径
edge-tts 是否已正确安装并配置路径
配置文件中路径是否指向正确的可执行文件

Q：支持哪些视频格式？

A：生成的视频为 MP4 格式，兼容主流播放器和浏览器。

Q：视频文件保存在哪里？

A：原始视频保存在上传目录的 video/ 文件夹下，合成配音后的视频保存在 ai_video/ 文件夹下。

1. 介绍​

2. 功能概览​

3. 操作界面​

4. 使用步骤​

4.1 配置视频参数​

4.2 选择是否AI合成音效​

4.3 输入视频描述​

4.4 提交生成任务​

4.5 管理历史记录​

5. 后台配置​

配置参数说明​

6. API接口​

7. 注意事项​

8. 常见问题​