跳到主要内容

AI视频生成

1. 介绍

AI视频生成功能基于智谱AI的CogVideoX模型,可以根据文字描述自动生成高质量视频。系统支持多种分辨率、帧率和时长配置,并可自动为生成的视频添加AI旁白配音,适用于产品营销、教育培训、创意设计等场景。

AI视频生成依赖智谱AI的CogVideoX模型服务,使用前请确保已在后台配置文件中正确配置了相关API Key。

2. 功能概览

功能说明
文字生成视频输入文字描述,AI自动生成对应视频
多分辨率支持720P、1080P、2K、4K 等7种尺寸可选
帧率选择支持30 FPS 和 60 FPS
时长选择支持5秒和10秒
AI自动配音可自动生成旁白文案并合成配音
手动配音为已生成的视频手动添加配音
预设场景提供多种场景的提示词模板
历史记录自动保存生成历史,支持回放和下载

3. 操作界面

页面分为三个区域:

  • 左侧 — 参数配置面板:设置视频尺寸、帧率、时长、是否AI合成音效
  • 中间 — 预览与输入区域:输入文字描述,预览生成结果,显示生成进度
  • 右侧 — 生成历史列表:查看历史生成记录

4. 使用步骤

4.1 配置视频参数

在左侧面板中设置视频参数:

  • 视频尺寸:选择分辨率
    • 1280x720 (720P) — 适合快速预览
    • 1920x1080 (1080P) — 常用分辨率(默认)
    • 720x1280 — 竖版视频
    • 1080x1920 — 竖版高清
    • 1024x1024 — 正方形
    • 2048x1080 (2K) — 超宽屏
    • 3840x2160 (4K) — 超高清
  • 视频帧率:30 FPS(默认)或 60 FPS
  • 视频时长:5秒(默认)或 10秒

4.2 选择是否AI合成音效

  • 否(默认):AI合成音效功能会先使用大语言模型根据视频描述生成旁白文案,再通过 edge-tts 或 TTS API 合成语音,最后使用 FFmpeg 将视频和语音合并。
  • :视频生成完成后,AI自动生成旁白文案并合成配音,最终输出带有音频的视频文件

4.3 输入视频描述

在中间区域的文本框中输入视频内容描述。系统提供4种预设场景,点击即可快速填入:

通用演示

  • 金色沙滩上的日落
  • 雪山与草地的壮丽景色
  • 樱花树下的春日场景

产品营销

  • 咖啡制作过程特写
  • 精致手表展示
  • 运动鞋产品展示

教育培训

  • 地球自转动画
  • 翻书学习场景
  • 细胞分裂过程

创意设计

  • 赛博朋克风格城市
  • 中国水墨画风格山水
  • 北极光极光景观

4.4 提交生成任务

点击"生成视频"按钮提交任务。视频生成为异步任务,页面会实时显示等待时间和当前状态:

  1. 任务提交 — 系统向AI服务发送请求,获取任务ID
  2. 生成中 — 页面自动轮询任务状态,显示等待计时
  3. 生成完成 — 视频自动下载到服务器,页面显示预览

视频生成通常需要1~5分钟,请耐心等待。生成期间请勿关闭页面。

4.5 管理历史记录

右侧历史列表展示所有生成记录,支持以下操作:

  • 预览:点击播放已完成的视频
  • 下载:下载视频文件到本地
  • 配音:为已完成的视频添加配音
  • 删除:删除不需要的记录

5. 后台配置

application-dev.yml(或对应环境配置)中添加视频相关配置:

jeecg:
ai-chat:
ai-model-video:
provider: ZHIPU
model: cogvideox-flash
apiKey: 你的智谱AI API Key
apiHost: https://open.bigmodel.cn/api/paas/v4
timeout: 60
ffmpeg-path: C:/tools/ffmpeg/ffmpeg.exe
edge-tts-path: C:/Users/xxx/AppData/Local/Programs/Python/Python312/Scripts/edge-tts.exe

配置参数说明

参数说明必填
providerAI服务供应商,当前支持 ZHIPU
model视频生成模型名称
apiKey智谱AI API Key
apiHostAPI 访问地址
timeout请求超时时间(秒)否,默认60
ffmpeg-pathFFmpeg 可执行文件路径否,已加入PATH可不填
edge-tts-pathedge-tts 可执行文件路径否,已加入PATH可不填

如需使用AI合成音效(自动配音)功能,必须安装 FFmpeg 和 edge-tts。

6. API接口

接口方法说明
/airag/video/submitPOST提交视频生成任务,返回任务ID
/airag/video/query/{taskId}GET查询视频生成任务状态
/airag/video/voiceoverPOST为已完成的视频添加配音
/airag/video/promptsGET获取预设场景提示词列表
/airag/video/listByUserGET查询当前用户的视频生成历史
/airag/video/deleteVideoRecordDELETE删除指定的视频生成记录

7. 注意事项

  • API费用:视频生成会消耗智谱AI API额度,请关注账户余额
  • 生成时间:视频生成为异步任务,通常需要数分钟,分辨率越高耗时越长
  • 存储空间:生成的视频文件较大,请确保服务器有足够的磁盘空间
  • 配音依赖:AI合成音效功能依赖 FFmpeg 和 edge-tts,请提前安装配置
  • 网络要求:需要能访问智谱AI API(open.bigmodel.cn

8. 常见问题

Q:视频生成任务长时间未完成?

A:视频生成通常需要1~5分钟。如超过10分钟仍未完成,可能是API服务繁忙,建议稍后重新提交。

Q:生成的视频没有声音?

A:默认生成的是无声视频。如需配音,请在生成时开启"AI合成音效",或在生成完成后手动添加配音。

Q:配音功能提示失败?

A:请检查:

  1. FFmpeg 是否已正确安装并配置路径
  2. edge-tts 是否已正确安装并配置路径
  3. 配置文件中路径是否指向正确的可执行文件

Q:支持哪些视频格式?

A:生成的视频为 MP4 格式,兼容主流播放器和浏览器。

Q:视频文件保存在哪里?

A:原始视频保存在上传目录的 video/ 文件夹下,合成配音后的视频保存在 ai_video/ 文件夹下。