Grok ImagineGrok Imagine API

Grok Imagine:文本/图片直出同步音轨的视频

免安装直接用 Grok Imagine,用提示词或单张图片生成运动画面,自带背景音轨,还能切换 Spicy Mode 获取更大胆的风格。

文本转视频

写下提示词,Grok T2V 输出连贯的镜头与流畅运动。

图片转视频

上传单张图片,保留原始风格的同时补足景深与运动。

音频同步

每条视频都会配好背景音,让导出更像成品。

T2V

Grok Imagine

写下提示词,Grok T2V 输出连贯的镜头与流畅运动。

图片转视频

上传单张图片,保留原始风格的同时补足景深与运动。

音频同步

每条视频都会配好背景音,让导出更像成品。

Grok Imagine 生成视窗

这里为 Grok Imagine 输出预留首屏,一旦 API 接通即可用免费额度跑文本转视频、图生视频和带音频的结果。

Sample prompt

无人机视角俯瞰霓虹未来集市,热闹但平静,配合柔和合成器音乐。

Grok Imagine 生成器

在一个界面跑文本/图片转视频,并一键 Upscale。

填写生成参数
输入提示词,可选上传参考图,再选择模式和画幅。

Upscale 需要一条已完成的视频任务。

进度与结果
任务会自动同步到历史记录。

暂时没有生成结果,先写一个提示词试试。

查看 AI 历史

Grok Imagine 视频示例

先看各模式的效果,再决定如何对接 API。

t2v

文本转视频运动感

短提示词生成的连贯镜头,运动顺滑。

i2v

图片转视频深度感

单张图被动画化,风格保持不变。

audio

自带同步音轨

生成结果直接附带背景声,无需额外混音。

spicy

Spicy Mode 表现力

提高创意强度,得到更风格化的画面。

speed

快速生成体验

更短的渲染路径,便于灵感验证与 QA。

Grok Imagine vs Veo 3.1 vs Sora 2

按画质、速度、可控性选择合适的模型。

Multimodel preview

xAI Grok Imagine

支持文/图生视频,带同步音轨与 Spicy Mode。

Google Veo 3.1

偏重电影级质感与提示词贴合,含口型同步。

OpenAI Sora 2

长序列与复杂场景更强,适合叙事与镜头衔接。

placeholder hero

Kie.ai 上能用到的 Grok Imagine 能力

挑一个模式契合需求,用同步音轨的 AI 运动画面加速交付。

  • Grok T2V 模型
    纯文字即可生成短视频,运动自然、镜头连贯。
  • Grok I2V 模型
    上传一张图片,动画化但不破坏原有风格与构图。
  • 运动 + 音频同步
    每条结果都自带同步音轨,无需额外剪音。
为什么在这里试 Grok Imagine

轻量上手,贴近真实 API

小步试错同时保持与正式接口一致的体验。

无需开通计费即可立刻验证 Grok Imagine 的输出质感。

免费额度提示
模式切换展示
快速生成效果
使用方式

3 步交付一条 Grok Imagine 视频

对齐 Kie.ai 的流程,快速收集素材与 API 请求。

Grok Imagine 能力集

API 级积木,让想法更快落地到成片。

文生图/视频同源

同一套流程即可产出静帧或运动镜头。

图生视频更有深度

保持主体风格,同时补充景深和镜头移动。

Spicy Mode

需要更艺术或夸张效果时,直接提升创意强度。

音频同步输出

生成结果自带匹配运动节奏的背景音。

统一控制台

与其他视频模型放在同一面板,方便管理调用。

开发者友好

支持状态跟踪、webhook 与重试,保证管线稳定。

常见问题

关于 Grok Imagine 的问答

为评估文本/图片转视频流程的团队准备的细节。

1

Grok Imagine 是什么,怎么工作的?

它是 xAI 的视觉模型,可通过 API 或网页把提示词/图片生成短视频或静帧。

2

生成结果会有同步音频吗?

会。每条视频都附带与运动匹配的背景音,无需额外做音效。

3

这里试用 Grok Imagine 需要付费吗?

新用户有免费额度,可先生成图片与视频再决定是否开通计费。

4

支持图片转视频吗?

支持。I2V 路径能把单张图变成平滑视频,并保持构图。

5

Spicy Mode 能用吗?

支持。想要更具表现力的画面时,可以在安全规则下切到 Spicy Mode。

6

这里的模型与官方一致吗?

接入的就是同一 Grok Imagine 系列,并会随版本更新同步迭代。

用免费额度试用 Grok Imagine

生成带同步音轨的文本/图片驱动视频,再把 API 接入你的产品。