模型广场
聊天 · 图片 · 视频 · 音频 · 共 84 个模型
Gemini 3.5 flash
Gemini 3.5 闪电版已正式发布(GA),是谷歌最智能的轻量高速模型。性能稳定,可大规模用于生…

GPT-5.4
GPT-5.4是OpenAI用于复杂专业工作的前沿模型,具备强大的深度推理、多模态理解和工具调用能力…

GPT-5.5
GPT-5.5 是 OpenAI 推出的新一代旗舰模型,全面提升对话流畅度、多模态理解与代码能力,适…
Gemini 3.1 Pro
Gemini 3.1是谷歌迄今为止最智能的模型系列,以先进的推理能力为基础,最适合需要广泛世界知识和…
opus-4-7
Claude系列最新一代旗舰模型,在复杂逻辑推理、数学证明及创意写作的细腻度上进一步提升,文采斑斓且…

GPT-5.5 深度推理
GPT-5.5-xhigh 是 OpenAI 推出的最高推理强度版本,专为需要深度逻辑分析、多步骤严…

GPT-5.5 高推理
GPT-5.5-high 是 OpenAI 推出的高强度推理版本,在推理深度与响应速度之间取得良好平…
Gemini 3 Pro
谷歌最强AI大脑,拥有无限上下文记忆能力,能瞬间吞噬并分析海量文档、整本小说或长视频,回答任意细节问…

GPT Image 2
ChatGPT Images 2.0是OpenAI最新发布的图像生成模型,作为ChatGPT平台内图…
Nano Banana Pro
谷歌2025年最新超高清图像模型,拥有目前最强的文字渲染能力,擅长生成8K分辨率的微距摄影、皮肤质感…
Nano Banana 2
谷歌最新高效图像模型,Nano Banana Pro的高速版本,针对速度和高用量场景优化。支持联网搜…

GPT Image 2 官转
OpenAI 官方直连通道,按 token 精准计费、多退少补;文生图与多图参考编辑兼备,画质与稳定…

VIDU Iamge 2
Vidu 官方 reference2image:模型 viduimage-2,支持文生图、多图参考与…
即梦 5.0
字节跳动即梦AI图像生成模型,基于Seedream-5.0架构,支持多图融合、高清3K输出、联网搜索…
即梦 4.5
字节跳动即梦AI图像生成模型,基于Seedream-4.5架构,支持多图融合、高清4K输出,文字和人…

Midjourney
Midjourney 是全球最火的 AI 图像生成模型,以极高的艺术性和美感著称。擅长生成电影级概念…
Sora-2 官转版
OpenAI Sora-2 稳定版,高质量视频生成,直接接入的官方接口,价格会比基础版稍贵,但是基本…
SD 2.0 参考生
字节跳动即梦团队推出的旗舰级视频生成模型 Seedance 2.0,支持多图参考生视频,上传 1~9…
即梦 3.5 Pro
字节跳动即梦团队推出的高质量视频生成模型,支持音画同生,可生成带有环境音、动作音、背景音乐的有声视频…

grok-video-3
Grok 推出的首帧参考图视频模型,专注于高效的图生视频体验。支持生成 6 秒及 10 秒时长的 7…
可灵-Omni 参考生
可灵 V3 Omni 参考生模式,支持纯文生视频或上传1-7张参考图片,AI参考图片风格/内容智能分…

快乐马-参考生
阿里百炼 HappyHorse 参考生(R2V):可把多张参考图中的角色/物件融合进同一段短片。支持…
SD 2.0 全能参考
字节跳动即梦团队推出的旗舰级多模态参考视频生成模型 Seedance 2.0,支持文本+图片+视频+…
veo3.1
谷歌推出的高可控性视频模型,凭借独特的“首尾帧控制”技术(补全起始与结束画面)和精准运镜指令,能生成…
Hailuo Voice Clone 2.8
MiniMax 海螺语音克隆模型,支持上传音频复刻你的专属音色,首次激活后永久有效。提供 HD 高清…
Hailuo Music Generation 2.5+
MiniMax 海螺音乐生成增强模型,支持歌曲生成和纯音乐生成两种模式。歌曲模式下输入歌词和风格描述…

Suno Music Generation 4.5
Suno V4.5(chirp-auk)音乐生成模型,输入歌词与风格描述即可生成完整人声歌曲,支持纯…
Hailuo Music Generation 2.5
MiniMax 海螺音乐生成模型,输入歌词和风格描述即可生成完整歌曲。支持 AI 歌词创作、14+ …
Doubao TTS 2.0
火山引擎豆包语音合成2.0,支持上百种精品音色,支持多情感、多语种、长文本合成(最大10万字符),音…
Gemini-3.1-TTS
Google Gemini 3.1 Flash 原生文字转语音模型,支持30种预置音色和24种语言,…
Gemini-2.5-TTS
Google Gemini 原生文字转语音模型,支持30种预置音色和24种语言,支持双人对话,支持自…
