
FLUX.2 作为围绕控制、参考和生产就绪输出构建的现代图像生成系统的视觉概述。
如果您搜索“FLUX.2”,简短的答案很简单:FLUX.2 是 2026 年最面向生产的 AI 图像系列之一。它不仅仅是一种模型。它是黑森林实验室的一堆变体,每个变体都针对不同的工作进行了调整:最终质量的英雄图像、高容量生成、大量排版布局、开放重量本地工作流程和亚秒级交互使用。
这种区别很重要,因为许多文章将 FLUX.2 简化为单个“评论”,而错过了真正的购买决策:哪种 FLUX.2 变体适合您的工作流程、预算、延迟目标和控制要求? 本指南重点关注该决策。它基于 Black Forest Labs 文档、模型页面、发行说明以及截至 2026 年 3 月 19 日的官方 FLUX.2 推理存储库。
这是前面的实用建议:
- 如果您想要默认的托管制作选项,请选择 FLUX.2 [pro]。
- 如果可读文本、精确提示控制和小细节保留最重要,请选择 FLUX.2 [flex]。
- 如果您想要最强的提示跟随、最佳的最终质量输出以及具有实时网络上下文的接地生成,请选择 FLUX.2 [max]。
- 如果您最关心延迟、高容量或消费者 GPU 部署,请选择 FLUX.2 [klein]。
- 如果您需要开放权重进行本地实验、研究或自定义工作流程,请选择 FLUX.2 [dev]。
FLUX.2 到底是什么
FLUX.2 是 Black Forest Labs 的下一代图像生成和编辑系列。核心要点不仅仅是照片写实主义。它是受控的真实感:具有多参考支持、精确的色彩匹配、结构化提示、姿势指导和高达 4MP 的高分辨率输出的生成和编辑。
实际上,当您需要以下一项或多项结果时,FLUX.2 最为强大:
- 多个图像中一致的字符或产品
- 为海报、包装、UI 或信息图表提供更可靠的文本渲染
- 比“氛围优先”发生器更能及时坚持
- 托管制作速度而不放弃编辑质量
- 为不想完全依赖封闭端点的团队提供本地或开放权重路径
这就是为什么 FLUX.2 出现在截然不同的工作流程中:
- 产品营销和目录生成
- 品牌一致的广告变体
- 故事板和预可视化
- UI 模型和排版繁重的设计工作
- 性格一致的娱乐资产
- 需要足够快的图像生成速度才能感觉实时的交互式应用程序
FLUX.2 模型一览
最重要的是要了解 FLUX.2 是一个 家族,而不是单个 SKU。
| 模型 | 最适合 | 参考图像支持 | 卓越的能力 | 部署 |
|---|---|---|---|---|
| 通量.2 [最大] | 最高质量的最终资产 | 通过 API 最多 8 个,在 Playground 中最多 10 个 | 通过实时网络上下文进行基础搜索 | 主办 |
| FLUX.2 [专业版] | 大规模生产工作流程 | 通过 API 最多 8 个,在 Playground 中最多 10 个 | 速度和质量的最佳默认平衡 | 主办 |
| FLUX.2 [柔性] | 排版、细节保留、提示控制 | 最多 10 个 | 可调节 steps 和 guidance | 主办 |
| FLUX.2 [开发] | 本地开发和定制 | 建议最多 6 个 | 开放权重和完全定制 | 自托管 |
| FLUX.2 [克莱因] 4B / 9B | 实时、大批量生成 | 最多 4 个 | 在有能力的硬件上进行亚秒级推理 | API 或本地 |
一些细节很容易被忽略,但在实际使用中很重要:
max、pro和flex是托管高级路径。flex是唯一具有公开steps和guidance控件的托管 FLUX.2 变体。klein不仅仅是一个更便宜的版本。它是一个面向延迟的分支,专为交互产品而设计。- 对于只想快速获取图像的非技术团队来说,
dev并不是最佳选择。当所有权和定制比便利更重要时,这一点就很重要。
如果您想要家庭的最短视觉摘要,此图表是正确的思维模型:

使用它作为快速过滤器:pro用于一般制作,flex用于文本和控制,max用于高级决赛,dev用于开放工作流程,klein用于低延迟生成。
2026 年最近发生了什么变化
如果您阅读较旧的 FLUX.2 文章,许多文章已经过时,因为 Black Forest Labs 在首次推出 FLUX.2 后发布了一些有意义的更新。
2026 年 1 月 15 日:FLUX.2 [klein] 推出
这是家庭最大的扩张。 klein介绍:
- 用于交互式生成的亚秒级推理
- 两种主要尺寸,4B 和 9B
- 消费级 GPU 的可行性,4B 系列位于 ~13GB VRAM 左右
- 开放、快速部署和高级托管模型之间的划分更加清晰
对于构建创意工具、演示、个性化功能或内部原型实用程序的团队来说,klein 使 FLUX.2 更加实用。
2026 年 1 月 29 日:FLUX.2 [flex] 变得更快
Black Forest Labs 报告称,flex 的速度快了 3 倍,同时保持了相同的质量。这很重要,因为 flex 是控制密集型模型,而从历史上看,当延迟变得烦人时,用户首先放弃的是控制密集型选项。
2026 年 3 月 3 日:FLUX.2 [pro] 变得更快
Black Forest Labs 报告称,pro 现在在文本到图像和图像编辑方面速度大约提高了 2 倍,且没有质量损失,也没有价格变化。他们还引入了 flux-2-pro-preview 端点以实现最新改进,同时保留原始 flux-2-pro 端点作为更稳定的快照以实现可重复性。
对于大多数团队来说,此更新强化了 pro 作为默认第一个评估模型的理由。
FLUX.2最强的地方
评估 FLUX.2 最有用的方法不是“它是最好的图像模型吗?”但是“它特别擅长处理哪些工作?”
1. 多参考生成和编辑
Black Forest Labs 围绕上下文控制构建了 FLUX.2。官方文档将该系列定位为能够组合多个源图像,同时在复杂场景中保持身份。
这使得 FLUX.2 对于以下方面异常实用:
- 多种环境下的产品拍摄
- 保持相同面孔或项目一致的广告变体
- 风格稳定的时尚或编辑活动
- 复合场景,其中一张图像定义主题,另一张图像定义风格,另一张图像定义设置
这是 FLUX.2 感觉更像是一个生产工具而不是玩具的一个重要原因。
2. 文字和排版
flex 被明确定位为最强的 FLUX.2 排版选项。如果您的作品在图像、标签、包装、海报或 UI 风格的模型中包含可读文本,那么这是选择 FLUX.2 而不是更美观但更难控制的生成器的最明显原因之一。
3. 精确的色彩控制
FLUX.2支持十六进制颜色匹配,这是一个具有巨大商业价值的小功能。当颜色发生变化时,品牌工作很快就会崩溃。如果您要生成产品变体、化妆品、包装或活动视觉效果,则能够将特定的十六进制值附加到特定对象比通用的“使其更红”提示更有用。
4. 结构化提示
对于自动化和可重复性而言,结构化提示比原始图像质量更重要。 FLUX.2 支持 JSON 风格的提示,适用于您希望提示的行为更像规范而不是段落的情况。
5. max 上的接地生成
max 添加了基础搜索,这意味着它可以提取当前事件、产品、地点或风格的实时网络上下文。这并不是每个项目都需要的,但是当您的提示依赖于时间敏感的信息时,它非常有用。
FLUX.2 仍有局限性
任何完整的指南都不应该假装模型是完美的。 FLUX.2 很强大,但它有影响实际项目的边界。
负面提示不是答案
Black Forest Labs 的提示指南很明确: FLUX.2 不支持用户期望的负面提示。您应该描述您想要的视觉结果,而不是要删除的内容的列表。
这意味着这些对不等价:
- 坏:
no crowd, no blur, no clutter - 更好:
quiet empty plaza, sharp focus throughout, minimal clean composition
对于来自旧传播习惯的用户来说,这是工作流程的转变。
变体差异是有意义的
许多在线帖子都说“FLUX.2 支持最多 10 个引用”,但没有澄清限制因模型和接口而异。这条捷径会造成混乱。在实践中:
klein仅限于最多 4 参考图像max和pro通过 API 最多为 8 个**,在 Playground 中最多为 10 个flex达到多达 10 参考图像dev最好更保守地对待,大约 6 作为建议的最大值
托管质量与本地控制仍然是一个权衡
如果您想要最简单的高端体验,您可能会从托管 pro、flex 或 max 开始。如果您想要本地控制、降低长期成本或自定义培训路径,您可以转向 dev 或 klein。每个团队都没有唯一的获胜者。
如何更好地提示 FLUX.2
这是许多指南所忽视的部分。 FLUX.2 的更好结果较少来自神奇的提示技巧,更多来自清晰的视觉规范。
Black Forest Labs 推荐一个简单的结构:
主题+动作+风格+背景
该框架之所以有效,是因为它保持了提示的视觉效果和秩序。
在考虑高级控件之前,将结构视为紧凑的清单会有所帮助:

及时的顺序很重要。从主要拍摄对象开始,然后锁定动作、视觉风格和背景,然后再添加摄像机、颜色和参考角色详细信息。
把最重要的事情放在第一位
FLUX.2 更注重先发生的事情。预先加载提示:
- 主要科目
- 关键动作或姿势
- 批判风格方向
- 基本设置和照明
- 次要细节
例如:
Premium skincare bottle standing on matte stone, front-facing pack shot, soft top light, clean gray studio background, sharp label typography, luxury commercial photography
这比将产品埋在大气和填充物下的长提示效果更好。
对大多数工作使用中等长度的提示
黑森林实验室的指南建议:
- 10 到 30 个单词用于快速概念探索
- 大多数制作工作需要 30 到 80 个字
- 80 多个字适用于真正需要细节的复杂场景
长提示并不一定会更好。如果每个句子都没有增加视觉重量,那么您通常会添加噪音。
清楚地描述文字
如果您需要图像内的可读文本:
- 将单词放在引号中
- 说出文本出现的位置
- 说明文本应使用什么材料或样式
例子:
Minimal storefront at night, the text "OPEN LATE" appears in bright red neon above the door, clean black facade, rainy sidewalk reflections, cinematic street photography
使用积极提示代替消极提示
不要说要避免什么,而是描述替换图像。
- 写
empty street而不是no people - 写
sharp focus throughout而不是no blur - 写
minimal clean composition而不是no clutter
添加相机和灯光参考以实现真实感
为了获得更真实的结果,FLUX.2 可以很好地响应:
- 相机名称
- 镜头长度如
35mm或85mm - 光圈值如
f/2.8 Rembrandt lighting或golden hour等光照样式- 电影或时代线索,例如
Kodak Portra 400或2000s digicam
为参考图像分配明确的角色
如果您使用多个参考文献,请不要上传它们并希望得到最好的结果。用通俗易懂的语言陈述每个人的角色。
一个实用的心理模型是:
- 图片 1 = 受试者身份
- 图 2 = 造型或衣柜
- 图片 3 = 背景或情绪
- 图 4 = 产品细节或品牌线索
当您需要控制细节与速度时,请使用 flex
flex 公开了两个非常重要的控件:
steps:最多 50。更高通常意味着更多细节和更多延迟。guidance:1.5 至 10,默认 4.5。更高的指导意味着更严格的及时遵守。
一个实用的经验法则:
- 当排版和精细纹理很重要时,请使用更高的
steps。 - 当模型不断偏离您的规格时,请增加
guidance。 - 默认情况下不要最大化这两个值。从默认心态开始,然后仅在输出以特定方式缺失时进行调整。
以下是生产工作的结构化提示示例:
{
"subject": "electric teal running shoe",
"action": "3/4 angle hero pack shot",
"background": "wet night street with reflected neon",
"lighting": "soft key light from upper left, subtle rim light",
"text": "the billboard in the background reads \"LIMITLESS ENERGY\"",
"style": "premium commercial photography",
"camera": "shot on Sony A7IV, 50mm lens, f/4",
"color": "shoe upper uses hex #00B7B2"
}
定价、硬件和部署现实
完整的 FLUX.2 指南还需要回答操作问题:它的成本是多少,以及应该在哪里运行它?
官方定价方向
Black Forest Labs 使用基于信用的定价,1 信用 = 0.01 美元,以及具有模型和分辨率的 FLUX.2 定价范围。
在较高层面上,官方文档是这样描述这个家族的:
| 模型 | 官方定价方向 | 这在实践中意味着什么 |
|---|---|---|
| 通量.2 [最大] | $0.07 / MP 起 | 优质最终输出层 |
| FLUX.2 [专业版] | $0.03 / MP 起 | 默认托管生产价值层 |
| FLUX.2 [柔性] | 0.06 美元/MP | 为控制和排版支付更多费用 |
| FLUX.2 [克莱因] 4B | $0.014 / 图片起 | 成本最低的交互式托管选项 |
| FLUX.2 [克莱因] 9B | $0.015 / 图片起 | 比 4B 更好的质量与速度平衡 |
| FLUX.2 [开发] | 免费供非商业本地使用 | 自托管实验路径 |
对于托管工作,请记住分辨率很重要。 4MP 图像的成本高于 1MP 图像,因此纸面上的“最佳”模型并不总是适合您实际预算的最佳模型。
许可和所有权注意事项
这是在线快捷方式导致错误的另一个领域。
dev是开放权重路线,但默认情况下它不是全面的商业许可证。klein 4B是 Apache 2.0。klein 9B使用 FLUX NCL。- 托管商业用途取决于提供商和您选择的端点的条款。
如果您正在构建业务工作流程,请将许可视为模型选择的一部分,而不是稍后阅读的内容。
本地与托管:哪个更聪明?
| 如果你需要... | 更好的起点 | 为什么 |
|---|---|---|
| 最低的摩擦力和坚固的品质 | FLUX.2 [专业版] | 质量和速度的良好默认平衡 |
| 最佳最终图像质量 | 通量.2 [最大] | 最强的提示跟随和接地 |
| 文字较多的设计工作 | FLUX.2 [柔性] | 更好地控制版式和细节 |
| 实时或大量生成 | FLUX.2 [克莱因] | 亚秒级且经济高效 |
| 自托管、实验、定制培训方向 | FLUX.2 [开发] | 开放式重量和本地控制 |
换句话说,正确的 FLUX.2 模型主要是工作流程决策,而不是排行榜决策。
如何选择正确的 FLUX.2 变体
如果您不想考虑太多,请使用这个简单的决策框架。
如果您不确定,请从 pro 开始
pro 对于大多数团队来说是最安全的首次评估模型,因为它现在受益于 2026 年 3 月 3 日的速度升级,保持生产友好性,并且不会强迫用户进行控制调整。
如果您的图像包含文本或严格的布局,请移至 flex
创建时使用 flex:
- 海报
- 包装
- UI 和产品模型
- 信息图表
- 小文本必须保持清晰的营销布局
当最终资产比成本更重要时,转向 max
当您关心以下问题时,请使用 max:
- 最高风险的英雄视觉效果
- 更强的及时忠诚度
- 实时生成当前信息
- 最终候选资产而不是广泛探索
当延迟为乘积时,移至 klein
当您的产品需要立即生成时,请使用 klein:
- 消费者应用程序
- 内部创意工具
- 批量变化系统
- 快速实验循环
- 较小硬件上的边缘或本地部署
当控制比便利更重要时,请转向 dev
如果您的团队需要以下内容,请使用 dev:
- 开放重量实验
- 本地优先堆栈
- 微调或研究导向的工作流程
- 对模型如何部署有更直接的所有权
在 Seedance AI 上使用 FLUX.2
如果您想使用 FLUX.2 而不自行管理 BFL 组织、积分和端点选择,最简单的途径是通过 Seedance AI 的 FLUX.2 工作区 使用它。
Seedance AI 在这个工作流程中的自然定位很明确:它是一个一站式 AI 创建平台,FLUX.2 可以与其他图像和视频模型并存,而不是成为堆栈中的孤立工具。如果您的真实工作流程如下所示,这尤其有用:
- 使用 FLUX.2 生成产品或活动视觉效果
- 利用 AI 视频模型将获胜的静态资产转化为运动
- 比较多个模型系列的输出,无需每次都重建工作流程
- 将图像生成保持在更广泛的创意流程已运行的同一环境中
对于许多团队来说,操作便利性与端点之间微小的质量差异同样重要。
常问问题
FLUX.2 与 Midjourney:哪个更好?
这取决于工作。中途对于风格化的审美探索仍然很强大。当您需要多参考控制、更可靠的排版、品牌颜色精度、编辑工作流程或更清晰的从实验到生产的路径时,FLUX.2 通常更适合。
哪种 FLUX.2 变体最适合可读文本?
从 FLUX.2 [flex] 开始。它是黑森林实验室明确定位于版式和细粒度控制的变体。
FLUX.2 定价:多少钱?
官方托管定价取决于变体和输出大小。如上所述,max 起价为 $0.07 / MP,pro 起价为 $0.03 / MP,flex 起价为 $0.06 / MP,klein 起价约为 $0.014 至 $0.015 每幅图像,具体取决于模型大小。
可以在本地运行 FLUX.2 吗?
是的,但答案取决于变体。 dev 是面向高级用户的开放权重本地路径。如果速度和较轻的硬件要求最重要,那么 klein 是本地路径,4B 型号定位于 13GB VRAM 范围左右的消费类硬件。
FLUX.2支持负面提示吗?
不,不是以人们通常期望的方式。官方指南是描述您想要的积极视觉效果,而不是列出要避免的内容。
FLUX.2 适合品牌一致的营销活动吗?
是的。这是其最明显的优势之一,因为该系列是围绕多参考生成、精确的色彩控制以及比许多氛围驱动工具更结构化的提示而构建的。
最终判决
截至 2026 年 3 月 19 日,思考 FLUX.2 的最有力方式是:它不是一个单一的“最佳图像生成器”声明。它是一个精心设计的模型系列,非常好地涵盖了几个严肃的生产场景。
它的核心优势是实用的,而不是炒作驱动的:
- 针对不同工作流程的清晰模型细分
- 强大的多参考编辑和生成
- 比许多竞争对手更好地支持可读文本
- 有用的控制功能,如十六进制颜色匹配、结构化提示和姿势指导
- 托管便利性和本地部署之间的真正选择
如果您只记得一个要点,请记住这一点:从 pro 开始,对于文本较多的工作转向 flex,对于高级决赛转向 max,当延迟或所有权比便利更重要时转向 klein 或 dev。
该决策框架将比任何通用的“FLUX.2 评论分数”让您走得更远。


