如何使用 AI 创建bokeh效果 — Magic Eraser
使用 AI 深度估计在任何照片上创建专业的bokeh背景模糊效果。分步指南涵盖人像模糊、产品隔离和自然的景深模拟。
Product Marketing
审稿人 Magic Eraser Editorial ·

bokeh — 照片中焦外区域的审美质量 — 是摄影中最受欢迎视觉效果之一,这是有充分理由的。精心呈现的bokeh效果将主体与背景分离,营造出三维立体感,直接将观者的视线吸引到画面中最清晰锐利的元素上。专业人像摄影师花费数千美元购买具有大最大光圈的快速镜头,专门为了实现这种浅景深效果,而这种效果立即可识别,并被普遍视为专业品质摄影的标志。
挑战在于,传统上实现自然bokeh需要昂贵的设备。具有大光圈的快速定焦镜头价格从几百到几千美元不等,而小传感器物理特性意味着智能手机相机无法匹敌更大传感器搭配快速镜头在光学上实现的景深分离效果。这就是智能手机人像模式存在的原因 — 它们使用计算方法来模拟硬件无法物理产生的结果。但这些模式有众所周知的局限性:不精确的边缘检测会导致头发和细长物体边缘模糊,二值化清晰或模糊深度图缺乏光学bokeh的自然渐变,以及经验丰富的摄影师一眼就能识别的计算痕迹明显的人工高光渲染。
AI 驱动的bokeh工具代表了计算景深模拟的下一代技术,产生的效果远比基本的智能手机人像模式更加逼真。AI 构建的是连续深度图而不是二值蒙版,比立体相机计算更准确地估计遮挡深度边界,并以模仿真实镜头光学特性的方式渲染模糊效果 — 包括适当的高光盘渲染、逐渐的焦点过渡和与深度相适应的模糊强度。本指南将介绍如何使用 AI Filter、AI Enhance 和 Background Eraser 在任何相机拍摄的照片上创建专业品质的bokeh效果。
- AI 深度估计创建的是连续深度图而非二值化的清晰或模糊蒙版,从而产生表征光学bokeh的自然模糊渐变效果。
- AI Filter 同时控制模糊强度和bokeh特性 — 从微弱的环镜分离到媲美昂贵 f/1.4 快速镜头的最大奶油般虚化隔离效果。
- 头发和眼镜框等纤细特征经过专门的边缘处理,在模糊其间可见背景的同时保持发丝级别的细节。
- Background Eraser 为产品照片提供了一种替代方法,当完全替换背景比背景模糊更为合适时使用。
- 焦外高光渲染模仿真实镜头光圈的形状 — 圆形或多边形光盘,赋予计算bokeh光学真实感。
AI 深度估计如何从平面照片中创建逼真的bokeh效果
创建人工bokeh的根本挑战在于确定图像中每个像素与相机的距离。真实镜头通过物理原理实现这一点 — 来自不同距离物体的光线相对于传感器聚焦在不同位置,只有处于精确焦距上的物体才能产生清晰点,而其他所有物体都会产生越来越大的模糊圆。计算系统必须明确计算每个像素的深度,以确定需要施加多少模糊。这种深度估计正是区分令人信服的 AI bokeh与明显人工结果的关键所在。
AI 深度估计通过识别每张二维照片中存在的深度线索来工作:大小关系、遮挡、纹理渐变、大气透视和消失点几何。AI 已经从数百万张具有已知深度信息的图像中学习到这些线索 — 这些图像通常由配备 LiDAR 的相机拍摄或从立体相机对生成 — 并综合应用这些线索来估计照片中每个像素的连续深度值。
连续深度图正是 AI bokeh看起来自然的原因。早期的智能手机人像模式创建的是二值深度图,每个像素要么是前景要么是背景,产生明显的剪切效果。真实镜头不会产生二值深度 — 模糊程度随着与焦平面的距离逐渐增加。AI 深度估计为每个像素分配特定的深度值,因此主体清晰,两英尺外的物体略微柔和,二十英尺外的物体严重模糊。每个深度区域获得比例不同的模糊量,从而形成表征光学bokeh的自然深度渐变效果。
- AI 从单张平面照片中识别深度线索,包括大小关系、遮挡、纹理渐变、大气透视和消失点几何。
- 连续深度图为每个像素分配特定的距离值,实现随距离逐渐增加的比例模糊,而非二值化的清晰或模糊蒙版。
- 基于数百万张具有已知深度数据的图像(来自 LiDAR 和立体拍摄)进行训练,使 AI 能够比基于规则的方法更准确地估计深度。
- 模糊程度随距离逐渐增加,这使得 AI bokeh在大多数观看情境下与光学bokeh难以区分 — 二值蒙版看起来总是人工的。
针对不同摄影风格控制bokeh强度和特性
微妙bokeh — 相当于在全画幅相机上使用 f/2.8 至 f/4 光圈 — 提供恰到好处的背景柔化以分离主体,同时保持环境可辨识。这种模糊级别适合环境人像、订婚照和生活方式摄影,其中环境为故事增添了内容但不应该主导画面。
中等bokeh — 相当于 f/1.8 至 f/2.4 — 将背景模糊到特定物体无法辨认的程度,简化为形状和色彩。这个范围是大多数人像摄影的最佳选择:强烈的主体隔离配合平滑的背景渲染,同时保持足够的深度线索以了解大致环境。
最大bokeh — 相当于 f/1.2 或更宽 — 将背景溶解为纯粹的色彩和光线,点光源变成巨大的发光圆盘。这种模糊级别具有戏剧性和引人注目的效果,适合紧密特写头像、产品微距摄影和艺术创意作品。挑战在于保持可信度 — 真实镜头在这样极端的孔径下景深非常浅。
- 等效 f/2.8 至 f/4 的微妙bokeh在柔化背景的同时保持背景可辨识 — 适合环境对故事有贡献的环境人像拍摄。
- 等效 f/1.8 至 f/2.4 的中等bokeh将背景物体简化为无法辨认的形状和色彩 — 是大多数人像和产品摄影的最佳选择。
- 等效 f/1.2 或更宽的最大bokeh将背景溶解为纯粹色彩和发光高光盘 — 适合特写和艺术作品的戏剧性效果。
- 令人信服的最大bokeh应对焦平面之外的主体元素施以轻微柔化,而非保持整个主体均匀清晰。
处理边缘检测挑战:头发、眼镜和纤细特征
头发是计算bokeh最具挑战性的边缘,因为单根发丝只有子像素粗细,并会在其间可见背景的位置形成复杂的透明度图案。将每个像素分类为主体或背景的深度估计系统在头发上必然失败,因为沿着头发边缘的许多像素同时包含发丝和背景元素。
AI 深度估计通过沿着头发边缘分配基于概率的深度过渡来处理头发,效果优于传统方法。一个百分之六十是头发、百分之四十是背景的像素会接受混合处理,模糊背景贡献同时保持发丝贡献清晰。这种柔边抠图方法产生自然的头发边缘,每一根发丝都能在模糊背景下保持其清晰度。
眼镜框、耳环和其他小配饰带来了不同的挑战。这些物体与面部处于相同深度,但具有复杂的形状,深度估计可能会遗漏。AI Enhance 在初次bokeh处理之后,通过分析高频细节图案来优化这些检测,识别出眼镜框和珠宝具有应作为清晰前景元素保留的独特边缘特征。
- 头发是最具挑战性的边缘,因为单根发丝会产生子像素透明度图案 — AI 使用基于概率的柔边抠图而非二值像素分类。
- 柔边抠图为头发边缘像素分配混合深度过渡,在模糊其间可见背景的同时保持发丝清晰度。
- 眼镜框和纤细配饰可能被错误分类为背景 — AI Enhance 在初次bokeh处理之后通过高频细节模式识别来优化这些检测。
- 对于有问题的案例,仅应用于背景区域的 Background Eraser 提供了手动控制,决定哪些元素接受模糊处理、哪些保持清晰。
产品摄影和电子商务的bokeh应用
bokeh在产品摄影中同样强大,将产品与其周围环境分离有助于观看者专注于物品的细节和设计。在杂乱的桌面上拍摄的一件珠宝会与画面中的每个元素产生视觉竞争。同一张照片应用 AI bokeh后,珠宝在平滑模糊的背景衬托下被隔离出来,消除了干扰,同时保持足够的环境背景以传达场景信息。
美食摄影是 AI bokeh将智能手机照片转变为专业级内容的另一个领域。餐厅餐桌上的一盘食物通常背景中有盐罐、餐巾架和桌面杂物。AI bokeh保持食物清晰,同时将这些干扰模糊成诱人的暖色调。对于在社交媒体或外卖平台发布内容的餐厅来说,这单一步骤就能极大地提升手机照片的质量。
对于需要完全移除背景而非模糊处理的产品摄影 — 例如需要白底图的电子商务列表 — Background Eraser 提供了替代方法。然而,许多产品场景受益于bokeh提供的深度线索而非完全隔离。手腕上佩戴的手表搭配模糊的办公室背景,比同一只手表悬浮在白色背景上看起来更具吸引力。
- 带有bokeh效果的产品摄影既能提供产品清晰度,也能提供理想化的场景氛围 — 通常比纯粹的白色抠图或杂乱的生活照片转化效果更好。
- 美食摄影从 AI bokeh中获益显著,它能在保持每种食物纹理清晰的同时,将菜肴从温暖诱人的背景模糊中凸显出来。
- 对于电子商务白底图,Background Eraser 更为合适,但许多营销场景受益于bokeh所保留的深度线索和生活方式背景。
- bokeh与背景移除之间的选择取决于平台和目的 — 生活方式营销倾向于bokeh,而产品详情页倾向于干净的隔离效果。
AI bokeh与光学bokeh的对比:需要关注什么
计算bokeh最明显的特征是高光渲染。光学bokeh将焦外的点光源转化为发光圆盘,其形状反映镜头光圈的结构 — 七片叶片产生七边形圆盘,九片叶片产生更圆的圆盘,圆形叶片产生完美正圆的圆盘。将高光渲染为简单高斯模糊而非成形圆盘的 AI bokeh,对于任何熟悉真实镜头行为的人来说都会感到微妙的不自然。
第二个特征是bokeh品质 — 焦外区域是平滑宜人还是杂乱分散。在镜头光学中,这取决于球面像差特性。校正不足的镜头产生的bokeh平滑,高光盘边缘柔和。最优秀的 AI bokeh通过呈现柔和边缘的高光来模拟这种特性,看起来如同高端镜头的输出效果。
深度过渡的准确性是第三个判断依据。光学景深与距离之间存在特定的数学关系 — 模糊程度随距焦平面距离的平方增加。稍微位于主体之后的物体呈现出几乎不可察觉的模糊,而距离两倍的物体则显示出四倍的模糊。使用线性模糊缩放的 AI 深度估计会产生一种微妙的不自然感,而最高品质的 AI bokeh能再现真实光学系统的不对称前后景特性。
- 光学高光盘反映镜头光圈的形状 — 七片叶片产生七边形圆盘,九片叶片产生更圆的圆盘 — 最好的 AI bokeh能正确呈现这些形状。
- 宜人的bokeh品质需要柔和边缘的高光盘逐渐淡出,模仿高端镜头特有的校正不足的球面像差。
- 在真实光学系统中,模糊程度随距焦平面距离的平方增加 — AI bokeh应遵循这种非线性关系,而非按每个深度增量施加等量模糊。
- 前景和背景模糊具有不同的光学特性 — 前景边缘更锐利而背景更柔和 — AI bokeh应再现这种不对称性。
参考资料
- Depth Estimation and Bokeh Rendering Using Deep Neural Networks — arXiv
- Understanding Bokeh and Depth of Field in Photography — Cambridge in Colour
- Computational Bokeh: Advances in Portrait Mode Photography — Google AI Blog