官方微信 手机客户端 设为首页 收藏本站

织里资讯

搜索
查看: 122|回复: 0

影调是噱头?新功能下放?AI 抗幻觉?价格有点贵?FindX7 的小问题张老板直

[复制链接]
发表于 2024-3-29 11:29:47|来自:中国浙江湖州 | 显示全部楼层 |阅读模式
本周一,OPPO 的年度影像旗舰 Find X7 系列正式和大家见面了,大家关于这款新机的影像表现还是有很多期待和兴趣的。尽管相关内容我们目前还在进行中,但是我们有幸参加了 OPPO 组织的媒体采访环节,我们和众多媒体一起采访了 OPPO 首席产品官刘作虎、OPPO 影像产品总监张璇、OPPO 软件创新中心总经理张峻,他们也回答了很多我们关系的、也是用户关心的好问题。以下是采访实录,有删改。
受访人:OPPO 首席产品官刘作虎(中)、OPPO 影像产品总监张璇(右)、OPPO 软件创新中心总经理张峻(左)图片来源:蜂鸟网媒体:关于定价的问题,这次两个价格一出来以后,拉得很开,这是很多人的感觉,虽然标准版是 4599 那个档位,但它还是离 Ultra 整个定价有 2000 元的区间,拉这么开,客观地说,在市场上做产品布局是非常不利的,所以我想问问,你们是如何看待这个问题?我知道 Ultra 的定价的确是往上拉,你的定价是和之前的 Pro 是一样的,但因为标准版往下走了,起步价往上走了 500 块钱,这中间怎么填?刘作虎:你应该感觉得到我们两个版本都是诚意满满,我们的 Ultra 有升级,但价格和之前没有什么变化,标准版反而比之前更有诚意,我们的确也没有想好这中间的 Pro 怎么做,大家也知道在 X6 时把 X6 Pro 定义成当时的影像旗舰,在 X7 时,我们依然是这样的定位,不停地往上加,加上去以后发现 Ultra 的定义就是代表最巅峰的旗舰,下面还是有一个目的,希望能让更多用户体验到,不然做了这么多好功能,结果就几百万人使用,未来有没有上千万人使用这个产品?我们发现 4K 到 6K 的价位是一个非常主力的价位段,这一段的用户是在增长的,所以我们希望在这一块可以做得更扎实,让更多人能够用到,所以这次就把诚意做足,至于未来中间的怎么填,等我们想好产品怎么定义的时候再来填,反正一个是做到最好,一个是让更多人体验,先把两个极端做好再说。实际上,我不认为这两者对销量有什么影响,说不定比以前卖的量更大,的确是诚意满满。媒体:Pete,你能不能解释一下为什么还没有想好 Pro 版怎么做?因为这一代标准版基本上和上一代的 Pro 很近。刘作虎:当然和别人的 Pro 比,别人的 Pro 还不如我们的标准版,所以要超越 Pro,我们定了诚意的价格,我是用 Pro 的产品,但是定义了标准版的价格,无非就是想让更多人使用。这的确会导致中间的 Pro 定义的难度变得更大,因为我已经把 Pro 给到大家了。爱否作为一个影像旗舰,为什么这次没有 1T,特别是 Ultra 顶级版本没有 1T?刘作虎:我看到很多人有这个需求,之前还在想这个事情该怎么搞,如果这个需求很强,我是该好好考虑一下,需求收到了,如果以后真的有,我代用户感谢你。媒体:现在很多摄影师在使用手机时面临一个问题,他们最常用的焦段并不是现在手机中 23mm 的主摄,对于很多职业摄影师来说,他们更喜欢用 135mm 或者 50mm,现在有很多摄影师吐槽所有手机的主摄都太广,我想问问,OPPO 有没有什么计划未来改变摄像头的模组?而且现在对于大部分用户来说,都认为超广角镜头是比较鸡肋的状态,大家用的比较少,但它又在所有手机中存在。张璇:这里面还是会有一些不太一样的角度。第一个问题,的确主摄会越来越广,去年在做 X6 Pro 的时候曾经问过大家,发现的确有人觉得很广,所以我们第一时间推出一个功能,通过主摄的方式可以定义 28 或者 35 的焦段,苹果后面也做了,苹果的做法比我们更好,它提供了点切的选择,但会不会回退?这里面有一个前置条件,假如退到 35mm,你究竟可以用多大的硬件来做它?如果退到 35mm 之后,硬件至少需要用 1/2 左右英寸的底才能做到不错标准,如果以 23 焦段真实地做 QBC 算法的部分,其实在 35mm 的部分也可以做到等效的效果,我的答案是随着一英寸带来的变化,大家对高度的限制,在做一英寸的 35mm 有没有机会?目前看起来没有机会,我们在做模组时推演过,我觉得不太会发生。我们也看到市场上有一些变化,比如接下来的产品焦段会不会都往 23mm 上靠?我的看法可能是在 27mm 左右,有一些项目可以做到 1/1.5 英寸的尺寸,但一英寸没有机会。第二个问题,和超广角有关。首先,重回拍照的角度,大家觉得超广角构图相对比较难,事实上从更大的用户在日常的用户使用中,超广角的使用比例并不低,我们发现很多用户拍摄时,并不是基于构图的需要,而是基于看到的信息需要拍到。其次,超广角还有另外一个作用,超广角之所以不能取消,是因为人像焦段和主摄裁切以后想覆盖 50mm 人像,还需要用双目虚化来做,如果这个时候把超广角取消,另外一个焦段人像模式和算法会受到影响;第三,超广获得的信息是最广的,剩下所有焦段的信息应该是以它为 base,如果没有超广,有可能接下来再做 SAT 变焦、多摄一致性协同,以及运动检测,超广是最早看到的,超广基于算法的角度,还是有更大的作用。包括我们现在做视频,事实上超广做视频时,由于 FOV 的变化,防抖的效果指标更有优势。纯粹讲摄影的维度,越来越广的广角使用会有问题,但放在整个影像框架和架构中,我认为超广不会消失,当然排序,大家可能会默认主摄、长焦、超广,大家在一些策略上,超广的产品选型相比以往增加会有放缓,但基本上在旗舰机里是 1/2,在一段时间内是稳定的。媒体:Find 影像这两代很强调影调和审美的工作,但有一些普通的用户无法欣赏这个东西,可能没有经受过美学训练,包括有一些个别场景影调也不是那么万能,比如想拍美食,中间调和上一代的暗角就不像他想象的比较俗的好看,在正确的审美和大众认知之间,OPPO 怎么考虑这个事情?张璇:这个事情真的没有那么复杂,我们从来没有想教育大众,影调不是我们发明的,影调是影像诞生,影调这两年在传播中有一点被异化了,影调好像成了某种风格,影调等于高对比度、高明度,影调这两个字可能伴随着摄影,我们把影调看成光影,把色彩去掉以后,整个画面明暗的分布,它本质上并不是一种风格化,而是摄影相对比较本质的地方。我们做影调,并不是我们强调影调,而且我们做摄影中必须要抓到摄影本质是什么,这个本质是指当我们掌握一些本质的能力,我们可以帮助用户更好地创作,所以影调才会被提起来,对大众而言,的确不需要了解影调这两个字是什么,或者中间调是什么,大众拍到手最直观的感觉。我举一个真实的例子,昨天请几个朋友吃饭,他们问我干什么,我说这两天发新品,他们问相比以前有的产品什么不一样的地方?这很难讲,也不可能讲影调、中间调,我说就拍几张人像,拍完以后给他们看,他们看完以后第一反应是你给我修图了吗?我觉得这就是普通人认为好照片做的好的地方,我们在做影调和相关部分的背后是在践行 OPPO 的理念 “轻松捕捉生活之美”,什么是轻松捕捉?用户点快门就好了,生活之美是用户日常中所拍的场景,用户不需要思考它应该是什么样,拍出来的东西,用户觉得 “给我修过了吗”,是一种非常高级的审美,但是这种高级的审美严格意义上不是区分低级的,我相信用户看到之后还是觉得它很好。如果我们真的要做一个东西需要教育用户很好,那有可能是我们错了,我觉得这是很核心的地方,我相信那张照片,我们要相信大众的眼光和变化。上个月,我们在内部也在分享,比如以前我们说韩剧的光影很好,电视剧打光很强,但奈飞进入了韩国以后,韩剧进入了另外一个阶段,比如我们看《黑暗荣耀》,我们看十几年前的《浪漫满屋》,影调、色彩,奈飞的电视剧很像电影,很大一部分是影调整体的进步和理解的变化,我们要相信公众的审美,只是我们把公众想要的东西通过我们的技术手段来实现出来而已,我觉得影调不是风格化。媒体:在较小光圈和更长的焦距,以及在更大光圈和较短焦距中,我们发现 OPPO 选择了前者,较小的光圈,但获得了更长的焦距,这是出于什么考虑?和竞品的对比,虽然竞品焦距短点,但通过 AI 算法也可以获得不错的画质,而且由于它的光圈更大,所以在超长焦拍摄的成功率更高一些。面对这个问题,你们是怎么看的?张璇:其实这两个技术并不矛盾,在我们的产品上,这两种选择都有,如果基于竞品的选择,分为两方面看更合理,严格意义上,如果没有任何限制条件,当然每一个焦段做最大光圈显然是最好的,但做产品是限制性的条件,在刚刚那个条件里,还有一个条件,我们把这个机器拆开以后发现占比空间有多大?如果我们把它拆开来看,刚刚讲了影像最难的地方不是要不要做所有行业里最高的模组,而是所有的模组放在一个超影像旗舰里,会不会这个产品只剩下影像了?我们在做这个产品时有一个非常关键的点,首先是超大杯,即便影像作为行业领先,但它一定是一个手机。就像去年做完 Find X6 Pro 以后,在中间做了一次媒体回访,除去商务合作和真实的工作以外,最终媒体用哪些手机更多?这是一个很重要的指标。我们很欣喜地发现,除了商务合作阶段的特性之外,Find X6 Pro 的使用率非常高,甚至很多媒体是去年一年下来真实作为主力机使用时间最长的,这里面有两个关键因素,首先是当然它的影像非常好,其次它真的可以作为日常手机来使用,在这个情况下,如果还想提升焦段的表现力,应该用什么样的组合来完成超大杯的特性?在整个技术方案里,它并不是单一选择的逻辑,它包含了两个长焦之间的组合完成焦段的覆盖,如果选择一个更近的焦段做大,有没有什么坏处?有,高度会非常高,其次是需要作一些裁切,但焦段可能只能落在 100 的范围左右,这个时候如果要往前补,要不就要补一个直立的,往后补也很难,但如果作为之一的选择,它是一个不错的选择,它试图在覆盖时作到一定的覆盖,如果看超长焦的解析力,尤其是推完之后可以再比一下,超大杯的特性,有时候厂商比的可能是 90 分和 95 分的区别,这 5 分的差异是很重要的,但在标准版时,大家比较的是日常使用更顺心。我同意你的观点,如果随着技术的演进来做,同样的焦段,是不是更大的光圈表现力更强?当然是这样的,这也是去年我们在做中焦时为什么选择大底,把光圈做到中焦最大的原因。媒体:关于今天的大模型,我们看到今天演示了通识问答、多模态的能力、录音转文字再作总结,包括今天精彩的演示对我们个人得生活有很深的介入,我比较关心的问题是它总结生成内容准确性如何?有没有一些具体模型幻觉的情况?能不能分享一些更详细的?以及生成出来的东西是否在事实上是准确的。张峻:我们一般评估大模型的效果时有几方面:一是准确性,二是完善度,特别是对摘要这样的功能,后面还有对于信息细节的反映,以及有一些负向指标,这可能是全量评估摘要模型。在这个模型上,我们对于通话摘要这个功能做了很多竞品对比综合测评,可以很负责任地讲,我们在所有的综合评分里是最好的。另外一方面,经常有人问我们,比如通话摘要实现了 70 亿大模型端侧化做的,很多人问为什么选择 70 亿,为什么不用 10 亿?其实我们在上次的产品技术沟通会里专门有展示过对比,我们每一个场景都会选择最恰到好处的参数规模,它代表了这个模型在这个场景的聪明程度,我们也会选择最恰当聪明程度的模型来做最恰当的场景。事实证明,在新模型上,在通话摘要功能的设想,包括摘要的准确度、关键信息的提取完善度、细节提取的精准度上面,我们和竞品对比都是比较好的。爱否我们的 AI 有考虑过本地化部署的问题吗?未来会有直接运行在本地,不需要联网或者说不需要联云同步的这种部署的方式吗?张峻:有,这次的 X7 本身就会端侧化部署 70 亿参数的大语言模型,视觉模型也会端侧化部署,它会跟着我们的 OTA 后面上线。我们也看到真正把 70 亿参数大模型同时在两个芯片平台上端侧化部署的,可能 OPPO 也是第一家,真正应用起来的。媒体:关于影像,2021 年有发布了连续光变技术,为什么这次 Find X7 Ultra 选择双潜望的方式,而没有用连续光变?张璇:很简单,连续光变底的尺寸会做得非常小,当时做底的是接近 1/4 左右的底,但是做连续光变的时候,连续光变的本质是要保证中间焦段画质的部分,但尺寸非常大,甚至连续光变的尺寸比现在用的 1/1.56 中焦潜望尺寸更大。连续光变是一种技术方式,用户最终买的不是技术,用户买的是解决问题的方案,最终比较时逻辑很简单,在尺寸供应链的可靠性、算法和最终效果角度上,哪一个方案更可以覆盖用户常用焦段的画质,这是一个先决条件。其次是连续光变看起来缩成一个模组,但有一个问题,比如这次看 6X 人像表现力很好,本质上是我们有一颗最厉害的中焦作为景深和虚化裁切,如果没有中焦两个摄像头配合,6X 人像的抓拍、虚化不会做得太好,因为做景深需要算,如果做成连续光变,它强化了光学特性,但有可能从画质和基于算法的链路来看,它并不是最合理的,这也是很多媒体之前问的为什么不做成光学,不是不能做成光学,而是现在的手机影像是计算影像时、移动影像时,是平台算力、算法和模组之间的组合,不太容易退回到原有相机的逻辑,否则就会出现在手机里有很多功能和使用上,从体验的维度上未必像大家想的那么好。爱否:我发现咱们的两台产品线,很少见的在一个产品线里面用了两个芯片的平台,同时用了天玑和高通,我们发现有大量的功能在两台产品上都有上线,对于厂商朋友来说同时调教两个产品平台,在技术方面有没有遇到什么困难?或者有什么感受?尤其在 AI 这个方面对 NPU 的要求还比较高的一个场景。刘作虎:唯一的就是要加大资源,的确,你说得是很对的,同时做两个平台挑战非常大,这个就只能加人了。爱否上一次参加另外一个友商品牌发布会时,有一个媒体老师问,你们和 iPhone 比摄像大概能到多少分?我也想问一下我们的手机既然特意强调了摄像这个视频,和 iPhone 比大概能到多少分?张璇:我们是 iPhone 视频的学徒,这个也不是谦虚,事实上,我们做完视频就发现和 iPhone 的差距是非常大的,我相信你们在座的一定也是同样的这个问题。刘作虎:所以如果行业有人说他的视频跟 iPhone 水平一样,那你就知道他是吹牛的,不靠谱。张璇:所以我们这一代在做芯片的时候,尤其 MTK 在合作,包括我们做芯片,把它打开来讲,其实视频很大程度上对于你软硬芯算尤其是功耗的能力是要求非常高的,你拆开苹果看就会发现,苹果的功耗非常可怕,可怕到苹果以最高的指标来跑,比如 4K60 帧一些压的时候,可能比厂商不跑 4K60 的功耗还低,这个根本就没法玩对吧?你拆完以后就会发现,这个差距别想那些有的没的,我们当时说,要不要拿出一些功能?虽然我们在发布会上好像拿苹果做 PK,但我们心里非常清楚,在视频的相当长时间内,它一定还是一个学习的过程,所以我们今年在做视频的时候,当时我们做产品规划,我定了几个月,我说我们也不用做什么奇奇怪怪的视频功能,你把视频里面你们要的第一个问题是视频可不可以让我非常稳定地连续进行拍摄?这一个点先把它展开来看,所以我们今年的视频发布会没有讲任何新功能,这个有点像我们去年做相机的时候的第一年一样,也不做任何的新功能,就把老功能新做,所以今年的视频我希望得到你们的评测,我们自己认为如果你把苹果的视频看成 100 分,我觉得我们今年做完之后差不多也就是在 80-82 分之间,我觉得应该是这样的。刘作虎:我补充一下,视频这一块,我自认为我们的方向目前应该理解还是对的,就像视频方面,刚刚张璇也说,我们跟 iPhone 比,我觉得整个安卓跟 iPhone 比,不是一个点差距的问题,而是一个系统性的问题,所以我们还是回到系统性的问题那你应该怎么去解决,而不是要说我今天这个点好像在某一个特定场景很牛。所以视频这个方向,我记得在过去很多年安卓的厂商理解都是错的,我觉得我们现在至少在一个正确的方向上,但是我觉得这条路还比较长,就是你首先怎么把它做到稳定拍摄,这个已经是很不容易了,并且它很多的算法跟我们现在在拍照上面不断地去加一些算法,让局部场景要做好,这个思路是完全不一样的,所以整个在视频上我觉得整个团队的理解现在是在正确的方向上。张璇:对。我们今年的视频目标就是让大家在拍的时候觉得和 iPhone 很像,但是你仔细放到一些极端场景,可能你依旧能抓到我们不如 iPhone 的地方,我觉得这个可以得到你们这一块的反馈,对我们改进很重要。刘作虎:今年是我们全焦段支持 4K HDR,iPhone 可能什么时候就已经有了?但其实你就算做到这种一致性,这种我觉得也是很挑战的,但这是一个长期的过程,比如说今天 iPhone 视频是 100 分,我们现在做到 70 分,明天做到 80 分,后天 85 分,我觉得这个已经不错了,但是我拍照的确还是挺牛逼的,对不对?张璇:我觉得这一代可能不能让你们感觉到 iPhone 视频认知,但是这一代如果你们用我们的机子进行拍摄,可能会觉得视频在很大程度上能够让自己放心地交给它去用了,这个很重要。因为我印象中跟你们很多人沟通,一说到拍视频,你们其实极少用安卓来完成类似的部分,以至于我发完媒体机之后,想通过公关去回收你们视频的反馈都收不到,所以我恳请大家可以多用一下,有什么样的意见反馈给我们提点。刘作虎:但是我听到反馈,我们 N3 的视频大家好像说提升还是挺大的对不对?但肯定跟 iPhone 还是有差距的,所以我们希望两年后可以再更进一步。媒体:我表扬两个比较好的点,首先关于发丝抠图效果带给我的感觉非常好,不知道能不能透露算法逻辑是怎么样的?我从观感上来讲,不像是一根头发一根头发抠出来的,更像是还原了一部分发丝。张璇:我们其实还没有做 AIGC 的部分,但的确可以用 AIGC 的方式来做某些场景可以达到更好的效果,对于我们的算法而言,这个事情已经搞定了。但这两条线的逻辑我们都在做。老师您此刻拿到的发丝级的虚化,它的确是基于我们的 AI depth mask 这样的方式来做的,我们用更多的计算来处理,但 AIGC 以后能不能生成一些方式,试图让它看起来更真,问题是可控性问题还需要斟酌一下。今年在我们的项目里,景深的深度信息会算得更准。对于主体的识别部分,对于某些特征,比如绒毛状物体边缘,尤其是大模型之后,相机在本地端的算法,能产生非常积极的效果。你们反馈以后,目前这个方案还需要精进,还没有做到 100% 的、每次都可以达到最好的状态,但这个方向会继续往下迭代。行业里有一些是用类似的方式做,在一些场景里可以达到不错的效果,这也是很好的技术方向。但我们 在和 AIGC 讨论时,在今年和明年的产品里定了一个基本原则,在相机拍摄时,我们要捕捉生活之美,要以用户的实际信息作为条件。当然,当用户在相册里进行编辑时,是不是可以把它的整个生成或者范围变得更大,让客户可以自由选择地对其照片的部分。但目前还没有在相机端引入这些有可能篡改一部分信息,导致用户觉得拍出来的照片信息和预想的信息有问题的地方。在一些准确的地方,比如拍文字,一定要把文字拍得很清楚,不用猜文字。如果墙上没有字,生成一段文字,这还是要比较谨慎的。所以我们宁可把它放在后端作为功能的添加项,比如擦除、模糊等处理功能可以基于原图进行处理。随着技术的发展,相信相机的特性会得到反哺和提升。张峻:我在璇工的基础上稍微补充一下。现在抠图的功能并没有用生成式的能力。那为什么发丝抠的那么好?还是基于我们在人像和动物上积累了三年的数据训练。大家看到的 AIGC 消除那个功能的背景补充生成部分,那个是用了生成式能力做的。媒体:关于 AIGC 消除的部分,随着 AI 的发展,随着算力的提升,AI 的处理效果前置是迟早的事情,现在是通过后期编辑画一个圈,多少年以后 AI 会帮你去掉,OPPO 会怎么处理这个问题?还是在很长一段时间里不会动原始图象原始信息?张璇:我们在一周前,在技术内部发生了一次讨论,我们叫原产地保护,大家开始争议这个过程中,工程师发起的,大家发现算法进入边界以后,对于相机拍照的信息是不是真的,比如拍月亮,只要帮助用户拍出想象的照片,真实性从何而来?需不需要对原始图象作一个备份?就是原产地保护的逻辑,这是一个很好的输入,我们回去以后基于整个公司的图象 AIGC,包括我们公司有伦理的部分,会受到统一的管控。张峻:我接着璇工的这个讲。对,我们的思路是一样的,从 AI 的角度来说,这是一个很有趣的话题,AI 本身在生成式有大量的能力可以替代,在一段时间以内,我们内部讨论了很久,我们更希望把这种 AI 的能力作为用户的工具,帮助他、辅助,把意愿留给用户本身,所以在一段时间内,我们不希望直接作替代这个事情,从人性的角度来说,也许不一定是用户真正想要的,当然从大数据的角度技术上是可行的,但从伦理角度、体验角度,我们都希望在一段时间内定位成是一个 AI 辅助帮助的工具。



来源:https://view.inews.qq.com/k/20240111A0983800
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

联系客服 关注微信 下载APP 返回顶部 返回列表