安兔兔一些跑分软件并不能保证觉对客观的将手机的性能展现给人看。

老罗又开炮了,这一次面对的是测试软件。因为锤子手机在同配置手机中“跑分”并不占优势(尤其是被广大手机爱好者所经常使用、喜闻乐见的安兔兔)而被不少舆论指出。老罗这一次一不做二不休,不仅放出了“AnandTech的调查报告显示:除摩托罗拉和谷歌Nexus产品之外,几乎所有世界级大厂的安卓手机都在跑分上作弊”的言论(来自罗永浩个人长微博内容),更是将几乎市面常见的测试软件的分数有意而为之的进行了“劣化”。锤子手机就这样成为了一部有史以来跑分最低的旗舰手机——其数值甚至低过300元的底端安卓机。于此,关于跑分,老罗宣称“我知道大家认同这个行业游戏规则,但我们不打算认同”。

安兔兔跑分规则存“狭隘性”

以测试软件作为评价计算设备的性能是长久以来行业一个公认的做法,这件事情从PC行业的处理器、显卡延展而言,在当年,英特尔、AMD、英伟达、ATI(后被AMD收购)就不时遭遇测试软件作弊、优化的抨击,也时有旗舰产品跑分不如意的情形发生。这种潮流被完美的移植到了手机上,其中一个叫“安兔兔”的测试软件在这个年代瞬间风行。为什么是它火起来了而不是别的测试软件火起来了?

其实原因有很多:早前的不少测试软件都是基于专业用途,因此其界面、结论非常需要专业知识做背书,一般的爱好者或是用户无法从其中得到笃定的、直接可以解读的含义,安兔兔则彻底的将这种专业知识门槛打破,其结论变为只要是对手机产品有兴趣、有一些基础认知便可轻松易懂。

不过这类新形态的评测软件在经过了一段时间的风靡后,得到了两面性的评价:一种是在低门槛入门用户群中得到欢迎,而另一种是对于这种评测软件是否能够代表手机的真实完整体验指标评价的质疑。

评测软件其实有不同的两个类型,一种是基于实际场景的应用体验,比如非常老牌的XPRT系列的评测软件,其针对安卓平台设备的MobileXPRT专门有一测试项为UX Test(用户体验测试),这项体验的分数完全不同于我们可以理解的常规性能跑分。千元档的机器跑出来的分很可能比旗舰机还要高——它透过真实的屏幕滑动、图像处理、缩放放大等众多真实应用场景来测试真实的手机操作流畅度得出分值。

早期不少跑出了30000+安兔兔分数的国产旗舰机型在Mobile XPRT的UX Test单元仅能得出40-50分的惨淡分数——而这个分数与该机器真实的使用流畅程度反而是吻合的,点名机型:金立E7。而不少优化出色的廉价机型,如采用联发科处理器的索尼Xperia C,在UX Test单元可以得到98分的高分。它比较客观的呈现了手机操作的流畅程度,因为在这项测试中,能达到100分以上的机型已是凤毛麟角(目前测得的最高分数102来自SONY Xperia Z1 Compact/Nexus5,这两部机型的顺畅程度我相信大家有目共睹)。

操作非常流畅的Smartisan T1跑分比不上配置更低的手机,这科学么?

这类并不以理论性能为基础而是依据真实体验测试的软件因其使用门槛较高,且得分并不容易被厂商利用成为自己的卖点,除了在专业杂志及文章中被采用外,网络舆论中并不常见。

而占据主要舆论市场的另一种评测软件便是以理论运算性能的测试为主要手段,典型如安兔兔,这种测试软件并不基于真正的应用场景,而是基于处理器的理论性能,因此时常出现跑分颇高但实际体验欠佳的情形,也有跑分非常一般但运行无比流畅的产品出现。在去年就已经有不少媒体指出当下的安兔兔这类跑分软件已经不能代表一部手机的真实体验,而部分老字号的技术杂志、平面媒体甚至在评测体系中直接摒弃了安兔兔的存在。由此也能看出这种跑分体系对于产品评价体系慢慢体现出的狭隘性。

不服跑个分”成为网友对其“既是裁判员又是运动员”做法的调侃。不过在我这更多是一种网民的调侃,因为在诸多超越小米的旗舰机型出现后,小米自家产品的跑分数值也不再处于最高的几个名次。另一项重点之一来自最新更换了算法的安兔兔V5版:安兔兔声称更换了算法“更加具有可参考性”,不过令早前拔得头筹的华为海思新旗舰处理器Kirin920分数立刻落后于骁龙801机型。这种评测体系规格的改变令公众猜疑其背后的利益关系。

但实际上,因为安兔兔这类测试软件拥有数量异常庞大的用户群,即使厂商们心知肚明某些利益关系,仍然对它的跑分给产品可能带来的宣传作用表达了不同程度的重视:这件事情从安兔兔V5内测版的媒体沟通会上ARM、高通、英特尔、英伟达、展讯、海思、瑞芯微等几乎所有的移动设备处理器厂牌都趋之若鹜的到场参加就可窥见一斑。

看似漂亮的跑分成绩都是优化过的

基于“安兔兔们”强大的“群众基础”,大部分手机产品为了展现自己的性能优势——尤其是旗舰产品,走上了一条针对测试软件的“专门优化”的不归路。有的舆论称其为“作弊”,其实有些夸大:因为所有的“专门优化”不过是在检测到测试软件的运行时将手机的性能最大化而已。为了平衡手机的功耗和性能之间的关系,当下大部分的移动处理器都采用了动态调配的主频/功耗设计,日常应用时维系在比较低主频和工作核心较少的状态(后者针对多核处理器),而到大负载高负荷的应用时切换至高主频甚至是“马力全开”的状态——在测试软件运行的时候往往手机被优化至“马力全开”的状态,也就是你的手机标称的处理器的主频+核数全数工作的状态,这个也包括GPU的状态。

因此,你看到的漂亮无比的测试软件分数所代表的性能,在大部分的应用场合下你是享受不到的。从这个技术细节上,你就可以轻松理解老罗的“跑分软件劣化”是怎么实现的——无非就是别家手机在检测到测试软件的事情“火力全开”了,而锤子人为的进行了性能的硬性限定,仅此而已。

有人一定要问了,为什么手机就不可以时刻“马力全开”让用户享受到标称和测试跑分体现出来的数据呢?如果你想让你的手机不只是“冬天里的一把火”而是“每天都是一把火”的话,这个功能分分钟可以实现的啊。已经被“电量焦虑症”和“暖手宝综合症”害得人心惶惶的智能手机产品必须考虑到实际的应用情形,令产品时刻工作在峰值状态是没有什么实际意义的。因此,你大概也能理解了一下几个事实的存在:跑分软件执行的时候手机的耗电、发热量都会急剧上升,部分手机跑了多次分数之后你会发现分数是不断下滑的——因为手机持续长时间发热引发了手机内部温控的保护机制,处理器开始硬性降频保护,而更有新闻指出手机扔冰箱里跑分会跑出好成绩——这也完全不足为奇了,因为低温环境抵消了手机跑分带来的高发热量可能引发的手机降频保护。

不过说到此大概你也会明了,这种跑分真的能代表这部手机的日常体验吗?真的只是个数值参考而已。而往大里说,包括手机参数标称的核数和主频,往往也是它能够达到的峰值主频和性能,并不能代表其实际获得的体验。

回过头来我们说说同样以测试软件作为评价体系的重要组成部分的PC行业,同样经历了跑分大战(不过那个跑分大战门槛比手机高多了)之后,处理器的标称方式已经发生了重大改变,英特尔/AMD都会推出自家的“自适应超频”技术——比如英特尔的睿频技术。在常规的应用条件下,处理器运行在较低的标称主频上,而有了高负荷强度的计算时候,才会以睿频技术运行。因此你看到的现在大部分的PC处理器的标注方式已经变为类似“2.2G/3G”这样的标称方式,明确的标注常态的运行主频和峰值主频。虽然处理器主频这件事儿其实离广大消费者实际使用中可感知的部分差得很远(除了被商家作为忽悠消费者的主要指标外),但这种明确的实用值和峰值的标注方式值得手机处理器品牌学习,这种更接近实际运行状态的标注更符合真实的场景。

跑分是消遣,认真没啥用

不过你以为这就是全部了吗?No,No,No。老罗在这篇个人长微博的最后一段颇有深意,其实也就是光明正大的说清楚了自己做这件事情的真正意图:“产品经理在精通产品设计之外,最好同时懂得市场营销和品牌建设,从人性洞察的角度看,这三者其实是一回事。”有一句俗语:“人越是缺少什么,越是在乎什么。”老罗才不是真正的不在乎,而是利用了它在互动的这件事情做了一次成功的、不按常理出牌的营销,一面是成功的塑造“反跑分”的“道德制高点”形象,而另一面其实也完美的彰显了对于这件事情的心有不甘。若是真的毫不在乎,何必如此大动干戈?当然,置身于行业之中,你也无法完全将跑分这件事情置之度外。从营销角度将,老罗的举动亦算是成功的,不过也可以顺势看到老罗的真实心态:亦是精明,亦是不甘。

突然想起了《小时代3》,如果你看过剧中不断的好了分、分了好的姐妹撕逼大战,就是瞬时间明白测试软件们和手机品牌们相爱相杀的纠结情愫:与我所用是优势,自然卿卿我我甜甜蜜蜜如胶似漆;于我是无关痛痒甚至是不利因素,自然是毫不客气的恶语相向。所以,广大的手机用户们——尤其是跑分爱好者们大家都醒醒吧,如果不想被这两个利益阵营利用成为彼此对抗另一利益阵营的筹码,就把“跑分”这件事情看成无聊之时的一种消遣吧。毕竟买回来的手机是要用得放心、玩得舒心的,而不是天天给你生成一个五位数字哄你开心的。

手机跑分中含有很多猫腻,还是理性点好[图]图片1