这篇文章将会比515鸟巢发布会更精彩,因为很多发布会上没有讲述的内幕,将要一一揭开。

​​少啰嗦,看东西。

这次发布会我自己还挺激动的,但是大家看完后好像不是那么激动,看来起在技术理解上存在不匹配。

微博上的质疑集中在这个9999的TNT工作站,觉得这就是个显示器,不理解为什么显示器要这么贵。

TNT(Touch and Talk)的核心并不是显示器,显示器只是一个硬件载体。

这次发布的核心产品其实是一个创新的交互逻辑。

为了便于这套交互逻辑的设计动机,要先剖析一下IT行业的交互变革史(以下内容来自我的第一条问答)。

交互的发展史

计算机刚被发明的时候并不是现时看到这个样子的,而是这个样子的。

​像房子一样大的计算机​像房子一样大的计算机

当时的计算机一切数据和操作指令都是通过由纸带输入机进行的,是当时唯一的输入设备。穿孔纸带上利用一排孔表示一个字符,用穿孔或不穿孔表示1和0,来将指令和数据导入内存。

​用于人机交互的穿孔纸​用于人机交互的穿孔纸

穿孔纸用起来非常慢,即使是一个简单的程序,所需要的纸也是一箱一箱的。

后来,键盘终于被发明了,可想而知这输入速度有多大的提升啊,直到今天,键盘仍然是人机交互当中效率非常高的输入设备。

键盘键盘

​再之后,苹果推出(其实是抄了施乐)了图形用户界面的操作系统,同时把鼠标这种输入工具也发扬光大了(鼠标也不是苹果发明的),在图形用户界面上,鼠标是一种比键盘更高效的定位工具,与键盘配合直到今天仍然是高频的输入设备。

鼠标可以在图形界面中快速定位鼠标可以在图形界面中快速定位

​再然后,又是苹果,把触摸屏这种交互方式在智能设备上发扬光大,(触摸屏也不是苹果发明的,但基于移动设备触摸屏的交互方式,基本上是苹果定义的),所见即所得的交互方式更符合人性的直觉,乃至儿童不经培训也懂得使用,触摸屏迅速风靡全球,成为移动设备上非常重要的操作方式。

触摸交互符合人类直觉,更容易使用触摸交互符合人类直觉,更容易使用

​随着人工智能当中的深度学习算法变得成熟,语音输入法终于把识别率达到日常可用的程度,于是人们又多了一种输入方式:麦克风。只要说话就可以实现与设备的交互,机器能理解人说的话并转变成执行操作。

讯飞语音输入法讯飞语音输入法

​人工智能带来的交互方式不止一种,随着视觉识别技术的成熟,摄像头也成为了一种交互方式,人们只要对着摄像头做出某种手势,机器就能识别出你的操作意图。

支持手势识别的无人机支持手势识别的无人机

基于视觉识别的体感游戏机基于视觉识别的体感游戏机

​甚至,马斯克放言要基于人脑电波的识别技术开发脑机接口,你什么都不用做,只要你的大脑在想,计算机就能识别出来并执行你的意图。

脑机接口脑机接口

​感觉霍金应该很喜欢这个技术,可惜他走得太早了。

这中间,还出现过其他的交互方案,例如搭配Surface Studio使用的Surface Dial模块,在屏幕上旋转就可以实现很多功能,使某些应用场景下的交互变得更快。

Surface Dial旋转交互模块Surface Dial旋转交互模块

​还有MacBook Pro上的touch bar,也是一种传统交互方式的补充。

touch bartouch bar

​在人机交互发展史上,苹果并没有发明图形界面、鼠标和触摸屏,但却多次把握住风口机会利用交互技术开创出新的时代,在所有IT巨头中,苹果对交互的理解是最深的。

交互变革引发IT时代变革

IT技术的发展基本上是伴随着交互的变革前进的,新的交互会带来新的流量入口和市场机会,键盘鼠标之于PC,触摸屏之于智能手机,语音交互之于智能音箱,这些交互变革的规律无非两个:效率越来越高,使用越来越简单

键盘和鼠标比打孔纸更高效率因此繁荣了PC时代,触摸屏降低了交互的难度(老人小孩都会用),使移动计算设备得以更大范围地普及,而语音交互时代的到来,又一次降低了交互的难度(释放双手,不学习任何输入法也可以用),则使语音交互入口(如智能音箱,车载设备等)成为所有巨头都争相抢夺的新战场。

关于语音交互的趋势,大家可以参考几个数据,一是亚马逊的智能音箱(Echo、Tap、Dot系列)保守估计已经卖出超过5000万个了(注意:美国只有1亿多个家庭),二是Siri已经成为美国第二大搜索引擎了(是的,点亮屏幕-打开Google-输入关键词,人们都嫌麻烦),三是手机百度上使用语音搜索的比例是相当高的,最后,微信用户每天发送的语音是61亿条。

前三个数据是为了说明,人类总是懒的,当语音识别率在某些场景达到可用水平时,用户趋势肯定是倾向于不输入文字的,而微信的语音发送数据只是为了说明:发语音比打字容易太多了,这是微信当初引爆用户规模的其中一个杀手锏。

越简单的交互,越能侵入用户的生活。

基于键盘和鼠标的个人电脑已经发明了数十年,今天老罗却说,要重新定义未来十年的个人电脑。

为什么传统的个人电脑值得颠覆?

每一个质疑TNT工作站的人都认为,TNT在效率上怎么可能比PC+键盘鼠标+office三件套要高呢?

现在请office三件套高手回忆一下,从开始练习键盘打字、中文输入法、Windows使用等一系列平台工具,然后再学习office三件套基本操作及高级技巧,最终成为office高手,总共花了多少时间?

计算完这个答案,大家会哭。

​Office的高效率,并非来自平台或软件本身做得好,而是因为自己花了大量的时间学习和刻苦训练,而我们却把这种效率当作理所当然。

现在小学就有电脑课了,要学习键盘打字,要学习windows基本操作,要学习中文输入法,社会上有大量在职培训机构开设office培训班(在线课程也很多),真正开始工作后,还要学习大量的实战技巧,这些都是你成为office高手前付出的代价。

电脑培训班是全球性的产业电脑培训班是全球性的产业

​事实上,windows和office都是相当难用的,因为这两个软件都需要无差别匹配全球用户的需求,而且一直要以向上兼容的方式来迭代,导致软件非常臃肿和复杂,每个人打开软件都要面对大量自己很少用到但别人可能会用到的功能,只是大家经过长年累月的学习,即使很难用也已经学会了,适应了,没有人去研究这个问题。

office取得了接近垄断式的成功,这也导致微软没有什么动力去优化软件体验,而且社会上的培训体系已经成为成熟产业,微软只需要不断增加office的功能以满足更多的需求就可以了,这只会令office越来越难用。

以word为例,1983年就开始编写,1989年成为office的一部分运行于windows,这个PC早期发明的软件即使到了今天仍然具有非常明显的交互特征:命令导向

所谓命令导向就是DOS时期的思维:把一系列命令图形化,仅此而已。

传统PC软件的交互方式就是命令的堆叠传统PC软件的交互方式就是命令的堆叠

​命令导向的软件都是很难用的,office三件套都有一致的交互,软件顶部和右边是一系列复杂的菜单和功能键,集成了处理工作所需要的所有命令,多得令人不寒而栗,你要记住和熟悉这么多的命令及其功能,才能熟练使用这些软件。

其实整个PC时代的软件都是基于命令导向来设计的,因为这就是基于鼠标键盘的windows平台的交互特色。

那么来看看锤子科技的TNT。

TNT—革命性的交互逻辑

举个例子,你想到了一个PPT的逻辑顺序,随手拿起手机记录闪念胶囊,回到工作站面前,胶囊一键自动生成PPT,这个过程中系统会根据胶囊里的内容含义自动从网上抓取适合的配图及排版,注意,是自动配图及排版。

再举个例子,你想把一篇长文章里62处“我爱这个世界”这个关键词换为红色并加下划线,在传统的Word里大概需要点击200次鼠标和花费10分钟,但是在TNT里,只需要说一句话就可以了。

再举个例子,当你指着当前窗口说:关掉其他窗口。系统就只保留了当前窗口,其他窗口全部关掉,而在过去,这是需要你用鼠标一个一个关掉的。

发现什么规律了吗?

这种交互方式跟传统的命令导向有很大的不同,TNT处理的是用户的“意图”而不是“命令”,我把这种交互方式命令为“想法导向”。

我想关掉其他窗口我用鼠标一个一个关掉窗口就是想法导向和命令导向的典型区别,基于命令导向的交互方式,每个动作都要自己逐一完成,而基于想法导向的交互方式,藏在系统背后的AI会理解你的意图并帮你完成一系列复杂的操作,直接给你呈现结果。

命令导向的交互方式是反人性的,这种交互仅提供了工具,依赖于用户大量的前置学习和训练,依赖于用户对系统功能非常熟悉,依赖于用户一点一滴地执行,这种交互方式的效率来源于用户自身的努力和时间投入。

以一份办公室经常用到的晋升通知为例,在过去,这样的稿件需要我们打开word一字一句地输入-排版-审批-打印-盖章-张贴,这个简单的文档前前后后花了HR一个小时,但是在未来,吴德周只要在上班路上对着坚果R系列手机的闪念胶囊上说一句:“写一份朱海舟从产品经理晋升到高级产品经理的晋升通知,表彰他在TNT产品研发过程中取得的优异成绩”,回到办公室的TNT工作站前,一份排版优美用词严谨的完整版晋升通知已经自动生成了,只需要修改某些字眼就可以打印出来。

从一字一句地输入到所想即所得的交互方式,就是我们马上可以触摸到的未来。

很多人通过分析坚果R1手机和显示器的硬件参数,又或觉得语音识别和触摸交互都不是新鲜的技术来质疑老罗说的颠覆是不是吹牛逼,这是错误的判断角度,从命令导向到想法导向,就是TNT对传统交互最大的颠覆。

TNT这种交互方式的终极目标是你不用学习复杂的工具和命令用法,只需要清晰自己的工作目标,不断地提出你的想法就可以迅速地完成工作。

TNT创新交互的设计依据

老罗把TNT的交互方式称为直觉交互

为什么说直觉交互更符合人类的真实体验呢?

语言学家认为,人与人在面对面交流时,身体语言(如眼神、表情、动作等)比口头语言(声音)传达了更大的信息量,结合身体语言来表达意图已经是人类数百万年来的习惯,这就是电话里有些事情很难表达清楚的原因。

肢体语言配合声音是人类长期以来形成的表达习惯肢体语言配合声音是人类长期以来形成的表达习惯

​这也是人们觉得智能音箱像个智障的原因,因为如果你把智能音箱当人,音箱看不懂你的身体语言,而你却已经习惯了身体语言+口头语言的表达方式,因此智能音箱会漏掉了很大的信息量,造成错误的理解,显得像个智障。

无论智能音箱怎么努力调整算法,人类以肢体语言辅助声音来表达这种方式是很难改变的,用户单用嘴巴总是难以表达清楚需求(例如用户很焦急地说:“给我输出啊!”其实这个需求漏掉了大量的信息,语音交互平台既不知道要输出什么,也没看到用户焦急的表情,就会一直问用户想要什么),所以纯语音交互的瓶颈是极难打破的。

正是因为洞察到这个难以解决的问题,所以老罗设计出TNT交互方式。

TNT(touch and talk)相当于给了用户补充肢体语言的表达机会,当你触摸某个具体区域再说出你的想法,系统不再漫无目的地乱猜你的想法,而是根据所指区域迅速收窄你的需求,给出更精准的答案,如果你对着空气中说一个需求,即使是打败了柯洁的Alpha GO理解起来都是困难的,但是当你触摸到具体的文字、图片或表格上再说需求,系统大概就知道你想要干什么了。

结合语音和触摸收窄用户需求(TNT),再基于语义分析和行为习惯来领悟用户需求(CRYSTAL BALL),在桌面上以AI来组合一系列功能动作完成用户需求,这就是想法导向的TNT与命令导向的鼠标键盘最大的不同之处。

基于以上创新的交互理念,再结合POKER DEALER(发牌手功能,相当于全局搜索,充分利用大屏优势提高答案命中效率), Bullet Messenger(子弹短信其实是一个跨平台协作系统,不是发布会上那样用来群聊的,目前完成度不足,后期有巨大惊喜),闪电胶囊,及配备双线性马达的 10 个多功能触控键,使工作或娱乐的效率得到巨大提升。

TNT里集成了大量的AI技术,但锤子科技并没有大力吹嘘AI,好多厂商都说自己的手机用了AI,但我想说的是,把AI用于生产力才是最大的价值,把AI用来美颜那是小儿科而已。

TNT的目标

我们的人生中需要花费大量时间学习和训练来弥补传统PC软件的难用,这不是必然的,即使这种反人性的用户体验方式持续了三十年,但也不是必然的,键盘和纸带输入一样,是计算历史上阶段性的产物,当其他不需要学习的输入方式效率提高到一定程度时,键盘就会被淘汰。

TNT的短期目标是缩短基于命令导向软件的学习时间,降低使用难度,提升工作效率,长远目标是干掉鼠标键盘和陈旧的软件交互方式,所想即所得。

我知道有些人还是很想杠,在办公室里大家这么说话不是很奇怪吗?

杠精专用图杠精专用图

首先,你的办公室没有鸟巢现场那样三万多人和三万多部手机产生干扰,不需要像发布会那样很严谨大声地说出来,正常说话的语气就可以了,坚果R1专门设计了双麦克风和硬件降噪算法来处理这个问题。

其次,随着系统背后的深度学习算法越来越智能,通过学习你日常的事务处理习惯,你需要说话的场景只会越来越少。

再次,结合挂在脖子或耳朵上的蓝牙智能耳机使用,嘴巴与耳机间的对话距离非常短,喃喃自语就可以完成语音交互,在办公室基本可以做到无干扰,相信不久将来就会有第三方厂商推出这样的蓝牙耳机,预计售价将不超过300块。

最后,搜狗最近推出的“唇语识别”技术准确率已经很高了,导入类似技术,一些简单的语音交互需求甚至只需动动嘴就能完成了。

杠是没有价值的,技术总是在进步,问题只要存在解决的可能性,就一定会被解决。

9999的一体机是不是太贵了?

我们来分析一下微软的Suface策略。

Suface只是微软向第三方厂商示范硬件可以怎么做才好用,但微软并不是一个擅长制造并贩卖硬件的企业,把硬件大规模分发到全球市场仍然需要依赖联想戴尔等厂商,,如果Suface定价太低,对市场产生了心理锚定,那合作厂商推出同类型产品就没有利润了,这样会打击到合作厂商的热情。

所以Suface的定价必须高高的,这样人们买第三方厂商产品时,就会觉得很超值。

同理,如果锤子科技希望基于TNT交互的Smartisan OS被大量使用,必然要借助第三方硬件厂商的力量,把TNT工作站的配置做到顶尖再宣布9999的定价,也是为了给市场锚定价格预期,给配套厂商留下空间,要知道勤劳美丽的深圳人很有可能会把这个工作站做到999元(老罗微博已经透露将会有低至500元的第三方配套产品),这么一来,第三方TNT工作站是不是显得很有吸引力啦?

买个坚果R1手机,以后就有机会享受到999元的第三方配套工作站,家里放一台公司放一台甚至车里也放一台,随时跨平台工作和游戏,想想现在还买其他骁龙845手机是不是很吃亏?

TNT是正确的方向吗?

随着技术的进步,在保持低功耗的同时,移动处理器的速度越来越快,以骁龙845为例,计算能力已经媲美普通的笔记本,而以后只会越来越快,越来越快的处理器只是用在手机上是不够的,高通一直以来希望有一个理想的桌面解决方案来推动处理器向桌面系统进军(并向其他厂商提供示范),以侵蚀英特尔的市场。

但环顾整个行业,所有已推出的解决方案都是噱头式方案,没有实用价值,而小米华为等厂商为了安全选择了难用的微软桌面系统,没有一家厂商能支撑高通的梦想。

直到TNT出现。

高通非常认可TNT的价值并决意在这个方向上作出支持和投入,所以这次我们看到在鸟巢发布会现场插满了高通的旗子,因为高通站在TNT身后,要全面推动这个桌面系统实用化,实现自己移动芯片桌面化的目标。

旗舰之选--高通骁龙处理器旗舰之选–高通骁龙处理器

​另外,核心合作伙伴讯飞和三角兽都是AI领域里积累极深的企业,也非常清楚纯语音交互的瓶颈(无法理解肢体语言),所以他们都觉得成为TNT项目的参与者是非常有价值的。

最后,如果Google也认可TNT比自己家的ChromeOS更有机会实现安卓向桌面化进军的野心,那就更好了。

行业巨头因为拥有更大的信息量和前瞻性,对一个方向的把握肯定比大众清晰得多,这几家巨头愿意与TNT项目通力合作甚至站台,足以表明TNT的发展方向是对的。

所以TNT这个项目不是锤子科技一家小公司捣鼓出来的,是一大堆相关领域的顶尖厂商合作做出来的,因为锤子科技是项目的核心设计者和牵头人,也是硬件终端企业,所以这个产品最后由老罗发布出来了。

苹果并没有发明图形界面、鼠标和触摸屏,锤子科技也没有发明语音识别和多点触摸屏,没有发明语义分析和深度学习技术,TNT的理念跟iOS第一次定义移动设备的交互是一样的,是交互逻辑和效率上的颠覆。

当然,创新只是一个项目是否能成功的其中一个因素,当年苹果的图形操作系统比微软早推出十年,但是在商业运作上的不成熟,最后还是输给了微软。TNT的商业化之路肯定也充满挑战,但是把交互从命令导向进化到想法导向,肯定是交互领域的革命性升级,跟普通的语音识别完全不是一回事(很多人跟风转了李开复那个视频,甚为无知),作为科技爱好者,这个本质的区别还是要懂的。

真正的商务旗舰

最后说说坚果R1这部旗舰机。

其实也没有什么好说的,这个机器特简单:

1.工业设计:坚果R1的设计语言沿袭了广受好评的坚果Pro 2,无论从大众角度还是专业角度,坚果R1的工业设计都是首屈一指的,美人尖屏幕在保证前置摄像头居中体验的同时,是目前最大限度降低主屏面积损失的方案,而且隐藏在状态栏里与下巴形成上下对称效果,堪称完美;后盖的平行双摄设计也避免了竖排双摄的突兀,在一众类iPhone X手机的外形中与众不同;与Logo合一的指纹识别模块使用了更有质感的材质并处于后盖黄金分割线位置,使背面有了点缀但又不至于显得繁复,是整个双摄手机市场上最好看的后盖;3D玻璃后盖既晶莹又大大提升了手感;而白色版的简洁和惊艳程度。。。好了,@袁炫华 说不能拿白色坚果R1跟其他手机比较的,这样太欺负人。

美轮美奂的坚果R1白色版美轮美奂的坚果R1白色版

​2.硬件配置:只说几个特别的点,IMX 363摄像头(F1.8光圈,小米MIX 2S同款传感器)国内第三款发布的骁龙845旗舰,压感屏,线性马达,QC4.0快充,10W无线充电(传闻以后会推出带有类鼠标功能的无线充电板配合TNT工作站使用,简直酷),极速USB 3.0,旗舰手机当中为数不多使用了不伤眼的LCD屏幕。。。以及所有这些配置与交互之间的无缝融合,根本不是以价格为导向的其他旗舰可比的,以桌面系统为考虑设计的1T存储空间就不拿来跟其他手机对比了,这样太欺负人。

超强硬件配置的坚果R1超强硬件配置的坚果R1

​3.操作系统:植入了TNT交互和大量AI技术的Smartisan OS 因为升级太大,版本号直接从4.X跳到6.X了,上文已经介绍过很详细了,基于工作站的OS确实不方便跟其他手机系统对比,这样太欺负人。

从4.X直接进化到6.X的Smartisan OS从4.X直接进化到6.X的Smartisan OS

​至于大家都关心的拍照,我在微博上已经发过坚果R1拍的照片,好评如潮,其实目前同级旗舰手机的日常拍照在不借助仪器的情况下已经很难看出差异,而一些极端场景并没有太大的出片价值(摄影就是对光和影的捕捉,光都没有了还谈摄影就是有病),追求某种最高或第一的参数除了缓解自己的消费焦虑并没有什么实质意义,摄影的参数再提高下去对出片已经没有更多的帮助,多看看手机别的方面吧。

坚果R1拍摄作品坚果R1拍摄作品

坚果R1拍摄作品坚果R1拍摄作品

​稍微在构图和光线捕捉技巧方面花一点儿时间,那个效果提升比起镜头间的成像差异好太多了,以后我会再写篇文章教大家怎么简单地用手机拍出好照片。

也借此回应一下为什么之前的问答里建议大家515前不要买手机,虽然旗舰手机都有骁龙845处理器,但其他旗舰手机只是用这个处理器跑分和玩王者荣耀,而坚果R1却做成了功能强大的桌面系统和工作站,为手机的体验和显示面积增加了无限可能,坚果R1把骁龙845处理器的计算能力用在更有价值的生产力领域,但又没有牺牲原有的娱乐体验,这种产品定义方式跟其他旗舰手机已经不在同一个维度了,坚果R1可以说是市面上真正的全能旗舰

我有一个小小的建议,大容量的坚果R1不知道是不是可以改为存储卡版本,这样坚果R2出来的时候直接把TF卡换到新手机里就好了,不然那个1T存储淘汰掉太可惜了。

不完美的老罗

好几过接触过老罗的人都说老罗真人相当谦逊,在陌生人面前甚至有点腼腆,跟微博上的老罗完全不同,这可能跟他有社交恐惧症有关。

其实我也不喜欢老罗在微博上与大众的沟通方式,高兴的时候天生骄傲,兴奋起来就变成天生嚣张,但有时按也按不住。

人人都很焦虑,确实也没有时间和心情去原谅对方。

我觉得老罗的这个人有点像周星驰,或乔布斯,脾气古怪一根筋,对产品极度沉迷,心里想着把一件事情做好,在这个事情以外的事情就傻得要死,总是得罪人,自己却混然不觉,虽然比起初创企业的时候是有了很大进步,但是站在大众的立场,仍然没有达到期望。​

除了拍电影其他事情都很落寞的星爷除了拍电影其他事情都很落寞的星爷

鸟巢发布会从舆论上可以说是并不成功的,错误估计大众对交互变革的理解能力,期望拉得太高,但因为产品完成度不足(人们的不理解和不满主要因为这个造成的),发布时间也太短,没有完成概念普及的目标,如果改到秋天发布,把应用场景和完善的功能展示出来,效果绝对会好很多,所以老罗真的不应该把动静搞得这么大,以至大家都以为515是个响指,但其实他只是找到了第一颗原石。

TNT真的是一颗原石。

灭霸同样很难评价,复仇者联盟可以看作现实世界的既得利益者,形象永远正面,而灭霸这个坏小子总想破坏式创新,每个人看他都邪恶,但他存心认为自己只是想把世界变得更好而已。

也不知道究竟谁对谁错。

但没有偏执狂的世界,多少都是有点无聊的。

因为。。。

每个人都有自己喜欢的漫威英雄,但人人心里都有一个灭霸。​

=====================​==========

原文超过一万字,很努力才删到7000字,还有很多牛逼技术没介绍到,以后慢慢补充。

本文撰写过程没有采访相关各方,纯属个人技术分析,如有错漏敬请指正。​​​​​