记录黑客技术中优秀的内容,传播黑客文化,分享黑客技术精华

数字化过程竞争中,美国为啥焦虑?

2020-08-14 10:27

各领域的数字化、智能化也成为不可逆转的趋势。从华为到抖音、微信,美国正在打压中国的数字化公司。按理最强的数字化公司还在美国,为啥他们要打压我们?他们的焦虑、担心是什么?本文从数字化过程中的中国优势谈起,探讨领域智能化。

本文的内容摘自经济科学出版社出版的《人工智能智能为金融投资带来了什么》第二章。仅代表个人观点。

作者袁峻峰,目前就职于蚂蚁集团人工智能部,复旦大学金融学硕士。作者做为AI应用的亲历者,试图去给读者一张通往金融投资领域AI应用之路的“藏宝图”。本书由蚂蚁集团首席科学家漆远,蚂蚁集团数字金融线平台产品部研究员胡晓东,中国金融研究院副院长、上海交大李祥林教授,爱康国宾、以诺教育、叮诺科技创始人谭文清,IDG资本合伙人王啸、等多位业界大牛联袂推荐。

在数据化过程中的中国优势

英国哲学家培根说过“印刷术、火药、指南针这三种发明已经在世界范围内把事物的全部面貌和情况都改变了。”但四大发明并没有带给中国技术上的领先。蚂蚁金服首席战略官陈龙教授,受邀去著名的伦敦经济学院(LSE)主题分享《数字技术和普惠性增长》1。回国后陈龙教授在自己的公众号上分享一篇此行感言,其中就探讨了这个问题。“指南针没有让中国成为全世界最厉害的航海大国;火药没有让中国的兵器领先世界,反而被打穿了国门;造纸和活字印刷也没有让中国成为遍地图书馆的国度。这里面最重要的道理,是技术的普及分两个阶段,一个叫采用,一个叫渗透。采用不等于渗透,就像发明不等应用。技术要真的要成为经济和商业的引擎,除了要有人采用,还必须渗透到生活中去,转化为可被大部分人使用的应用。在应用方面,后发的国家反而有巨大的优势,尤其是当技术本身成本很低的时候。 因为这些国家的服务往往落后,由于用户需求若渴,其习惯的转换成本低;而在供给侧,也不会有那么多机构找各种类似安全、就业的亦真亦假的理由来抵制。”2笔者非常认同。凯文·凯利说过另一个相关观点,“无法采用旧有科技产品的国家碰到新科技时,处境也会相当不利”3

1 数字技术和普惠性增长[OL].罗汉堂. 2019.1.

2 陈龙. 你想解决的问题,决定了你的成就[OL]. 远行客陈龙公众号.2019,4.

3 凯文·凯利. 科技想要什么[M].中信出版社. 2011.

两个观点合起来,则是恰逢其时很重要。中国电商能够快速发展,是因为当时我国传统零售业、物流行业不发达,但我国相对于其他发展中国家,又有比较完善的交通基础设施。中国移动支付能够快速发展,是因为我国传统非现金支付手段落后,但我国相对于其他发展中国家,又有比较完善的3G、4G移动网络,而低成本的智能手机问世进一步推动这一趋势。同样道理,近几年,面向企业服务成为我国投资热点之一,也是因为相对发达国家,我国传统行业数字化程度低,但我国又有比较强的互联网、云计算基础服务能力。所以,虽然我国在高端芯片等高技术领域还远落后与美国,但数字化过程,更需要的是5G基础设施,物联网中大量低成本的智能终端以及大量工程师,在领域数字化、智能化过程中,我国大有优势。

在物联网、物理世界数字化、实体经济数字化的过程中,三千多万高性价比的中国工程师4将是未来数据化进程中重要优势。德国是工业4.0、物联网最早的倡导者,而且他们有成熟的现代化工业,加之SAP这样全球最大的企业资源规划ERP系统提供商也是德国公司,按理说,他们应该很有优势。可如果去一些德国的软件公司看看,大多是40、50岁的工程师,年轻的工程师比例较少,当然这也是其国家经济发达的表现之一。但不可否认,这在数字化进程中将是非常大的劣势。反观我国,互联网浪潮中培养的一大批工程师,加上各大院校中毕业的大学生、研究生、博士们源源不断地输出。当前,我国各大院校都纷纷加大了人工智能相关专业投入,已有33所高校开设了与人工智能相关的专业与学院,包括中国科学院大学、上海交通大学、南京大学、清华大学、哈尔滨工业大学等知名院校。5这些都是比人口红利更重要的“工程师红利”。

4 环球网评:为三千多万中国工程师设个节日[OL].环球网.2018,2.

5 Robot L(网名). 大盘点:中国33所高校人工智能研究院[OL].新智元. 2018,11.

最重要的还有以习近平总书记为核心的党中央的正确领导。 2017年12月,新华社就中共中央政治局实施国家大数据战略进行第二次集体学习的报道中,总结道:”推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民生活改善。”6中国在数字化的过程中将大有可为。

6 习近平:实施国家大数据战略加快建设数字中国[OL].新华网.2017,12.

中国需要数字化

我们关于一切自然运动中某个特殊结果的最初想象或构想总是主观任意的。

—— 休谟

中国人是善于借题发挥的,“指鹿为马”的故事大家都听过,这并不是讨论是鹿、还是马的问题,赵高借助这样一个事件去了解群臣们的态度,并彰显自己在朝廷上的统治力。鲁迅先生有篇文章讽刺那些借题发挥的人和事:“现在各色的人们大喊着各种的救国,好像大家突然爱国了似的。其实不然,本来就是这样,在这样地救国的,不过现在喊了出来罢了。所以银行家说贮蓄救国,卖稿子的说文学救国,画画儿的说艺术救国,爱跳舞的说寓救国于娱乐之中,还有,据烟草公司说,则就是吸吸马占山将军牌香烟,也未始非救国之一道云。”

历史学家黄仁宇以大历史观而为世人所知。在其《万历十五年》7、《中国大历史》8等著作中都反复提到 数目字管理,其评价历史改革失败原因重要标准之一是:是否实现、推动了数目字管理,即整个社会资源是否整合进数字化的记录系统。在其著作中反复阐述的一个观点:中国缺乏数目字管理的传统,并强调数目字管理对中国的重要性。笔者非常认同,感兴趣的读者可以参阅黄仁宇的相关著作。

7 黄仁宇. 万历十五年[M]. 三联书店.1997.

8 黄仁宇. 中国大历史[M]. 三联书店. 2007.

房地产行业在中国整体经济中有着举足轻重的地位,又是重要的民生问题,自然有很多专家、学者进行探讨。专家、学者都是从专业的统计数据出发进行论证,可往往能听到完全不同的结论。例如,2018年,就有专家基于国民收入的中位数、人均住房面积中位数、城市化率、住房空置率、未来家庭户独居人口等数据得出房地产业还需要快速发展。而另一些经济学家,根据人口红利、城镇化、居民杠杆率等指标分析结果是中国房地产业已到高点。为什么都是基于相同数据的分析会得到不同的结果?

首先,我们并不怀疑那些专家、学者们的专业性和职业情操。但为什么会得出不同的结果呢?著名经济学家、诺贝尔经济学奖获得者罗纳德·哈里·科斯探讨过类似问题。9为什么耶鲁大学和芝加哥大学各自论文中,关于同一特定历史阶段货币政策和财政政策作用的讨论,会得到不同的结果。科斯认为,首先,两个大学的研究者在估计难以计量的重要数据变量时使用了不同的方法。更主要的原因是两个大学所拥护的理论是不同的。哈耶克在讨论社会科学理论时更尖锐的指出,社会科学理论不外是提供了一种推理的技术,其从来不能借助于事实证明什么是正确、什么是错误。这些理论大抵是用来解释的思想体系,从来不能被“验证”真伪,只能对其一致性进行检验。如此说来,数据只是观点的注释,在分析前,观点已经在那里,数据只是用来粉饰结论,说服自己并说服观众罢了。

9 罗纳德·哈里·科斯. 经济学家应如何选择[OL].

归其原因,哈耶克认为社会、经济领域的事实是主观性的,是真实世界事实映射到数据的结果,和采取的特定方法是密切相关的,当我们采取了一种方法来处理、解读数据时,就使它们成了这样一种特定方法论、一定主观性的特定事实。10这样的主观性也是经济、社会领域不确定性的原因之一。而我们中国人更善于放大这样的主观性,很多事,大家并不是通过一面平光镜观测,而是更像用一面多棱镜观测,其将人们对事物的看法以各样的色彩反射出来。因为我们总是善于借势,什么不相关的事都能用于服务自己的目的。

10 哈耶克. 个人主义与经济秩序[M], 三联书店.2002.

黑泽明有部著名的电影《罗生门》(1950),主要讲述了一宗案件以及案件发生后的故事。武士和妻子在野外碰到盗贼,盗贼杀害了武士。堂审时,盗贼、武士之妻和被招魂的武士给出了三份不同的供词,武士尸体发现者的樵夫还给出另一份供词。四份不同的陈述,真相扑朔迷离。黑泽明的解读是“人有这种秉性,对于自己的事情,会因为主观愿望而产生认知偏差”。这和以上观点基本一致。但,如果当时有视频监控,自然就能知道真相,而且也会帮助人们克服自以为自利的主观性。

科斯认为随着科学的发展,社会科学的理论选择问题是有标准的评价方式的11。这也是本书认同的观点,讨论房地产问题时,一些诸如住房空置率等关键事实数据,无法有效统计也是导致不同结论的原因之一。在数字化时代,更多实时的、事实的数据必然能有效提升决策质量。诚然,即使所有相关事实数据都被有效收集,还是可能有不同的观点。那这时,观点的差异将来自理论路线、价值观等方面的差异。在数字化时代,那些事实性的记录可用于方方面面的决策,将极大地改善我们善于借题发挥的特质。

11 罗纳德·哈里·科斯. 经济学家应如何选择[OL].

领域精细化方案

在上一章,我们提到数字化将有利于决策,当一个现象、一个事物、一个问题被有效量化后,得到相关事实性数据,必然有助于决策。一个经典案例是临床判断新生儿是否处于危险状态的评估标准:通过5个变量,心率、呼吸、反应、肌肉强度和颜色,分别打3个等级分数(0,1,2)代表稳健度。一个8分以上婴儿一般是健康的,低于4分的婴儿则需要立即抢救,一个简单的公式就能够降低判断错误率。

在数字化时代,医疗将更加精细化。埃里克·托普的《颠覆医疗:大数据时代的个人健康革命》12书中提出,个体的差异性,比病症统计特征更重要,未来数字化医疗,是基于生理特征的数字化个体之上的量身定制的治疗方案。每个人都将拥有独立的数字化医疗档案,每时每刻的心跳、血压,呼吸频率、体温、血糖、脑电波等生理活动特征将从生物传感器、基因组测序以及其他个性化医疗设备中收集并整合。医生在这些信息基础上制定个人的精细化医疗方案。

12 埃里克·托普. 颠覆医疗:大数据时代的个人健康革命[M]. 电子工业出版社. 2013,10.

针对个人用户的个性化、精细化的方案是领域智能化的重要一部分。另一部分是领域数字化带来的 流程精细化决策,该概念来自精细化管理,它是社会分工精细化、以及服务质量精细化对现代管理的必然要求。在数字化的初期,特别是近几十年,由于度量、量化能力的提升,基于统计的决策已深入人们工作、生活之中。泊松(Poisson)分布,是一种统计与概率学里常见到的离散概率分布,适合于描述单位时间内随机事件发生的次数。例如公共汽车站的乘客、放射性物质发射出的粒子、显微镜下某区域中的白血球、金融市场中的突发事件、信贷违约事件的发生概率等等。当这些事件以固定的平均密度随机且独立地出现时,事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布。泊松分布在各个领域相关问题的决策中都起到重要作用。

上一章,我们引用过哈耶克举的一个关于经济不确定性不能被统计有效消除的案例。如果我们基于泊松分布预期未来有一定概率出现突发上游A供应商货物或服务断供事件,我们就会准备上游配件的仓库,会有备选B公司代替A公司等方案,但这些方案都是有成本的。

在数字化时代,由于全产业链的数据被打通,当A公司生产规划阶段,通过实时数据链,这些信息将被传递到下游公司,下游公司可以更早地调整,避免效率损失。更实时的数据,通过机器学习以及其他算法,可以进一步降低不确定性,改善原有基于统计的决策。例如将强化学习13(Reinforcement Learning)和点过程14(Point Process)相结合,能在连续时间内对对有序事件进行预测。李爽、肖帅、宋乐教授的论文15提出使用强化学习框架优化学习点过程模型,将每个事件作为随机策略采取的行动,应用于医疗保健,智能城市和信息网络等随机事件预测,取得了良好效果。

13 强化学习是利用观察到的回报来学习针对某个环境的最优策略。

14 在统计学中,点过程是描述随机点分布的随机过程,经常被用作随机事件的模型,例如客户到达队列等。

15 Li, S., Xiao, S., Zhu, S., Du, N., Xie, Y., and Song, L… Learning temporal point processes via reinforcement learning[C]. NIPS. 2018.

在数字化的世界中,原有的统计决策流程,必将被精细化决策流程代替。这也是领域智能化的重要方向之一。在产品开发、客户定位、交付周期、上游选择、生产计划、库存管理、营销策略等各个生产销售环节必然都将智能化、精细化改造。接下来几章,我们将重点探讨金融投资领域数据化、智能化带来的精细化决策流程变革。

“廉价”的智能

图2-1 :Xilinx(赛灵思) 公司介绍
图片来源:Xilinx(赛灵思)公司官网

Xilinx(赛灵思)是全球领先的可编程芯片解决方案供应商之一。20世纪初,电动马达开始普及,家用马达的广告中,主要卖点就是多用途,即可以转动缝纫机,又可以搅拌、研磨,还可以驱动风扇。Xilinx(赛灵思)的广告词和100年前马达制造商的广告何其相似。

在上一章我们也提到,一种技术大范围推广的前提之一是低成本。今天,电动马达,无处不在,其不再是独立装置,已融入到日常生活、工作中。且不说生产线上有多少马达,就是房间里的马达也有很多,硬盘、榨汁机、空调、电动牙刷等都靠电动马达驱动。未来,“智能”必然将如马达一样无处不在,但又是透明的,你不需要感知它的存在。当前,智能化还在寻找各种合适的场景的过程中,可以预见,这个过程不会再需要100年。

将云计算与各领域系统结合,并提供智能化服务是当前各领域系统提供商以及云计算服务商共同的发展方向。2018年3月,微软发布新的组织架构调整,将所有的商业智能和云计算企业级服务并入云计算及AI平台事业部。由华人沈向洋统一领导的AI研究部门,在进行人工智能等前沿技术研究的同时,更加注重人工智能技术研究的商业化应用。2018年11月,阿里云也进行架构调整,升级为阿里云智能,希望构建数字经济时代,面向全社会基于云计算的智能化技术基础设施。可以预见,在不远的未来,对于各领域、各行业的企业来说,机器学习、算法等能力会像现在云计算、存储一样的低成本与易用。关注如何将这些能力与本领域问题相结合才是更重要的方向。

还是成本决定论,当一项技术成本不断下降,并且易用性不断提高时,这项技术将被广泛应用到各个领域。而之前论述中已提到,本书的基础假设是由于计算成本的下降,数字化时代必然到来。智能化的成本也随着技术进步而不断下降,将在更广阔的领域得到应用。机器学习的重要能力之一是预测,即从已掌握的信息,通过模型推导未掌握的信息。可以想见,在数字化时代,预测能力将无处不在,这也将极大地降低经济生活中的不确定性,提升效率。这便是所谓“智能”无处不在。

机器学习在其他领域应用中,学习成本、易用性、开发效率等都非常重要。深度学习框架TensorFlow由谷歌公司开发和维护,于2015年11月授权开源,是当前应用最广的深度学习开发框架。2017年1月,Facebook人工智能研究院(FAIR)团队开源了PyTorch,PyTorch很快就以其简洁、易用性、开发效率等优点得到从业者的关注。在2019年,TensorFlow 2.0版本中,也极大地提升易用性和开发效率。

自动化机器学习(Automatic Machine Learning,AutoML) 也是谷歌公司最先提出的,将机器学习应用于实际问题的端到端流程自动化的过程,包括执行算法选择和超参数优化等。对于非机器学习领域的其他领域专家,AutoML技术极大地降低了机器学习调优的难度,是机器学习在其他领域大范围应用的重要解决方案之一。谷歌提供的Cloud AutoML服务是一个相对成熟、方便的方案,只要按要求上传数据,该服务能自动寻找算法架构以及调优。可以想见,AutoML对于各领域智能化将起到重要的作用。

从”互联网+”到”智能+”

2019年3月,第十三届全国人民代表大会,国务院总理李克强的《政府工作报告》中,提出“智能+”,为制造业转型升级赋能。这是继“互联网+”被写入政府工作报告之后,“智能+”第一次出现在总理报告中。

关于什么是“智能”,有着各样的定义。其中笔者更偏好于:“完成复杂目标的能力。”领域中的智能,我们定义为人机结合解决领域中的能力。对于大多数领域问题还是需要人机结合,这个“机“不止包括弱人工智能,更是指领域中已有的系统与数据以及各种算法

图2-2:从”互联网+”到”智能+”
来源:阿里巴巴研究院报告
16

16 从连接到赋能:“智能+”助力中国经济高质量发展[OL]. 阿里巴巴研究院. 2019,3.

“互联网+”是“智能+”的前提。其并不只是建一个网站,开一家网店,以及建一个在线的客服中心,又或是支持手机操控的互联网微波炉、烤箱、冰箱等。“互联网+”是要将企业核心的产品与服务进行线上化。《智能商业》17中曾鸣教授总结了互联网的本质,认为互联网首先是联,联结,将人通过互联网联结起来。第二个关键词:互,互动,互联网目前最大的价值是所有人同时互动的能力。第三个关键词:网,结网,因为当所有人开始能够互动后,人们如何协作去完成一件事情,就可能变成新的商业模式。在线将是未来商业的重要发展方向,亦是数字经济的重要部分,即制造业、服务业、流通业等实体经济数字化。实体经济数字化过程,必将和物理世界数字化同步发展。只有全链路都数字化后,才可能有更智能化的解决方案。我们看到在过去几年,”互联网+”已然成为各行各业的一部分。在不远的将来,”基于数据智能的商业必将超越1913年横空出世的福特流水线,给人类整体的生产力带来一次根本性的巨大突破。” 18

17 曾鸣. 智能商业[M]. 中信出版社. 2018,11.

18 曾鸣. 智能商业[M]. 中信出版社. 2018,11.

  • 智能化方案

阿里巴巴研究院发布过一个针对人工智能在电子商务行业应用的研究19,报告指出超八成商家已采用平台提供的智能工具。使用前三的智能工具是智能客服、智能化店面设计和生意参谋。生意参谋是全渠道、全链路、一站式数据平台,致力于为商户提供经营分析、市场洞察、客群洞察等多样化数据服务,提升商业决策效率。超过80%的受访商家认为,“提高工作效率”是采用智能化工具的主要原因。

19 人工智能在电子商务行业应用和对就业的影响研究报[OL]. 阿里巴巴研究院. 2018,09.

1688淘工厂的目标是为中小工厂提供软硬件服务,帮助它们进行数字化升级。用曾鸣教授的话说,淘工厂定位B2S2B2C模式20,“S”指通过改造供应链,致力于打通制造与消费端。借助于数字化平台,无数的中小企业,特别是服装业,从生产到销售正在快速数字化。

20 曾鸣. 智能商业[M]. 中信出版社. 2018,11.

图2-3:1688淘工厂
图片来源:阿里巴巴研究院21

21 从连接到赋能:“智能+”助力中国经济高质量发展[OL]. 阿里巴巴研究院. 2019,3.

以企业资源计划系统(ERP)为例,以前,中小企业很少实施企业资源计划ERP系统。抛开传统的ERP系统成本与实施成本不说,受限于中小企业管理与员工能力的限制,很可能即使企业完成了ERP改造,后期使用过程中,由于数据采集和处理的误差,导致无法达到预期效果。目前ERP云服务提供商们已有针对各个行业生产资源计划、制造、财务、存货、销售、采购、质量管理、研发管理、人力资源管理等云服务。在数字化实体经济改造过程中,是在物理世界数字化基础上同步进行的。物联网(IoT)设备终端采集的数据能极大优化ERP流程中数据准确性。原先需要不同角色主动采集的数据、处理的操作,正在逐步被传感器、监控设备自动采集与处理代替。。即使不使用机器学习,而是用商务智能(Business Intelligence BI),通过报表、数据分析同样能够提升企业效率。这些统统都可以称为“智能+”方案。

通常,我们认为智能化离小微企业太远了,只有有实力、有远见的行业龙头才有资源整合原有企业资源计划系统?(ERP)?系统、供应链管理(SCM)系统、客户关系管理(CRM)等系统,并将公司产品与服务在线化改造,形成闭环。实际上,传统行业中的龙头企业,需要自我变革原有已取得领先优势的企业流程、制度等,成本巨大。他们在线化、数字化、智能化是成本昂贵的长期过程。反而,小微企业借助于在线平台服务很可能率先实现数字化转型。将各领域专业系统与数据服务于更广阔的客户群体一直是各行业系统供应商发展方向之一。之前受限于系统计算能力等因素,这个想法并不容易实现。当前,以云计算为基础、将各领域专业系统与能力提供给更广阔的用户群体成为可能,这将为更多小企业、个人提供助力,重塑全社会生产力。2018年《首届天下码商大会》上,蚂蚁金服董事长兼CEO井贤栋提出“支付宝将为1亿小微经营者提供数字化经营工具”。这些服务包括门店数字化、数字化供应链、智能化用户运营等22

22 支付宝升级码商成长计划:将为1亿小微经营者提供数字化经营工具.TechWeb网站. 2018,10.

  • 专家自动化和增强服务(Expert Automation & Augmentation Software,EAAS)

专家系统是一种模拟人类专家解决领域问题的计算机程序系统。上世纪九十年代,各领域通过计算机程序复制领域专家的知识与经验,进行推理和判断,模拟人类专家决策过程的系统已非常成熟。例如,金融信贷领域,基于规则引擎、评分卡模型等都是领域专家系统的实现案例。

全球知名创投研究机构CB Insights有一篇分析报告23,探讨专家自动化和增强服务(Expert Automation & Augmentation Software,EAAS),认为在很多领域中,都将迎来人工智能辅助、人工智能增强生产力的新时代。EAAS是一种使用 机器智能 来复制和增强人类认知的服务。在财富管理、人力资源管理、记者、编辑、律师、教育、会计和审计等领域,通过EAAS提供的助理服务可以提供初级分析师、律师、记者等职责的部分职能。

23 Dear MBAs, AI is Coming For You: The Coming Wave of Expert Automation & Augmentation Software (EAAS)[OL]. CB Insights. 2018,1.

  • 利用数据中人类所无法理解、认识的信息是“智能”化的标准之一

在数字化时代,通过机器学习挖掘数据中人类所未知的信息,以及挖掘我们还没有掌握的知识去解决领域问题,是领域智能化方案重要方向。

图2-4:智能化服务
资料来源:笔者自制

利用数据中人类所无法理解、认识的信息,是评判是否“智能”化的标准之一。这需要领域专家和人工智能专家共同合作。在此过程中,往往碰到可解释性的障碍。在深度学习过程中,我们给神经网络一个输入,它就会按我们的要求输出一个结果,其中高维空间计算过程是难以解释的。

可解释性重要吗? 当然重要,可解释性有助于大家预期一致性,亦是有利于降低不确定性。可解释性还涉及信任,如医疗、投资领域,病人看病,如果系统给出一个病症的诊断而无法给出理由的话,病人是可能不敢接受治疗;投资中也一样,只说投资效果好、历史业绩好,却说不出为什么,投资人也是难以下决心投资。在涉及选择的领域,可解释性是非常重要的,因为这个问题会导致信任问题。这还涉及可控制性问题,我们知道在投资中风险管理是非常重要的一个环节,如果模型、算法不可解释,当模型出现错误时,我们无法进行及时修正与控制。

但需要强调的是,智能化方案并不需要一味要求可解释性,能有效挖掘那些不可解释的,但有助于事实、有助于决策、有助于降低不确定性的信息更为重要。我们已有的知识是有限的,我们的认知手段是有限的,不论是物理世界的事实,还是经济、社会中事实,并不是全部都已包含在人类可理解范围内。通过机器利用我们还不曾理解的数据中的信息,是通过机器学习的智能化重要优势之一。

被误解的“智能化”过程

近些年,各行业、领域的方案大多都带上”智能”二字。这也非常容易理解,只要机器学习、人工智能这面大旗依然高高立在风口上飘扬,那么相关的、不太相关的都会继续汇集到这面大旗的下面,浩浩荡荡。在互联网行业更是如此,不论是做图像的、视频的、语音的、搜索的、推荐的、自然语言的等等,现在都正名叫”人工智能”了,乘势彰显自己的存在并争取更多的资源。

各领域智能方案,正在改变每个行业,但它也不是魔术,不是万能的。本书一直强调,我们所说的智能方案都是 弱人工智能方案。在特定领域中的智能方案,重点是了解相关技术的能力范围,了解各种技术能做什么和不能做什么,选择可行的、有价值的项目与方向。这都需要人工智能专家与领域专家共同对特定领域进行技术调查,查看数据,讨论目标,然后探讨算法是否真正可以在其中发挥价值。

面对一个领域问题,在持续的数字化进程中,找到相关的数据才是首要的一步。有了合适的数据,简单的统计模型也能有不错的效果,没有合适的数据,深度学习模型也不可能有更好效果。这亦是为什么线性模型、逻辑回归模型、XGBoost模型仍然是各领域使用最多的模型。而且,在具体场景应用时,深度学习建模过程常常是经验性的,需要基于对数据的理解和不断调整网络和超参数,反复尝试才能得到更好的结果。对于那些每提高1%的准确率都能为公司带来巨额收益的场景当然值得这么做。但在其他领域应用时,很可能没有那么多计算资源以及专家进行模型优化。

未来,同时精通领域知识和人工智能的专家将发挥更大的作用。因为领域智能化方案还涉及领域中整个流程改造、各环节定位以及合适的模型目标等问题。时常,互联网公司研究一个新功能、新产品,自认为可以替代领域中已有成熟方案。却忽略了这只是领域问题中一小部分环节,虽然”智能”了,并没有对整个流程有什么根本性改变,只是环节中的工具而已。所以,当面对领域流程数字化、智能化问题时,首先是结合可行技术方案,各环节职责需要重新设定。

在领域智能方案实施过程中,我们也常常能看到各种误区。前面的业务团队,往往将后面所有的系统都归为一个黑箱,分不清哪些是系统的能力、哪些是AI(人工智能)的能力、哪些是BI(商业智能)的能力。而AI算法团队也是同样,认为自己只是在做一个特定数据集、特定目标的优化问题,恨不得其他事都与他无关。当算法团队自认为在研究一个确定环境、有反馈数据的特定问题时,一个小小的不合理假设,就变成了事实上在探索无监督领域通用方案,那可不是工业界该干的事。最好的方案,是让业务团队只看见业务框架、流程价值;AI团队只看见模型价值;BI团队只看见分析价值;系统团队只看见平台价值。当然这样的完美方案并不存在。

还有一个重要误区,对人工智能方案常常产生过高的期望,并且要求工程师们做一些今天的技术无法做到的事情。咎其原因,部分是因为新闻媒体对人工智能过度的报道。这些新闻通常只是报道人工智能的成功故事,让人们产生错觉,认为人工智能可以做好任何事情。而且由于人工智能还在风口上,几乎所有的方案都会加上智能二字,将很多不属于机器学习的功劳也归在其下。有报告称欧洲40%人工智能创业公司与AI无关24,想来在我国情况也大体如此。我们强调,解决领域问题就是智能,这是结合弱人工智能、各类算法以及领域中系统、数据结合的共同方案。本书所说的”机器”是领域内所有计算机系统的总称。

24 报告称欧洲40%人工智能创业公司与AI无关[N]. 网易科技. 2019,03.

智能化是数字化改造的一部分,让各领域业务充分利用数据,让数据创造更多价值是根本目标。我国制定了《大数据产业发展规划(2016-2020年)》25,目的是推动大数据资源的采集、整合、共享和利用。数据既然是世界上最有价值的资源,而大多又是由个人客户提供的,那自然应该也为客户所用。那些贩卖、泄露客户数据当然是违法的,但也不应将客户大数据只用于提升拥有数据的公司市值。只为提升本公司价值的数据化运营也算不得数据是为用户所用。卖数据,其状显,还违法;用客户数据提升公司市值,其状隐,还被市场追捧。旁观者据以清浊之分,窃以为,只有高下之分。用户画像、穿戴设备采集的数据,不应只是用于企业、平台数字化运营,还要能帮助用户更好地认识自己、更好地决策。拥有数据的公司不但有义务利用好数据为客户服务,还有义务将数据在保护好客户隐私安全等条件的基础上以合适的方式提供给个人用户、提供给市场,以降低整个市场信息不对称。由于数据的外部性,这必然还将提升数据价值,提升全社会效率,那才是既积无量之福,又极市值之富的大道。

25 大数据产业发展规划(2016-2020年)[OL]. 工业和信息化部. 2017.

世界对于有的人来说是可衡量的,对于一个好的称量者来说是可称量的。

—— 尼采

本章主要观点

在数字化时代,那些事实性的记录可用于方方面面的决策,将极大的改善我们善于借题发挥的特质。

在领域数字化、智能化过程中,更需要的是5G基础设施,物联网中大量低成本的智能终端以及大量工程师,我国恰逢其时,将大有优势。

在数字化的世界中,原有的统计决策流程,必将被精细化决策流程代替。

对于大多数领域问题还是需要人机结合,这个“机“不止包括弱人工智能,更是指那些领域中已有的系统与数据以及各种算法。

利用数据中那些人类所无法理解、认识的信息,是评判是否智能化的标准之一

智能化方案并不需要一味要求可解释性,能有效挖掘那些不可解释的,但有助于事实,有助于决策的信息更为重要。

参考文献

1 曾鸣. 智能商业[M]. 中信出版社. 2018,11.

2 Jianfeng Gao , Michel Galley , Lihong Li. Neural Approaches to Conversational AI[C]. International Acm Sigir Conference. 2018.

3 从连接到赋能:“智能+”助力中国经济高质量发展[OL]. 阿里巴巴研究院. 2019,3.


知识来源: www.infoq.cn/article/A4c8ACdiTro2CT9tMsLZ

阅读:19733 | 评论:0 | 标签:无

想收藏或者和大家分享这篇好文章→复制链接地址

“数字化过程竞争中,美国为啥焦虑?”共有0条留言

发表评论

姓名:

邮箱:

网址:

验证码:

ADS

标签云