快捷搜索:  test  xxx

梅宏:我国大数据总量有望占全球两成,应用尚处于初级阶段

2019/10/28 9:39:0021世纪经济报道关键字:大年夜数据 总量 举世两成

浏览量:

中国科学院院士、中国人夷易近解放军军事科学院副院长梅宏觉得,当前大年夜数据利用尚处于低级阶段,根据大年夜数据阐发猜测未来、指示实践的深层次利用将成为成长重点。

十三届全国人大年夜常委会第十四次会议10月26日下昼在北京人夷易近大年夜会堂终结。会后,十三届全国人大年夜常委会举办专题讲座第十四讲,题目为《大年夜数据:成长现状与未来趋势》。

中国科学院院士、中国人夷易近解放军军事科学院副院长梅宏觉得,当前大年夜数据利用尚处于低级阶段,根据大年夜数据阐发猜测未来、指示实践的深层次利用将成为成长重点。

他指出,估计到2020年,我国数据总量有望占举世数据总量的21%,但我国核心技巧懦弱,建议以开源为根基构建自立可控的大年夜数据财孕育发生态。

大年夜数据利用三个层次

梅宏指出,按照数据开拓利用深入程度的不合,可将浩繁的大年夜数据利用分为三个层次。

第一层,描述性阐发利用,是指从大年夜数据中总结、抽取相关的信息和常识,赞助人们阐发发生了什么,并出现事物的成长过程。

如美国的DOMO公司从其企业客户的各个信息系统中抽取、整合数据,再以统计图表等可视化形式,将数据蕴含的信息推送给不合岗位的营业职员和治理者,赞助其更好地懂得企业现状,进而做出判断和决策。

第二层,猜测性阐发利用,是指从大年夜数据中阐发事物之间的关联关系、成长模式等,并据此对事物成长的趋势进行猜测。

如微软公司纽约钻研院钻研员David Rothschild经由过程网络和阐发赌钱市场、好莱坞证券买卖营业所、社交媒体用户宣布的帖子等大年夜量公开数据,建立猜测模型,对多届奥斯卡奖项的归属进行猜测。2014和2015年,均准确猜测了奥斯卡共24个奖项中的21个,准确率达87.5%。

第三层,指示性阐发利用,是指在前两个层次的根基上,阐发不合决策将导致的后果,并对决策进行指示和优化。

如无人驾驶汽车阐发高精度舆图数据和海量的激光雷达、摄像优等传感器的实时感知数据,对车辆不合驾驶行径的后果进行预判,并据此指示车辆的自动驾驶。

自动驾驶有效利用面临寻衅

梅宏觉得,当前,在大年夜数据利用的实践中,描述性、猜测性阐发利用多,决策指示性等更深层次阐发利用偏少。

一样平常而言,人们做出决策的流程平日包括:认知现状、猜测未来和选择策略这三个基础步骤。这些步骤也对应了上述大年夜数据阐发利用的三个不合类型。

不合类型的利用意味着人类和谋略机在决策流程中不合的分工和协作。例如:第一层次的描述性阐发中,谋略机仅认真将与现状相关的信息和常识展现给人类专家,而对未来态势的判断及对最优策略的选择仍旧由人类专家完成。利用层次越深,谋略机承担的义务越多、越繁杂,效率提升也越大年夜,代价也越大年夜。

然而,跟着钻研利用的赓续深入,人们徐徐意识到前期在大年夜数据阐发利用中大年夜放异彩的深度神经收集尚存在根基理论不完善、模型不具可解释性、鲁棒性较差等问题。

是以,虽然利用层次最深的决策指示性利用,当前已在人机博弈等非关键性领域取得较好利用效果,然则,在自动驾驶、政府决策、军事批示、医疗康健等利用代价更高,且与人类生命、家当、成长和安然慎密关联的领域,要真正得到有效利用,仍面临一系列待办理的重大年夜根基理论和核心技巧寻衅。

梅宏指出,在此之前,人们还不敢、也不能放手将更多的义务交由谋略机大年夜数据阐发系统来完成。这也意味着,虽然已有很多成功的大年夜数据利用案例,但还远未达到我们的预期,大年夜数据利用仍处于低级阶段。

未来,跟着利用领域的拓展、技巧的提升、数据共享开放机制的完善,以及财孕育发生态的成熟,具有更大年夜潜在代价的猜测性和指示性利用将是成长的重点。

工业互联网政府热、企业冷

作为人口大年夜国和制造大年夜国,我国数据孕育发生能力伟大年夜,大年夜数据资本极为富厚。

梅宏指出,估计到2020年,我国数据总量有望达到8000EB(1018),占举世数据总量的21%,将成为名列前茅的数据资本大年夜国和举世数据中间。

然而,我们也必须清醒地熟识到我国在大年夜数据方面仍存在一系列亟待补上的短板。

此中较为凸起的是核心技巧懦弱,根基理论与核心技巧的后进导致我国信息技巧经久存在“空心化”和“低端化”问题,大年夜数据期间需避免此问题在新一轮成长中再次呈现。

近年来,我国在大年夜数据利用领域取得较大年夜进展,然则根基理论、核心器件和算法、软件等层面,较之美国等技巧蓬勃国家仍显着后进。

在大年夜数据治理、处置惩罚系统与对象方面,我国主要依附国外开源社区的开源软件,然而,因为我国对国际开源社区的影响力较弱,导致对大年夜数据技巧生态短缺自立可控能力,成为制约我国大年夜数据财产成长和国际化运营的重大年夜隐患。

梅宏建议采纳“介入融入、蓄势引领”的开源推进策略,一方面鼓励我国企业积极“介入融入”国际成熟的开源社区,争取话语权;另一方面,也要在扶植基于中文的开源社区方面加大年夜投入,汇聚海内软硬件资本和开源人才,打造自立可控开源生态,在进修实践中徐徐生长强盛年夜,伺机实现引领成长。

此外,交融利用有待深化。梅宏指出我国大年夜数据与实体经济交融不敷深入,主要问题表现在:根基举措措施设置设置设备摆设摆设不到位,数据采集难度大年夜;短缺有效向导与支撑,实体经济数字化转型迟钝;短缺自立可控的数据互联共享平台等。

当前,工业互联网成为互联网成长的新领域,然而仍存在不少问题:政府热、企业冷,政府时有“项目式”、“运动式”推进,而企业因为没看到直接、快捷的好处,吸收度低;设备举措措施的数字化率和联网率偏低;大年夜多半大年夜企业仍旧倾向打造难以与外部系统交互数据的封闭系统,而浩繁中小企业数字化转型的动力和能力严重不够;国外厂商的设备在我国具有垄断职位地方,这些企业纷繁推出响应的工业互联网平台,抢占工业领域的大年夜数据根基办事市场。

梅宏建议大年夜力成长行业大年夜数据利用。以制造业为例,麦肯锡钻研申报称:制造企业在使用大年夜数据技巧后,其临盆资源能够低落10%—15%。

而大年夜数据技巧对制造业的影响远非资源这一个方面。使用源于产品生命周期中市场、设计、制造、办事、再使用等各个环节数据,制造业企业可以加倍精细、个性化地懂得客户需求;建立加倍精益化、柔性化、智能化的临盆系统;创造包括贩卖产品、办事、代价等多样的商业模式;并实现从应激式到预防式的工业系统运转治理模式的转变。

您可能还会对下面的文章感兴趣: