精华共享:数据管理的未来

GartnerInc 工业智能官

当时,数据驱动型事务战略与信息产品的精华同享:数据办理的未来潜力比以往任何时候都要大。关于大都企业安排而言,数据剖析与办理已成为它们事务战略的重要驱动力。数据剖析与办理领导者正在经过开掘数据价值来驱动数字化转型、发明盈余时机、改进客户体会和重塑职业格式。

在本周的Gartner CIO峰会期间,Gartner高档研讨总监简儁芬(Melody Chien)为参会CIO们带来了关于“数据办理的标签14未来:现在所做的一切将会很快得到改动”的精彩讲演。以下为讲演精华内容。

四大要害字

跟着云、本地、边际间的边界逐步消失,数据办理的未来能够用四个要害词来描绘。首先是分布式(Distributed),未来的数据办理将是分精华同享:数据办理的未来布式的,由于数据办理须随数据地点的方位而进行。其次是无服务器(Serverless),此概念较特别、并不是指未来的数据办理不再需求服务器,而是指未来将没有一个清晰的集中式服务器。第三是和谐(Orchestrated),今日的数据会发生在不同的当地和设备上,所以须把它们协标签14调办理。第四是元数据(Metadata),不管数据涣散在何处,元数据均能把它们和谐在一起,因而元数据是未来数据办理中十分重要的一个元素。

三大维度

整体而言,数据办理的未来发展趋势可从三个维度来看——架构的改动、技术的改动以及安排的衍化。

1

架构标签3的改动(Architecture Shifts)

(点击查看大图)

Gartner于2018年针对数据和剖析的选用趋势进行了一项查询(多选题)。成果显现企业安排现在运用最遍及的信息根底架构技术为“依据云渠道的数据存储”(63%)。一些传统技术,例如数据仓库(Data Warehouse)和数据库办理体系(DBMS)依然占着适当大的比重。这些传统技术在未来并不会消失。举例而言,“数据仓库”是一个十分广泛的事例,未来数据的精华同享:数据办理的未来研讨和剖析都将需求用标签3到该技术——首要配合在特定事例和场合中运用。此外,未来还将有比如“数据目录”(D标签10ata Catalogs)这样的技术被广泛运用。“数据目录”是元数据的重要根底,以往“数据目录”首要用于协助企业安排了解数据的界说和来历,但现在的趋势是“数据目录”能够协助企业安排了解数据的特性、运用者以及运用场景。因而,在数据办理的未来趋势中,“数据目录”将具有无足轻重的位置。此外,数据湖(Date Lake)已从此前放置在内部数据中标签17心中改动为现在可放在云端上,这是一个十分大的改变,未来比如此类比较高端的技术均能够移至云渠道之上。

重“相关”、轻“收集”

(点击查看大图)

从上述查询布景能够看出,未来的数据办理和集成将会变得愈加“相关”(Connect),更少“收集”(Collect)。当时,在数据办理上,企业安排一般重“收集”、轻“相关”,此景象在我国尤为严峻——即企业安排在收集和存储数据后,并不能当即开掘其间的价值,失掉其时效性。原因在于,从数据被“收集”到运用其价值,这中心有适当长的流程(如上左图所示),包含描绘、收拾、集成、同享、办理和施行。这一长串流程对企业安排内部IT技术具有适当大的检测。跟着机器学习技术的引进和元数据的运用,现在数据办理和集成已开端出现出一种新趋势,即愈加重视数据的“相关”标签19(如上右图所示),也便是指不管数据是在本地、云端、某个设备感应器上或任何当地,咱们都能够在数据保留在原地的情况下,将它们相关起来,而无须收集到特定当地。在未来增强式的数据办理的环境中,主动开掘数据、透过机器主动认识辨认数据中的价值、确定有价值的数据、剖析数据、主动选用合适数据的安全措施、同享数据、优化数据,终究完成在最短时刻内将精准的数据发送给对的人,关于企业安排至关重要。

“移动性数据”成为首要事例

数据办理与集成方面的另一个趋势是“移动性数据”(Data in Motion)。以往,比如买卖发生后,企业安排便把数据存储进数据库或数据中心内,后续使命即制造报表等作业,这类的数据被称为“静态型”。“移动性数据”指的是在买卖过程中,企业安排就能够看到实时的数据处理——不管数据处在边际设备仍是在数据中心内。数据始终是数据商用渠道的中心地点。

集中式、分布式、随机式数据办理并存

与数据办理(Data Management)不同,数据办理(Data Governance)重视数据的运用者、运用方法、运用权限的合规性拟定。未来的“数据办理”将会十分动态——能够是集中式、分布式,亦但是随机式。“随机式”是指企业安排能够经过机器学习来增强数据内容以及评价用例。举例而言,某件物品在初次被海关征收关税时,海关或许不知怎么“办理”它。但“机器学习”引擎能够主动分辩该物品的特点,从而据此主动协助海关生成此件物品应该遵从的“办理”规矩。

元数据是未来数据办理的要害

企业安排的数据来历不只多种多样(包含ERP、CRM、SCM和HCM),且用处极为广泛(可用于外部供货商、客户与合作伙伴,出现方法包含图表、报表和指示板)。将这些来历与用处衔接起来——即连通无服务器进程(Serverless Processes)和物理兼并(Physical Consolidation)的要害桥梁便是元数据。

2

技术的改动(Technology Changes)

Gartner估计,在2021年之前,能够选用数据中心、数据湖或许数据仓库这种一致战略的企业安排,将比竞争对手多出30%的运用事例。此外,在2023年之前,75%的数据库将迁移至云渠道上,此举意味着削减数据库办理体系供货商的规划而且添加数据办理和集精华同享:数据办理的未来成的杂乱性。

人工智能让数据办理软件的运转愈加流通

(点击查看大图)

现在,人工智能能够协助企业安排增强数据办理。事实上,数据办理技术的未来便是人工智能和机器学习的运用。详细而言,有以下四方面。首先是数据质量(Data Quality)。现在市场上有许多供货商都是在用机器学习的方法协助企业安排扩展和增强数据的剖析、整理、衔接、辨认、语义和谐和重组。企业安排在不同数据源中管标签3理主数据质量以往需求人为操作、费时吃力,而机器学习能够使这一整串流程变得彻底主动化,且准确率明显提高。其次是主数据办理(Master Data Management)。机器学习能够协助企业安排装备和优化主数据,尤其在记载匹配和算法交融方面,机器学习能够让企业安排对主数据的办理愈加便当。第三是数据集成(Data Integration)。人工智能能够经过晋级多个相同形式并依据语义剖析,向企业安排奉告数据源的相关性,引荐企业安排将相同的数据源进行衔接,终究使得数据集成的流程愈加简化。第四是数据库办理体系(DataBase Management System)。人工智能技术的引进将精华同享:数据办理的未来使数据库从存储、索引、分区到调整、优化、修补——这标签10一系列繁琐的人工流程变得愈加主动化。

动态元数据发明“自我驱动型”数据办理

(点击查看大图)

机器学习和人工智能是一个后端底层技术,比如功能剖析等更大都据办理作业的完结还需动态元数据的支撑。元数据专门用于描绘数据的特质,协助企业安排将不同的数据进行相关并做引荐。以数据剖析为例,企业安排在界说数据的相关性时,动态元数据就会起到中心凝合力的效果。

开源软件收益与危险的平衡

(点击查看大图)

提及开源,一般想到的是总具有本钱(TCO)很低、企业安排的回本速度很快。尽管企业安排有时无法经过开源软件(OS标签1S)得到所需支撑,但现在市场上已有许多商业软件包可给予协助。其次,若企业安排需求研制立异并坚持灵活性,那么开源软件应是首要挑选。第三,据Gartner查询,全球90%的企业安排已把开源软件用在使命要害型的IT流程中。第四,企业安排应把服务水平协议与商业供货商的平衡性放入本身的精华同享:数据办理的未来数据办理战略考量中。

3

安排的衍化(Organization Evolves)

Gartner猜测,到2022年之前,运用动态元数据去衔接、优化、主动化数据集成流程的企业安排将削减30%的数据交给的时刻。此外,到2023年之前,在数据办理中运用人工智能技术能够协助企业安排进行更多的主动化作业,因而这些企业安排关于IT专业人士的需求将削减20%。

主动化数据与剖析作业即将来临

(点击查看大图)

Gartner就数据剖析作业的主动化优先级进行过一项调研。调研成果显现,数据集成(Data Integration)排名榜首,由于其最费时刻也标签5最易犯错。此外,机器学习相关技术的研制需求进行许多前期的数据预备(Data Preparation)。Gartner估计数据科学家大约需求花费70%到80%的时刻进行数据预备。因而,若数据预备无法进行主动化,那么项目交给的时刻就会极端绵长。

人机联盟:少花钱、多干事

(点击查看大图)

未来,数据集成作业需求人与机器共同完结。数据存在不同的端口且数量巨大,因而独自的人力难以进行处理、需有东西进行支撑。未来,这种东西将引进人工智能与机器学习技术,让人力做不到或短期内无法完成的作业变成实际。与此同时,此前从精华同享:数据办理的未来事这类作业的IT工程师将可腾出时刻去做更多、更重要的工作。

元数据与数据办理架构严密贴合

(点击查看大图)

元数据的办理渠道上有许多引擎,有些能够依据数据目录,即现在所存储的数据信息,主动地发现企业安排现在架构中有哪些数据源还未掌控,然后进行处理。元数据有两种维度——衡量(Metrics)与语义(Meaning)。以往,企业安排做得更多的是语义,但在未来元数据的办理上,两者具有平等重要性,乃至“衡量”的位置更高,由于它能够依据此前相似数据的集成方法主动进行数据开掘和规划。

数据办理新人物不断涌现

(点击查看大图)

Gartner针对“企业安排现在及2020前的数据办理职位”进行过调研,成果如上图所示。其间,需求点着重的是数据管家(Dat标签5a Steward)。“数据管家”在未来的数据办理作业中占有极端重要的位置。当时,企业安排现已认识到自己的数据源变得更多、数据运用事例变得更为杂乱,在此情况下,它们需求新的岗位去应对应战。但需着重的是,每个企业安排都有自己不同的战略,它们需求依据猜测的事务成果来运用不同的技术、设置不同的数据办理岗位。

Write a Comment

电子邮件地址不会被公开。 必填项已用 *标注