BI、数据仓库、数据中台等数据管理工具的系统解析

2022年10月26日12:13:24 科技 1187

随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发展,相关概念如雨后春笋一般应运而生,如从最初决策支持系统(DSS)商业智能(BI)、数据仓库、数据湖、数据中台等,这些概念特别容易混淆,本文对这些名词术语及内涵进行系统的解析,便于读者对数据平台相关的概念有全面的认识。

一、BI

BI、数据仓库、数据中台等数据管理工具的系统解析 - 天天要闻

商务智能(BI,Business Intelligence是一种以提供决策分析性的运营数据为目的而建立的信息系统。它将数据仓库、在线分析处理、数据挖掘等技术与客户关系管理等应用系统结合起来,并应用于企业活动实际过程当中,最终实现服务于管理层决策的目的 。

BI利用信息科技,将分散于企业内、外部各种数据加以整合并转换成知识,并依据某些特定的主题需求,进行决策分析和运算;用户则通过报表、图表、多维度分析的方式,寻找解决业务问题所需要的方案;这些结果将呈报给决策者,以支持策略性的决策和定义组织绩效,或者融入智能知识库自动向客户推送 。

二、数据仓库

BI、数据仓库、数据中台等数据管理工具的系统解析 - 天天要闻

数据仓库(Data Warehouse),也称为企业数据仓库,它是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合存储系统,它将来自不同来源的结构化数据聚合起来,用于业务智能领域的比较和分析,数据仓库是包含多种数据的存储库,并且是高度建模的 。

数据仓库系统的作用能实现跨业务线、跨系统的数据整合,为管理分析和业务决策提供统一的数据支持。数据仓库能够从根本上帮助人们把公司的运营数据转化成为高价值的可以获取的信息或知识,并且在恰当的时候通过恰当的方式把恰当的信息传递给恰当的人 。

三、数据湖

BI、数据仓库、数据中台等数据管理工具的系统解析 - 天天要闻

数据湖(Data Lake)是Pentaho公司CTO James Dixon提出来一种数据存储理念——即在系统或存储库中以自然格式存储数据的方法。数据湖作为一个集中的存储库,可以在其中存储任意规模的结构化和非结构化数据。在数据湖中,可以存储不需要对其进行结构化的数据,这样就可以运行不同类型的分析 。

数据湖能够帮助企业实现数据的集中式管理等多种能力。数据湖融合了先进的数据科学、机器学习和人工智能技术,帮助企业构建更加优化的数据运营模型,为企业提供预测分析、推荐模型等能力,这些模型能够刺激企业能力的持续增长,不断赋能于企业增长 。

四、数据中台

BI、数据仓库、数据中台等数据管理工具的系统解析 - 天天要闻

“数据中台”这个新概念最早于2014年被阿里芬兰引入国内,目前仍处于“定义混乱期”,不同的人对数据中台都有着各自的理解。部分数据专家将其解读为数据中台是一套可持续“让企业的数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。阿里云在对数据中台的战略解读中提出“中台包含先进技术(技术竞争力) ,但不仅仅是技术,更重要的是组织可以依托先进技术,利用其所拥有的核心资源(资源竞争力) ,构建其在企业数字化转型中的竞争力、话语权,及生态向心力(生态竞争力) , 中台是一种能力(技术、使能、赋能、创新、生态) 。”

数据中台通过对企业内外部多源异构的数据采集、治理、建模、分析和应用,使数据对内优化 管理提高业务价值,对外进行数据合作让业务价值得到释放,使之成为企业数据资产管理中枢。数据中台建立后,会形成数据API服务,为企业和客户提供高效各种数据服务 。

五、数据仓库 VS 数据湖

在储存方面上,数据湖能处理所有类型的数据,如结构化数据,非结构化数据,半结构化数据等,数据的类型依赖于数据源系统的原始数据格式。数据仓库,主要处理历史的、结构化的数据,通常从事务系统中提取 。

数据湖适用于深度分析,它拥有足够强的计算能力用于处理和分析所有类型的数据,可以做数据挖掘和数据分析。数据仓库主要是处理结构化数据,将它们或者转化为多维数据,或者转换为报表,以满足后续的高级报表及数据分析需求 。

与数据仓库相比,数据湖缺乏结构性,而且更灵活,并且提供了更高的敏捷性。数据仓库具有高性能、可重复性的特点 。

六、数据仓库 VS 数据中台

数据仓库的出发点为一个支撑性的技术系统,强调数据质量和元数据管理;而数据中台的第一出发点不是数据而是业务,更加注重思考业务问题需要什么样的数据服务 。

在具体的技术处理环节,二者也有明显不同,数据的预处理流程正在从传统的ETL结构向ELT结构转变。传统的数据仓库集成处理架构是ETL结构,这是构建数据仓库的重要一环,即用户从数据源抽取出所需的数据,经过数据清洗,将数据加载到数据仓库中去。而大数据背景下的架构体系是ELT结构,其根据上层的应用需求,随时从数据中台中抽取想要的原始数据进行建模分析 。

七、数据仓库 VS BI

商业智能 BI 相比于数据仓库,它是一个更大的概念。商业智能可以说是基于数据仓库,经过了数据挖掘后,得到了商业价值的过程。所以说数据仓库是个金矿,数据挖掘是炼金术,而商业报告则是黄金。数据仓库就像是 BI 这个房子的地基,搭建好 DW 这个地基之后,才能进行分析使用,最后产生价值 。

文字来源:肉眼品世界(微信公众号)

科技分类资讯推荐

7199元!华为新机定档:6月26日,即将登场! - 天天要闻

7199元!华为新机定档:6月26日,即将登场!

华为Mate70系列刚发布的时候,真的是一机难求啊。一机难求导致的结果,首先就是长时间处于无货状态,想买根本买不到。就算是部分渠道有货,想买的话也必须加钱。后来为了缓解压力,华为推出了华为Mate70Pro优享版。你还别说,华为Mate70
华为发布“智聚大上行”技术:5.5G上行速率提升15% 时延降低30% - 天天要闻

华为发布“智聚大上行”技术:5.5G上行速率提升15% 时延降低30%

快科技6月20日消息,在2025 MWC上海期间,中国电信联合华为举办5G-A“智聚大上行”创新发布会。会上,双方联合发布了“基于智能编排和上行频谱解耦与池化,形成智能大上行技术”最新创新技术成果。据了解,智聚大上行创新技术,利用AI模型实时预测信道质量以及通过AI实现时频制空功五维协同调度,多频段智能选择,根据业务...
对话宇树科技:机器人“烧脑”又烧钱,竟还有比这两样更缺的 - 天天要闻

对话宇树科技:机器人“烧脑”又烧钱,竟还有比这两样更缺的

6月16日,摩根士丹利发布研究报告称,中国机器人市场规模预计以每年23%的增幅快速增长,在未来四年翻一倍以上,巩固中国在全球机器人领域的领先地位。就在同一天,国家统计局公布数据显示,2025年5月中国工业机器人产量同比飙升35.5%,达到6.9万台,服务机器人产量跃升13.8%,达到120万台。人形机器人演示竞技太极动作。受...
签约奖金高达1亿美元,美国科技巨头砸重金争抢稀缺AI人才 - 天天要闻

签约奖金高达1亿美元,美国科技巨头砸重金争抢稀缺AI人才

【环球时报报道 记者 丁雅栀】随着人工智能领域竞争日益激烈,美国科技巨头们正不惜重金争夺人才。据美国CNBC网站18日报道,Meta首席执行官马克·扎克伯格近期大举招兵买马,甚至向OpenAI和谷歌DeepMind的研究人员提供1亿美元的签约奖金,以换取他们跳槽。这一消息迅速引发业界广泛讨论。Meta首席执行官马克·扎克伯格 图源...
ToB话聊室:AI智能体对话存在低俗内容;荣耀和中国移动达成AI终端战略合作 - 天天要闻

ToB话聊室:AI智能体对话存在低俗内容;荣耀和中国移动达成AI终端战略合作

【ZOL中关村在线原创新闻】6月19日,欢迎收看《ToB话聊室》。在这里,小编将跟你唠一唠科技领域的新鲜事儿。AI智能体对话存在低俗擦边内容据“网信上海”微信公众号消息,近期有媒体报道,筑梦岛APP等AI聊天软件存在虚拟角色互动生成低俗内容等问题,经核实,该平台AI智能体内容生成环节存在低俗擦边等违规内容,危害未成年...
总台现场直击丨第一批在以中国公民从塔巴口岸进入埃及 - 天天要闻

总台现场直击丨第一批在以中国公民从塔巴口岸进入埃及

当地时间6月19日,总台记者获悉,首批119名在以中国公民从埃及和以色列接壤的塔巴口岸进入埃及。他们都是在以中国留学生。中国驻埃及大使馆高度重视,第一时间启动应急机制,派出工作组赴口岸接应并协助转运至开罗。 总台记者直击中国公民撤离19日晚些时候,通过塔巴口岸进入埃及的第一批中国公民都已登上了大巴。总台记者...