包含标签 数据中台 的文章

国内几个云厂商大数据平台

国内几个厂商,阿里、华为、腾讯、网易的大数据平台产品粗略调研;共同点:去Ambari 自己的管控平台,报警 监控 自动化运维,智能诊断,数据治理,集成各开源组件,离线、实时、OLAP,数据服务。 阿里云:有 celeborn向量化, EMR on ECS、on ACK,Serverless, 网易:自动化诊断做的不错,Kyuubi、Impala两个增强点; 华为云:基于OpenStack还有 API,鲲鹏硬件整合、CarbonData,Superiro Scheduler;腾讯:TDBS 比较中规中矩 各种都有

阅读全文

数据中台总结

数仓时代、大数据出现、大数据平台、数据中台。自顶向下建模、自底向上建模。大数据平台问题:1、指标口径不一致;2、数据重复建设;3、取数难;4、数据质量差;5、成本高;数据中台:OneData、OneService,基于大数据平台,增加数据治理能。其中元数据中心是关键(数据字典、数据血缘、数据特征)。 数据指标:口径不一致,描述错误/不清晰/难以理解/计算逻辑不清晰;面向主题域管理、原子和派生指标、规范命名。数据模型复用:DWD跨层引用,DWS/ADS/DM 汇总查询比列,接管ODS,划分主题域,构建一致性维度、事实表整合、ETL开发。数据质量:添加稽核任务、全链路监控、智能预警、质量打分、SLA。成本治理:全局资产盘点、发现问题、治理优化(无用的下线、高消耗查询、存储成本)、治理效果评估。 数据服务:提供统一接口、解决数据接入效率低、数据和接口无法复用、不知道数据被哪些应用访问;具备网关能力,全链路打通,利用中间存储加速查询,逻辑模型嵌套底层多个物理数据源。 数据安全:HDFS快照+备份;垃圾箱、权限管理:OpenLDAP + Kerberos + Ranger,两套环境物理隔离 or 复用底层设施 + 共享 meta-store。 实践: BI 赋能、打通行业的运营体系、自助取数; 研发流程:需求阶段、开发阶段、交付阶段、运维阶段。 中台建设:数据中台和业务的关系,就是鱼和水的关系,谁也离不开谁;业务想要获得更大的增长,就必须依赖数据中台,数据中台想要存活下去,就必须依赖业务的口碑和认可

阅读全文