另外hive监控指标,我这边是之前单独开发的任务调度与监控系统,具体请参考大数据平台任务调度与监控系统 第八章我的数据要实时 在第六章介绍Kafka的时候提到hive监控指标了一些需要实时指标的业务场景,实时基本可以分为绝对实时和准实时,绝对实时的延迟要求一般在毫秒级,准实时的延迟要求一般在秒分钟级对于需要绝对实时的业务场景,用。
负责和支撑各部门相关的报表建立和优化指标体系监控数据的波动和异常,找出问题优化和驱动业务,推动数据化运营找出可增长的市场或产品优化空间输出专题分析报告需要掌握Excel+SQLhive,了解描述统计学,知道常见的可视化表达,了解一些Python编程,足够完成大部分任务二更注重数据挖掘技术,门槛较。
数据仓库数据建模的几种思路主要分为一下几种 1 星型模式 星形模式Star Schema是最常用的维度建模方式星型模式是以事实表为中心,所有的维度表直接连接在事实表上,像星星一样星形模式的维度建模由一个事实表和一组维表成,且具有以下特点a 维表只和事实表关联,维表之间没有关联b。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。