1.ODS(**operation data store****,操作数据层**):

  ODS层数据主要是,收集数据采集接口采集的原始数据,可以做简单的聚合,不做深度加工。用电信业务举例,这里的数据基本上是来自xdr和trace的数据。

2.DIM(**dimention,公共维度层**):

  基于维度建模理念思想,建立整个企业的一致性维度。降低数据计算口径和算法不统一风险。公共维度层的表通常也被称为逻辑维度表,维度和维度逻辑表通常一一对应。

3.**DWD(data** **warehouse** **detail,明细数据层****)

主要对ODS层做数据清洗和规范化的操作,并且可以按照不同的行为维度对数据进行划分,即事实表。分为3种类型:

•**事务事实表。**发生在某个时间点上的一个事件,比如MR。

•**周期快照事实表。**按照规律时间间隔对事务进行度量,比如15分钟PM。

•**累计快照事实表。**涵盖一个事务或离散对象生命周期的不确定时间跨度的度量。比如呼叫话单,含有起呼时间、接听时间、终呼时间、通话时长等多个事务状态与累计度量。

  这里业务上会有大宽表的说法,个人理解大宽表就是一个业务字段的汇总,一般有几百个字段,相当于是XDR和TRACE的表的数据的汇总。

4.DWS(data  warehouse  service,服务数据层)

对各个域进行了适度汇总,主要以数据域+业务域的理念建设公共汇总层。如天统计、栅格统计,区域统计

5.TDM(tag  data  model,标签层)

l面向对象建模,对跨业务板块、跨数据域的特定对象数据进行整合,通过ID-Mapping把各个业务板块、各个业务过程中的同一对象的数据打通,形成对象的全域标签体系,方便深度分析、挖掘、应用。TDM分为3种类型:

•**统计类:**统计对象相关数值,客观描述对象状态的标签,如高负荷小区近7天话务量、小区近7天弱覆盖天数。(区别于DWS层常规的天统计、月统计)

•**规则类:**根据业务运营上的需要,在业务层面制定规则的标签。如弱覆盖小区、高负荷小区、漫游用户

•**数据挖掘类:**应用算法挖掘对象相关特征。如不满意用户、私家车、快递员

6.ADS(application  data  store,应用数据层)

l按照业务的需要从统一数仓层、标签数据层抽取数据,并面向业务的特殊需要加工业务特定数据,以满足业务及性能需求,向特定应用组装应用数据。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐