logo

A dimensão Data no Data Warehouse

Blog do Rui Data Warehouse,Business Intelligence

A dimensão Data contextualiza um facto no tempo, permitindo dessa forma analisar o processo numa perspectiva temporal. Como o tempo é uma de análise muito importante, que permite, por exemplo, compreender a evolução do negócio ao longo dos meses, saber em que épocas do ano há maior volume de vendas, relacionar o facto de ser feriado com ao aumento do consumo, etc.,  há todo o interesse em definir uma rica em características de forma a proporcionar ao utilizador diversas possibilidades de análise. Deixo então a minha sugestão (neste momento) para a data:

NOME: Dimensão Data

CAMPOS:

Chave da Data - Chave da tabela Dimensão Data

Geralmente utilizam-se chaves artificiais (*) para as tabelas do data warehouse, independentes das chaves das tabelas dos sistemas operacionais (mais voláteis). Essas chaves são números sequenciais sem qualquer significado especial. Neste caso é comum utilizar uma chave que representa o dia, por exemplo 20110321 (ano 2011, mês 03, dia 21). A grande vantagem está no preenchimento da tabela de factos, no processo de obtenção da Chave da Data. Por exemplo, se tivermos a data de 15 Dez 1982 no sistema operacional, para obter a Chave da Data (chave na data) basta fazer uma conversão de formato, mudando para AAAAMMDD. Se a Chave da Data fosse um simples número sequencial teríamos ter um processo de procura do número correspondente à data a inserir.

(*) o termo inglês para chave artificial é surrogate key, que significa chave substituta, ou seja, a chave que substitui a chave natural.

Data - Data no formato: 23-03-2011  (DD-MM-YYYY)

Descrição Completa da Data - Data no formato: 12 de Janeiro de 2008

Ano - Ano no formato 2011 (AAAA)

Semestre - Valores:  1º Semestre, 2º Semestre

Trimestre - Valores: 1º Trimestre, 2º Trimestre, ..., 4º Trimestre

Estação do Ano - Valores: Primavera, Verão, Outono, Inverno

Época Festiva - indicação da época festiva tal como o Natal, Páscoa, Carnaval, ...

Mês - Valores: 1, 2, ...,  12

Nome do Mês - Valores: Janeiro, Fevereiro, ...

Mês do Ano - Mês e ano no formato:  Janeiro-2011

Semana do Ano - Valores 1, 2, 3,  ...  para a semana do ano

Semana do Mês - Valores 1, 2, 3,  ...  para a semana do mês

Dia da Semana - Valores:   Segunda-feira, Terça-feira, Quarta-feira, Quinta-feira, Sexta-feira, Sábado e Domingo

Número do Dia da Semana - Valores: 1, 2, 3, 4, 5, 6, 7.  Valores numéricos correspondentes a: Domingo, Segunda-feira, Terça-feira, ... Sábado

Dia do Ano - Valores: 1, 2, 3, ..., 365   para o dia do ano

Dia do Mês - Valores: 1, 2, 3, ..., 31   para o dia do mês

Último dia do Mês -Valores:  Último dia do Mês, Não é último dia do Mês

Feriado - Indicação se é dia feriado. Valores: É feriado, Não é Feriado

SQLData - campo tipo DATE com a data. Utilizado como auxiliar.


E esta é a minha proposta actual para a Dimensão Data, com 21 campos. Se tiver novas ideias por favor deixe o seu comentário.

Quanto ao carregamento desta dimensão a minha sugestão é usar o Excel com algumas fórmulas mágicas que poderão fazer quase todo o trabalho :)

 


Deixe o seu comentário