Fuentes: SQLite (originales) + PostgreSQL (migración)
| Archivo | Ruta | Tamaño | Tablas |
|---|
| data_warehouse.db | SALIDAS/db/ | 3.22 MB | 9 |
| pedidos_SAP.db | SALIDAS/db/curated/ | 2.44 MB | 3 |
| pedidos_HES.db | SALIDAS/db/curated/ | 1.37 MB | 3 |
| facturacion.db | SALIDAS/db/curated/ | 1.25 MB | 1 |
| ingeldata.db | SALIDAS/db/ | 0.31 MB | 4 |
Total: 8.91 MB, 32 tablas
| Config | Valor |
|---|
| Servidor | localhost:5432 |
| Base de datos | ingelcoding |
| Usuario | ingeluser |
| Puerto Gateway | On-Premises Data Gateway |
Tablas migradas:
- dim_calendario: 4,018 filas
- dim_gantt: 9,603 filas
- fact_facturas: 6,345 filas
- Total: 19,966 filas
| Tabla | Descripción | Columnas |
|---|
dim_calendario | Dimensión temporal | Fecha, Ano, Mes, Dia, Dia_Semana, Trimestre, Semana_Anio, Es_Finde, Es_Feriado |
dim_gantt | Planificación Gantt | 33 columnas: OT_Proyecto, Descripcion, Actividades, Duracion, Brigada, Supervisor, Estado_PMO, etc. |
dim_ot | Dimensión central de OTs | id, proyecto_original, ot_limpia, tipo, zonal, fuente |
dim_personal_brigadas | Personal y brigadas | RUT, Nombre, id_Brigada, Cargo, Fecha_Inicio, Fecha_Termino, Vehiculos |
| Campo | Tipo | Descripción |
|---|
id | INTEGER | Primary key |
proyecto_original | TEXT | Descripción del proyecto (NOMBRE_PROYECTO… para CTO, Descripcion para Gantt/Fact) |
ot_limpia | TEXT | OT individual extraída (key para cruces) |
tipo | TEXT | Clasificación: OT, OA, MAN, LITERAL |
zonal | TEXT | OSORNO / CASTRO / ANCUD / vacío |
fuente | TEXT | CTO / GANTT / FACTURACION |
extraido_de | TEXT | Texto original de la columna OT antes del split por ; |
| Tabla | Zona | Columnas clave |
|---|
dim_control_ots_ancud | Ancud | OT, proyecto, supervisor, cuadratura, finiquito, monto facturado |
dim_control_ots_castro | Castro | Mismo esquema que Ancud |
dim_control_ots_osorno | Osorno | + proceso, capataz, supervisor_saesa, materiales |
| Tabla | Descripción |
|---|
fact_facturacion | Facturación real por OT (HES, monto, fecha ejecución) |
fact_facturas | Cabeceras de facturas SAP |
fact_notas_credito | Notas de crédito asociadas |
fact_productividad | Presupuesto inicial (HH OT) extraído de planilla Productividad |
fact_costos_hh | Costos operativos por Brigada × Mes — grano (zonal, id_Brigada, mes), 16 cols. Persiste ResultadoCostos.costo_por_hh vía export_costos(). Commit 64febc8. Ver Pipeline-Costos y ADR-Costos-Metas-a-DW |
fact_productividad_diaria | (En diseño) Derivada de fact_productividad × dim_gantt al grano Brigada × Día × OT. Ver Datos-Esperados-Productividad |
Ver Modelo-Productividad-Rentabilidad para entender el cruce analítico de estas tablas de hechos.
| Vista | Definición | Descripción |
|---|
metas_mes | SELECT mes, zonal, id_Brigada, hb_dia_total FROM fact_costos_hh | Equivalente de la hoja METAS MES de GSheets. Consumible por Power BI. Creada por export_costos(). |
| Tabla | Descripción |
|---|
SAP_Cancelados | Pedidos cancelados en SAP |
SAP_Modificados | Pedidos modificados |
SAP_Nuevos | Pedidos nuevos |
11 columnas cada tabla (estado, pedido, monto, fecha, etc.)
| Tabla | Descripción |
|---|
HES_Cancelados | HES cancelados |
HES_Modificados | HES modificados |
HES_Nuevos | HES nuevos |
9 columnas cada tabla
| Tabla | Descripción |
|---|
Facturas | Facturas procesadas (12 columnas) |
| Tabla | Descripción |
|---|
raw_emails | [obsoleta — pre-parquet] Emails crudos (20 columnas: id, subject, sender, date, body, folder) |
processed_facturas | [obsoleta — pre-parquet] Facturas procesadas (15 columnas) |
processed_pedidos | [obsoleta — pre-parquet] Pedidos procesados (12 columnas) |
processed_hes | [obsoleta — pre-parquet] HES procesados (11 columnas) |
facturas | Tabla de dominio — facturas |
pedidos_hes | Tabla de dominio — pedidos HES |
pedidos_sap | Tabla de dominio — pedidos SAP |
valorizaciones | Tabla de dominio — valorizaciones |
gantt_actividades | Tabla de dominio — actividades Gantt |
pagos_pendientes | Tabla de dominio — pagos pendientes |
pipeline_runs | Observabilidad — 1 fila por run: status, ventana, fecha_source, scope_version |
pipeline_stage_runs | Observabilidad — 1 fila por stage por run (ingest/store/process/…) |
publish_log | Observabilidad — 1 fila por publicación: success/failed, error_msg, rows_published |
raw_files | Observabilidad — 1 fila por archivo descargado + scope_version |
scope_rebuild_history | Observabilidad — 1 fila por bump de scope: old/new scope, reason, bumped_by |
dim_proceso_* | Dimensiones de proceso (tablas múltiples) |
proceso_* | Tablas de proceso (tablas múltiples) |
ot_no_parseables | OTs que no pudieron ser parseadas |
_metadata | Metadatos internos de la BD |
sqlite_sequence | Secuencia interna SQLite (auto-generada) |
| Columna | Tipo | Descripción |
|---|
input_hash | TEXT | SHA256 del raw parquet de entrada |
output_rows | INTEGER | Filas del output procesado |
raw_date_from | TEXT | FECHA_DESDE usada en la ejecución |
raw_date_to | TEXT | FECHA_HASTA usada |
code_version | TEXT | Hash corto del commit git |
usuario | TEXT | ABV del usuario IMAP (ING, MC, HC) |
Ubicación: SALIDAS/processed/
Nueva estructura de parquets duraderos por dominio, con manifests:
SALIDAS/processed/{dominio}/{tabla}.parquet
SALIDAS/processed/{dominio}/_manifest.json (índice de versiones y fechas)