Capítulo 2 CARGA Y DESCRIPCIÓN DE LOS DATOS

2.1 Carga de los datos

Inicialmente se carga la base de datos que contiene la variable a estudiar.A continuación se muestra una breve visualización de la data.

data <- read.csv(file = "Datos.csv", header = TRUE, sep = ",", fill = TRUE)
library(dplyr)
library(ggplot2)
library(forecast)
library(zoo)
library(grid)
library(plotly)
library(TSA)
library(tseries)
glimpse(data)
## Rows: 999
## Columns: 7
## $ Mes        <chr> "7/1/1955", "8/1/1955", "9/1/1955", "10/1/1955", "11/1/1955", "12/1/1955", "1/1/1956", "2/1/…
## $ IPC        <chr> "-0.87%", "-0.01%", "0.84%", "0.77%", "1.44%", "2.03%", "2.10%", "2.57%", "3.10%", "3.04%", …
## $ DTF        <chr> "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", …
## $ usura.E.A. <chr> "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", …
## $ usura.M.V. <chr> "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", …
## $ usura.DTF  <chr> "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", …
## $ usura.IPC  <chr> "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", …

2.2 Descripción de la base de datos

Como se puede observar en la anterior tabla, el dataset se compone de 7 variables y 832 registros.Todas las variables identificadas como tipo caracter.

A continuación se define una tabla la cual indica el tipo de adecuado de cada una de las variables:

Resumen_variables<-data.frame(
  Variable= c("Mes","IPC","DTF","usura E.A.","usura M.V.","usura DTF","usura IPC"),
  Tipo_variable= c("Fecha","Numerica","Numerica","Numerica","Numerica","Numerica","Numerica")
  )
print(Resumen_variables)
##     Variable Tipo_variable
## 1        Mes         Fecha
## 2        IPC      Numerica
## 3        DTF      Numerica
## 4 usura E.A.      Numerica
## 5 usura M.V.      Numerica
## 6  usura DTF      Numerica
## 7  usura IPC      Numerica

2.3 Pre-procesamiento de datos

Después del cargue y análisis descriptivo de la información, se identificó que los tipos de datos estaban incorrectos, pues eran de tipo caracter y se esperaba que fueran tipo fecha y numérico. Adicionalmente, se observan otras variables que no se van a utilizar durante el desarrollo de este proyecto, por consiguiente se procede a eliminarlas a traves del siguiente codigo:

data <- data[ , -c(3:7)]

También se observo que las variables tenian un nombre inadecuado, por lo tanto, se procede a renombrar las variables.

colnames(data)<-c("Tiempo","IPC")

Posteriormente, se hace preprocesamiento de las variables, para poder convertir la data en serie de tiempo. Los cambios que se le aplicaron a los datos fueron:

-Se convierte la variable Tiempo a formato Fecha. -Se elimina el caracter % de la variable IPC. -Se cambia la “,” por “.” como separador de decimales. -Se convierte la variable IPC a tipo numérica. -Se eliminan datos faltantes en ambas variables.

# Convertir la columna "Tiempo" a formato de fecha
data$Tiempo <- as.Date(data$Tiempo, format = "%m/%d/%Y")

# Remover el símbolo de porcentaje y reemplazar comas por puntos
data$IPC <- gsub("%", "", data$IPC)  # Eliminar '%'
data$IPC <- gsub(",", ".", data$IPC) # Reemplazar ',' por '.'

# Convertir a numérico y dividir entre 100 para obtener el valor decimal
data$IPC <- as.numeric(data$IPC) / 100

# eliminar faltantes
data <- data[!is.na(data$Tiempo) & !is.na(data$IPC), ] 

Después, se convierte la data en tipo serie de tiempo mediante la funcion ts. A continuación, se puede ver como los datos quedaron organizados en una matriz donde las filas son años y las columnas meses y el dato correspondiente se encuentra en el cruce de ambas.

min_Tiempo <- min(data$Tiempo, na.rm = TRUE) #encontrar el minimo de la variable mes
#convertir los datos en serie de tiempo
Indice_ts <- ts(data$IPC, start = c(as.numeric(format(min_Tiempo, "%Y")), as.numeric(format(min_Tiempo, "%m"))), frequency = 12)
print(Indice_ts) # imprimir datos
##          Jan     Feb     Mar     Apr     May     Jun     Jul     Aug     Sep     Oct     Nov     Dec
## 1955                                                 -0.0087 -0.0001  0.0084  0.0077  0.0144  0.0203
## 1956  0.0210  0.0257  0.0310  0.0304  0.0425  0.0528  0.0636  0.0576  0.0726  0.0831  0.0883  0.0791
## 1957  0.0930  0.1030  0.1121  0.1297  0.1358  0.1715  0.1939  0.2143  0.2093  0.2117  0.1984  0.2069
## 1958  0.1946  0.1805  0.1786  0.1724  0.1806  0.1390  0.1099  0.1047  0.1014  0.0892  0.0854  0.0798
## 1959  0.0947  0.1034  0.0909  0.0896  0.0762  0.0787  0.0841  0.0778  0.0723  0.0714  0.0742  0.0781
## 1960  0.0652  0.0524  0.0614  0.0549  0.0552  0.0493  0.0479  0.0496  0.0557  0.0612  0.0713  0.0735
## 1961  0.0759  0.0836  0.0870  0.0987  0.1023  0.1027  0.1003  0.0840  0.0747  0.0681  0.0613  0.0574
## 1962  0.0563  0.0529  0.0454  0.0366  0.0263  0.0257  0.0330  0.0455  0.0585  0.0601  0.0615  0.0630
## 1963  0.0979  0.1634  0.2129  0.2508  0.2652  0.2924  0.2899  0.2928  0.2983  0.3155  0.3344  0.3360
## 1964  0.3067  0.2388  0.2051  0.1818  0.2043  0.1958  0.1767  0.1563  0.1370  0.1101  0.0962  0.0880
## 1965  0.0875  0.0710  0.0616  0.0557  0.0360  0.0361  0.0457  0.0637  0.0805  0.1123  0.1186  0.1444
## 1966  0.1430  0.1690  0.1809  0.1951  0.1942  0.1756  0.1758  0.1704  0.1724  0.1600  0.1470  0.1286
## 1967  0.1201  0.1109  0.0962  0.0687  0.0630  0.0824  0.0830  0.0840  0.0760  0.0728  0.0760  0.0717
## 1968  0.0768  0.0718  0.0714  0.0848  0.0852  0.0704  0.0773  0.0765  0.0743  0.0697  0.0712  0.0651
## 1969  0.0671  0.0641  0.0617  0.0618  0.0642  0.0658  0.0616  0.0681  0.0735  0.0837  0.0789  0.0863
## 1970  0.0736  0.0769  0.0772  0.0743  0.0701  0.0756  0.0744  0.0643  0.0651  0.0522  0.0612  0.0658
## 1971  0.0826  0.0915  0.0930  0.0978  0.1054  0.1000  0.1119  0.1303  0.1314  0.1465  0.1460  0.1403
## 1972  0.1350  0.1384  0.1383  0.1346  0.1302  0.1357  0.1334  0.1290  0.1360  0.1424  0.1431  0.1399
## 1973  0.1395  0.1494  0.1775  0.2009  0.2270  0.2377  0.2478  0.2344  0.2336  0.2164  0.2289  0.2408
## 1974  0.2628  0.2691  0.2670  0.2573  0.2353  0.2245  0.2120  0.2206  0.2226  0.2670  0.2542  0.2635
## 1975  0.2636  0.2529  0.2463  0.2439  0.2518  0.2480  0.2436  0.2399  0.2375  0.1991  0.1925  0.1777
## 1976  0.1711  0.1786  0.1712  0.1635  0.1569  0.1773  0.2008  0.2182  0.2227  0.2304  0.2531  0.2576
## 1977  0.2572  0.2753  0.2991  0.3663  0.4085  0.4165  0.3945  0.3701  0.3487  0.3240  0.2944  0.2871
## 1978  0.2722  0.2436  0.2340  0.1708  0.1475  0.1413  0.1269  0.1321  0.1353  0.1616  0.1762  0.1842
## 1979  0.2104  0.2149  0.2253  0.2279  0.2261  0.2157  0.2347  0.2551  0.2771  0.2687  0.2815  0.2880
## 1980  0.2759  0.2662  0.2420  0.2664  0.2827  0.2772  0.2737  0.2613  0.2549  0.2652  0.2620  0.2585
## 1981  0.2567  0.2800  0.2882  0.2705  0.2602  0.2787  0.2893  0.2952  0.2833  0.2710  0.2635  0.2636
## 1982  0.2603  0.2510  0.2455  0.2477  0.2478  0.2419  0.2354  0.2346  0.2452  0.2526  0.2479  0.2403
## 1983  0.2308  0.2188  0.2185  0.2242  0.2228  0.2046  0.1982  0.1832  0.1742  0.1720  0.1704  0.1664
## 1984  0.1702  0.1720  0.1664  0.1542  0.1416  0.1517  0.1567  0.1619  0.1651  0.1527  0.1639  0.1828
## 1985  0.1927  0.2124  0.2282  0.2381  0.2761  0.2791  0.2564  0.2467  0.2440  0.2477  0.2349  0.2245
## 1986  0.2355  0.2372  0.2265  0.2254  0.1640  0.1346  0.1411  0.1617  0.1679  0.1817  0.1954  0.2095
## 1987  0.2109  0.1977  0.2036  0.1980  0.2273  0.2481  0.2665  0.2527  0.2501  0.2480  0.2473  0.2402
## 1988  0.2370  0.2613  0.2636  0.2841  0.2844  0.3027  0.3026  0.2965  0.2900  0.2859  0.2768  0.2812
## 1989  0.2791  0.2703  0.2653  0.2485  0.2488  0.2363  0.2376  0.2569  0.2655  0.2661  0.2709  0.2612
## 1990  0.2669  0.2712  0.2763  0.2798  0.2824  0.2897  0.2872  0.2898  0.3024  0.3065  0.3097  0.3236
## 1991  0.3198  0.3165  0.3118  0.3116  0.3149  0.3100  0.3160  0.3120  0.3001  0.2925  0.2822  0.2682
## 1992  0.2743  0.2735  0.2708  0.2715  0.2730  0.2813  0.2836  0.2770  0.2692  0.2632  0.2570  0.2513
## 1993  0.2482  0.2471  0.2418  0.2308  0.2221  0.2138  0.2046  0.2107  0.2143  0.2169  0.2237  0.2260
## 1994  0.2250  0.2301  0.2341  0.2394  0.2386  0.2308  0.2269  0.2235  0.2231  0.2237  0.2216  0.2259
## 1995  0.2104  0.2086  0.2133  0.2117  0.2130  0.2166  0.2150  0.2109  0.2079  0.2052  0.2013  0.1946
## 1996  0.2024  0.2081  0.2020  0.1990  0.1978  0.1970  0.2057  0.2113  0.2155  0.2187  0.2188  0.2163
## 1997  0.2062  0.1958  0.1893  0.1852  0.1860  0.1867  0.1788  0.1793  0.1801  0.1780  0.1781  0.1768
## 1998  0.1784  0.1803  0.1924  0.2074  0.2067  0.2069  0.2027  0.1894  0.1780  0.1709  0.1635  0.1670
## 1999  0.1718  0.1538  0.1351  0.1117  0.0998  0.0896  0.0878  0.0928  0.0933  0.0932  0.0965  0.0923
## 2000  0.0825  0.0889  0.0973  0.0996  0.1000  0.0968  0.0929  0.0910  0.0920  0.0899  0.0882  0.0875
## 2001  0.0849  0.0806  0.0781  0.0798  0.0787  0.0793  0.0809  0.0803  0.0797  0.0801  0.0778  0.0765
## 2002  0.0737  0.0670  0.0589  0.0565  0.0584  0.0625  0.0616  0.0598  0.0597  0.0637  0.0707  0.0699
## 2003  0.0739  0.0724  0.0760  0.0785  0.0773  0.0721  0.0704  0.0726  0.0711  0.0658  0.0613  0.0649
## 2004  0.0619  0.0628  0.0621  0.0549  0.0537  0.0607  0.0619  0.0589  0.0597  0.0590  0.0582  0.0550
## 2005  0.0543  0.0525  0.0503  0.0501  0.0504  0.0483  0.0491  0.0488  0.0502  0.0527  0.0510  0.0485
## 2006  0.0456  0.0419  0.0411  0.0412  0.0404  0.0394  0.0432  0.0472  0.0458  0.0419  0.0431  0.0448
## 2007  0.0471  0.0525  0.0578  0.0626  0.0623  0.0603  0.0577  0.0522  0.0501  0.0516  0.0541  0.0569
## 2008  0.0600  0.0635  0.0593  0.0573  0.0639  0.0718  0.0752  0.0787  0.0757  0.0794  0.0773  0.0767
## 2009  0.0718  0.0647  0.0614  0.0573  0.0477  0.0381  0.0328  0.0313  0.0321  0.0272  0.0237  0.0200
## 2010  0.0210  0.0209  0.0184  0.0198  0.0207  0.0225  0.0224  0.0231  0.0228  0.0233  0.0259  0.0317
## 2011  0.0340  0.0317  0.0319  0.0284  0.0302  0.0323  0.0342  0.0327  0.0373  0.0402  0.0396  0.0373
## 2012  0.0354  0.0355  0.0340  0.0343  0.0344  0.0320  0.0303  0.0311  0.0308  0.0306  0.0277  0.0244
## 2013  0.0200  0.0183  0.0191  0.0202  0.0200  0.0216  0.0222  0.0227  0.0227  0.0184  0.0176  0.0194
## 2014  0.0213  0.0232  0.0251  0.0272  0.0293  0.0279  0.0289  0.0302  0.0286  0.0329  0.0365  0.0366
## 2015  0.0382  0.0436  0.0456  0.0464  0.0441  0.0442  0.0446  0.0474  0.0535  0.0589  0.0639  0.0677
## 2016  0.0745  0.0759  0.0798  0.0793  0.0820  0.0860  0.0897  0.0810  0.0727  0.0648  0.0596  0.0575
## 2017  0.0547  0.0518  0.0469  0.0466  0.0437  0.0399  0.0340  0.0387  0.0397  0.0405  0.0412  0.0409
## 2018  0.0368  0.0337  0.0314  0.0313  0.0316  0.0320  0.0312  0.0310  0.0323  0.0333  0.0327  0.0318
## 2019  0.0315  0.0301  0.0321  0.0325  0.0331  0.0343  0.0379  0.0375  0.0382  0.0386  0.0384  0.0380
## 2020  0.0362  0.0372  0.0386  0.0351  0.0285  0.0219  0.0197  0.0188  0.0197  0.0175  0.0149  0.0161
## 2021  0.0160  0.0156  0.0151  0.0195  0.0330  0.0363  0.0397  0.0444  0.0451  0.0458  0.0526  0.0562
## 2022  0.0694  0.0801  0.0853  0.0923  0.0907  0.0967  0.1021  0.1084  0.1144  0.1222  0.1253  0.1312
## 2023  0.1325  0.1328  0.1334  0.1282  0.1236  0.1213  0.1178  0.1143  0.1099  0.1048  0.1015  0.0928
## 2024  0.0835  0.0774  0.0736  0.0716  0.0716  0.0718  0.0686  0.0612