vol. 40 (nº 01) año 2019. pág. 18 análisis de …issn 0798 1015 home revista espacios! Índices...

18
ISSN 0798 1015 HOME Revista ESPACIOS ! ÍNDICES / Index ! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de supervivencia para predicción de bancarrota: Caso de las industrias minoristas en Colombia Survival analysis for bankruptcy prediction: The case of the retail industry in Colombia CASTRO, Yamile 1; HUERTAS, César A. 2; OBANDO, Carlos E. 3; VALENCIA, Carlos F. 4 Recibido: 26/07/2018 • Aprobado: 14/11/2018 • Publicado 14/01/2019 Contenido 1. Introducción 2. Metodología 3. Datos 4. Resultados 5. Conclusiones y discusión Referencias bibliográficas RESUMEN: En este estudio se desarrolla un modelo de análisis de supervivencia para analizar el comportamiento de las empresas del sector de comercio minorista (retail) en Colombia. El objetivo es predecir la probabilidad de riesgo de quiebra en función del tiempo a partir de razones financieras, por medio de metodologías interpretables como los modelos aditivos generalizados GAM y la regresión de Cox. Adicionalmente, se desarrolla un mecanismo de selección de variables y métricas evaluación de desempeño mediante validación cruzada. Palabras clave: Predicción de bancarrota, análisis de supervivencia, modelo GAM, comercio minorista. ABSTRACT: . In this study we develop a survival analysis model for the analysis of the behavior of firms in the retail sector of Colombia. The main purpose is to predict the bankruptcy probability as a function of time and incorporating the information of financial ratios. We use interpretable methodologies as the generalized additive model and the Cox regression. In addition, we propose a novel variable selection mechanism and adequate metrics for performance measuring using cross-validation. Keywords: Bankruptcy prediction, survival analysis, generalized additive model, retail. 1. Introducción La bancarrota se define como el resultado de una condición crónica en la que el total de pasivos de una firma excede el valor de sus activos. Dicha situación de insolvencia permanente puede estar asociada a manejos administrativos incorrectos, efectos en la economía, transformaciones coyunturales del mercado, problemas de liquidez, entre otros factores que afectan directamente los resultados financieros de la compañía. La insolvencia generalizada puede causar efectos colaterales al resto del sistema financiero y provocar una crisis sistémica, razón por la cual se establece el Acuerdo de Basilea II (2004), con el fin de

Upload: others

Post on 16-Apr-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

ISSN 0798 1015

HOME Revista ESPACIOS

IacuteNDICES Index

A LOS AUTORES To theAUTORS

Vol 40 (Nordm 01) Antildeo 2019 Paacuteg 18

Anaacutelisis de supervivencia paraprediccioacuten de bancarrota Caso de lasindustrias minoristas en ColombiaSurvival analysis for bankruptcy prediction The case of theretail industry in ColombiaCASTRO Yamile 1 HUERTAS Ceacutesar A 2 OBANDO Carlos E 3 VALENCIA Carlos F 4

Recibido 26072018 bull Aprobado 14112018 bull Publicado 14012019

Contenido1 Introduccioacuten2 Metodologiacutea3 Datos4 Resultados5 Conclusiones y discusioacutenReferencias bibliograacuteficas

RESUMENEn este estudio se desarrolla un modelo de anaacutelisis desupervivencia para analizar el comportamiento de lasempresas del sector de comercio minorista (retail) enColombia El objetivo es predecir la probabilidad deriesgo de quiebra en funcioacuten del tiempo a partir derazones financieras por medio de metodologiacuteasinterpretables como los modelos aditivosgeneralizados GAM y la regresioacuten de CoxAdicionalmente se desarrolla un mecanismo deseleccioacuten de variables y meacutetricas evaluacioacuten dedesempentildeo mediante validacioacuten cruzadaPalabras clave Prediccioacuten de bancarrota anaacutelisis desupervivencia modelo GAM comercio minorista

ABSTRACT In this study we develop a survival analysis modelfor the analysis of the behavior of firms in the retailsector of Colombia The main purpose is to predict thebankruptcy probability as a function of time andincorporating the information of financial ratios Weuse interpretable methodologies as the generalizedadditive model and the Cox regression In additionwe propose a novel variable selection mechanism andadequate metrics for performance measuring usingcross-validationKeywords Bankruptcy prediction survival analysisgeneralized additive model retail

1 IntroduccioacutenLa bancarrota se define como el resultado de una condicioacuten croacutenica en la que el total depasivos de una firma excede el valor de sus activos Dicha situacioacuten de insolvenciapermanente puede estar asociada a manejos administrativos incorrectos efectos en laeconomiacutea transformaciones coyunturales del mercado problemas de liquidez entre otrosfactores que afectan directamente los resultados financieros de la compantildeiacutea La insolvenciageneralizada puede causar efectos colaterales al resto del sistema financiero y provocar unacrisis sisteacutemica razoacuten por la cual se establece el Acuerdo de Basilea II (2004) con el fin de

crear un estaacutendar internacional que le permita a los reguladores bancarios establecerrequerimientos de capital necesarios frente a los riesgos financieros y operativos en los quepueden incurrir las compantildeiacuteas es decir creacioacuten de portafolios crediticios de acuerdo alincumplimiento de los clientes A partir de lo anterior conocer de antemano cuando unafirma va a entrar en bancarrota es una informacioacuten valiosa que impacta muchas decisionesen el sistema financiero y de alliacute se deriva la importancia del desarrollo de herramientasanaliacuteticas que permitan determinar los factores econoacutemicos relevantes para predecir elestreacutes financieroUna de las metodologiacuteas maacutes trabajadas a traveacutes del tiempo para la explicacioacuten de labancarrota corresponde al uso de razones financieras (Bellovary Giacomino amp Akers 2007)Se trata de estudiar las relaciones de variables del estado econoacutemico de una compantildeiacuteacategorizadas en razones de liquidez las cuales miden el dinero en efectivo para el pago dedeudas de actividad o eficiencia que permiten identificar la rapidez de convertir los activosno-corrientes en activos corrientes razones de deuda con las que se puede medir el pago dedeudas de largo plazo de ganancia las cuales evaluacutean los activos y el control de los gastosy por uacuteltimo razones de mercado que relacionan el rendimiento y el valor de una inversioacutenen acciones de la compantildeiacuteaEl estudio para determinar el estreacutes financiero a traveacutes del uso de razones financierasymeacutetodos estadiacutesticos inicia en 1932 cuando Fitzpatrick da origen a la etapa descriptiva yposteriormente en 1968 Altman inicia la etapa predictiva con el desarrollo de modelosmultivariados (Altman 1968) Las siguientes metodologiacuteas se basaron en teacutecnicasestadiacutesticas claacutesicas de clasificacioacuten a partir de las cuales es posible tener unainterpretacioacuten sencilla de los resultados tales como anaacutelisis discriminante lineal regresioacutenlogiacutestica y modelos probit Durante los uacuteltimos antildeos se han realizado numerosos estudiosde nuevas metodologiacuteas para la prediccioacuten de quiebra basadas en aprendizaje automaacutetico einteligencia artificial como son redes neuronales artificiales (Atiya 2001 Wilson amp Sharda1994) maacutequinas de soporte vectorial (Shin Lee amp Kim 2005 Lin Yeh amp Lee 2011) ymeacutetodos de ensamble (Wang amp Ma 2012 Kim amp Kang 2010) En general estas uacuteltimasmetodologiacuteas ofrecen un mejor rendimiento de clasificacioacuten que los modelos estadiacutesticosparameacutetricos claacutesicos sin embargo aunque los algoritmos predictivos de caja negrafuncionan muy bien para predecir cuaacutendo se produciraacute la bancarrota no dan razoacuten por lacual sucede De esta forma un buen modelo de prediccioacuten de bancarrota debe considerardesempentildeo precisioacuten e interpretabilidad a partir del cual sea posible describir elcomportamiento estaacutetico y dinaacutemico de los indicadores financierosEn Colombia se establece la existencia de dos tipos de liquidacioacuten para las sociedadesliquidacioacuten voluntaria y liquidacioacuten judicial la primera hace referencia a la disolucioacuten de unacompantildeiacutea por ocurrencia de unas de las causales previstas en los estatutos o en la ley y lasegunda es un proceso consagrado en la Ley 1116 de 2006 por medio de la cual seestablece el Reacutegimen de Insolvencia Empresarial el cual persigue la liquidacioacuten pronta yordenada buscando el aprovechamiento del patrimonio del deudor Dentro de los estudiosque se han realizado se destacan el de Gomez-Gonzalez amp Kiefer (2006) enfocado enentender los factores que determinaron el estreacutes financiero de las instituciones bancarias afinales de 1990 y principios del antildeo 2000 Como resultado del estudio se evidencioacute que estefenoacutemeno en gran medida se dio gracias a una fuerte caiacuteda en la razoacuten financiera decapitalizacioacuten de las empresas en conjunto con la rentabilidad y liquidez Por otro ladoGoacutemez Hinojosa amp Zamudio (2006) proponen un anaacutelisis de la probabilidad condicional deincumplimiento de los mayores deudores privados del sistema financiero colombianoutilizando las variables del modelo Camel El principal hallazgo del estudio revela que el nivelde la deuda de las empresas es el principal determinante de la probabilidad condicional deincumplimiento con un efecto adicional que aporta pertenecer a ciertos sectores econoacutemicoscomo la construccioacutenMaacutes recientemente Carlos Valencia et al (2014) desarrollaron un nuevo enfoque al usar unmodelo generalizado aditivo para la prediccioacuten de bancarrota con un mecanismo integradopara la seleccioacuten de variables Tomando como referencia esta nueva perspectiva surge laidea de explorar un modelo interpretable y eficiente con la metodologiacutea de anaacutelisis desupervivencia junto con un modelo aditivo generalizado (GAM) estimado a traveacutes de la

seleccioacuten de variables Cuando el efecto encontrado es una funcioacuten lineal se obtiene un soloparaacutemetro que representa la contribucioacuten marginal a las razones de momios (odds ratios)en el caso no lineal se obtiene una funcioacuten que puede ser interpretable debido a lapropiedad aditiva (Berg 2006) Ademaacutes la seleccioacuten de variables produciraacute una estimacioacutenen la que se descartan predictores no significativos para la explicacioacuten de la bancarrotaEl objetivo de utilizar modelos de supervivencia para la prediccioacuten de la bancarrota esobtener ademaacutes de la clasificacioacuten del riesgo la probabilidad de que ocurra la insolvenciadado una ventana de tiempo El periodo de supervivencia se define como el tiempotranscurrido desde el estado inicial antildeo 2007 hasta el estado final (10 antildeos) Para elestudio se habla de datos censurados a la derecha ya que despueacutes del tiempo de estudiono se conoce el estado de las sociedades que no quebraron durante el anaacutelisisDe acuerdo con todo lo mencionado previamente y dada la importancia de la insolvenciafinanciera frente a los efectos adversos en la economiacutea del paiacutes el propoacutesito de esteproyecto es estimar un modelo de anaacutelisis de supervivencia que permita analizar elcomportamiento de las empresas de comercio minorista colombianas y predecir laprobabilidad de riesgo de quiebra en funcioacuten del tiempo a partir de razones financierasusadas como variables explicativas Se presenta la aplicacioacuten de este tipo de anaacutelisis desdela identificacioacuten de informacioacuten requerida diversas fuentes mineriacutea de datos anaacutelisis yconsolidacioacuten hasta el ajuste calibracioacuten y evaluacioacuten de un modelo lineal y no lineal Acontinuacioacuten se explica la metodologiacutea desarrollada en el trabajo en la cual se incluye ladescripcioacuten de los meacutetodos informacioacuten e indicadores analizados enseguida se presenta laseccioacuten de resultados obtenidos durante el proceso de estimacioacuten y finalmente lasconclusiones y recomendaciones

2 Metodologiacutea

21 Generalidades del Anaacutelisis de SupervivenciaLa funcioacuten de supervivencia se define como la probabilidad que un individuo sobreviva almomento que en este estudio equivale a la probabilidad que una sociedad no se declare enbancarrota al tiempo La variable aleatoria positiva representa el tiempo hasta el evento deintereacutes de un individuo y la funcioacuten de supervivencia se puede formular como

En el presente estudio es de intereacutes determinar la influencia de las covariables sobre eltiempo de supervivencia de las compantildeiacuteas razoacuten por la que se desea realizar lasestimaciones usando el modelo de Cox Este modelo propuesto por primera vez por Cox(1972) es llamado modelo de riesgos proporcionales debido a que el cociente entre elriesgo para dos empresas es constante en el tiempo El Modelo Cox consiste en expresar la

funcioacuten de riesgo en dos componentes uno no parameacutetrico que depende soacutelo del tiempo yotro parameacutetrico que depende soacutelo de las variables de la siguiente forma

22 Modelo Aditivo Generalizado (GAM)En el modelo GAM los predictores son funciones suaves desconocidas estimadas a partir dela distribucioacuten de las variables de entrada Este modelo fue desarrollado para mezclarpropiedades de modelos lineales generalizados con modelos no-parameacutetricos

En este caso se utilizoacute la funcioacuten GAM del paquete MGCV en R que realiza el ajuste delparaacutemetro de suavizacioacuten mediante la funcioacuten magic (Wood SN 2004) en lacualinternamente aplica meacutetodo de Newton de manera multi-dimensional en combinacioacutencon validacioacuten cruzada sobre la poblacioacuten de entrenamiento para hallar el factor desuavizacioacuten oacuteptimo Como ventajas del modelo se tiene que produce formas flexibles y sin importar ladimensionalidad ademaacutes es eficiente computacionalmente y es faacutecil de interpretar cadafuncioacuten separadamente sin embargo la forma funcional estaacute limitada a ser aditiva

23 Seleccioacuten de VariablesLa seleccioacuten de variables es el proceso de escoger predictores significativos para laconstruccioacuten de modelos Generalmente entre maacutes variables sean incluidas en un modeloel ajuste a los datos mejora pero aumenta el nuacutemero de paraacutemetros a estimar y disminuyela precisioacuten al incrementarse la varianza produciendo un sobreajuste Por el contrario si seincluyen menos variables de las necesarias la volatilidad se reduce pero aumenta el sesgo ypor tal razoacuten se tendraacute una mala prediccioacuten Por otra parte algunos predictores pueden

afectar la confiabilidad del modelo principalmente si estaacuten correlacionados con otrosDebido a lo anterior la motivacioacuten para hacer seleccioacuten de variables es encontrar un modeloque busque un equilibrio entre bondad de ajuste y parsimonia mejore interpretabilidadreduzca el tiempo de entrenamiento evite el problema de la dimensionalidad y disminuya elsobreajusteSe utilizoacute la seleccioacuten exhaustiva de variables en la cual se busca el mejor modelo entretodas las combinaciones posibles de variables para un conjunto de p variables se realiza lacalibracioacuten y evaluacioacuten de 2p posibles subconjuntos Es importante resaltar que estateacutecnica demanda una alta capacidad computacional y tiempo de ejecucioacuten extenso debido ala cantidad de modelos que son calculados y evaluados Para seleccionar el modelo seestablece una medida global de evaluacioacuten que tenga en cuenta el ajuste y se escogeraacute elmodelo cuya medida global sea la mejor

24 Meacutetricas de Evaluacioacuten241 Criterio del Aacuterea Bajo la Curva (AUC)El criterio usado para la evaluacioacuten de los modelos fue el AUC que representa el aacuterea bajo laCurva ROC cuya finalidad es analizar todos los valores para la relacioacuten entre sensibilidad yespecificidad en funcioacuten del umbral Por lo anterior se presenta una descripcioacuten de lametodologiacutea para mayor entendimientoLa sensibilidad es la probabilidad de clasificar correctamente una compantildeiacutea en bancarrotacuando eacutesta presenta insolvencia (TPF ndash Fraccioacuten de verdaderos positivos) y la especificidades la probabilidad de catalogar una sociedad solvente cuando la empresa presenta estadosfinancieros controlados (TNF- Fraccioacuten de verdaderos negativos) Los valores continuospueden ser transformados en binarios si se establece un punto de corte (- Umbral) a partirdel cual se consideraraacuten los resultados como quiebra o no quiebra Sea la variable binariaque denota el estado verdadero de solvencia y el resultado binario del pronoacutestico entonceslos resultados del modelo pueden ser

La Curva ROC permite describir que tan separadas estaacuten las distribuciones de la sensibilidady la especificidad de una muestra de validacioacuten definido como y dado que la curva ROC esuna funcioacuten monoacutetona creciente en el primer cuadrante entonces donde la funcioacuten ROC esaquella a la que cada valor de le hace corresponder siendo un punto de corte particularpara el cual El Aacuterea Bajo la Curva ROC (Area Under the Curve AUC) estima la capacidadque tiene un modelo de discriminar entre bancarrota y no bancarrota definido por y portanto a mayor aacuterea bajo la curva el modelo produciraacute un mejor ajusteAhora se detallaraacuten las anteriores definiciones para datos de supervivencia y para esto sepresenta coacutemo influye el tiempo en las variables definidas anteriormente En el anaacutelisis desupervivencia se define como la variable tiempo hasta la ocurrencia de la quiebra para lacompantildeiacutea por tanto se crea una nueva variable binaria que representa el estado de lasolvencia de la empresa en el tiempo Heagerty amp Zheng (2005) proponen las siguientesdefiniciones de casos y controles dependientes del tiempo y su clasificacioacutenCasos Individuos que presentan el fallo Utilizados para definir la sensibilidad

Casos Incidentes Individuos donde Por tanto presenta el fallo en el momentoCasos Acumulativos Individuos donde presentando el fallo antes o justo en el momento

Controles Individuos que no presentan el fallo Utilizados para definir la especificidad

Controles Estaacuteticos Individuos donde ( valor fijo por lo general alto) se dice que no presentanel fallo supervivientes a largo plazo

Controles Dinaacutemicos Individuos donde por lo que no presentan fallo antes del tiempordquoDado lo anterior las extensiones de la definicioacuten de la curva ROC para eventos dependientesdel tiempo surgen por la eleccioacuten de un tipo de casos (incidentes o acumulativos) y un tipode controles (estaacuteticos o dinaacutemicos) dando lugar a tres posibles exposiciones de la curvaROC

Acumulativo-Dinaacutemico (Heagerty Lumley amp Pepe 2000) Sensibilidad acumulada yespecificidad dinaacutemica En cualquier tiempo fijo el conjunto de empresas estudiadas puede serclasificada o bien como un caso o como un control Lo anterior es posible porque cada compantildeiacuteadesempentildea el rol de un control para un tiempo pero luego contribuye como un caso paratiempos Incidente-Estaacutetico (Etzioni et al 1999 y Slate amp Turnbull 2000) Sensibilidad y especificidadtiempo-dependiente Los casos son etiquetados seguacuten el momento en el que el evento ocurre ylos controles son definidos como aquellas sociedades que durante todo el tiempo de estudionunca cayeron en quiebraIncidente-Dinaacutemico Caso considerado en este estudio Un compantildeiacutea puede desempentildear el rol decontrol para un tiempo cercano pero luego desempentildear el caso cuando Esta definicioacutenpresenta las siguientes caracteriacutesticas- La sensibilidad incidente y la especificidad dinaacutemica son definidas por clasificar el riesgodeterminado en el tiempo entre aquellos en los que se observoacute la bancarrota (casos) y aquellosen los que se observoacute la supervivencia (controles) siendo por tanto usado en el modelo de CoxLas definiciones de sensibilidad (incidente) y especificidad (dinaacutemica) son faacutecilmente reescritasteniendo en cuenta la dependencia del tiempo y la variable longitudinal

De acuerdo con lo anterior es fundamental tener en cuenta que

Los verdaderos positivos (TPF) pueden ser una funcioacuten decreciente en el tiempo y en suestimacioacuten se considera la censura en el tiempoEn algunas situaciones la sensibilidad podriacutea depender no solo de y de la ventana de tiempoDebido a que los grupos de control variacutean con el tiempo el eje de las abscisas de la curva ROCtambieacuten cambia por lo tanto resulta maacutes difiacutecil interpretar tendencias en el tiempo en estascurvas

Para la evaluacioacuten de los modelos de este estudio el criterio que se utilizoacute fue el AUC y dadoque la caracteriacutestica de la curva de ROC es Incidente-Dinaacutemico entonces es posiblepromediar los AUC en el tiempo Por tanto el mejor modelo seleccionado es aquel con mayorpromedio de AUC en la ventana de tiempo definida

242 Validacioacuten CruzadaLa evaluacioacuten de desempentildeo sobre los modelos predictivos ya calibrados se realizoacute mediantevalidacioacuten cruzada teacutecnica que se usa en el aprendizaje automaacutetico para evaluar tanto lavariabilidad de un conjunto de datos como la confiabilidad del modelo entrenadoLa validacioacuten cruzada divide aleatoriamente los datos en varias particiones y cada una ellases fraccionada en conjunto de datos de entrenamiento y validacioacuten para cada muestra deentrenamiento se crea un modelo que luego es probado en la muestra de validacioacuten Cuandoel proceso de construccioacuten y evaluacioacuten se completa para todos las muestras se genera unconjunto de medidas de rendimiento (AUC) y resultados para todos los datosAl comparar las estadiacutesticas para todas las particiones se puede evaluar la confiabilidad yprecisioacuten de las predicciones ademaacutes de interpretar la calidad del conjunto de datos ycomprender si el modelo es susceptible a variaciones en la informacioacuten

3 DatosLa muestra de estudio fue tomada a partir de la informacioacuten reportada para consulta puacuteblicapor las sociedades sujetas a vigilancia y control por parte de la Superintendencia deSociedades A traveacutes del sistema de Informacioacuten y Reporte Empresarial - SIREM ndash fueposible consultar los Estados Financieros anuales reportados por las compantildeiacuteas bajo estudioSe obtuvieron todos los estados financieros reportados desde el antildeo 2000 hasta el antildeo 2015y se consolidaron las sociedades que reportaron informacioacuten encontrando en total 48600

sociedades con al menos el reporte de un estado financiero en el horizonte de tiempoanalizado Con base en la Clasificacioacuten Industrial Internacional Uniforme (coacutedigo CIIU) sedefinieron 45 tipos de actividades asociadas al sector retailUna de las mayores dificultades en el desarrollo de este tipo de estudios es la obtencioacuten dela variable que describe el momento en el cual se considera que una sociedad entra enbancarrota debido a que esta informacioacuten no se encuentra explicita en los estadosfinancieros o reportes realizados por las sociedadesPara dar solucioacuten a este problema se realizoacute una revisioacuten de los sistemas de reporteexistentes en las entidades que regulan y vigilan las sociedades (SuperintendenciasCaacutemaras de comercio direccioacuten de impuestos) de esta forma se identificoacute el sistema puacuteblicode informacioacuten Baranda Virtual de la Superintendencia de Sociedades el cual permiteobtener informacioacuten acerca de cambios de estado procesos avisos autos y resolucionespuntuales de cada sociedad A partir del entendimiento del proceso de liquidacioacuten de lassociedades se identificaron los criterios de reorganizacioacuten liquidacioacuten u otro asociado alcese de actividades Con base en esto se establecioacute el criterio de bancarrota a partir de lasfechas de cambios de estado y procesos asociados a liquidacioacuten o reorganizacioacutenLa consulta de informacioacuten en Baranda Virtual se debiacutea realizar puntualmente a traveacutes de unformulario de buacutesqueda por nuacutemero de NIT teniendo en cuenta la cantidad de sociedades aconsultar se requirioacute un desarrollo adicional para obtener masivamente la informacioacuten Paraesto se implementoacute un proceso de web scraping en lenguaje de programacioacuten Python con elcual se accedioacute de forma automaacutetica y remota a la aplicacioacuten y se obtuvo toda lainformacioacuten acerca de la sociedad etapas y causas de su estado actual asiacute como las fechasrelevantes (constitucioacuten estado etapa situacioacuten) A partir de dicha informacioacuten fue posiblegenerar la variable respuesta asociada al evento de bancarrota y el momento del tiempo enque sucedioacuteEl estudio se centroacute en analizar las sociedades que reportaron informacioacuten en el antildeo 2007con el fin de tener una ventana de tiempo de 10 antildeos en los cuales el nuacutemero de empresasen estado de bancarrota fuera significativo Asiacute las cosas el panel final de datos antes delanaacutelisis exploratorio quedoacute constituido por 4048 sociedades del sector minorista Para ladefinicioacuten y caacutelculo de las razones financieras utilizadas como predictores se tomaron encuenta los 21 indicadores [5] propuestos por Valencia et al (2014) detallados en la Tabla 1

Tabla 1Razones financieras consideradas como predictores

Una vez calculadas las razones se realizoacute un anaacutelisis descriptivo de la informacioacuten ydeteccioacuten de valores atiacutepicos mediante el algoritmo LOF (Breunig et al (2000)) de acuerdocon esto se excluyeron 137 sociedades Uno de los principales enfoques de este trabajo hasido garantizar la calidad de la informacioacuten centraacutendose en entender desde el origen de losdatos posibles errores u omisiones en lo que se reporta a la entidad reguladora A partir de

esto y con base en los resultados obtenidos en el presente estudio retirar de la base dedatos aquellos registros cuya informacioacuten de ingresos operacionales sean cero o uno enlugar de imputarlos permitiraacute capturar el comportamiento real de la base de datos ya quede tomar la segunda opcioacuten se estariacutea realizando suposiciones fuertes sobre las ventasrealizadas por las empresas en el antildeo de reporte y con la cual se estiman aproximadamentenueve razones financieras utilizadas dentro del anaacutelisisSe eliminaron variables que presentan correlaciones superiores a 08 criterio sugerido porGujarati (1988) (Partington amp Kim 2008) tales como capital de trabajo sobre activos totales(working capital to total assets) deudas totales sobre activos totales (total liabilities to totalassets) ingreso neto sobre ventas (net income to sales) Por uacuteltimo siguiendo el enfoque deShumway (2001) para reducir la influencia de los valores atiacutepicos se realizoacute un truncado delos datos en cada variable para los valores inferiores al primer percentil y superiores alpercentil 99La muestra final es de 3911 sociedades de las cuales 372 (951) presentaron bancarrotaen la ventana de tiempo de 10 antildeos La Tabla 2 presenta las sociedades que cayeron eninsolvencia antildeo a antildeo durante la ventana de estudio En la Ilustracioacuten 1 se presenta unresumen de todo el proceso de mineriacutea de datos anaacutelisis y depuracioacuten que se realizoacute

Tabla 2Clasificacioacuten de estado de sociedades en la ventana de estudio

Antildeo 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Total

Censura 0 0 0 0 0 0 0 0 0 3539 3539

Bancarrota 20 35 53 38 44 56 55 35 23 13 372

Ilustracioacuten 1Proceso mineriacutea de datos anaacutelisis y depuracioacuten de la informacioacuten

4 Resultados

41 Modelo de riesgos proporcionales de CoxPara la seleccioacuten del modelo de regresioacuten de Cox tal como se menciona en la seccioacuten 2 seaplicoacute la teacutecnica de buacutesqueda exhaustiva para hallar la mejor combinacioacuten de variablesposibles tomando como medida de desempentildeo el promedio de los AUC en la ventana detiempo analizada Mediante un proceso de validacioacuten cruzada (3-Fold Cross-Validation) seevaluaron 262144 subconjuntos resultados de la combinacioacuten de 18 variables El tiempo deejecucioacuten de todos los modelos fue de 15 horas de forma secuencial por una sola maacutequina[5]Se seleccionoacute un modelo de cinco variables el cual presentoacute el mejor desempentildeo promedioen las muestras de validacioacuten con un AUC = 06825 La Ilustracioacuten 2 presenta elcomportamiento del mejor AUC de acuerdo con la cantidad de variables Se puede observarcoacutemo existe un punto maacuteximo donde se obtiene el mejor AUC y a medida que se aumenta elnuacutemero de predictores el desempentildeo empeora esto se asocia con el sobreajusteLas variables seleccionadas los coeficientes estimados y sus medidas de validacioacuten sepresentan en la Tabla 3 En este caso todas las variables son significativas al 5 El modeloes aceptable para cualquiera de los tres criterios de test de razoacuten de verosimilitud y pruebade WaldSe validoacute el ajuste del modelo de regresioacuten de Cox con la hipoacutetesis fundamental de que losriesgos son proporcionales encontrando que no existen evidencias significativas al 5 deque se viole este supuesto tanto globalmente como para las cinco variables seleccionadas

Tabla 3Modelo ajustado riesgos proporcionales Cox

Financial Ratio Β exp(β) se(β) z Pr(gt|z|) Sig

Currentliabilitiestototalassets (1053) 0349 0531 -1984 0047

Netincometototalassets (14840) 0000 1941 -7646 0000

Nocreditinterval (0004) 0996 0002 -2331 0020

Quickassetstosales 0681 1977 0305 2234 0026

Quickassetstototalassets 1345 3836 0532 2527 0012

Likelihood ratio test= 9453 on 5 df p=0Wald test = 7948 on 5 df p=111e-15Score (logrank) test = 8555 on 5 df p=111e-16

Ilustracioacuten 2Evolucioacuten del AUC en Modelo Cox

------

Ilustracioacuten 3Graacutefico de la funcioacuten de supervivencia Modelo CPH

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 2: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

crear un estaacutendar internacional que le permita a los reguladores bancarios establecerrequerimientos de capital necesarios frente a los riesgos financieros y operativos en los quepueden incurrir las compantildeiacuteas es decir creacioacuten de portafolios crediticios de acuerdo alincumplimiento de los clientes A partir de lo anterior conocer de antemano cuando unafirma va a entrar en bancarrota es una informacioacuten valiosa que impacta muchas decisionesen el sistema financiero y de alliacute se deriva la importancia del desarrollo de herramientasanaliacuteticas que permitan determinar los factores econoacutemicos relevantes para predecir elestreacutes financieroUna de las metodologiacuteas maacutes trabajadas a traveacutes del tiempo para la explicacioacuten de labancarrota corresponde al uso de razones financieras (Bellovary Giacomino amp Akers 2007)Se trata de estudiar las relaciones de variables del estado econoacutemico de una compantildeiacuteacategorizadas en razones de liquidez las cuales miden el dinero en efectivo para el pago dedeudas de actividad o eficiencia que permiten identificar la rapidez de convertir los activosno-corrientes en activos corrientes razones de deuda con las que se puede medir el pago dedeudas de largo plazo de ganancia las cuales evaluacutean los activos y el control de los gastosy por uacuteltimo razones de mercado que relacionan el rendimiento y el valor de una inversioacutenen acciones de la compantildeiacuteaEl estudio para determinar el estreacutes financiero a traveacutes del uso de razones financierasymeacutetodos estadiacutesticos inicia en 1932 cuando Fitzpatrick da origen a la etapa descriptiva yposteriormente en 1968 Altman inicia la etapa predictiva con el desarrollo de modelosmultivariados (Altman 1968) Las siguientes metodologiacuteas se basaron en teacutecnicasestadiacutesticas claacutesicas de clasificacioacuten a partir de las cuales es posible tener unainterpretacioacuten sencilla de los resultados tales como anaacutelisis discriminante lineal regresioacutenlogiacutestica y modelos probit Durante los uacuteltimos antildeos se han realizado numerosos estudiosde nuevas metodologiacuteas para la prediccioacuten de quiebra basadas en aprendizaje automaacutetico einteligencia artificial como son redes neuronales artificiales (Atiya 2001 Wilson amp Sharda1994) maacutequinas de soporte vectorial (Shin Lee amp Kim 2005 Lin Yeh amp Lee 2011) ymeacutetodos de ensamble (Wang amp Ma 2012 Kim amp Kang 2010) En general estas uacuteltimasmetodologiacuteas ofrecen un mejor rendimiento de clasificacioacuten que los modelos estadiacutesticosparameacutetricos claacutesicos sin embargo aunque los algoritmos predictivos de caja negrafuncionan muy bien para predecir cuaacutendo se produciraacute la bancarrota no dan razoacuten por lacual sucede De esta forma un buen modelo de prediccioacuten de bancarrota debe considerardesempentildeo precisioacuten e interpretabilidad a partir del cual sea posible describir elcomportamiento estaacutetico y dinaacutemico de los indicadores financierosEn Colombia se establece la existencia de dos tipos de liquidacioacuten para las sociedadesliquidacioacuten voluntaria y liquidacioacuten judicial la primera hace referencia a la disolucioacuten de unacompantildeiacutea por ocurrencia de unas de las causales previstas en los estatutos o en la ley y lasegunda es un proceso consagrado en la Ley 1116 de 2006 por medio de la cual seestablece el Reacutegimen de Insolvencia Empresarial el cual persigue la liquidacioacuten pronta yordenada buscando el aprovechamiento del patrimonio del deudor Dentro de los estudiosque se han realizado se destacan el de Gomez-Gonzalez amp Kiefer (2006) enfocado enentender los factores que determinaron el estreacutes financiero de las instituciones bancarias afinales de 1990 y principios del antildeo 2000 Como resultado del estudio se evidencioacute que estefenoacutemeno en gran medida se dio gracias a una fuerte caiacuteda en la razoacuten financiera decapitalizacioacuten de las empresas en conjunto con la rentabilidad y liquidez Por otro ladoGoacutemez Hinojosa amp Zamudio (2006) proponen un anaacutelisis de la probabilidad condicional deincumplimiento de los mayores deudores privados del sistema financiero colombianoutilizando las variables del modelo Camel El principal hallazgo del estudio revela que el nivelde la deuda de las empresas es el principal determinante de la probabilidad condicional deincumplimiento con un efecto adicional que aporta pertenecer a ciertos sectores econoacutemicoscomo la construccioacutenMaacutes recientemente Carlos Valencia et al (2014) desarrollaron un nuevo enfoque al usar unmodelo generalizado aditivo para la prediccioacuten de bancarrota con un mecanismo integradopara la seleccioacuten de variables Tomando como referencia esta nueva perspectiva surge laidea de explorar un modelo interpretable y eficiente con la metodologiacutea de anaacutelisis desupervivencia junto con un modelo aditivo generalizado (GAM) estimado a traveacutes de la

seleccioacuten de variables Cuando el efecto encontrado es una funcioacuten lineal se obtiene un soloparaacutemetro que representa la contribucioacuten marginal a las razones de momios (odds ratios)en el caso no lineal se obtiene una funcioacuten que puede ser interpretable debido a lapropiedad aditiva (Berg 2006) Ademaacutes la seleccioacuten de variables produciraacute una estimacioacutenen la que se descartan predictores no significativos para la explicacioacuten de la bancarrotaEl objetivo de utilizar modelos de supervivencia para la prediccioacuten de la bancarrota esobtener ademaacutes de la clasificacioacuten del riesgo la probabilidad de que ocurra la insolvenciadado una ventana de tiempo El periodo de supervivencia se define como el tiempotranscurrido desde el estado inicial antildeo 2007 hasta el estado final (10 antildeos) Para elestudio se habla de datos censurados a la derecha ya que despueacutes del tiempo de estudiono se conoce el estado de las sociedades que no quebraron durante el anaacutelisisDe acuerdo con todo lo mencionado previamente y dada la importancia de la insolvenciafinanciera frente a los efectos adversos en la economiacutea del paiacutes el propoacutesito de esteproyecto es estimar un modelo de anaacutelisis de supervivencia que permita analizar elcomportamiento de las empresas de comercio minorista colombianas y predecir laprobabilidad de riesgo de quiebra en funcioacuten del tiempo a partir de razones financierasusadas como variables explicativas Se presenta la aplicacioacuten de este tipo de anaacutelisis desdela identificacioacuten de informacioacuten requerida diversas fuentes mineriacutea de datos anaacutelisis yconsolidacioacuten hasta el ajuste calibracioacuten y evaluacioacuten de un modelo lineal y no lineal Acontinuacioacuten se explica la metodologiacutea desarrollada en el trabajo en la cual se incluye ladescripcioacuten de los meacutetodos informacioacuten e indicadores analizados enseguida se presenta laseccioacuten de resultados obtenidos durante el proceso de estimacioacuten y finalmente lasconclusiones y recomendaciones

2 Metodologiacutea

21 Generalidades del Anaacutelisis de SupervivenciaLa funcioacuten de supervivencia se define como la probabilidad que un individuo sobreviva almomento que en este estudio equivale a la probabilidad que una sociedad no se declare enbancarrota al tiempo La variable aleatoria positiva representa el tiempo hasta el evento deintereacutes de un individuo y la funcioacuten de supervivencia se puede formular como

En el presente estudio es de intereacutes determinar la influencia de las covariables sobre eltiempo de supervivencia de las compantildeiacuteas razoacuten por la que se desea realizar lasestimaciones usando el modelo de Cox Este modelo propuesto por primera vez por Cox(1972) es llamado modelo de riesgos proporcionales debido a que el cociente entre elriesgo para dos empresas es constante en el tiempo El Modelo Cox consiste en expresar la

funcioacuten de riesgo en dos componentes uno no parameacutetrico que depende soacutelo del tiempo yotro parameacutetrico que depende soacutelo de las variables de la siguiente forma

22 Modelo Aditivo Generalizado (GAM)En el modelo GAM los predictores son funciones suaves desconocidas estimadas a partir dela distribucioacuten de las variables de entrada Este modelo fue desarrollado para mezclarpropiedades de modelos lineales generalizados con modelos no-parameacutetricos

En este caso se utilizoacute la funcioacuten GAM del paquete MGCV en R que realiza el ajuste delparaacutemetro de suavizacioacuten mediante la funcioacuten magic (Wood SN 2004) en lacualinternamente aplica meacutetodo de Newton de manera multi-dimensional en combinacioacutencon validacioacuten cruzada sobre la poblacioacuten de entrenamiento para hallar el factor desuavizacioacuten oacuteptimo Como ventajas del modelo se tiene que produce formas flexibles y sin importar ladimensionalidad ademaacutes es eficiente computacionalmente y es faacutecil de interpretar cadafuncioacuten separadamente sin embargo la forma funcional estaacute limitada a ser aditiva

23 Seleccioacuten de VariablesLa seleccioacuten de variables es el proceso de escoger predictores significativos para laconstruccioacuten de modelos Generalmente entre maacutes variables sean incluidas en un modeloel ajuste a los datos mejora pero aumenta el nuacutemero de paraacutemetros a estimar y disminuyela precisioacuten al incrementarse la varianza produciendo un sobreajuste Por el contrario si seincluyen menos variables de las necesarias la volatilidad se reduce pero aumenta el sesgo ypor tal razoacuten se tendraacute una mala prediccioacuten Por otra parte algunos predictores pueden

afectar la confiabilidad del modelo principalmente si estaacuten correlacionados con otrosDebido a lo anterior la motivacioacuten para hacer seleccioacuten de variables es encontrar un modeloque busque un equilibrio entre bondad de ajuste y parsimonia mejore interpretabilidadreduzca el tiempo de entrenamiento evite el problema de la dimensionalidad y disminuya elsobreajusteSe utilizoacute la seleccioacuten exhaustiva de variables en la cual se busca el mejor modelo entretodas las combinaciones posibles de variables para un conjunto de p variables se realiza lacalibracioacuten y evaluacioacuten de 2p posibles subconjuntos Es importante resaltar que estateacutecnica demanda una alta capacidad computacional y tiempo de ejecucioacuten extenso debido ala cantidad de modelos que son calculados y evaluados Para seleccionar el modelo seestablece una medida global de evaluacioacuten que tenga en cuenta el ajuste y se escogeraacute elmodelo cuya medida global sea la mejor

24 Meacutetricas de Evaluacioacuten241 Criterio del Aacuterea Bajo la Curva (AUC)El criterio usado para la evaluacioacuten de los modelos fue el AUC que representa el aacuterea bajo laCurva ROC cuya finalidad es analizar todos los valores para la relacioacuten entre sensibilidad yespecificidad en funcioacuten del umbral Por lo anterior se presenta una descripcioacuten de lametodologiacutea para mayor entendimientoLa sensibilidad es la probabilidad de clasificar correctamente una compantildeiacutea en bancarrotacuando eacutesta presenta insolvencia (TPF ndash Fraccioacuten de verdaderos positivos) y la especificidades la probabilidad de catalogar una sociedad solvente cuando la empresa presenta estadosfinancieros controlados (TNF- Fraccioacuten de verdaderos negativos) Los valores continuospueden ser transformados en binarios si se establece un punto de corte (- Umbral) a partirdel cual se consideraraacuten los resultados como quiebra o no quiebra Sea la variable binariaque denota el estado verdadero de solvencia y el resultado binario del pronoacutestico entonceslos resultados del modelo pueden ser

La Curva ROC permite describir que tan separadas estaacuten las distribuciones de la sensibilidady la especificidad de una muestra de validacioacuten definido como y dado que la curva ROC esuna funcioacuten monoacutetona creciente en el primer cuadrante entonces donde la funcioacuten ROC esaquella a la que cada valor de le hace corresponder siendo un punto de corte particularpara el cual El Aacuterea Bajo la Curva ROC (Area Under the Curve AUC) estima la capacidadque tiene un modelo de discriminar entre bancarrota y no bancarrota definido por y portanto a mayor aacuterea bajo la curva el modelo produciraacute un mejor ajusteAhora se detallaraacuten las anteriores definiciones para datos de supervivencia y para esto sepresenta coacutemo influye el tiempo en las variables definidas anteriormente En el anaacutelisis desupervivencia se define como la variable tiempo hasta la ocurrencia de la quiebra para lacompantildeiacutea por tanto se crea una nueva variable binaria que representa el estado de lasolvencia de la empresa en el tiempo Heagerty amp Zheng (2005) proponen las siguientesdefiniciones de casos y controles dependientes del tiempo y su clasificacioacutenCasos Individuos que presentan el fallo Utilizados para definir la sensibilidad

Casos Incidentes Individuos donde Por tanto presenta el fallo en el momentoCasos Acumulativos Individuos donde presentando el fallo antes o justo en el momento

Controles Individuos que no presentan el fallo Utilizados para definir la especificidad

Controles Estaacuteticos Individuos donde ( valor fijo por lo general alto) se dice que no presentanel fallo supervivientes a largo plazo

Controles Dinaacutemicos Individuos donde por lo que no presentan fallo antes del tiempordquoDado lo anterior las extensiones de la definicioacuten de la curva ROC para eventos dependientesdel tiempo surgen por la eleccioacuten de un tipo de casos (incidentes o acumulativos) y un tipode controles (estaacuteticos o dinaacutemicos) dando lugar a tres posibles exposiciones de la curvaROC

Acumulativo-Dinaacutemico (Heagerty Lumley amp Pepe 2000) Sensibilidad acumulada yespecificidad dinaacutemica En cualquier tiempo fijo el conjunto de empresas estudiadas puede serclasificada o bien como un caso o como un control Lo anterior es posible porque cada compantildeiacuteadesempentildea el rol de un control para un tiempo pero luego contribuye como un caso paratiempos Incidente-Estaacutetico (Etzioni et al 1999 y Slate amp Turnbull 2000) Sensibilidad y especificidadtiempo-dependiente Los casos son etiquetados seguacuten el momento en el que el evento ocurre ylos controles son definidos como aquellas sociedades que durante todo el tiempo de estudionunca cayeron en quiebraIncidente-Dinaacutemico Caso considerado en este estudio Un compantildeiacutea puede desempentildear el rol decontrol para un tiempo cercano pero luego desempentildear el caso cuando Esta definicioacutenpresenta las siguientes caracteriacutesticas- La sensibilidad incidente y la especificidad dinaacutemica son definidas por clasificar el riesgodeterminado en el tiempo entre aquellos en los que se observoacute la bancarrota (casos) y aquellosen los que se observoacute la supervivencia (controles) siendo por tanto usado en el modelo de CoxLas definiciones de sensibilidad (incidente) y especificidad (dinaacutemica) son faacutecilmente reescritasteniendo en cuenta la dependencia del tiempo y la variable longitudinal

De acuerdo con lo anterior es fundamental tener en cuenta que

Los verdaderos positivos (TPF) pueden ser una funcioacuten decreciente en el tiempo y en suestimacioacuten se considera la censura en el tiempoEn algunas situaciones la sensibilidad podriacutea depender no solo de y de la ventana de tiempoDebido a que los grupos de control variacutean con el tiempo el eje de las abscisas de la curva ROCtambieacuten cambia por lo tanto resulta maacutes difiacutecil interpretar tendencias en el tiempo en estascurvas

Para la evaluacioacuten de los modelos de este estudio el criterio que se utilizoacute fue el AUC y dadoque la caracteriacutestica de la curva de ROC es Incidente-Dinaacutemico entonces es posiblepromediar los AUC en el tiempo Por tanto el mejor modelo seleccionado es aquel con mayorpromedio de AUC en la ventana de tiempo definida

242 Validacioacuten CruzadaLa evaluacioacuten de desempentildeo sobre los modelos predictivos ya calibrados se realizoacute mediantevalidacioacuten cruzada teacutecnica que se usa en el aprendizaje automaacutetico para evaluar tanto lavariabilidad de un conjunto de datos como la confiabilidad del modelo entrenadoLa validacioacuten cruzada divide aleatoriamente los datos en varias particiones y cada una ellases fraccionada en conjunto de datos de entrenamiento y validacioacuten para cada muestra deentrenamiento se crea un modelo que luego es probado en la muestra de validacioacuten Cuandoel proceso de construccioacuten y evaluacioacuten se completa para todos las muestras se genera unconjunto de medidas de rendimiento (AUC) y resultados para todos los datosAl comparar las estadiacutesticas para todas las particiones se puede evaluar la confiabilidad yprecisioacuten de las predicciones ademaacutes de interpretar la calidad del conjunto de datos ycomprender si el modelo es susceptible a variaciones en la informacioacuten

3 DatosLa muestra de estudio fue tomada a partir de la informacioacuten reportada para consulta puacuteblicapor las sociedades sujetas a vigilancia y control por parte de la Superintendencia deSociedades A traveacutes del sistema de Informacioacuten y Reporte Empresarial - SIREM ndash fueposible consultar los Estados Financieros anuales reportados por las compantildeiacuteas bajo estudioSe obtuvieron todos los estados financieros reportados desde el antildeo 2000 hasta el antildeo 2015y se consolidaron las sociedades que reportaron informacioacuten encontrando en total 48600

sociedades con al menos el reporte de un estado financiero en el horizonte de tiempoanalizado Con base en la Clasificacioacuten Industrial Internacional Uniforme (coacutedigo CIIU) sedefinieron 45 tipos de actividades asociadas al sector retailUna de las mayores dificultades en el desarrollo de este tipo de estudios es la obtencioacuten dela variable que describe el momento en el cual se considera que una sociedad entra enbancarrota debido a que esta informacioacuten no se encuentra explicita en los estadosfinancieros o reportes realizados por las sociedadesPara dar solucioacuten a este problema se realizoacute una revisioacuten de los sistemas de reporteexistentes en las entidades que regulan y vigilan las sociedades (SuperintendenciasCaacutemaras de comercio direccioacuten de impuestos) de esta forma se identificoacute el sistema puacuteblicode informacioacuten Baranda Virtual de la Superintendencia de Sociedades el cual permiteobtener informacioacuten acerca de cambios de estado procesos avisos autos y resolucionespuntuales de cada sociedad A partir del entendimiento del proceso de liquidacioacuten de lassociedades se identificaron los criterios de reorganizacioacuten liquidacioacuten u otro asociado alcese de actividades Con base en esto se establecioacute el criterio de bancarrota a partir de lasfechas de cambios de estado y procesos asociados a liquidacioacuten o reorganizacioacutenLa consulta de informacioacuten en Baranda Virtual se debiacutea realizar puntualmente a traveacutes de unformulario de buacutesqueda por nuacutemero de NIT teniendo en cuenta la cantidad de sociedades aconsultar se requirioacute un desarrollo adicional para obtener masivamente la informacioacuten Paraesto se implementoacute un proceso de web scraping en lenguaje de programacioacuten Python con elcual se accedioacute de forma automaacutetica y remota a la aplicacioacuten y se obtuvo toda lainformacioacuten acerca de la sociedad etapas y causas de su estado actual asiacute como las fechasrelevantes (constitucioacuten estado etapa situacioacuten) A partir de dicha informacioacuten fue posiblegenerar la variable respuesta asociada al evento de bancarrota y el momento del tiempo enque sucedioacuteEl estudio se centroacute en analizar las sociedades que reportaron informacioacuten en el antildeo 2007con el fin de tener una ventana de tiempo de 10 antildeos en los cuales el nuacutemero de empresasen estado de bancarrota fuera significativo Asiacute las cosas el panel final de datos antes delanaacutelisis exploratorio quedoacute constituido por 4048 sociedades del sector minorista Para ladefinicioacuten y caacutelculo de las razones financieras utilizadas como predictores se tomaron encuenta los 21 indicadores [5] propuestos por Valencia et al (2014) detallados en la Tabla 1

Tabla 1Razones financieras consideradas como predictores

Una vez calculadas las razones se realizoacute un anaacutelisis descriptivo de la informacioacuten ydeteccioacuten de valores atiacutepicos mediante el algoritmo LOF (Breunig et al (2000)) de acuerdocon esto se excluyeron 137 sociedades Uno de los principales enfoques de este trabajo hasido garantizar la calidad de la informacioacuten centraacutendose en entender desde el origen de losdatos posibles errores u omisiones en lo que se reporta a la entidad reguladora A partir de

esto y con base en los resultados obtenidos en el presente estudio retirar de la base dedatos aquellos registros cuya informacioacuten de ingresos operacionales sean cero o uno enlugar de imputarlos permitiraacute capturar el comportamiento real de la base de datos ya quede tomar la segunda opcioacuten se estariacutea realizando suposiciones fuertes sobre las ventasrealizadas por las empresas en el antildeo de reporte y con la cual se estiman aproximadamentenueve razones financieras utilizadas dentro del anaacutelisisSe eliminaron variables que presentan correlaciones superiores a 08 criterio sugerido porGujarati (1988) (Partington amp Kim 2008) tales como capital de trabajo sobre activos totales(working capital to total assets) deudas totales sobre activos totales (total liabilities to totalassets) ingreso neto sobre ventas (net income to sales) Por uacuteltimo siguiendo el enfoque deShumway (2001) para reducir la influencia de los valores atiacutepicos se realizoacute un truncado delos datos en cada variable para los valores inferiores al primer percentil y superiores alpercentil 99La muestra final es de 3911 sociedades de las cuales 372 (951) presentaron bancarrotaen la ventana de tiempo de 10 antildeos La Tabla 2 presenta las sociedades que cayeron eninsolvencia antildeo a antildeo durante la ventana de estudio En la Ilustracioacuten 1 se presenta unresumen de todo el proceso de mineriacutea de datos anaacutelisis y depuracioacuten que se realizoacute

Tabla 2Clasificacioacuten de estado de sociedades en la ventana de estudio

Antildeo 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Total

Censura 0 0 0 0 0 0 0 0 0 3539 3539

Bancarrota 20 35 53 38 44 56 55 35 23 13 372

Ilustracioacuten 1Proceso mineriacutea de datos anaacutelisis y depuracioacuten de la informacioacuten

4 Resultados

41 Modelo de riesgos proporcionales de CoxPara la seleccioacuten del modelo de regresioacuten de Cox tal como se menciona en la seccioacuten 2 seaplicoacute la teacutecnica de buacutesqueda exhaustiva para hallar la mejor combinacioacuten de variablesposibles tomando como medida de desempentildeo el promedio de los AUC en la ventana detiempo analizada Mediante un proceso de validacioacuten cruzada (3-Fold Cross-Validation) seevaluaron 262144 subconjuntos resultados de la combinacioacuten de 18 variables El tiempo deejecucioacuten de todos los modelos fue de 15 horas de forma secuencial por una sola maacutequina[5]Se seleccionoacute un modelo de cinco variables el cual presentoacute el mejor desempentildeo promedioen las muestras de validacioacuten con un AUC = 06825 La Ilustracioacuten 2 presenta elcomportamiento del mejor AUC de acuerdo con la cantidad de variables Se puede observarcoacutemo existe un punto maacuteximo donde se obtiene el mejor AUC y a medida que se aumenta elnuacutemero de predictores el desempentildeo empeora esto se asocia con el sobreajusteLas variables seleccionadas los coeficientes estimados y sus medidas de validacioacuten sepresentan en la Tabla 3 En este caso todas las variables son significativas al 5 El modeloes aceptable para cualquiera de los tres criterios de test de razoacuten de verosimilitud y pruebade WaldSe validoacute el ajuste del modelo de regresioacuten de Cox con la hipoacutetesis fundamental de que losriesgos son proporcionales encontrando que no existen evidencias significativas al 5 deque se viole este supuesto tanto globalmente como para las cinco variables seleccionadas

Tabla 3Modelo ajustado riesgos proporcionales Cox

Financial Ratio Β exp(β) se(β) z Pr(gt|z|) Sig

Currentliabilitiestototalassets (1053) 0349 0531 -1984 0047

Netincometototalassets (14840) 0000 1941 -7646 0000

Nocreditinterval (0004) 0996 0002 -2331 0020

Quickassetstosales 0681 1977 0305 2234 0026

Quickassetstototalassets 1345 3836 0532 2527 0012

Likelihood ratio test= 9453 on 5 df p=0Wald test = 7948 on 5 df p=111e-15Score (logrank) test = 8555 on 5 df p=111e-16

Ilustracioacuten 2Evolucioacuten del AUC en Modelo Cox

------

Ilustracioacuten 3Graacutefico de la funcioacuten de supervivencia Modelo CPH

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 3: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

seleccioacuten de variables Cuando el efecto encontrado es una funcioacuten lineal se obtiene un soloparaacutemetro que representa la contribucioacuten marginal a las razones de momios (odds ratios)en el caso no lineal se obtiene una funcioacuten que puede ser interpretable debido a lapropiedad aditiva (Berg 2006) Ademaacutes la seleccioacuten de variables produciraacute una estimacioacutenen la que se descartan predictores no significativos para la explicacioacuten de la bancarrotaEl objetivo de utilizar modelos de supervivencia para la prediccioacuten de la bancarrota esobtener ademaacutes de la clasificacioacuten del riesgo la probabilidad de que ocurra la insolvenciadado una ventana de tiempo El periodo de supervivencia se define como el tiempotranscurrido desde el estado inicial antildeo 2007 hasta el estado final (10 antildeos) Para elestudio se habla de datos censurados a la derecha ya que despueacutes del tiempo de estudiono se conoce el estado de las sociedades que no quebraron durante el anaacutelisisDe acuerdo con todo lo mencionado previamente y dada la importancia de la insolvenciafinanciera frente a los efectos adversos en la economiacutea del paiacutes el propoacutesito de esteproyecto es estimar un modelo de anaacutelisis de supervivencia que permita analizar elcomportamiento de las empresas de comercio minorista colombianas y predecir laprobabilidad de riesgo de quiebra en funcioacuten del tiempo a partir de razones financierasusadas como variables explicativas Se presenta la aplicacioacuten de este tipo de anaacutelisis desdela identificacioacuten de informacioacuten requerida diversas fuentes mineriacutea de datos anaacutelisis yconsolidacioacuten hasta el ajuste calibracioacuten y evaluacioacuten de un modelo lineal y no lineal Acontinuacioacuten se explica la metodologiacutea desarrollada en el trabajo en la cual se incluye ladescripcioacuten de los meacutetodos informacioacuten e indicadores analizados enseguida se presenta laseccioacuten de resultados obtenidos durante el proceso de estimacioacuten y finalmente lasconclusiones y recomendaciones

2 Metodologiacutea

21 Generalidades del Anaacutelisis de SupervivenciaLa funcioacuten de supervivencia se define como la probabilidad que un individuo sobreviva almomento que en este estudio equivale a la probabilidad que una sociedad no se declare enbancarrota al tiempo La variable aleatoria positiva representa el tiempo hasta el evento deintereacutes de un individuo y la funcioacuten de supervivencia se puede formular como

En el presente estudio es de intereacutes determinar la influencia de las covariables sobre eltiempo de supervivencia de las compantildeiacuteas razoacuten por la que se desea realizar lasestimaciones usando el modelo de Cox Este modelo propuesto por primera vez por Cox(1972) es llamado modelo de riesgos proporcionales debido a que el cociente entre elriesgo para dos empresas es constante en el tiempo El Modelo Cox consiste en expresar la

funcioacuten de riesgo en dos componentes uno no parameacutetrico que depende soacutelo del tiempo yotro parameacutetrico que depende soacutelo de las variables de la siguiente forma

22 Modelo Aditivo Generalizado (GAM)En el modelo GAM los predictores son funciones suaves desconocidas estimadas a partir dela distribucioacuten de las variables de entrada Este modelo fue desarrollado para mezclarpropiedades de modelos lineales generalizados con modelos no-parameacutetricos

En este caso se utilizoacute la funcioacuten GAM del paquete MGCV en R que realiza el ajuste delparaacutemetro de suavizacioacuten mediante la funcioacuten magic (Wood SN 2004) en lacualinternamente aplica meacutetodo de Newton de manera multi-dimensional en combinacioacutencon validacioacuten cruzada sobre la poblacioacuten de entrenamiento para hallar el factor desuavizacioacuten oacuteptimo Como ventajas del modelo se tiene que produce formas flexibles y sin importar ladimensionalidad ademaacutes es eficiente computacionalmente y es faacutecil de interpretar cadafuncioacuten separadamente sin embargo la forma funcional estaacute limitada a ser aditiva

23 Seleccioacuten de VariablesLa seleccioacuten de variables es el proceso de escoger predictores significativos para laconstruccioacuten de modelos Generalmente entre maacutes variables sean incluidas en un modeloel ajuste a los datos mejora pero aumenta el nuacutemero de paraacutemetros a estimar y disminuyela precisioacuten al incrementarse la varianza produciendo un sobreajuste Por el contrario si seincluyen menos variables de las necesarias la volatilidad se reduce pero aumenta el sesgo ypor tal razoacuten se tendraacute una mala prediccioacuten Por otra parte algunos predictores pueden

afectar la confiabilidad del modelo principalmente si estaacuten correlacionados con otrosDebido a lo anterior la motivacioacuten para hacer seleccioacuten de variables es encontrar un modeloque busque un equilibrio entre bondad de ajuste y parsimonia mejore interpretabilidadreduzca el tiempo de entrenamiento evite el problema de la dimensionalidad y disminuya elsobreajusteSe utilizoacute la seleccioacuten exhaustiva de variables en la cual se busca el mejor modelo entretodas las combinaciones posibles de variables para un conjunto de p variables se realiza lacalibracioacuten y evaluacioacuten de 2p posibles subconjuntos Es importante resaltar que estateacutecnica demanda una alta capacidad computacional y tiempo de ejecucioacuten extenso debido ala cantidad de modelos que son calculados y evaluados Para seleccionar el modelo seestablece una medida global de evaluacioacuten que tenga en cuenta el ajuste y se escogeraacute elmodelo cuya medida global sea la mejor

24 Meacutetricas de Evaluacioacuten241 Criterio del Aacuterea Bajo la Curva (AUC)El criterio usado para la evaluacioacuten de los modelos fue el AUC que representa el aacuterea bajo laCurva ROC cuya finalidad es analizar todos los valores para la relacioacuten entre sensibilidad yespecificidad en funcioacuten del umbral Por lo anterior se presenta una descripcioacuten de lametodologiacutea para mayor entendimientoLa sensibilidad es la probabilidad de clasificar correctamente una compantildeiacutea en bancarrotacuando eacutesta presenta insolvencia (TPF ndash Fraccioacuten de verdaderos positivos) y la especificidades la probabilidad de catalogar una sociedad solvente cuando la empresa presenta estadosfinancieros controlados (TNF- Fraccioacuten de verdaderos negativos) Los valores continuospueden ser transformados en binarios si se establece un punto de corte (- Umbral) a partirdel cual se consideraraacuten los resultados como quiebra o no quiebra Sea la variable binariaque denota el estado verdadero de solvencia y el resultado binario del pronoacutestico entonceslos resultados del modelo pueden ser

La Curva ROC permite describir que tan separadas estaacuten las distribuciones de la sensibilidady la especificidad de una muestra de validacioacuten definido como y dado que la curva ROC esuna funcioacuten monoacutetona creciente en el primer cuadrante entonces donde la funcioacuten ROC esaquella a la que cada valor de le hace corresponder siendo un punto de corte particularpara el cual El Aacuterea Bajo la Curva ROC (Area Under the Curve AUC) estima la capacidadque tiene un modelo de discriminar entre bancarrota y no bancarrota definido por y portanto a mayor aacuterea bajo la curva el modelo produciraacute un mejor ajusteAhora se detallaraacuten las anteriores definiciones para datos de supervivencia y para esto sepresenta coacutemo influye el tiempo en las variables definidas anteriormente En el anaacutelisis desupervivencia se define como la variable tiempo hasta la ocurrencia de la quiebra para lacompantildeiacutea por tanto se crea una nueva variable binaria que representa el estado de lasolvencia de la empresa en el tiempo Heagerty amp Zheng (2005) proponen las siguientesdefiniciones de casos y controles dependientes del tiempo y su clasificacioacutenCasos Individuos que presentan el fallo Utilizados para definir la sensibilidad

Casos Incidentes Individuos donde Por tanto presenta el fallo en el momentoCasos Acumulativos Individuos donde presentando el fallo antes o justo en el momento

Controles Individuos que no presentan el fallo Utilizados para definir la especificidad

Controles Estaacuteticos Individuos donde ( valor fijo por lo general alto) se dice que no presentanel fallo supervivientes a largo plazo

Controles Dinaacutemicos Individuos donde por lo que no presentan fallo antes del tiempordquoDado lo anterior las extensiones de la definicioacuten de la curva ROC para eventos dependientesdel tiempo surgen por la eleccioacuten de un tipo de casos (incidentes o acumulativos) y un tipode controles (estaacuteticos o dinaacutemicos) dando lugar a tres posibles exposiciones de la curvaROC

Acumulativo-Dinaacutemico (Heagerty Lumley amp Pepe 2000) Sensibilidad acumulada yespecificidad dinaacutemica En cualquier tiempo fijo el conjunto de empresas estudiadas puede serclasificada o bien como un caso o como un control Lo anterior es posible porque cada compantildeiacuteadesempentildea el rol de un control para un tiempo pero luego contribuye como un caso paratiempos Incidente-Estaacutetico (Etzioni et al 1999 y Slate amp Turnbull 2000) Sensibilidad y especificidadtiempo-dependiente Los casos son etiquetados seguacuten el momento en el que el evento ocurre ylos controles son definidos como aquellas sociedades que durante todo el tiempo de estudionunca cayeron en quiebraIncidente-Dinaacutemico Caso considerado en este estudio Un compantildeiacutea puede desempentildear el rol decontrol para un tiempo cercano pero luego desempentildear el caso cuando Esta definicioacutenpresenta las siguientes caracteriacutesticas- La sensibilidad incidente y la especificidad dinaacutemica son definidas por clasificar el riesgodeterminado en el tiempo entre aquellos en los que se observoacute la bancarrota (casos) y aquellosen los que se observoacute la supervivencia (controles) siendo por tanto usado en el modelo de CoxLas definiciones de sensibilidad (incidente) y especificidad (dinaacutemica) son faacutecilmente reescritasteniendo en cuenta la dependencia del tiempo y la variable longitudinal

De acuerdo con lo anterior es fundamental tener en cuenta que

Los verdaderos positivos (TPF) pueden ser una funcioacuten decreciente en el tiempo y en suestimacioacuten se considera la censura en el tiempoEn algunas situaciones la sensibilidad podriacutea depender no solo de y de la ventana de tiempoDebido a que los grupos de control variacutean con el tiempo el eje de las abscisas de la curva ROCtambieacuten cambia por lo tanto resulta maacutes difiacutecil interpretar tendencias en el tiempo en estascurvas

Para la evaluacioacuten de los modelos de este estudio el criterio que se utilizoacute fue el AUC y dadoque la caracteriacutestica de la curva de ROC es Incidente-Dinaacutemico entonces es posiblepromediar los AUC en el tiempo Por tanto el mejor modelo seleccionado es aquel con mayorpromedio de AUC en la ventana de tiempo definida

242 Validacioacuten CruzadaLa evaluacioacuten de desempentildeo sobre los modelos predictivos ya calibrados se realizoacute mediantevalidacioacuten cruzada teacutecnica que se usa en el aprendizaje automaacutetico para evaluar tanto lavariabilidad de un conjunto de datos como la confiabilidad del modelo entrenadoLa validacioacuten cruzada divide aleatoriamente los datos en varias particiones y cada una ellases fraccionada en conjunto de datos de entrenamiento y validacioacuten para cada muestra deentrenamiento se crea un modelo que luego es probado en la muestra de validacioacuten Cuandoel proceso de construccioacuten y evaluacioacuten se completa para todos las muestras se genera unconjunto de medidas de rendimiento (AUC) y resultados para todos los datosAl comparar las estadiacutesticas para todas las particiones se puede evaluar la confiabilidad yprecisioacuten de las predicciones ademaacutes de interpretar la calidad del conjunto de datos ycomprender si el modelo es susceptible a variaciones en la informacioacuten

3 DatosLa muestra de estudio fue tomada a partir de la informacioacuten reportada para consulta puacuteblicapor las sociedades sujetas a vigilancia y control por parte de la Superintendencia deSociedades A traveacutes del sistema de Informacioacuten y Reporte Empresarial - SIREM ndash fueposible consultar los Estados Financieros anuales reportados por las compantildeiacuteas bajo estudioSe obtuvieron todos los estados financieros reportados desde el antildeo 2000 hasta el antildeo 2015y se consolidaron las sociedades que reportaron informacioacuten encontrando en total 48600

sociedades con al menos el reporte de un estado financiero en el horizonte de tiempoanalizado Con base en la Clasificacioacuten Industrial Internacional Uniforme (coacutedigo CIIU) sedefinieron 45 tipos de actividades asociadas al sector retailUna de las mayores dificultades en el desarrollo de este tipo de estudios es la obtencioacuten dela variable que describe el momento en el cual se considera que una sociedad entra enbancarrota debido a que esta informacioacuten no se encuentra explicita en los estadosfinancieros o reportes realizados por las sociedadesPara dar solucioacuten a este problema se realizoacute una revisioacuten de los sistemas de reporteexistentes en las entidades que regulan y vigilan las sociedades (SuperintendenciasCaacutemaras de comercio direccioacuten de impuestos) de esta forma se identificoacute el sistema puacuteblicode informacioacuten Baranda Virtual de la Superintendencia de Sociedades el cual permiteobtener informacioacuten acerca de cambios de estado procesos avisos autos y resolucionespuntuales de cada sociedad A partir del entendimiento del proceso de liquidacioacuten de lassociedades se identificaron los criterios de reorganizacioacuten liquidacioacuten u otro asociado alcese de actividades Con base en esto se establecioacute el criterio de bancarrota a partir de lasfechas de cambios de estado y procesos asociados a liquidacioacuten o reorganizacioacutenLa consulta de informacioacuten en Baranda Virtual se debiacutea realizar puntualmente a traveacutes de unformulario de buacutesqueda por nuacutemero de NIT teniendo en cuenta la cantidad de sociedades aconsultar se requirioacute un desarrollo adicional para obtener masivamente la informacioacuten Paraesto se implementoacute un proceso de web scraping en lenguaje de programacioacuten Python con elcual se accedioacute de forma automaacutetica y remota a la aplicacioacuten y se obtuvo toda lainformacioacuten acerca de la sociedad etapas y causas de su estado actual asiacute como las fechasrelevantes (constitucioacuten estado etapa situacioacuten) A partir de dicha informacioacuten fue posiblegenerar la variable respuesta asociada al evento de bancarrota y el momento del tiempo enque sucedioacuteEl estudio se centroacute en analizar las sociedades que reportaron informacioacuten en el antildeo 2007con el fin de tener una ventana de tiempo de 10 antildeos en los cuales el nuacutemero de empresasen estado de bancarrota fuera significativo Asiacute las cosas el panel final de datos antes delanaacutelisis exploratorio quedoacute constituido por 4048 sociedades del sector minorista Para ladefinicioacuten y caacutelculo de las razones financieras utilizadas como predictores se tomaron encuenta los 21 indicadores [5] propuestos por Valencia et al (2014) detallados en la Tabla 1

Tabla 1Razones financieras consideradas como predictores

Una vez calculadas las razones se realizoacute un anaacutelisis descriptivo de la informacioacuten ydeteccioacuten de valores atiacutepicos mediante el algoritmo LOF (Breunig et al (2000)) de acuerdocon esto se excluyeron 137 sociedades Uno de los principales enfoques de este trabajo hasido garantizar la calidad de la informacioacuten centraacutendose en entender desde el origen de losdatos posibles errores u omisiones en lo que se reporta a la entidad reguladora A partir de

esto y con base en los resultados obtenidos en el presente estudio retirar de la base dedatos aquellos registros cuya informacioacuten de ingresos operacionales sean cero o uno enlugar de imputarlos permitiraacute capturar el comportamiento real de la base de datos ya quede tomar la segunda opcioacuten se estariacutea realizando suposiciones fuertes sobre las ventasrealizadas por las empresas en el antildeo de reporte y con la cual se estiman aproximadamentenueve razones financieras utilizadas dentro del anaacutelisisSe eliminaron variables que presentan correlaciones superiores a 08 criterio sugerido porGujarati (1988) (Partington amp Kim 2008) tales como capital de trabajo sobre activos totales(working capital to total assets) deudas totales sobre activos totales (total liabilities to totalassets) ingreso neto sobre ventas (net income to sales) Por uacuteltimo siguiendo el enfoque deShumway (2001) para reducir la influencia de los valores atiacutepicos se realizoacute un truncado delos datos en cada variable para los valores inferiores al primer percentil y superiores alpercentil 99La muestra final es de 3911 sociedades de las cuales 372 (951) presentaron bancarrotaen la ventana de tiempo de 10 antildeos La Tabla 2 presenta las sociedades que cayeron eninsolvencia antildeo a antildeo durante la ventana de estudio En la Ilustracioacuten 1 se presenta unresumen de todo el proceso de mineriacutea de datos anaacutelisis y depuracioacuten que se realizoacute

Tabla 2Clasificacioacuten de estado de sociedades en la ventana de estudio

Antildeo 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Total

Censura 0 0 0 0 0 0 0 0 0 3539 3539

Bancarrota 20 35 53 38 44 56 55 35 23 13 372

Ilustracioacuten 1Proceso mineriacutea de datos anaacutelisis y depuracioacuten de la informacioacuten

4 Resultados

41 Modelo de riesgos proporcionales de CoxPara la seleccioacuten del modelo de regresioacuten de Cox tal como se menciona en la seccioacuten 2 seaplicoacute la teacutecnica de buacutesqueda exhaustiva para hallar la mejor combinacioacuten de variablesposibles tomando como medida de desempentildeo el promedio de los AUC en la ventana detiempo analizada Mediante un proceso de validacioacuten cruzada (3-Fold Cross-Validation) seevaluaron 262144 subconjuntos resultados de la combinacioacuten de 18 variables El tiempo deejecucioacuten de todos los modelos fue de 15 horas de forma secuencial por una sola maacutequina[5]Se seleccionoacute un modelo de cinco variables el cual presentoacute el mejor desempentildeo promedioen las muestras de validacioacuten con un AUC = 06825 La Ilustracioacuten 2 presenta elcomportamiento del mejor AUC de acuerdo con la cantidad de variables Se puede observarcoacutemo existe un punto maacuteximo donde se obtiene el mejor AUC y a medida que se aumenta elnuacutemero de predictores el desempentildeo empeora esto se asocia con el sobreajusteLas variables seleccionadas los coeficientes estimados y sus medidas de validacioacuten sepresentan en la Tabla 3 En este caso todas las variables son significativas al 5 El modeloes aceptable para cualquiera de los tres criterios de test de razoacuten de verosimilitud y pruebade WaldSe validoacute el ajuste del modelo de regresioacuten de Cox con la hipoacutetesis fundamental de que losriesgos son proporcionales encontrando que no existen evidencias significativas al 5 deque se viole este supuesto tanto globalmente como para las cinco variables seleccionadas

Tabla 3Modelo ajustado riesgos proporcionales Cox

Financial Ratio Β exp(β) se(β) z Pr(gt|z|) Sig

Currentliabilitiestototalassets (1053) 0349 0531 -1984 0047

Netincometototalassets (14840) 0000 1941 -7646 0000

Nocreditinterval (0004) 0996 0002 -2331 0020

Quickassetstosales 0681 1977 0305 2234 0026

Quickassetstototalassets 1345 3836 0532 2527 0012

Likelihood ratio test= 9453 on 5 df p=0Wald test = 7948 on 5 df p=111e-15Score (logrank) test = 8555 on 5 df p=111e-16

Ilustracioacuten 2Evolucioacuten del AUC en Modelo Cox

------

Ilustracioacuten 3Graacutefico de la funcioacuten de supervivencia Modelo CPH

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 4: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

funcioacuten de riesgo en dos componentes uno no parameacutetrico que depende soacutelo del tiempo yotro parameacutetrico que depende soacutelo de las variables de la siguiente forma

22 Modelo Aditivo Generalizado (GAM)En el modelo GAM los predictores son funciones suaves desconocidas estimadas a partir dela distribucioacuten de las variables de entrada Este modelo fue desarrollado para mezclarpropiedades de modelos lineales generalizados con modelos no-parameacutetricos

En este caso se utilizoacute la funcioacuten GAM del paquete MGCV en R que realiza el ajuste delparaacutemetro de suavizacioacuten mediante la funcioacuten magic (Wood SN 2004) en lacualinternamente aplica meacutetodo de Newton de manera multi-dimensional en combinacioacutencon validacioacuten cruzada sobre la poblacioacuten de entrenamiento para hallar el factor desuavizacioacuten oacuteptimo Como ventajas del modelo se tiene que produce formas flexibles y sin importar ladimensionalidad ademaacutes es eficiente computacionalmente y es faacutecil de interpretar cadafuncioacuten separadamente sin embargo la forma funcional estaacute limitada a ser aditiva

23 Seleccioacuten de VariablesLa seleccioacuten de variables es el proceso de escoger predictores significativos para laconstruccioacuten de modelos Generalmente entre maacutes variables sean incluidas en un modeloel ajuste a los datos mejora pero aumenta el nuacutemero de paraacutemetros a estimar y disminuyela precisioacuten al incrementarse la varianza produciendo un sobreajuste Por el contrario si seincluyen menos variables de las necesarias la volatilidad se reduce pero aumenta el sesgo ypor tal razoacuten se tendraacute una mala prediccioacuten Por otra parte algunos predictores pueden

afectar la confiabilidad del modelo principalmente si estaacuten correlacionados con otrosDebido a lo anterior la motivacioacuten para hacer seleccioacuten de variables es encontrar un modeloque busque un equilibrio entre bondad de ajuste y parsimonia mejore interpretabilidadreduzca el tiempo de entrenamiento evite el problema de la dimensionalidad y disminuya elsobreajusteSe utilizoacute la seleccioacuten exhaustiva de variables en la cual se busca el mejor modelo entretodas las combinaciones posibles de variables para un conjunto de p variables se realiza lacalibracioacuten y evaluacioacuten de 2p posibles subconjuntos Es importante resaltar que estateacutecnica demanda una alta capacidad computacional y tiempo de ejecucioacuten extenso debido ala cantidad de modelos que son calculados y evaluados Para seleccionar el modelo seestablece una medida global de evaluacioacuten que tenga en cuenta el ajuste y se escogeraacute elmodelo cuya medida global sea la mejor

24 Meacutetricas de Evaluacioacuten241 Criterio del Aacuterea Bajo la Curva (AUC)El criterio usado para la evaluacioacuten de los modelos fue el AUC que representa el aacuterea bajo laCurva ROC cuya finalidad es analizar todos los valores para la relacioacuten entre sensibilidad yespecificidad en funcioacuten del umbral Por lo anterior se presenta una descripcioacuten de lametodologiacutea para mayor entendimientoLa sensibilidad es la probabilidad de clasificar correctamente una compantildeiacutea en bancarrotacuando eacutesta presenta insolvencia (TPF ndash Fraccioacuten de verdaderos positivos) y la especificidades la probabilidad de catalogar una sociedad solvente cuando la empresa presenta estadosfinancieros controlados (TNF- Fraccioacuten de verdaderos negativos) Los valores continuospueden ser transformados en binarios si se establece un punto de corte (- Umbral) a partirdel cual se consideraraacuten los resultados como quiebra o no quiebra Sea la variable binariaque denota el estado verdadero de solvencia y el resultado binario del pronoacutestico entonceslos resultados del modelo pueden ser

La Curva ROC permite describir que tan separadas estaacuten las distribuciones de la sensibilidady la especificidad de una muestra de validacioacuten definido como y dado que la curva ROC esuna funcioacuten monoacutetona creciente en el primer cuadrante entonces donde la funcioacuten ROC esaquella a la que cada valor de le hace corresponder siendo un punto de corte particularpara el cual El Aacuterea Bajo la Curva ROC (Area Under the Curve AUC) estima la capacidadque tiene un modelo de discriminar entre bancarrota y no bancarrota definido por y portanto a mayor aacuterea bajo la curva el modelo produciraacute un mejor ajusteAhora se detallaraacuten las anteriores definiciones para datos de supervivencia y para esto sepresenta coacutemo influye el tiempo en las variables definidas anteriormente En el anaacutelisis desupervivencia se define como la variable tiempo hasta la ocurrencia de la quiebra para lacompantildeiacutea por tanto se crea una nueva variable binaria que representa el estado de lasolvencia de la empresa en el tiempo Heagerty amp Zheng (2005) proponen las siguientesdefiniciones de casos y controles dependientes del tiempo y su clasificacioacutenCasos Individuos que presentan el fallo Utilizados para definir la sensibilidad

Casos Incidentes Individuos donde Por tanto presenta el fallo en el momentoCasos Acumulativos Individuos donde presentando el fallo antes o justo en el momento

Controles Individuos que no presentan el fallo Utilizados para definir la especificidad

Controles Estaacuteticos Individuos donde ( valor fijo por lo general alto) se dice que no presentanel fallo supervivientes a largo plazo

Controles Dinaacutemicos Individuos donde por lo que no presentan fallo antes del tiempordquoDado lo anterior las extensiones de la definicioacuten de la curva ROC para eventos dependientesdel tiempo surgen por la eleccioacuten de un tipo de casos (incidentes o acumulativos) y un tipode controles (estaacuteticos o dinaacutemicos) dando lugar a tres posibles exposiciones de la curvaROC

Acumulativo-Dinaacutemico (Heagerty Lumley amp Pepe 2000) Sensibilidad acumulada yespecificidad dinaacutemica En cualquier tiempo fijo el conjunto de empresas estudiadas puede serclasificada o bien como un caso o como un control Lo anterior es posible porque cada compantildeiacuteadesempentildea el rol de un control para un tiempo pero luego contribuye como un caso paratiempos Incidente-Estaacutetico (Etzioni et al 1999 y Slate amp Turnbull 2000) Sensibilidad y especificidadtiempo-dependiente Los casos son etiquetados seguacuten el momento en el que el evento ocurre ylos controles son definidos como aquellas sociedades que durante todo el tiempo de estudionunca cayeron en quiebraIncidente-Dinaacutemico Caso considerado en este estudio Un compantildeiacutea puede desempentildear el rol decontrol para un tiempo cercano pero luego desempentildear el caso cuando Esta definicioacutenpresenta las siguientes caracteriacutesticas- La sensibilidad incidente y la especificidad dinaacutemica son definidas por clasificar el riesgodeterminado en el tiempo entre aquellos en los que se observoacute la bancarrota (casos) y aquellosen los que se observoacute la supervivencia (controles) siendo por tanto usado en el modelo de CoxLas definiciones de sensibilidad (incidente) y especificidad (dinaacutemica) son faacutecilmente reescritasteniendo en cuenta la dependencia del tiempo y la variable longitudinal

De acuerdo con lo anterior es fundamental tener en cuenta que

Los verdaderos positivos (TPF) pueden ser una funcioacuten decreciente en el tiempo y en suestimacioacuten se considera la censura en el tiempoEn algunas situaciones la sensibilidad podriacutea depender no solo de y de la ventana de tiempoDebido a que los grupos de control variacutean con el tiempo el eje de las abscisas de la curva ROCtambieacuten cambia por lo tanto resulta maacutes difiacutecil interpretar tendencias en el tiempo en estascurvas

Para la evaluacioacuten de los modelos de este estudio el criterio que se utilizoacute fue el AUC y dadoque la caracteriacutestica de la curva de ROC es Incidente-Dinaacutemico entonces es posiblepromediar los AUC en el tiempo Por tanto el mejor modelo seleccionado es aquel con mayorpromedio de AUC en la ventana de tiempo definida

242 Validacioacuten CruzadaLa evaluacioacuten de desempentildeo sobre los modelos predictivos ya calibrados se realizoacute mediantevalidacioacuten cruzada teacutecnica que se usa en el aprendizaje automaacutetico para evaluar tanto lavariabilidad de un conjunto de datos como la confiabilidad del modelo entrenadoLa validacioacuten cruzada divide aleatoriamente los datos en varias particiones y cada una ellases fraccionada en conjunto de datos de entrenamiento y validacioacuten para cada muestra deentrenamiento se crea un modelo que luego es probado en la muestra de validacioacuten Cuandoel proceso de construccioacuten y evaluacioacuten se completa para todos las muestras se genera unconjunto de medidas de rendimiento (AUC) y resultados para todos los datosAl comparar las estadiacutesticas para todas las particiones se puede evaluar la confiabilidad yprecisioacuten de las predicciones ademaacutes de interpretar la calidad del conjunto de datos ycomprender si el modelo es susceptible a variaciones en la informacioacuten

3 DatosLa muestra de estudio fue tomada a partir de la informacioacuten reportada para consulta puacuteblicapor las sociedades sujetas a vigilancia y control por parte de la Superintendencia deSociedades A traveacutes del sistema de Informacioacuten y Reporte Empresarial - SIREM ndash fueposible consultar los Estados Financieros anuales reportados por las compantildeiacuteas bajo estudioSe obtuvieron todos los estados financieros reportados desde el antildeo 2000 hasta el antildeo 2015y se consolidaron las sociedades que reportaron informacioacuten encontrando en total 48600

sociedades con al menos el reporte de un estado financiero en el horizonte de tiempoanalizado Con base en la Clasificacioacuten Industrial Internacional Uniforme (coacutedigo CIIU) sedefinieron 45 tipos de actividades asociadas al sector retailUna de las mayores dificultades en el desarrollo de este tipo de estudios es la obtencioacuten dela variable que describe el momento en el cual se considera que una sociedad entra enbancarrota debido a que esta informacioacuten no se encuentra explicita en los estadosfinancieros o reportes realizados por las sociedadesPara dar solucioacuten a este problema se realizoacute una revisioacuten de los sistemas de reporteexistentes en las entidades que regulan y vigilan las sociedades (SuperintendenciasCaacutemaras de comercio direccioacuten de impuestos) de esta forma se identificoacute el sistema puacuteblicode informacioacuten Baranda Virtual de la Superintendencia de Sociedades el cual permiteobtener informacioacuten acerca de cambios de estado procesos avisos autos y resolucionespuntuales de cada sociedad A partir del entendimiento del proceso de liquidacioacuten de lassociedades se identificaron los criterios de reorganizacioacuten liquidacioacuten u otro asociado alcese de actividades Con base en esto se establecioacute el criterio de bancarrota a partir de lasfechas de cambios de estado y procesos asociados a liquidacioacuten o reorganizacioacutenLa consulta de informacioacuten en Baranda Virtual se debiacutea realizar puntualmente a traveacutes de unformulario de buacutesqueda por nuacutemero de NIT teniendo en cuenta la cantidad de sociedades aconsultar se requirioacute un desarrollo adicional para obtener masivamente la informacioacuten Paraesto se implementoacute un proceso de web scraping en lenguaje de programacioacuten Python con elcual se accedioacute de forma automaacutetica y remota a la aplicacioacuten y se obtuvo toda lainformacioacuten acerca de la sociedad etapas y causas de su estado actual asiacute como las fechasrelevantes (constitucioacuten estado etapa situacioacuten) A partir de dicha informacioacuten fue posiblegenerar la variable respuesta asociada al evento de bancarrota y el momento del tiempo enque sucedioacuteEl estudio se centroacute en analizar las sociedades que reportaron informacioacuten en el antildeo 2007con el fin de tener una ventana de tiempo de 10 antildeos en los cuales el nuacutemero de empresasen estado de bancarrota fuera significativo Asiacute las cosas el panel final de datos antes delanaacutelisis exploratorio quedoacute constituido por 4048 sociedades del sector minorista Para ladefinicioacuten y caacutelculo de las razones financieras utilizadas como predictores se tomaron encuenta los 21 indicadores [5] propuestos por Valencia et al (2014) detallados en la Tabla 1

Tabla 1Razones financieras consideradas como predictores

Una vez calculadas las razones se realizoacute un anaacutelisis descriptivo de la informacioacuten ydeteccioacuten de valores atiacutepicos mediante el algoritmo LOF (Breunig et al (2000)) de acuerdocon esto se excluyeron 137 sociedades Uno de los principales enfoques de este trabajo hasido garantizar la calidad de la informacioacuten centraacutendose en entender desde el origen de losdatos posibles errores u omisiones en lo que se reporta a la entidad reguladora A partir de

esto y con base en los resultados obtenidos en el presente estudio retirar de la base dedatos aquellos registros cuya informacioacuten de ingresos operacionales sean cero o uno enlugar de imputarlos permitiraacute capturar el comportamiento real de la base de datos ya quede tomar la segunda opcioacuten se estariacutea realizando suposiciones fuertes sobre las ventasrealizadas por las empresas en el antildeo de reporte y con la cual se estiman aproximadamentenueve razones financieras utilizadas dentro del anaacutelisisSe eliminaron variables que presentan correlaciones superiores a 08 criterio sugerido porGujarati (1988) (Partington amp Kim 2008) tales como capital de trabajo sobre activos totales(working capital to total assets) deudas totales sobre activos totales (total liabilities to totalassets) ingreso neto sobre ventas (net income to sales) Por uacuteltimo siguiendo el enfoque deShumway (2001) para reducir la influencia de los valores atiacutepicos se realizoacute un truncado delos datos en cada variable para los valores inferiores al primer percentil y superiores alpercentil 99La muestra final es de 3911 sociedades de las cuales 372 (951) presentaron bancarrotaen la ventana de tiempo de 10 antildeos La Tabla 2 presenta las sociedades que cayeron eninsolvencia antildeo a antildeo durante la ventana de estudio En la Ilustracioacuten 1 se presenta unresumen de todo el proceso de mineriacutea de datos anaacutelisis y depuracioacuten que se realizoacute

Tabla 2Clasificacioacuten de estado de sociedades en la ventana de estudio

Antildeo 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Total

Censura 0 0 0 0 0 0 0 0 0 3539 3539

Bancarrota 20 35 53 38 44 56 55 35 23 13 372

Ilustracioacuten 1Proceso mineriacutea de datos anaacutelisis y depuracioacuten de la informacioacuten

4 Resultados

41 Modelo de riesgos proporcionales de CoxPara la seleccioacuten del modelo de regresioacuten de Cox tal como se menciona en la seccioacuten 2 seaplicoacute la teacutecnica de buacutesqueda exhaustiva para hallar la mejor combinacioacuten de variablesposibles tomando como medida de desempentildeo el promedio de los AUC en la ventana detiempo analizada Mediante un proceso de validacioacuten cruzada (3-Fold Cross-Validation) seevaluaron 262144 subconjuntos resultados de la combinacioacuten de 18 variables El tiempo deejecucioacuten de todos los modelos fue de 15 horas de forma secuencial por una sola maacutequina[5]Se seleccionoacute un modelo de cinco variables el cual presentoacute el mejor desempentildeo promedioen las muestras de validacioacuten con un AUC = 06825 La Ilustracioacuten 2 presenta elcomportamiento del mejor AUC de acuerdo con la cantidad de variables Se puede observarcoacutemo existe un punto maacuteximo donde se obtiene el mejor AUC y a medida que se aumenta elnuacutemero de predictores el desempentildeo empeora esto se asocia con el sobreajusteLas variables seleccionadas los coeficientes estimados y sus medidas de validacioacuten sepresentan en la Tabla 3 En este caso todas las variables son significativas al 5 El modeloes aceptable para cualquiera de los tres criterios de test de razoacuten de verosimilitud y pruebade WaldSe validoacute el ajuste del modelo de regresioacuten de Cox con la hipoacutetesis fundamental de que losriesgos son proporcionales encontrando que no existen evidencias significativas al 5 deque se viole este supuesto tanto globalmente como para las cinco variables seleccionadas

Tabla 3Modelo ajustado riesgos proporcionales Cox

Financial Ratio Β exp(β) se(β) z Pr(gt|z|) Sig

Currentliabilitiestototalassets (1053) 0349 0531 -1984 0047

Netincometototalassets (14840) 0000 1941 -7646 0000

Nocreditinterval (0004) 0996 0002 -2331 0020

Quickassetstosales 0681 1977 0305 2234 0026

Quickassetstototalassets 1345 3836 0532 2527 0012

Likelihood ratio test= 9453 on 5 df p=0Wald test = 7948 on 5 df p=111e-15Score (logrank) test = 8555 on 5 df p=111e-16

Ilustracioacuten 2Evolucioacuten del AUC en Modelo Cox

------

Ilustracioacuten 3Graacutefico de la funcioacuten de supervivencia Modelo CPH

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 5: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

afectar la confiabilidad del modelo principalmente si estaacuten correlacionados con otrosDebido a lo anterior la motivacioacuten para hacer seleccioacuten de variables es encontrar un modeloque busque un equilibrio entre bondad de ajuste y parsimonia mejore interpretabilidadreduzca el tiempo de entrenamiento evite el problema de la dimensionalidad y disminuya elsobreajusteSe utilizoacute la seleccioacuten exhaustiva de variables en la cual se busca el mejor modelo entretodas las combinaciones posibles de variables para un conjunto de p variables se realiza lacalibracioacuten y evaluacioacuten de 2p posibles subconjuntos Es importante resaltar que estateacutecnica demanda una alta capacidad computacional y tiempo de ejecucioacuten extenso debido ala cantidad de modelos que son calculados y evaluados Para seleccionar el modelo seestablece una medida global de evaluacioacuten que tenga en cuenta el ajuste y se escogeraacute elmodelo cuya medida global sea la mejor

24 Meacutetricas de Evaluacioacuten241 Criterio del Aacuterea Bajo la Curva (AUC)El criterio usado para la evaluacioacuten de los modelos fue el AUC que representa el aacuterea bajo laCurva ROC cuya finalidad es analizar todos los valores para la relacioacuten entre sensibilidad yespecificidad en funcioacuten del umbral Por lo anterior se presenta una descripcioacuten de lametodologiacutea para mayor entendimientoLa sensibilidad es la probabilidad de clasificar correctamente una compantildeiacutea en bancarrotacuando eacutesta presenta insolvencia (TPF ndash Fraccioacuten de verdaderos positivos) y la especificidades la probabilidad de catalogar una sociedad solvente cuando la empresa presenta estadosfinancieros controlados (TNF- Fraccioacuten de verdaderos negativos) Los valores continuospueden ser transformados en binarios si se establece un punto de corte (- Umbral) a partirdel cual se consideraraacuten los resultados como quiebra o no quiebra Sea la variable binariaque denota el estado verdadero de solvencia y el resultado binario del pronoacutestico entonceslos resultados del modelo pueden ser

La Curva ROC permite describir que tan separadas estaacuten las distribuciones de la sensibilidady la especificidad de una muestra de validacioacuten definido como y dado que la curva ROC esuna funcioacuten monoacutetona creciente en el primer cuadrante entonces donde la funcioacuten ROC esaquella a la que cada valor de le hace corresponder siendo un punto de corte particularpara el cual El Aacuterea Bajo la Curva ROC (Area Under the Curve AUC) estima la capacidadque tiene un modelo de discriminar entre bancarrota y no bancarrota definido por y portanto a mayor aacuterea bajo la curva el modelo produciraacute un mejor ajusteAhora se detallaraacuten las anteriores definiciones para datos de supervivencia y para esto sepresenta coacutemo influye el tiempo en las variables definidas anteriormente En el anaacutelisis desupervivencia se define como la variable tiempo hasta la ocurrencia de la quiebra para lacompantildeiacutea por tanto se crea una nueva variable binaria que representa el estado de lasolvencia de la empresa en el tiempo Heagerty amp Zheng (2005) proponen las siguientesdefiniciones de casos y controles dependientes del tiempo y su clasificacioacutenCasos Individuos que presentan el fallo Utilizados para definir la sensibilidad

Casos Incidentes Individuos donde Por tanto presenta el fallo en el momentoCasos Acumulativos Individuos donde presentando el fallo antes o justo en el momento

Controles Individuos que no presentan el fallo Utilizados para definir la especificidad

Controles Estaacuteticos Individuos donde ( valor fijo por lo general alto) se dice que no presentanel fallo supervivientes a largo plazo

Controles Dinaacutemicos Individuos donde por lo que no presentan fallo antes del tiempordquoDado lo anterior las extensiones de la definicioacuten de la curva ROC para eventos dependientesdel tiempo surgen por la eleccioacuten de un tipo de casos (incidentes o acumulativos) y un tipode controles (estaacuteticos o dinaacutemicos) dando lugar a tres posibles exposiciones de la curvaROC

Acumulativo-Dinaacutemico (Heagerty Lumley amp Pepe 2000) Sensibilidad acumulada yespecificidad dinaacutemica En cualquier tiempo fijo el conjunto de empresas estudiadas puede serclasificada o bien como un caso o como un control Lo anterior es posible porque cada compantildeiacuteadesempentildea el rol de un control para un tiempo pero luego contribuye como un caso paratiempos Incidente-Estaacutetico (Etzioni et al 1999 y Slate amp Turnbull 2000) Sensibilidad y especificidadtiempo-dependiente Los casos son etiquetados seguacuten el momento en el que el evento ocurre ylos controles son definidos como aquellas sociedades que durante todo el tiempo de estudionunca cayeron en quiebraIncidente-Dinaacutemico Caso considerado en este estudio Un compantildeiacutea puede desempentildear el rol decontrol para un tiempo cercano pero luego desempentildear el caso cuando Esta definicioacutenpresenta las siguientes caracteriacutesticas- La sensibilidad incidente y la especificidad dinaacutemica son definidas por clasificar el riesgodeterminado en el tiempo entre aquellos en los que se observoacute la bancarrota (casos) y aquellosen los que se observoacute la supervivencia (controles) siendo por tanto usado en el modelo de CoxLas definiciones de sensibilidad (incidente) y especificidad (dinaacutemica) son faacutecilmente reescritasteniendo en cuenta la dependencia del tiempo y la variable longitudinal

De acuerdo con lo anterior es fundamental tener en cuenta que

Los verdaderos positivos (TPF) pueden ser una funcioacuten decreciente en el tiempo y en suestimacioacuten se considera la censura en el tiempoEn algunas situaciones la sensibilidad podriacutea depender no solo de y de la ventana de tiempoDebido a que los grupos de control variacutean con el tiempo el eje de las abscisas de la curva ROCtambieacuten cambia por lo tanto resulta maacutes difiacutecil interpretar tendencias en el tiempo en estascurvas

Para la evaluacioacuten de los modelos de este estudio el criterio que se utilizoacute fue el AUC y dadoque la caracteriacutestica de la curva de ROC es Incidente-Dinaacutemico entonces es posiblepromediar los AUC en el tiempo Por tanto el mejor modelo seleccionado es aquel con mayorpromedio de AUC en la ventana de tiempo definida

242 Validacioacuten CruzadaLa evaluacioacuten de desempentildeo sobre los modelos predictivos ya calibrados se realizoacute mediantevalidacioacuten cruzada teacutecnica que se usa en el aprendizaje automaacutetico para evaluar tanto lavariabilidad de un conjunto de datos como la confiabilidad del modelo entrenadoLa validacioacuten cruzada divide aleatoriamente los datos en varias particiones y cada una ellases fraccionada en conjunto de datos de entrenamiento y validacioacuten para cada muestra deentrenamiento se crea un modelo que luego es probado en la muestra de validacioacuten Cuandoel proceso de construccioacuten y evaluacioacuten se completa para todos las muestras se genera unconjunto de medidas de rendimiento (AUC) y resultados para todos los datosAl comparar las estadiacutesticas para todas las particiones se puede evaluar la confiabilidad yprecisioacuten de las predicciones ademaacutes de interpretar la calidad del conjunto de datos ycomprender si el modelo es susceptible a variaciones en la informacioacuten

3 DatosLa muestra de estudio fue tomada a partir de la informacioacuten reportada para consulta puacuteblicapor las sociedades sujetas a vigilancia y control por parte de la Superintendencia deSociedades A traveacutes del sistema de Informacioacuten y Reporte Empresarial - SIREM ndash fueposible consultar los Estados Financieros anuales reportados por las compantildeiacuteas bajo estudioSe obtuvieron todos los estados financieros reportados desde el antildeo 2000 hasta el antildeo 2015y se consolidaron las sociedades que reportaron informacioacuten encontrando en total 48600

sociedades con al menos el reporte de un estado financiero en el horizonte de tiempoanalizado Con base en la Clasificacioacuten Industrial Internacional Uniforme (coacutedigo CIIU) sedefinieron 45 tipos de actividades asociadas al sector retailUna de las mayores dificultades en el desarrollo de este tipo de estudios es la obtencioacuten dela variable que describe el momento en el cual se considera que una sociedad entra enbancarrota debido a que esta informacioacuten no se encuentra explicita en los estadosfinancieros o reportes realizados por las sociedadesPara dar solucioacuten a este problema se realizoacute una revisioacuten de los sistemas de reporteexistentes en las entidades que regulan y vigilan las sociedades (SuperintendenciasCaacutemaras de comercio direccioacuten de impuestos) de esta forma se identificoacute el sistema puacuteblicode informacioacuten Baranda Virtual de la Superintendencia de Sociedades el cual permiteobtener informacioacuten acerca de cambios de estado procesos avisos autos y resolucionespuntuales de cada sociedad A partir del entendimiento del proceso de liquidacioacuten de lassociedades se identificaron los criterios de reorganizacioacuten liquidacioacuten u otro asociado alcese de actividades Con base en esto se establecioacute el criterio de bancarrota a partir de lasfechas de cambios de estado y procesos asociados a liquidacioacuten o reorganizacioacutenLa consulta de informacioacuten en Baranda Virtual se debiacutea realizar puntualmente a traveacutes de unformulario de buacutesqueda por nuacutemero de NIT teniendo en cuenta la cantidad de sociedades aconsultar se requirioacute un desarrollo adicional para obtener masivamente la informacioacuten Paraesto se implementoacute un proceso de web scraping en lenguaje de programacioacuten Python con elcual se accedioacute de forma automaacutetica y remota a la aplicacioacuten y se obtuvo toda lainformacioacuten acerca de la sociedad etapas y causas de su estado actual asiacute como las fechasrelevantes (constitucioacuten estado etapa situacioacuten) A partir de dicha informacioacuten fue posiblegenerar la variable respuesta asociada al evento de bancarrota y el momento del tiempo enque sucedioacuteEl estudio se centroacute en analizar las sociedades que reportaron informacioacuten en el antildeo 2007con el fin de tener una ventana de tiempo de 10 antildeos en los cuales el nuacutemero de empresasen estado de bancarrota fuera significativo Asiacute las cosas el panel final de datos antes delanaacutelisis exploratorio quedoacute constituido por 4048 sociedades del sector minorista Para ladefinicioacuten y caacutelculo de las razones financieras utilizadas como predictores se tomaron encuenta los 21 indicadores [5] propuestos por Valencia et al (2014) detallados en la Tabla 1

Tabla 1Razones financieras consideradas como predictores

Una vez calculadas las razones se realizoacute un anaacutelisis descriptivo de la informacioacuten ydeteccioacuten de valores atiacutepicos mediante el algoritmo LOF (Breunig et al (2000)) de acuerdocon esto se excluyeron 137 sociedades Uno de los principales enfoques de este trabajo hasido garantizar la calidad de la informacioacuten centraacutendose en entender desde el origen de losdatos posibles errores u omisiones en lo que se reporta a la entidad reguladora A partir de

esto y con base en los resultados obtenidos en el presente estudio retirar de la base dedatos aquellos registros cuya informacioacuten de ingresos operacionales sean cero o uno enlugar de imputarlos permitiraacute capturar el comportamiento real de la base de datos ya quede tomar la segunda opcioacuten se estariacutea realizando suposiciones fuertes sobre las ventasrealizadas por las empresas en el antildeo de reporte y con la cual se estiman aproximadamentenueve razones financieras utilizadas dentro del anaacutelisisSe eliminaron variables que presentan correlaciones superiores a 08 criterio sugerido porGujarati (1988) (Partington amp Kim 2008) tales como capital de trabajo sobre activos totales(working capital to total assets) deudas totales sobre activos totales (total liabilities to totalassets) ingreso neto sobre ventas (net income to sales) Por uacuteltimo siguiendo el enfoque deShumway (2001) para reducir la influencia de los valores atiacutepicos se realizoacute un truncado delos datos en cada variable para los valores inferiores al primer percentil y superiores alpercentil 99La muestra final es de 3911 sociedades de las cuales 372 (951) presentaron bancarrotaen la ventana de tiempo de 10 antildeos La Tabla 2 presenta las sociedades que cayeron eninsolvencia antildeo a antildeo durante la ventana de estudio En la Ilustracioacuten 1 se presenta unresumen de todo el proceso de mineriacutea de datos anaacutelisis y depuracioacuten que se realizoacute

Tabla 2Clasificacioacuten de estado de sociedades en la ventana de estudio

Antildeo 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Total

Censura 0 0 0 0 0 0 0 0 0 3539 3539

Bancarrota 20 35 53 38 44 56 55 35 23 13 372

Ilustracioacuten 1Proceso mineriacutea de datos anaacutelisis y depuracioacuten de la informacioacuten

4 Resultados

41 Modelo de riesgos proporcionales de CoxPara la seleccioacuten del modelo de regresioacuten de Cox tal como se menciona en la seccioacuten 2 seaplicoacute la teacutecnica de buacutesqueda exhaustiva para hallar la mejor combinacioacuten de variablesposibles tomando como medida de desempentildeo el promedio de los AUC en la ventana detiempo analizada Mediante un proceso de validacioacuten cruzada (3-Fold Cross-Validation) seevaluaron 262144 subconjuntos resultados de la combinacioacuten de 18 variables El tiempo deejecucioacuten de todos los modelos fue de 15 horas de forma secuencial por una sola maacutequina[5]Se seleccionoacute un modelo de cinco variables el cual presentoacute el mejor desempentildeo promedioen las muestras de validacioacuten con un AUC = 06825 La Ilustracioacuten 2 presenta elcomportamiento del mejor AUC de acuerdo con la cantidad de variables Se puede observarcoacutemo existe un punto maacuteximo donde se obtiene el mejor AUC y a medida que se aumenta elnuacutemero de predictores el desempentildeo empeora esto se asocia con el sobreajusteLas variables seleccionadas los coeficientes estimados y sus medidas de validacioacuten sepresentan en la Tabla 3 En este caso todas las variables son significativas al 5 El modeloes aceptable para cualquiera de los tres criterios de test de razoacuten de verosimilitud y pruebade WaldSe validoacute el ajuste del modelo de regresioacuten de Cox con la hipoacutetesis fundamental de que losriesgos son proporcionales encontrando que no existen evidencias significativas al 5 deque se viole este supuesto tanto globalmente como para las cinco variables seleccionadas

Tabla 3Modelo ajustado riesgos proporcionales Cox

Financial Ratio Β exp(β) se(β) z Pr(gt|z|) Sig

Currentliabilitiestototalassets (1053) 0349 0531 -1984 0047

Netincometototalassets (14840) 0000 1941 -7646 0000

Nocreditinterval (0004) 0996 0002 -2331 0020

Quickassetstosales 0681 1977 0305 2234 0026

Quickassetstototalassets 1345 3836 0532 2527 0012

Likelihood ratio test= 9453 on 5 df p=0Wald test = 7948 on 5 df p=111e-15Score (logrank) test = 8555 on 5 df p=111e-16

Ilustracioacuten 2Evolucioacuten del AUC en Modelo Cox

------

Ilustracioacuten 3Graacutefico de la funcioacuten de supervivencia Modelo CPH

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 6: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

Controles Dinaacutemicos Individuos donde por lo que no presentan fallo antes del tiempordquoDado lo anterior las extensiones de la definicioacuten de la curva ROC para eventos dependientesdel tiempo surgen por la eleccioacuten de un tipo de casos (incidentes o acumulativos) y un tipode controles (estaacuteticos o dinaacutemicos) dando lugar a tres posibles exposiciones de la curvaROC

Acumulativo-Dinaacutemico (Heagerty Lumley amp Pepe 2000) Sensibilidad acumulada yespecificidad dinaacutemica En cualquier tiempo fijo el conjunto de empresas estudiadas puede serclasificada o bien como un caso o como un control Lo anterior es posible porque cada compantildeiacuteadesempentildea el rol de un control para un tiempo pero luego contribuye como un caso paratiempos Incidente-Estaacutetico (Etzioni et al 1999 y Slate amp Turnbull 2000) Sensibilidad y especificidadtiempo-dependiente Los casos son etiquetados seguacuten el momento en el que el evento ocurre ylos controles son definidos como aquellas sociedades que durante todo el tiempo de estudionunca cayeron en quiebraIncidente-Dinaacutemico Caso considerado en este estudio Un compantildeiacutea puede desempentildear el rol decontrol para un tiempo cercano pero luego desempentildear el caso cuando Esta definicioacutenpresenta las siguientes caracteriacutesticas- La sensibilidad incidente y la especificidad dinaacutemica son definidas por clasificar el riesgodeterminado en el tiempo entre aquellos en los que se observoacute la bancarrota (casos) y aquellosen los que se observoacute la supervivencia (controles) siendo por tanto usado en el modelo de CoxLas definiciones de sensibilidad (incidente) y especificidad (dinaacutemica) son faacutecilmente reescritasteniendo en cuenta la dependencia del tiempo y la variable longitudinal

De acuerdo con lo anterior es fundamental tener en cuenta que

Los verdaderos positivos (TPF) pueden ser una funcioacuten decreciente en el tiempo y en suestimacioacuten se considera la censura en el tiempoEn algunas situaciones la sensibilidad podriacutea depender no solo de y de la ventana de tiempoDebido a que los grupos de control variacutean con el tiempo el eje de las abscisas de la curva ROCtambieacuten cambia por lo tanto resulta maacutes difiacutecil interpretar tendencias en el tiempo en estascurvas

Para la evaluacioacuten de los modelos de este estudio el criterio que se utilizoacute fue el AUC y dadoque la caracteriacutestica de la curva de ROC es Incidente-Dinaacutemico entonces es posiblepromediar los AUC en el tiempo Por tanto el mejor modelo seleccionado es aquel con mayorpromedio de AUC en la ventana de tiempo definida

242 Validacioacuten CruzadaLa evaluacioacuten de desempentildeo sobre los modelos predictivos ya calibrados se realizoacute mediantevalidacioacuten cruzada teacutecnica que se usa en el aprendizaje automaacutetico para evaluar tanto lavariabilidad de un conjunto de datos como la confiabilidad del modelo entrenadoLa validacioacuten cruzada divide aleatoriamente los datos en varias particiones y cada una ellases fraccionada en conjunto de datos de entrenamiento y validacioacuten para cada muestra deentrenamiento se crea un modelo que luego es probado en la muestra de validacioacuten Cuandoel proceso de construccioacuten y evaluacioacuten se completa para todos las muestras se genera unconjunto de medidas de rendimiento (AUC) y resultados para todos los datosAl comparar las estadiacutesticas para todas las particiones se puede evaluar la confiabilidad yprecisioacuten de las predicciones ademaacutes de interpretar la calidad del conjunto de datos ycomprender si el modelo es susceptible a variaciones en la informacioacuten

3 DatosLa muestra de estudio fue tomada a partir de la informacioacuten reportada para consulta puacuteblicapor las sociedades sujetas a vigilancia y control por parte de la Superintendencia deSociedades A traveacutes del sistema de Informacioacuten y Reporte Empresarial - SIREM ndash fueposible consultar los Estados Financieros anuales reportados por las compantildeiacuteas bajo estudioSe obtuvieron todos los estados financieros reportados desde el antildeo 2000 hasta el antildeo 2015y se consolidaron las sociedades que reportaron informacioacuten encontrando en total 48600

sociedades con al menos el reporte de un estado financiero en el horizonte de tiempoanalizado Con base en la Clasificacioacuten Industrial Internacional Uniforme (coacutedigo CIIU) sedefinieron 45 tipos de actividades asociadas al sector retailUna de las mayores dificultades en el desarrollo de este tipo de estudios es la obtencioacuten dela variable que describe el momento en el cual se considera que una sociedad entra enbancarrota debido a que esta informacioacuten no se encuentra explicita en los estadosfinancieros o reportes realizados por las sociedadesPara dar solucioacuten a este problema se realizoacute una revisioacuten de los sistemas de reporteexistentes en las entidades que regulan y vigilan las sociedades (SuperintendenciasCaacutemaras de comercio direccioacuten de impuestos) de esta forma se identificoacute el sistema puacuteblicode informacioacuten Baranda Virtual de la Superintendencia de Sociedades el cual permiteobtener informacioacuten acerca de cambios de estado procesos avisos autos y resolucionespuntuales de cada sociedad A partir del entendimiento del proceso de liquidacioacuten de lassociedades se identificaron los criterios de reorganizacioacuten liquidacioacuten u otro asociado alcese de actividades Con base en esto se establecioacute el criterio de bancarrota a partir de lasfechas de cambios de estado y procesos asociados a liquidacioacuten o reorganizacioacutenLa consulta de informacioacuten en Baranda Virtual se debiacutea realizar puntualmente a traveacutes de unformulario de buacutesqueda por nuacutemero de NIT teniendo en cuenta la cantidad de sociedades aconsultar se requirioacute un desarrollo adicional para obtener masivamente la informacioacuten Paraesto se implementoacute un proceso de web scraping en lenguaje de programacioacuten Python con elcual se accedioacute de forma automaacutetica y remota a la aplicacioacuten y se obtuvo toda lainformacioacuten acerca de la sociedad etapas y causas de su estado actual asiacute como las fechasrelevantes (constitucioacuten estado etapa situacioacuten) A partir de dicha informacioacuten fue posiblegenerar la variable respuesta asociada al evento de bancarrota y el momento del tiempo enque sucedioacuteEl estudio se centroacute en analizar las sociedades que reportaron informacioacuten en el antildeo 2007con el fin de tener una ventana de tiempo de 10 antildeos en los cuales el nuacutemero de empresasen estado de bancarrota fuera significativo Asiacute las cosas el panel final de datos antes delanaacutelisis exploratorio quedoacute constituido por 4048 sociedades del sector minorista Para ladefinicioacuten y caacutelculo de las razones financieras utilizadas como predictores se tomaron encuenta los 21 indicadores [5] propuestos por Valencia et al (2014) detallados en la Tabla 1

Tabla 1Razones financieras consideradas como predictores

Una vez calculadas las razones se realizoacute un anaacutelisis descriptivo de la informacioacuten ydeteccioacuten de valores atiacutepicos mediante el algoritmo LOF (Breunig et al (2000)) de acuerdocon esto se excluyeron 137 sociedades Uno de los principales enfoques de este trabajo hasido garantizar la calidad de la informacioacuten centraacutendose en entender desde el origen de losdatos posibles errores u omisiones en lo que se reporta a la entidad reguladora A partir de

esto y con base en los resultados obtenidos en el presente estudio retirar de la base dedatos aquellos registros cuya informacioacuten de ingresos operacionales sean cero o uno enlugar de imputarlos permitiraacute capturar el comportamiento real de la base de datos ya quede tomar la segunda opcioacuten se estariacutea realizando suposiciones fuertes sobre las ventasrealizadas por las empresas en el antildeo de reporte y con la cual se estiman aproximadamentenueve razones financieras utilizadas dentro del anaacutelisisSe eliminaron variables que presentan correlaciones superiores a 08 criterio sugerido porGujarati (1988) (Partington amp Kim 2008) tales como capital de trabajo sobre activos totales(working capital to total assets) deudas totales sobre activos totales (total liabilities to totalassets) ingreso neto sobre ventas (net income to sales) Por uacuteltimo siguiendo el enfoque deShumway (2001) para reducir la influencia de los valores atiacutepicos se realizoacute un truncado delos datos en cada variable para los valores inferiores al primer percentil y superiores alpercentil 99La muestra final es de 3911 sociedades de las cuales 372 (951) presentaron bancarrotaen la ventana de tiempo de 10 antildeos La Tabla 2 presenta las sociedades que cayeron eninsolvencia antildeo a antildeo durante la ventana de estudio En la Ilustracioacuten 1 se presenta unresumen de todo el proceso de mineriacutea de datos anaacutelisis y depuracioacuten que se realizoacute

Tabla 2Clasificacioacuten de estado de sociedades en la ventana de estudio

Antildeo 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Total

Censura 0 0 0 0 0 0 0 0 0 3539 3539

Bancarrota 20 35 53 38 44 56 55 35 23 13 372

Ilustracioacuten 1Proceso mineriacutea de datos anaacutelisis y depuracioacuten de la informacioacuten

4 Resultados

41 Modelo de riesgos proporcionales de CoxPara la seleccioacuten del modelo de regresioacuten de Cox tal como se menciona en la seccioacuten 2 seaplicoacute la teacutecnica de buacutesqueda exhaustiva para hallar la mejor combinacioacuten de variablesposibles tomando como medida de desempentildeo el promedio de los AUC en la ventana detiempo analizada Mediante un proceso de validacioacuten cruzada (3-Fold Cross-Validation) seevaluaron 262144 subconjuntos resultados de la combinacioacuten de 18 variables El tiempo deejecucioacuten de todos los modelos fue de 15 horas de forma secuencial por una sola maacutequina[5]Se seleccionoacute un modelo de cinco variables el cual presentoacute el mejor desempentildeo promedioen las muestras de validacioacuten con un AUC = 06825 La Ilustracioacuten 2 presenta elcomportamiento del mejor AUC de acuerdo con la cantidad de variables Se puede observarcoacutemo existe un punto maacuteximo donde se obtiene el mejor AUC y a medida que se aumenta elnuacutemero de predictores el desempentildeo empeora esto se asocia con el sobreajusteLas variables seleccionadas los coeficientes estimados y sus medidas de validacioacuten sepresentan en la Tabla 3 En este caso todas las variables son significativas al 5 El modeloes aceptable para cualquiera de los tres criterios de test de razoacuten de verosimilitud y pruebade WaldSe validoacute el ajuste del modelo de regresioacuten de Cox con la hipoacutetesis fundamental de que losriesgos son proporcionales encontrando que no existen evidencias significativas al 5 deque se viole este supuesto tanto globalmente como para las cinco variables seleccionadas

Tabla 3Modelo ajustado riesgos proporcionales Cox

Financial Ratio Β exp(β) se(β) z Pr(gt|z|) Sig

Currentliabilitiestototalassets (1053) 0349 0531 -1984 0047

Netincometototalassets (14840) 0000 1941 -7646 0000

Nocreditinterval (0004) 0996 0002 -2331 0020

Quickassetstosales 0681 1977 0305 2234 0026

Quickassetstototalassets 1345 3836 0532 2527 0012

Likelihood ratio test= 9453 on 5 df p=0Wald test = 7948 on 5 df p=111e-15Score (logrank) test = 8555 on 5 df p=111e-16

Ilustracioacuten 2Evolucioacuten del AUC en Modelo Cox

------

Ilustracioacuten 3Graacutefico de la funcioacuten de supervivencia Modelo CPH

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 7: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

sociedades con al menos el reporte de un estado financiero en el horizonte de tiempoanalizado Con base en la Clasificacioacuten Industrial Internacional Uniforme (coacutedigo CIIU) sedefinieron 45 tipos de actividades asociadas al sector retailUna de las mayores dificultades en el desarrollo de este tipo de estudios es la obtencioacuten dela variable que describe el momento en el cual se considera que una sociedad entra enbancarrota debido a que esta informacioacuten no se encuentra explicita en los estadosfinancieros o reportes realizados por las sociedadesPara dar solucioacuten a este problema se realizoacute una revisioacuten de los sistemas de reporteexistentes en las entidades que regulan y vigilan las sociedades (SuperintendenciasCaacutemaras de comercio direccioacuten de impuestos) de esta forma se identificoacute el sistema puacuteblicode informacioacuten Baranda Virtual de la Superintendencia de Sociedades el cual permiteobtener informacioacuten acerca de cambios de estado procesos avisos autos y resolucionespuntuales de cada sociedad A partir del entendimiento del proceso de liquidacioacuten de lassociedades se identificaron los criterios de reorganizacioacuten liquidacioacuten u otro asociado alcese de actividades Con base en esto se establecioacute el criterio de bancarrota a partir de lasfechas de cambios de estado y procesos asociados a liquidacioacuten o reorganizacioacutenLa consulta de informacioacuten en Baranda Virtual se debiacutea realizar puntualmente a traveacutes de unformulario de buacutesqueda por nuacutemero de NIT teniendo en cuenta la cantidad de sociedades aconsultar se requirioacute un desarrollo adicional para obtener masivamente la informacioacuten Paraesto se implementoacute un proceso de web scraping en lenguaje de programacioacuten Python con elcual se accedioacute de forma automaacutetica y remota a la aplicacioacuten y se obtuvo toda lainformacioacuten acerca de la sociedad etapas y causas de su estado actual asiacute como las fechasrelevantes (constitucioacuten estado etapa situacioacuten) A partir de dicha informacioacuten fue posiblegenerar la variable respuesta asociada al evento de bancarrota y el momento del tiempo enque sucedioacuteEl estudio se centroacute en analizar las sociedades que reportaron informacioacuten en el antildeo 2007con el fin de tener una ventana de tiempo de 10 antildeos en los cuales el nuacutemero de empresasen estado de bancarrota fuera significativo Asiacute las cosas el panel final de datos antes delanaacutelisis exploratorio quedoacute constituido por 4048 sociedades del sector minorista Para ladefinicioacuten y caacutelculo de las razones financieras utilizadas como predictores se tomaron encuenta los 21 indicadores [5] propuestos por Valencia et al (2014) detallados en la Tabla 1

Tabla 1Razones financieras consideradas como predictores

Una vez calculadas las razones se realizoacute un anaacutelisis descriptivo de la informacioacuten ydeteccioacuten de valores atiacutepicos mediante el algoritmo LOF (Breunig et al (2000)) de acuerdocon esto se excluyeron 137 sociedades Uno de los principales enfoques de este trabajo hasido garantizar la calidad de la informacioacuten centraacutendose en entender desde el origen de losdatos posibles errores u omisiones en lo que se reporta a la entidad reguladora A partir de

esto y con base en los resultados obtenidos en el presente estudio retirar de la base dedatos aquellos registros cuya informacioacuten de ingresos operacionales sean cero o uno enlugar de imputarlos permitiraacute capturar el comportamiento real de la base de datos ya quede tomar la segunda opcioacuten se estariacutea realizando suposiciones fuertes sobre las ventasrealizadas por las empresas en el antildeo de reporte y con la cual se estiman aproximadamentenueve razones financieras utilizadas dentro del anaacutelisisSe eliminaron variables que presentan correlaciones superiores a 08 criterio sugerido porGujarati (1988) (Partington amp Kim 2008) tales como capital de trabajo sobre activos totales(working capital to total assets) deudas totales sobre activos totales (total liabilities to totalassets) ingreso neto sobre ventas (net income to sales) Por uacuteltimo siguiendo el enfoque deShumway (2001) para reducir la influencia de los valores atiacutepicos se realizoacute un truncado delos datos en cada variable para los valores inferiores al primer percentil y superiores alpercentil 99La muestra final es de 3911 sociedades de las cuales 372 (951) presentaron bancarrotaen la ventana de tiempo de 10 antildeos La Tabla 2 presenta las sociedades que cayeron eninsolvencia antildeo a antildeo durante la ventana de estudio En la Ilustracioacuten 1 se presenta unresumen de todo el proceso de mineriacutea de datos anaacutelisis y depuracioacuten que se realizoacute

Tabla 2Clasificacioacuten de estado de sociedades en la ventana de estudio

Antildeo 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Total

Censura 0 0 0 0 0 0 0 0 0 3539 3539

Bancarrota 20 35 53 38 44 56 55 35 23 13 372

Ilustracioacuten 1Proceso mineriacutea de datos anaacutelisis y depuracioacuten de la informacioacuten

4 Resultados

41 Modelo de riesgos proporcionales de CoxPara la seleccioacuten del modelo de regresioacuten de Cox tal como se menciona en la seccioacuten 2 seaplicoacute la teacutecnica de buacutesqueda exhaustiva para hallar la mejor combinacioacuten de variablesposibles tomando como medida de desempentildeo el promedio de los AUC en la ventana detiempo analizada Mediante un proceso de validacioacuten cruzada (3-Fold Cross-Validation) seevaluaron 262144 subconjuntos resultados de la combinacioacuten de 18 variables El tiempo deejecucioacuten de todos los modelos fue de 15 horas de forma secuencial por una sola maacutequina[5]Se seleccionoacute un modelo de cinco variables el cual presentoacute el mejor desempentildeo promedioen las muestras de validacioacuten con un AUC = 06825 La Ilustracioacuten 2 presenta elcomportamiento del mejor AUC de acuerdo con la cantidad de variables Se puede observarcoacutemo existe un punto maacuteximo donde se obtiene el mejor AUC y a medida que se aumenta elnuacutemero de predictores el desempentildeo empeora esto se asocia con el sobreajusteLas variables seleccionadas los coeficientes estimados y sus medidas de validacioacuten sepresentan en la Tabla 3 En este caso todas las variables son significativas al 5 El modeloes aceptable para cualquiera de los tres criterios de test de razoacuten de verosimilitud y pruebade WaldSe validoacute el ajuste del modelo de regresioacuten de Cox con la hipoacutetesis fundamental de que losriesgos son proporcionales encontrando que no existen evidencias significativas al 5 deque se viole este supuesto tanto globalmente como para las cinco variables seleccionadas

Tabla 3Modelo ajustado riesgos proporcionales Cox

Financial Ratio Β exp(β) se(β) z Pr(gt|z|) Sig

Currentliabilitiestototalassets (1053) 0349 0531 -1984 0047

Netincometototalassets (14840) 0000 1941 -7646 0000

Nocreditinterval (0004) 0996 0002 -2331 0020

Quickassetstosales 0681 1977 0305 2234 0026

Quickassetstototalassets 1345 3836 0532 2527 0012

Likelihood ratio test= 9453 on 5 df p=0Wald test = 7948 on 5 df p=111e-15Score (logrank) test = 8555 on 5 df p=111e-16

Ilustracioacuten 2Evolucioacuten del AUC en Modelo Cox

------

Ilustracioacuten 3Graacutefico de la funcioacuten de supervivencia Modelo CPH

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 8: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

esto y con base en los resultados obtenidos en el presente estudio retirar de la base dedatos aquellos registros cuya informacioacuten de ingresos operacionales sean cero o uno enlugar de imputarlos permitiraacute capturar el comportamiento real de la base de datos ya quede tomar la segunda opcioacuten se estariacutea realizando suposiciones fuertes sobre las ventasrealizadas por las empresas en el antildeo de reporte y con la cual se estiman aproximadamentenueve razones financieras utilizadas dentro del anaacutelisisSe eliminaron variables que presentan correlaciones superiores a 08 criterio sugerido porGujarati (1988) (Partington amp Kim 2008) tales como capital de trabajo sobre activos totales(working capital to total assets) deudas totales sobre activos totales (total liabilities to totalassets) ingreso neto sobre ventas (net income to sales) Por uacuteltimo siguiendo el enfoque deShumway (2001) para reducir la influencia de los valores atiacutepicos se realizoacute un truncado delos datos en cada variable para los valores inferiores al primer percentil y superiores alpercentil 99La muestra final es de 3911 sociedades de las cuales 372 (951) presentaron bancarrotaen la ventana de tiempo de 10 antildeos La Tabla 2 presenta las sociedades que cayeron eninsolvencia antildeo a antildeo durante la ventana de estudio En la Ilustracioacuten 1 se presenta unresumen de todo el proceso de mineriacutea de datos anaacutelisis y depuracioacuten que se realizoacute

Tabla 2Clasificacioacuten de estado de sociedades en la ventana de estudio

Antildeo 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Total

Censura 0 0 0 0 0 0 0 0 0 3539 3539

Bancarrota 20 35 53 38 44 56 55 35 23 13 372

Ilustracioacuten 1Proceso mineriacutea de datos anaacutelisis y depuracioacuten de la informacioacuten

4 Resultados

41 Modelo de riesgos proporcionales de CoxPara la seleccioacuten del modelo de regresioacuten de Cox tal como se menciona en la seccioacuten 2 seaplicoacute la teacutecnica de buacutesqueda exhaustiva para hallar la mejor combinacioacuten de variablesposibles tomando como medida de desempentildeo el promedio de los AUC en la ventana detiempo analizada Mediante un proceso de validacioacuten cruzada (3-Fold Cross-Validation) seevaluaron 262144 subconjuntos resultados de la combinacioacuten de 18 variables El tiempo deejecucioacuten de todos los modelos fue de 15 horas de forma secuencial por una sola maacutequina[5]Se seleccionoacute un modelo de cinco variables el cual presentoacute el mejor desempentildeo promedioen las muestras de validacioacuten con un AUC = 06825 La Ilustracioacuten 2 presenta elcomportamiento del mejor AUC de acuerdo con la cantidad de variables Se puede observarcoacutemo existe un punto maacuteximo donde se obtiene el mejor AUC y a medida que se aumenta elnuacutemero de predictores el desempentildeo empeora esto se asocia con el sobreajusteLas variables seleccionadas los coeficientes estimados y sus medidas de validacioacuten sepresentan en la Tabla 3 En este caso todas las variables son significativas al 5 El modeloes aceptable para cualquiera de los tres criterios de test de razoacuten de verosimilitud y pruebade WaldSe validoacute el ajuste del modelo de regresioacuten de Cox con la hipoacutetesis fundamental de que losriesgos son proporcionales encontrando que no existen evidencias significativas al 5 deque se viole este supuesto tanto globalmente como para las cinco variables seleccionadas

Tabla 3Modelo ajustado riesgos proporcionales Cox

Financial Ratio Β exp(β) se(β) z Pr(gt|z|) Sig

Currentliabilitiestototalassets (1053) 0349 0531 -1984 0047

Netincometototalassets (14840) 0000 1941 -7646 0000

Nocreditinterval (0004) 0996 0002 -2331 0020

Quickassetstosales 0681 1977 0305 2234 0026

Quickassetstototalassets 1345 3836 0532 2527 0012

Likelihood ratio test= 9453 on 5 df p=0Wald test = 7948 on 5 df p=111e-15Score (logrank) test = 8555 on 5 df p=111e-16

Ilustracioacuten 2Evolucioacuten del AUC en Modelo Cox

------

Ilustracioacuten 3Graacutefico de la funcioacuten de supervivencia Modelo CPH

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 9: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

4 Resultados

41 Modelo de riesgos proporcionales de CoxPara la seleccioacuten del modelo de regresioacuten de Cox tal como se menciona en la seccioacuten 2 seaplicoacute la teacutecnica de buacutesqueda exhaustiva para hallar la mejor combinacioacuten de variablesposibles tomando como medida de desempentildeo el promedio de los AUC en la ventana detiempo analizada Mediante un proceso de validacioacuten cruzada (3-Fold Cross-Validation) seevaluaron 262144 subconjuntos resultados de la combinacioacuten de 18 variables El tiempo deejecucioacuten de todos los modelos fue de 15 horas de forma secuencial por una sola maacutequina[5]Se seleccionoacute un modelo de cinco variables el cual presentoacute el mejor desempentildeo promedioen las muestras de validacioacuten con un AUC = 06825 La Ilustracioacuten 2 presenta elcomportamiento del mejor AUC de acuerdo con la cantidad de variables Se puede observarcoacutemo existe un punto maacuteximo donde se obtiene el mejor AUC y a medida que se aumenta elnuacutemero de predictores el desempentildeo empeora esto se asocia con el sobreajusteLas variables seleccionadas los coeficientes estimados y sus medidas de validacioacuten sepresentan en la Tabla 3 En este caso todas las variables son significativas al 5 El modeloes aceptable para cualquiera de los tres criterios de test de razoacuten de verosimilitud y pruebade WaldSe validoacute el ajuste del modelo de regresioacuten de Cox con la hipoacutetesis fundamental de que losriesgos son proporcionales encontrando que no existen evidencias significativas al 5 deque se viole este supuesto tanto globalmente como para las cinco variables seleccionadas

Tabla 3Modelo ajustado riesgos proporcionales Cox

Financial Ratio Β exp(β) se(β) z Pr(gt|z|) Sig

Currentliabilitiestototalassets (1053) 0349 0531 -1984 0047

Netincometototalassets (14840) 0000 1941 -7646 0000

Nocreditinterval (0004) 0996 0002 -2331 0020

Quickassetstosales 0681 1977 0305 2234 0026

Quickassetstototalassets 1345 3836 0532 2527 0012

Likelihood ratio test= 9453 on 5 df p=0Wald test = 7948 on 5 df p=111e-15Score (logrank) test = 8555 on 5 df p=111e-16

Ilustracioacuten 2Evolucioacuten del AUC en Modelo Cox

------

Ilustracioacuten 3Graacutefico de la funcioacuten de supervivencia Modelo CPH

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 10: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

Currentliabilitiestototalassets (1053) 0349 0531 -1984 0047

Netincometototalassets (14840) 0000 1941 -7646 0000

Nocreditinterval (0004) 0996 0002 -2331 0020

Quickassetstosales 0681 1977 0305 2234 0026

Quickassetstototalassets 1345 3836 0532 2527 0012

Likelihood ratio test= 9453 on 5 df p=0Wald test = 7948 on 5 df p=111e-15Score (logrank) test = 8555 on 5 df p=111e-16

Ilustracioacuten 2Evolucioacuten del AUC en Modelo Cox

------

Ilustracioacuten 3Graacutefico de la funcioacuten de supervivencia Modelo CPH

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 11: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

Interpretando las salidas se concluye que los ratios de liquidez (quick assets to total assetsy quick assets to sales) aumentan la razoacuten de riesgo a medida que su valor se incrementamientras que las razones de apalancamiento (current liabilities to total asset) y derentabilidad (net income to total assets) reducen la razoacuten de riesgo a medida que su valoraumentaLa Tabla 4 presenta los coeficientes β y exp(β) de cada una de las variables en mencioacuten

Tabla 4Interpretacioacuten de variables significativas

Financial Ratio Tipo β exp(β)

Current liabilities to total assets Apalancamiento (1053) 0349

Net income to total assets Rentabilidad (14840) 0000

No credit interval Liquidez (0004) 0996

Quick assets to sales Liquidez 0681 1977

Quick assets to total assets Liquidez 1345 3836

De acuerdo con esto se observa que bajo el resultado del modelo de regresioacuten de Cox parauna empresa del sector retail una reduccioacuten en la liquidez aumenta la razoacuten de riesgo debancarrota y un aumento de la rentabilidad lo reduce Lo cual es congruente con ladinaacutemica del sector estudiado

42 Modelo Aditivo Generalizado para riesgos proporcionalesde CoxAl igual que para los modelos de Cox se aplica el meacutetodo de seleccioacuten exhaustiva generando262144 combinaciones de variables diferentes para las cuales se realizoacute un ajuste con 3fold Cross-Validation Para la seleccioacuten exhaustiva fue necesario ejecutar los modelos envarios equipos dado que el tiempo computacional es mucho mayor que con un modelo linealpara esto se utilizaron ocho equipos para un periodo de ejecucioacuten de 1300 horas LaIlustracioacuten 4 presenta el comportamiento del mejor AUC de acuerdo con la cantidad devariables

Ilustracioacuten 4Evolucioacuten del AUC en Modelo Gam

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 12: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

El modelo con mejor desempentildeo se encuentra dentro del grupo de cuatro variables con unAUC promedio de 0689 La Tabla 5 presenta las variables significativas evaluadas a un nivelde significancia del 5

Tabla 5Interpretacioacuten de variables significativas

Financial Ratio Edf Refdf Chisq P-value Sig

Cash interval 1004 1009 2185 01397

Net income to total assets 3150 3863 128110 lt2e-16

Net worth to total sales 1994 2444 11137 00101

Quick assets to sales 2162 2658 9997 00195

En general se obtiene una curva de supervivencia (Ilustracioacuten 5) donde se puede inferir quepara el sector de comercio minorista en Colombia con la informacioacuten analizada el riesgo deentrar en estado de liquidacioacuten es bajo (probabilidad inferior al 10)

Ilustracioacuten 5Curva supervivencia modelo GAM

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 13: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

Dentro de las variables incluidas en el modelo el indicador Cash interval describe el nivel deefectivo del cual se dispone para cubrir los gastos de operacioacuten Para este caso dichavariable refleja un comportamiento lineal directo sobre el riesgo de bancarrotade unaempresa (Ilustracioacuten 6)Al analizar la variable ingreso neto sobre total de activos (net income to total assets) sepuede evidenciar que la relacioacuten es no lineal con respecto al estreacutes financiero Esto permitetener una mayor claridad de su efecto dado que bajo el modelo de Cox la intuicioacuten que seteniacutea era que mientras maacutes alta la capacidad de generar ingresos por cada peso del activo(mayor rentabilidad) menor era el riesgo al que estaba expuesta la firma sin embargocomo se puede observar en la Ilustracioacuten 7 hay un determinado punto (01) a partir delcual el incremento en los niveles de rentabilidad de la empresa no implica una reduccioacutentotal del riesgo de bancarrota

Ilustracioacuten 6Efecto de la variable Cash Interval sobre razoacuten riesgo de bancarrota

-----

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 14: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

Ilustracioacuten 7Efecto de la variable Net income to total assets

Para la variable Net worth to sales (ventas generadas con el patrimonio que se tiene) elefecto estaacute compuesto por dos segmentos uno constante para valores inferiores a 02 en elindicador y otro que genera una disminucioacuten en la razoacuten de riesgo una vez que se supera elvalor mencionado En teacuterminos financieros se puede concluir que un alto valor en estavariable implica que el nivel de ventas alcanzado es maacutes que suficiente para respaldar susobligaciones (Ilustracioacuten 8)

Ilustracioacuten 8Efecto de la variable Net worth to sales

Finalmente la variable Quick assets to sales refleja un comportamiento no lineal sobre elriesgo de quiebra para las compantildeiacuteas de retail en Colombia Esto desde el punto de vista dela informacioacuten que captura la variable indica que el porcentaje que representan los activosliacutequidos sobre las ventas tiene un impacto inverso sobre la razoacuten de riesgo siempre y cuandosea inferior a 05 A partir de dicho punto este indicador tendraacute un impacto positivo sobre laprobabilidad de bancarrota (Ilustracioacuten 9)

Ilustracioacuten 9Efecto de la variable Quick assets to sales

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 15: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

5 Conclusiones y discusioacutenLa situacioacuten de insolvencia causa efectos colaterales en la sociedad de ahiacute la importancia dedesarrollar herramientas analiacuteticas para predecir el estreacutes financiero y determinar losfactores econoacutemicos relevantes Las entidades reguladoras encargadas de la vigilancia ycontrol de las sociedades comerciales deben incorporar en sus procesos de solicitud deinformacioacuten toda aquella relacionada con estreacutes financiero y bancarrota Facilitar el acceso aesta informacioacuten al sector acadeacutemico y teacutecnico permitiraacute el desarrollo de estudios queconlleven al entendimiento y faciliten una mejor toma de decisiones por parte del entegubernamental En este proyecto se pretende aportar a la investigacioacuten econoacutemicacolombiana apoyado en la mineriacutea de datos y buscando extrapolar ejercicios acadeacutemicos ainformacioacuten real del paiacutes que luego pueden ser utilizados en la obtencioacuten de resultados maacutesprecisos de prediccioacuten y que permitan ser una herramienta de soporte en la toma dedecisionesA diferencia de las aplicaciones claacutesicas para prediccioacuten de bancarrota donde se conoce parauna ventana de tiempo fija e inamovible la estimacioacuten con base en unas variablesindependientes el anaacutelisis de supervivencia ademaacutes de estimar una razoacuten de riesgo enfuncioacuten del tiempo permite a las entidades reguladoras generar alertas y ser proactiva ensus acciones de vigilancia y control orientadas a mitigar dicho riesgo en el corto mediano olargo plazo seguacuten cada distribucioacuten Esto derivaraacute en mayor eficiencia en el esfuerzo que serealice y una mayor efectividad en el proceso de intervencioacutenEn los estudios de supervivencia para predecir bancarrota existe la limitante de obtener elmomento exacto en el que una compantildeiacutea entra en estado de liquidacioacuten Algunos trabajospresentan metodologiacuteas para inferir esta informacioacuten a partir de la suspensioacuten de reportesfinancieros de un antildeo al siguiente sin embargo este proyecto presenta un aporte relevanteal construir una metodologiacutea para identificar el momento en el que ocurre la bancarrota atraveacutes de la obtencioacuten de los estados financieros y el entendimiento de la informacioacutenpuacuteblica acerca del proceso de insolvencia asiacute como la identificacioacuten de caracteriacutesticas deliquidacioacuten no asociadas al desempentildeo econoacutemico tales como fusiones liquidacioacutenvoluntaria entre otrosAunque la regresioacuten de Cox es una metodologiacutea muy utilizada para analizar el efecto de lascovariables en el contexto financiero es importante tener precaucioacuten ya que este modeloestaacute sujeto al cumplimiento de supuestos de riesgos proporcionales covariables invariantesen el tiempo y relacioacuten lineal entre la funcioacuten de riesgo y los predictores En consecuencia siel supuesto de riesgos proporcionales no se cumple los resultados bajo el modelo de Cox noson los maacutes adecuados una alternativa es utilizar Modelos Aditivos Generalizados (GAM)que incorpora funciones no parameacutetricas que se adaptan a la estructura no lineal de los

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 16: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

datos manteniendo la interpretabilidad y mejorando el entendimiento del efecto de lospredictores Asiacute mismo el tratamiento o no de valores atiacutepicos afecta significativamente eldesempentildeo de los modelos lineales como la regresioacuten de Cox Caso contrario ocurre con losmodelos GAM que a partir de su capacidad de ajuste mediante la suavizacioacuten de susfunciones permiten capturar de una mejor manera el comportamiento de estos valores yreflejarlos en la funcioacuten resultante

Referencias bibliograacuteficasAbogados Bogotaacute (2015) Gestion compartida Obtenido dehttpswwwgestioncompartidacomsitiobeneficios-y-requisitos-de-la-ley-1429-de-2010-actualizacionAltman E I (1968) Financial Ratios Discriminant Analysis and the Prediction of CorporateBankruptcy American Finance Association 589-609Argyropoulos C amp Unruh M L (2015) Analysis of Time to Event Outcomes in RandomizedControlled Trials by Generalized Additive Models Albuquerque New Mexico United States ofAmerica Department of Internal Medicine Division of Nephrology University of New MexicoAtiya A F (2001) Bankruptcy Prediction for Credit Risk Using Neural Networks A Surveyand New Results IEEE TRANSACTIONS ON NEURAL NETWORKS 12(4) 929 - 935Beaver W H McNichols M F amp Rhie J-w (2005) Have Financial Statements BecomeLess Informative Evidence from the Ability of Financial Ratios to Predict Bankruptcy Reviewof Accounting Studies 10 93ndash122Bellovary J L Giacomino D amp Akers M D (2007) A Review of Bankruptcy PredictionStudies 1930-Present Journal of Financial Education 33 1-42Benavides A R (2017) Curvas ROC (Receiver-Operating-Characteristic) y sus aplicacionesUniversidad de Sevilla Sevilla Departamento de Estadiacutestica e Investigacioacuten OperativaObtenido de httphdlhandlenet1144163201Chouldechova A amp Hastie T (2015) Generalized additive model selectionGoacutemez J E Hinojosa I P amp Zamudio N E (2006) Anaacutelisis de la probabilidad condicionalde incumplimiento de los mayores deudores privados del sistema financiero colombianoTemas de Estabilidad Financiera Banco de la RepuacuteblicaGoacutemez-Gonzalez J E amp Kiefer N M (2006) Explaining time to bank failure in ColombiaBorradores de economiacutea Estudios Econoacutemicos del Banco de la RepuacuteblicaGrice J S amp Dugan M T (2001) The Limitations of Bankruptcy Prediction Models SomeCautions for the Researcher Review of Quantitative Finance and Accounting 17151-166Heagerty P J amp Zheng Y (2005) Survival Model Predictive Accuracy and ROC CurvesBiometrics 92-105Heagerty P Lumley T amp Pepe M (2000) Time Dependent ROC Curves for CensoredSurvival Data and a Diagnostic Marker Biometrics 56 337-344Jackson R H amp Wood A (2013) The performance of insolvency prediction and credit riskmodels in the UK A comparative study The British Accounting Review 183 -202James G Witten D Hastie T amp Tibshirani R (2013) An Introduction to StatisticalLearning with Applications in RKim M-J amp Kang D-K (2010) Ensemble with neural networks for bankruptcy predictionExpert Systems with Applications 37(4) 3373-3379Lin F Yeh C-C amp Lee M-Y (2011) The use of hybrid manifold learning and supportvector machines in the prediction of business failure Knowledge-Based Systems 95-101Martiacutenez-Camblor P (Diciembre de 2007) Comparacioacuten de pruebas diagnoacutesticas desde lacurva ROC Revista Colombiana de Estadiacutestica 30(2) 163 a 176Martiacutenez-Camblor P (2007) Comparacioacuten de pruebas diagnoacutesticas desde la curva ROCRevista Colombiana de Estadiacutestica 30(2) 163 a 176

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 17: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

Ministerio de Comercio Industria y Turismo y la Superintendencia de Sociedades (2007)NUEVO REacuteGIMEN DE INSOLVENCIA EMPRESARIAL Bogotaacute ColombiaMogensen U B Ishwaran H amp Gerds T A (2012) Evaluating Random Forests forSurvival Analysis Using Prediction Error Curves Journal of Statistical Software 50(11) 1-23Ortiz A T (2010) Curvas ROC para Datos de Supervivencia Aplicacioacuten a DatosBiomeacutedicos Santiago de Compostela Universidad de Santiago de CompostelaPalmer Pol A L (1993) Modelo de regresioacuten de cox ejemplo numeacuterico del proceso deestimacioacuten de paraacutemetros Psicothema 5(2) 387-402doihttpwwwredalycorgarticulooaid=72705214Partington G amp Kim M H (2008) Modeling Bankruptcy Prediction Using Cox RegressionModel with Time-Varying Covariates Available at SSRN httpsssrncomabstract=1101876or httpdxdoiorg102139ssrn1101876Pereira J (2014) Survival Analysis Employed in Predicting Corporate Failure A ForecastingModel Proposal Canadian Center of Science and EducationRoyston P (2011) Estimating a smooth baseline hazard function for the Cox modelShin K-S Lee T S amp Kim H-j (2005) An application of support vector machines inbankruptcy prediction model Expert Systems with Applications 127-135Shumway T (2001) Forecasting Bankruptcy More Accurately A Simple Hazard Model TheJournal of Business 74(1) 101-124Simon N Friedman J Hastie T amp Tibshirani R (2011) Regularization Paths for CoxsProportional Hazards Model via Coordinate Descent Journal of Statistical Software 30(5) 1-13 Obtenido de httpwwwjstatsoftorgSUPERINTENDENCIA DE SOCIEDADES (2015) INFORME AUDIENCIA PUacuteBLICA RENDICIOacuteNDE CUENTAS 2015 Bogotaacute ColombiaTibshirani R (1995) The lasso method for variable selection in the cox model TorontoOntario Canada Department of Preventive Medicine and Biostatistics and Department ofStatistics University of TorontoValencia C Cabrales S Garciacutea L Ramiacuterez J amp Calderoacuten D (2016) Generalizedadditive model with embedded variable selection for bankruptcy prediction The case of theretail industry in Colombia Working paper Bogotaacute ColombiaWang G amp Ma J (2012) A hybrid ensemble approach for enterprise credit risk assessmentbased on Support Vector Machine Expert Systems with Applications 5325-5331Wilson R amp Sharda R (1994) Bankruptcy prediction using neural networks DecisionSupport Systems 545ndash557Wood S (2003) Thin-plate regression splines Journal of the Royal Statistical Society65(1) 95-114Wood S (2011) Fast stable restricted maximum likelihood and marginal likelihoodestimation of Journal of the Royal Statistical Society 73(1) 3-36Wood S N (2006) Generalized Additive Models an introduction with R Chapman andHallCRCWu Y (2012) ELASTIC NET FOR COXrsquoS PROPORTIONAL HAZARDS MODEL WITH ASOLUTION PATH ALGORITHM Statistica Sinica 22 271-294doihttpdxdoiorg105705ss2010107

1 Estadiacutestica y Magister en Inteligencia Analiacutetica Profesional especializado Direccioacuten de Investigacioacuten y desarolloSuperintendencia Financiera de Colombia Bogotaacute Colombia Correo electroacutenico ycastrouniandeseduco2 Ingeniero Eleacutectrico y Magister en Inteligencia Analiacutetica Coordinador de anaacutelisis Divisioacuten mejora de las operacionescomerciales CODENSA SA ESP Bogotaacute Colombia Correo electroacutenico cahuertasuniandeseduco3 Ingeniero de Sistemas y Magister en Inteligencia Analiacutetica Socio de negocio de Analytics MetLife Colombia segurosde vida SA Colombia Correo electroacutenico ceobando10uniandeseduco4 PhD en Ingenieriacutea industrial con especializacioacuten en estadiacutestica Magister en Estadiacutestica y Magister en Ingenieriacutea

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados

Page 18: Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis de …ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES / Index! A LOS AUTORES / To the AUTORS ! Vol. 40 (Nº 01) Año 2019. Pág. 18 Análisis

industrial Profesor del Departamento de Ingenieriacutea Industrial Universidad de os Andes Bogotaacute Colombia Correoelectroacutenico cfvalenciauniandeseduco5 En este documento se presentan las razones financieras en ingleacutes con el fin de mantener su integralidad yentendimiento con respecto a los estudios referenciados6 Procesador 240 GHz Memoria RAM 4Gb Sistema Operativo 32 bits

Revista ESPACIOS ISSN 0798 1015Vol 40 (Nordm 01) Antildeo 2019

[Iacutendice]

[En caso de encontrar alguacuten error en este website favor enviar email a webmaster]

copy2019 revistaESPACIOScom bull Derechos Reservados