waiaf (ita) 2019 · machine learning: taxonomia. 35. machine learning: feature engineering: 14...
TRANSCRIPT
![Page 1: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/1.jpg)
Machine learning applied to accounting variables yields the risk-return metrics of
private company portfolios
WAIAF (ITA) 2019
16/05/2019
www.slq.com.br
Flavio Abdenur (SLQ)Elias Cavalcante (FEA-USP)Rodrigo de Losso (FEA-USP)
![Page 2: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/2.jpg)
{Roteiro
2
• A Fronteira Eficiente e a Carteira Ótima
• O Caso de Empresas Abertas
• O Caso de Empresas Fechadas: Métodos Tradicionais
• O Caso de Empresas Fechadas: Machine Learning
• Resultados
• Possíveis Aplicações
![Page 3: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/3.jpg)
{Roteiro
3
• A Fronteira Eficiente e a Carteira Ótima
• O Caso de Empresas Abertas
• O Caso de Empresas Fechadas: Métodos Tradicionais
• O Caso de Empresas Fechadas: Machine Learning
• Resultados
• Possíveis AplicaçõesTrabalho em conjunto com Elias Cavalcante (FEA-USP) e Rodrigo de Losso(FEA-USP)
![Page 4: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/4.jpg)
{Machine Learning: Taxonomia
4
A Fronteira Eficiente e a Carteira Ótima
Figura por Elias Cavalcante
![Page 5: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/5.jpg)
{Machine Learning: Taxonomia
5
A Fronteira Eficiente e a Carteira Ótima
Carteira Ótima
Figura por Elias Cavalcante
![Page 6: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/6.jpg)
{Machine Learning: Taxonomia
6
O Caso de Empresas Abertas:Dada uma cesta CA = {A1, ..., An} de empresas abertas, como obter a carteira ótima?
![Page 7: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/7.jpg)
{Machine Learning: Taxonomia
7
O Caso de Empresas Abertas:Dada uma cesta CA = {A1, ..., An} de empresas abertas, como obter a carteira ótima?
• Temos séries de preços (diários) publicamente disponíveis, logo obtemos
diretamente volatilidade, retorno (em excesso) e covariâncias
![Page 8: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/8.jpg)
{Machine Learning: Taxonomia
8
O Caso de Empresas Abertas:Dada uma cesta CA = {A1, ..., An} de empresas abertas, como obter a carteira ótima?
• Temos séries de preços (diários) publicamente disponíveis, logo obtemos
diretamente volatilidade, retorno (em excesso) e covariâncias
• Teoria de Markowitz permite construção de fronteira eficiente e portanto da
carteira ótima lançando mão de retornos, volatilidades e covariâncias das ações
![Page 9: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/9.jpg)
{Machine Learning: Taxonomia
9
O Caso de Empresas Abertas:Dada uma cesta CA = {A1, ..., An} de empresas abertas, como obter a carteira ótima?
• Temos séries de preços (diários) publicamente disponíveis, logo obtemos
diretamente volatilidade, retorno (em excesso) e covariâncias
• Teoria de Markowitz permite construção de fronteira eficiente e portanto da
carteira ótima lançando mão de retornos, volatilidades e covariâncias das ações
• Obs: “desempenho passado não garante desempenho futuro”
![Page 10: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/10.jpg)
{Machine Learning: Taxonomia
10
O Caso de Empresas Abertas:Dada uma cesta CA = {A1, ..., An} de empresas abertas, como obter a carteira ótima?
• Temos séries de preços (diários) publicamente disponíveis, logo obtemos
diretamente volatilidade, retorno (em excesso) e covariâncias
• Teoria de Markowitz permite construção de fronteira eficiente e portanto da
carteira ótima lançando mão de retornos, volatilidades e covariâncias das ações
• Obs: “desempenho passado não garante desempenho futuro”... mas tudo bem
![Page 11: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/11.jpg)
{Machine Learning: Taxonomia
11
O Caso de Empresas Fechadas:
Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira
ótima?
![Page 12: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/12.jpg)
{Machine Learning: Taxonomia
12
O Caso de Empresas Fechadas:
Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira
ótima? – não há preços diários!
![Page 13: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/13.jpg)
{Machine Learning: Taxonomia
13
O Caso de Empresas Fechadas:
Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira
ótima? – não há preços diários!
Problema se reduz a: como obter retornos, vols, covs para gerar carteira ótima?
![Page 14: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/14.jpg)
{Machine Learning: Taxonomia
14
O Caso de Empresas Fechadas:
Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira
ótima? – não há preços diários!
Problema se reduz a: como obter retornos, vols, covs para gerar carteira ótima?
• Métodos “artesanais” de valuation geram estimativas de valor
![Page 15: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/15.jpg)
{Machine Learning: Taxonomia
15
O Caso de Empresas Fechadas:
Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira
ótima? – não há preços diários!
Problema se reduz a: como obter retornos, vols, covs para gerar carteira ótima?
• Métodos “artesanais” de valuation geram estimativas de valor, mas não séries
diárias
![Page 16: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/16.jpg)
{Machine Learning: Taxonomia
16
O Caso de Empresas Fechadas:
Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira
ótima? – não há preços diários!
Problema se reduz a: como obter retornos, vols, covs para gerar carteira ótima?
• Métodos “artesanais” de valuation geram estimativas de valor, mas não séries
diárias
• Escolha de peers / “empresas comparáveis” gera as estatísticas
![Page 17: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/17.jpg)
{Machine Learning: Taxonomia
17
O Caso de Empresas Fechadas:
Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira
ótima? – não há preços diários!
Problema se reduz a: como obter retornos, vols, covs para gerar carteira ótima?
• Métodos “artesanais” de valuation geram estimativas de valor, mas não séries
diárias
• Escolha de peers / “empresas comparáveis” gera as estatísticas, mas é muito
subjetiva
![Page 18: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/18.jpg)
{Machine Learning: Taxonomia
18
O Caso de Empresas Fechadas:
Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira
ótima? – não há preços diários!
Problema se reduz a: como obter retornos, vols, covs para gerar carteira ótima?
• Métodos “artesanais” de valuation geram estimativas de valor, mas não séries
diárias
• Escolha de peers / “empresas comparáveis” gera as estatísticas, mas é muito
subjetiva
• “Controle sintético” é elegante
![Page 19: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/19.jpg)
{Machine Learning: Taxonomia
19
O Caso de Empresas Fechadas:
Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira
ótima? – não há preços diários!
Problema se reduz a: como obter retornos, vols, covs para gerar carteira ótima?
• Métodos “artesanais” de valuation geram estimativas de valor, mas não séries
diárias
• Escolha de peers / “empresas comparáveis” gera as estatísticas, mas é muito
subjetiva
• “Controle sintético” é elegante, mas manipulável
![Page 20: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/20.jpg)
{Machine Learning: Taxonomia
20
O Caso de Empresas Fechadas:
Dada uma cesta CF = {F1, ..., Fn} de empresas fechadas, como obter a carteira
ótima? – não há preços diários!
Problema se reduz a: como obter retornos, vols, covs para gerar carteira ótima?
• Métodos “artesanais” de valuation geram estimativas de valor, mas não séries
diárias
• Escolha de peers / “empresas comparáveis” gera as estatísticas, mas é muito
subjetiva
• “Controle sintético” é elegante, mas manipulável (vide Ferman-Cristine-Possebom
2018)
![Page 21: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/21.jpg)
{Machine Learning: Taxonomia
21
Machine Learning:
Abordagem via ML, usando companhias abertas como “proxies” de fechadas:
![Page 22: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/22.jpg)
{Machine Learning: Taxonomia
22
Machine Learning:
Abordagem via ML, usando companhias abertas como “proxies” de fechadas:
• Base de ≈ 1000 empresas abertas de diversos setores, cerca de 77% nos EUA e
23% no BR
![Page 23: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/23.jpg)
{Machine Learning: Taxonomia
23
Machine Learning:
Abordagem via ML, usando companhias abertas como “proxies” de fechadas:
• Base de ≈ 1000 empresas abertas de diversos setores, cerca de 77% nos EUA e
23% no BR (obs: small- e large-caps foram purgadas)
![Page 24: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/24.jpg)
{Machine Learning: Taxonomia
24
Machine Learning:
Abordagem via ML, usando companhias abertas como “proxies” de fechadas:
• Base de ≈ 1000 empresas abertas de diversos setores, cerca de 77% nos EUA e
23% no BR (obs: small- e large-caps foram purgadas)
• Séries trimestrais de ≈ 55 características e variáveis contábeis de cada empresa
entre 2005 e 2016, via Economática
![Page 25: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/25.jpg)
{Machine Learning: Taxonomia
25
Machine Learning:
Abordagem via ML, usando companhias abertas como “proxies” de fechadas:
• Base de ≈ 1000 empresas abertas de diversos setores, cerca de 77% nos EUA e
23% no BR (obs: small- e large-caps foram purgadas)
• Séries trimestrais de ≈ 55 características e variáveis contábeis de cada empresa
entre 2005 e 2016, via Economática
• Preços (e portanto vols, rets e corrs) e juros, via Bloomberg / Nefin
![Page 26: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/26.jpg)
{Machine Learning: Taxonomia
26
Variáveis incluem:• País• Setor• EBIDTA• Alavancagem financeira• ROI• etc etc
![Page 27: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/27.jpg)
{Machine Learning: Taxonomia
27
Machine Learning:
Abordagem via ML, usando companhias abertas como “proxies” de fechadas:
• Para cada uma das variáveis v ∈ {ret, vol, corr}, meta é obter função
fv({variáveis contábeis}) ℝ ☃
![Page 28: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/28.jpg)
{Machine Learning: Taxonomia
28
Machine Learning:
Abordagem via ML, usando companhias abertas como “proxies” de fechadas:
• Para cada uma das variáveis v ∈ {ret, vol, corr}, meta é obter função
fv({variáveis contábeis}) ℝ ☃
Train / test split e tuning:
• Split 70% train / 30% test, balanceado por classes (país e setor)
• Tuning via 5-fold CV (no training set)
![Page 29: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/29.jpg)
{Machine Learning: Taxonomia
29
Machine Learning:
Feature Engineering:
14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a
cada uma das variáveis:
![Page 30: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/30.jpg)
{Machine Learning: Taxonomia
30
Machine Learning:
Feature Engineering:
14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a
cada uma das variáveis:
• Por um lado, isso “achatou” as séries em 1 observação por empresa
![Page 31: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/31.jpg)
{Machine Learning: Taxonomia
31
Machine Learning:
Feature Engineering:
14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a
cada uma das variáveis:
• Por um lado, isso “achatou” as séries em 1 observação por empresa
• Por outro, gerou algo da ordem de 14 x 50 = 700 features...
![Page 32: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/32.jpg)
{Machine Learning: Taxonomia
32
Machine Learning:
Feature Engineering:
14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a
cada uma das variáveis:
• Por um lado, isso “achatou” as séries em 1 observação por empresa
• Por outro, gerou algo da ordem de 14 x 50 = 700 features...
o que traz a necessidade de:
![Page 33: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/33.jpg)
{Machine Learning: Taxonomia
33
Machine Learning:
Feature Engineering:
14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a
cada uma das variáveis:
• Por um lado, isso “achatou” as séries em 1 observação por empresa
• Por outro, gerou algo da ordem de 14 x 50 = 700 features...
o que traz a necessidade de:
Feature Selection:
![Page 34: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/34.jpg)
{Machine Learning: Taxonomia
34
Machine Learning:
Feature Engineering:
14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a
cada uma das variáveis:
• Por um lado, isso “achatou” as séries em 1 observação por empresa
• Por outro, gerou algo da ordem de 14 x 50 = 700 features...
o que traz a necessidade de:
Feature Selection:
• LASSO para lineares e semi-lineares
![Page 35: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/35.jpg)
{Machine Learning: Taxonomia
35
Machine Learning:
Feature Engineering:
14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a
cada uma das variáveis:
• Por um lado, isso “achatou” as séries em 1 observação por empresa
• Por outro, gerou algo da ordem de 14 x 50 = 700 features...
o que traz a necessidade de:
Feature Selection:
• LASSO para lineares e semi-lineares
• Boruta para baseados-em-árvores (e.g, random forest e GBM)
![Page 36: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/36.jpg)
{Machine Learning: Taxonomia
36
Machine Learning:
Modelos testados:
• SVMs, LASSO, Ridge, elastic net (= LASSO + Ridge), RF, GBM
![Page 37: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/37.jpg)
{Machine Learning: Taxonomia
37
Machine Learning:
Modelos testados:
• SVMs, LASSO, Ridge, elastic net (= LASSO + Ridge), RF, GBM
• No final, ensembling (nos folds)
![Page 38: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/38.jpg)
{Machine Learning: Taxonomia
38
Machine Learning:
Modelos testados:
• SVMs, LASSO, Ridge, elastic net (= LASSO + Ridge), RF, GBM
• No final, ensembling (nos folds)
• Usamos OLS como benchmark
![Page 39: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/39.jpg)
{Machine Learning: Taxonomia
39
Machine Learning:
Modelos testados:
• SVMs, LASSO, Ridge, elastic net (= LASSO + Ridge), RF, GBM
• No final, ensembling (nos folds)
• Usamos OLS como benchmark
Obs:
• Hipótese implícita: há comportamento semelhante de empresas abertas e
fechadas
![Page 40: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/40.jpg)
{Machine Learning: Taxonomia
40
Machine Learning:
Modelos testados:
• SVMs, LASSO, Ridge, elastic net (= LASSO + Ridge), RF, GBM
• No final, ensembling (nos folds)
• Usamos OLS como benchmark
Obs:
• Hipótese implícita: há comportamento semelhante de empresas abertas e
fechadas
• Não é forecasting; está mais para backcasting
![Page 41: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/41.jpg)
{Machine Learning: Taxonomia
41
Machine Learning:
Modelos testados:
• SVMs, LASSO, Ridge, elastic net (= LASSO + Ridge), RF, GBM
• No final, ensembling (nos folds)
• Usamos OLS como benchmark
Obs:
• Hipótese implícita: há comportamento semelhante de empresas abertas e
fechadas
• Não é forecasting; está mais para backcasting
• Moralmente, combina “empresas comparáveis” com “controle sintético”
![Page 42: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/42.jpg)
{Machine Learning: Taxonomia
42
Resultados
• Vencedor foi RF (random forest)
![Page 43: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/43.jpg)
{Machine Learning: Taxonomia
43
Resultados
• Vencedor foi RF (random forest)
(A rigor foi ensemble de RF com GBM, mas pouco incremento de desempenho e
muito aumento de custo computacional...)
![Page 44: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/44.jpg)
{Machine Learning: Taxonomia
44
Resultados
• Vencedor foi RF (random forest)
(A rigor foi ensemble de RF com GBM, mas pouco incremento de desempenho e
muito aumento de custo computacional...)
• RF (resp., OLS) teve seguintes R2s:
- vol:
- ret:
- corr:
![Page 45: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/45.jpg)
{Machine Learning: Taxonomia
45
Resultados
• Vencedor foi RF (random forest)
(A rigor foi ensemble de RF com GBM, mas pouco incremento de desempenho e
muito aumento de custo computacional...)
• RF (resp., OLS) teve seguintes R2s:
- vol: 50%
- ret:
- corr:
![Page 46: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/46.jpg)
{Machine Learning: Taxonomia
46
Resultados
• Vencedor foi RF (random forest)
(A rigor foi ensemble de RF com GBM, mas pouco incremento de desempenho e
muito aumento de custo computacional...)
• RF (resp., OLS) teve seguintes R2s:
- vol: 50% (15%)
- ret:
- corr:
![Page 47: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/47.jpg)
{Machine Learning: Taxonomia
47
Resultados
• Vencedor foi RF (random forest)
(A rigor foi ensemble de RF com GBM, mas pouco incremento de desempenho e
muito aumento de custo computacional...)
• RF (resp., OLS) teve seguintes R2s:
- vol: 50% (15%)
- ret: 40%
- corr:
![Page 48: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/48.jpg)
{Machine Learning: Taxonomia
48
Resultados
• Vencedor foi RF (random forest)
(A rigor foi ensemble de RF com GBM, mas pouco incremento de desempenho e
muito aumento de custo computacional...)
• RF (resp., OLS) teve seguintes R2s:
- vol: 50% (15%)
- ret: 40% (5%)
- corr:
![Page 49: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/49.jpg)
{Machine Learning: Taxonomia
49
Resultados
• Vencedor foi RF (random forest)
(A rigor foi ensemble de RF com GBM, mas pouco incremento de desempenho e
muito aumento de custo computacional...)
• RF (resp., OLS) teve seguintes R2s:
- vol: 50% (15%)
- ret: 40% (5%)
- corr: 45%
![Page 50: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/50.jpg)
{Machine Learning: Taxonomia
50
Resultados
• Vencedor foi RF (random forest)
(A rigor foi ensemble de RF com GBM, mas pouco incremento de desempenho e
muito aumento de custo computacional...)
• RF (resp., OLS) teve seguintes R2s:
- vol: 50% (15%)
- ret: 40% (5%)
- corr: 45% (5%)
![Page 51: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/51.jpg)
{Machine Learning: Taxonomia
51
Resultados
![Page 52: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/52.jpg)
{Machine Learning: Taxonomia
52
Machine Learning:
Importância das features varia muito com o modelo:
![Page 53: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/53.jpg)
{Machine Learning: Taxonomia
53
Aplicações
![Page 54: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/54.jpg)
{Machine Learning: Taxonomia
54
Aplicações
- Auxílio de tomada de decisões (de venda e aquisição de empresas fechadas)
![Page 55: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/55.jpg)
{Machine Learning: Taxonomia
55
Aplicações
- Auxílio de tomada de decisões (de venda e aquisição de empresas fechadas)
- Forecasting (ao invés de backcasting)?
![Page 56: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/56.jpg)
{Machine Learning: Taxonomia
56
Aplicações
- Auxílio de tomada de decisões (de venda e aquisição de empresas fechadas)
- Forecasting (ao invés de backcasting)?
- Private equity?
![Page 57: WAIAF (ITA) 2019 · Machine Learning: Taxonomia. 35. Machine Learning: Feature Engineering: 14 transformações (e.g., desvio padrão, taxa de crescimento, etc) foram aplicadas a](https://reader036.vdocument.in/reader036/viewer/2022062506/5f22e4f95561ed5e9a39cdb0/html5/thumbnails/57.jpg)
{Machine Learning: Taxonomia
57
Aplicações
- Auxílio de tomada de decisões (de venda e aquisição de empresas fechadas)
- Forecasting (ao invés de backcasting)?
- Private equity? (neste caso variável-alvo natural seria valuation)