domingo, 15 de outubro de 2017

Colocando lenha na fogueira: correlação e causalidade em crescimento econômico.

Hoje, em sua coluna na Folha, Samuel Pessôa pergunta se indústria causa desenvolvimento (link aqui). Como mote coloca um resultado apresentado pelo meu colega de departamento, José Oreiro, mostrando a correlação positiva entre renda per capita e complexidade da economia em diversos países (link aqui). Samuel desenvolve seu argumento nos lembrando que existem outras variáveis que também estão correlacionadas com PIB per capita, por exemplo educação, e que também podem levar a uma economia complexa, nas palavras dele:

“É razoável supor que um sistema de educação de elevada qualidade seja capaz de causar ambos: crescimento econômico e complexidade produtiva. Fato esse que será ainda mais verdadeiro se o país não for muito dotado em recursos naturais –pois, se assim for dotado, como é o caso australiano, haverá outras oportunidades de desenvolvimento econômico.”

Para o leitor que não é chegado em estatística vale um exemplo que corre a internet e costuma ser usado em cursos de análises de dados. Segundo a história, que não tenho a menor ideia se é verdadeira, um pesquisador encontrou uma forte correlação positiva entre vendas de sorvete e ataques de tubarão em uma determinada praia. Seriam os tubarões atraídos por sorvetes? Será que ao comer sorvete os banhistas ficavam mais displicentes e se tornavam alvos mais fáceis para os tubarões? Nada disso. O que ocorre é que em dias quentes as pessoas tomam mais sorvete e vão mais à praia, não são os sorvetes que causam os ataques de tubarão, é o calor que causa que as pessoas tomem sorvetes e se exponham a ataques de tubarão.

Fenômeno parecido pode ocorrer com correlações observadas em economia em geral e crescimento econômico em particular. Para uma discussão mais elaborada recomendo o artigo “A Sensitivity Analysis of Cross-Country Growth Regressions” de Ross Levine e David Renelt publicado em 1992 na American Economic Review (ERA, v.82, n.4, pp.942-962). No artigo os autores mostram como correlações entre algumas variáveis e crescimento desaparecem quando outras variáveis são colocadas no modelo. A conclusão de Levine e Renelt é que das variáveis usadas e no período considerado apenas a taxa de investimento e a parcela de comércio no PIB são robustas para explicar crescimento. Quem se interessou e quiser um contraponto ao artigo recomendo dar uma lida em “I Just Run Two Million Regressions” publicado em 1997 por Xavier Sala-I-Martin na mesma American Economic Review.

O problema encontrado por Levine e Renelt é da mesma natureza que o apontado por Samuel Pessôa: como as variáveis usadas para explicar crescimento costumam estar relacionadas umas com as outras fica difícil encontrar efeitos de causalidades por meio de regressões. Para buscarmos por causalidade precisamos ir além das regressões, precisamos fazer experimentos ou encontrar experimentos naturais que permitam inferir relação causal, na falta de experimentos outras técnicas podem ser usadas, como é o caso de variáveis instrumentais, mas é preciso usar destas técnicas com moderação e desconfiança. Um amigo estatístico cera vez se referiu a variáveis instrumentais como uma magia negra inventada por economistas. Magia negra as vezes até funciona, mas cobra um preço alto de quem usa.

Para ilustrar o ponto do Samuel Pessôa vou fazer um exercício inspirado pelo texto dele na Folha. No texto Samuel escreve;

“Adicionalmente, esse fato deve ser ainda mais verdadeiro se o país, além de ter um excelente sistema público de educação e de ser pobre em recursos naturais, possuir um setor público que gaste pouco com seguridade social –sendo, portanto, um país em que a carga tributária é baixa e a poupança das famílias é muito elevada.

Se o leitor lembrou do caso asiático (Japão, Coreia, Taiwan e China) não foi mera coincidência. Muita educação de qualidade –reduzindo o custo do trabalho qualificado– e muita poupança –o que reduz o custo do capital– estão na origem da complexidade produtiva.”

Não tenho às mãos uma medida de complexidade, pelo menos não achei em uma busca rápida nas bases que tenho já arrumadas para o blog (Banco Mundial, FMI e PWT), e não tenho o PISA, até tenho, mas é muito recente para o exercício. Desta forma no lugar de complexidade vou usar participação da manufatura do PIB, média entre 1978 e 1983, para explicar a taxa de crescimento entre 1980 e 2014. Os dados de manufatura são do Banco Mundial e os de crescimento foram obtidos a partir de dados da PWT, foram considerados países com mais de um milhão de habitantes por volta de 1980 o que deixou uma amostra de sessenta e oito países. A figura abaixo mostra a reta de regressão entre as duas variáveis.




O coeficiente da manufatura como proporção do PIB é positivo e significativo a 5%. Com tais resultados alguém poderia ser tentando a concluir que alta participação da manufatura no PIB por volta de 1980 causou maior crescimento entre 1980 e 2014. O resultado muda se acrescentarmos taxa de poupança e educação. Na falta do PISA vou usar gasto em educação como proporção do PIB, a ideia é que quanto maior o gasto melhor será a educação, o que não é necessariamente verdade (link aqui), mas dá para o gasto. A taxa de poupança é a da base de dados do Banco Mundial. A tabela abaixo mostra as duas regressões.



Taxa de Crescimento

Modelo 1
Modelo 2
Manufatura/PIB
0,053**
(0,025)
0,039
(0,026)
Taxa de poupança

0,018
(0,013)
Gasto em educação (%PIB)

-0,146
(0,129)
Constante
1,715***
(0,434)
2,135***
(0,649)
Observações
68
68
R2
0,063
0,100
R2 ajustado
0,049
0,058
Estatística F
4,455** (df=1; 66)
2,365*(df=3; 64)
Nota:                                                                                                                  *p<0,1;   **p<0,05;   ***p<0.01

Como pode ser observado na presença da taxa de poupança e de uma medida, mesmo que ruim, de capital humano, a relação entre taxa de crescimento e participação da manufatura deixa de ser significativa. Porém, ao contrário da história dos ataques de tubarão, não encontramos a variável que está faltando, aquela que explica todas as outras. Alguns vão dizer que são as instituições, outros que é a complexidade, outros que é uma melhor medida de capital humano e por aí vai. A verdade é que dificilmente a variável será encontrada por meio de regressões e correlações, para estabelecer relações de causalidade vamos precisar de mais dados e mais experimentos naturais ou idealizados. Até lá vamos ter de usar a teoria, mas isso não quer dizer que vale tudo, modelos teóricos bem construídos dão o caminho para que escolhamos quais variáveis entram nos modelos econométricos, testes realizados por vários autores ajudam a refinar a intuição.

O que posso dizer é que variáveis como câmbio, participação da manufatura no PIB e mesmo a complexidade ainda não estão presentes em vários artigos e livros texto de crescimento econômico usados nas melhores e mais destacadas escolas do mundo. Para tomar um exemplo, no texto do Levine e Renelt foram usadas mais de cinquenta variáveis, incluindo número de revoluções e golpes de estado por ano, índice de liberdade civis e inflação, mas entre elas não aprecem nem câmbio nem manufatura.


Um comentário: