Tese Doutoral Uma análise robusta de benchmarking utilizando o método de fronteira estocástica Bayesiano aplicado às empresas brasileiras de distribuição de energia Por Magno Silvério Campos Orientador: Prof. Dr. Marcelo Azevedo Costa Departamento de Engenharia de Produção Escola de Engenharia Trabalho apresentado ao Programa de Pós-Graduação em En- genharia de Produção, em conformidade com os requisitos para obtenção do grau de Doutor em Engenharia de Produção, na Escola de Engenharia da Universidade Federal de Minas Gerais. Novembro de 2018 Campos, Magno Silvério. C198a Uma análise robusta de benchmarking utilizando o método de fronteira estocástica bayesiano aplicado às empresas brasileiras de distribuição de energia [manuscrito] / Magno Silvério Campos. – 2018. xxviii, 125 f., enc.: il. Orientador: Marcelo Azevedo Costa. Tese (doutorado) - Universidade Federal de Minas Gerais, Escola de Engenharia. Apêndices: f. 91-108. Bibliografia: f. 109-121. 1. Engenharia de produção - Teses. 2. Análise envoltória de dados - Teses. I. Costa, Marcelo Azevedo. II. Universidade Federal de Minas Gerais. Escola de Engenharia. III. Título. CDU: 658.5(043) Resumo Um modelo de Análise Envoltória de Dados (DEA) é aplicado pelo reguladorbrasileiro para definir os custos operacionais regulatórios para 61 concessionáriasde distribuição de eletricidade ou DSOs, desde 2015. O modelo atual DEA compreende retornos não decrescentes de escala, um insumo, sete produtos e restrições aos pesos. Os custos regulatórios foram estimados utilizando valores médios de 2011 a 2013. Em 2017, novos custos regulatórios foram estimados utilizando um conjunto de dados atualizado e o modelo DEA anterior. Resultados recentes são semelhantes aos resultados obtidos em 2015 e mostram evidências de que o atual modelo de benchmarking ainda requer melhorias. Em suma, algumas DSOs têm baixíssimas eficiências, perto de 25%, e as análises estatísticas mostram a presença de outliers na base de dados. Além disso, o modelo ainda carece de ajustes ambientais. Esse estudo avalia o uso da Análise de Fronteira Estocástica (SFA) como um modelo alternativo para definir custos operacionais regulatórios. Prós e contras do modelo SFA são destacados. Os resultados mostram que o SFA é mais flexível para lidar com outliers. No entanto, o SFA tem grandes problemas de convergência se aplicado a amostras limitadas. Os problemas de convergência podem ser superados utilizando métodos de computação Bayesiana ou de verossimilhança penalizada. Em particular, é proposto um modelo SFA Bayesiano que é robusto a problemas de convergência. Esse estudo defende o uso do DEA e do SFA como as melhores alternativas para definir os custos operacionais regulatórios para as empresas brasileiras de distribuição de eletricidade, conforme indicado pelos reguladores europeus. Palavras-chave: Análise Envoltória de Dados, Análise de Fronteira Estocástica, Análise Bayesiana. iii Abstract A Data Envelopment Analysis (DEA) model is applied by the Brazilian regulatorto set regulatory operational costs for 61 electricity distribution utilities or DSOs,since 2015. The current DEA model comprises non-decreasing returns to scale, one input, seven outputs and weight restrictions. Regulatory costs were estimated using average values from 2011 to 2013. In 2017, new regulatory costs were estimated using an updated data set and the previous DEA model. Recent results are similar to results achieved in 2015 and show evidence that the current benchmarking model still requires improvements. In short, some DSOs have inconsistent low efficiencies, close to 25%, and standard statistical analysis shows the presence of outliers in the data base. Furthermore, the model still lacks environmental adjustments. This study evaluates the use of Stochastic Frontier Analysis (SFA) as an alternative model to set regulatory operational costs. Pros and cons of the SFA model are highlighted. Results show that the SFA is more flexible to deal with outliers. However, the SFA has major convergence problems if applied to limited samples. Convergence issues can be overcome using Bayesian computation or penalized likelihood methods. In particular, a Bayesian SFA model is proposed that is robust to convergence problems. This study advocates the use of both DEA and SFA as the best alternatives to set regulatory operational costs for Brazilian electricity distribution companies, as indicated by European regulators. Keywords: Data Envelopment Analysis, Stochastic Frontier Analysis, Bayesian Analysis. v Dedicatória e Agradecimentos Dedico esse trabalho aos meus pais, Mozart e Floripes, doutores honoris causaem minha vida. Agradeço àqueles que, cada qual à sua maneira, foram de extrema importânciapara que tudo acontecesse: • Pais, irmãos, cunhados e sobrinhos, sempre alegres e presentes; • Marcelle, sempre amorosa, entusiasta e compreensiva; • Professores, sempre apontando para frente e para o alto; • Alunos, sempre inspirando crescimento; • Colegas de estudo e de trabalho, sempre parceiros; • Marcelo, um gigante que me apoiou nos ombros para eu poder ver mais longe. Ao Deus de bondade infinita, criador e protetor de toda minha vida, muito obrigado! Magno vii “Não sei o que posso parecer aos olhos do mundo, mas aos meus, pareço apenas ter sido como um menino brincando à beira-mar, divertindo-me em encontrar de vez em quando um seixo mais liso ou uma concha mais bonita que o normal, enquanto o grande oceano da verdade permanece completamente desconhecido à minha frente.” Sir Isaac Newton ix Declaração Declaro que o trabalho dessa tese doutoral foi realizado de acordo comas exigências do Regulamento do Programa de Pós-Graduação emEngenharia de Produção da Universidade Federal de Minas Gerais e que o mesmo não foi submetido a nenhum outro prêmio acadêmico. Exceto quando indicado por referência específica, esse texto é próprio do autor. O trabalho feito em colaboração ou com a assistência de outros é indicado como tal. Quaisquer opiniões expressas na tese são de responsabilidade do autor. Assinatura: Data: novembro de 2018 xi Sumário Página Lista de Tabelas xvii Lista de Figuras xix 1 Contextualização do Estudo 1 1.1 Monopólio Natural Regulado . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 O Setor Brasileiro de Distribuição de Energia Elétrica . . . . . . . . . . . 2 1.3 Regulação Tarifária no SBDEE . . . . . . . . . . . . . . . . . . . . . . . 2 1.4 Métodos de Benchmarking para Avaliação de Eficiência . . . . . . . . . . 8 1.5 Métodos de Benchmarking no Setor Distribuição de Energia Elétrica . . . 10 1.5.1 DEA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.5.2 COLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.5.3 SFA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.5.4 StoNED . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.5.5 Empresa de Referência . . . . . . . . . . . . . . . . . . . . . . . . 13 1.6 Modelo de Benchmarking Vigente no SBDEE . . . . . . . . . . . . . . . 14 1.7 O Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.8 Motivações para o Estudo do Problema . . . . . . . . . . . . . . . . . . . 19 1.9 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.10 Organização do Texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2 Análise de Fronteira Estocástica (SFA) 25 2.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.2 Fronteira de Produção e Eficiência Técnica . . . . . . . . . . . . . . . . . 27 2.2.1 Algumas Formas Funcionais para a Função de Produção . . . . . 31 2.2.1.1 Função de Produção Cobb-Douglas . . . . . . . . . . . . 31 2.2.1.2 Função de Produção Translog . . . . . . . . . . . . . . . 32 xiii SUMÁRIO xiv 2.3 Eficiência Técnica versus Eficiência Alocativa . . . . . . . . . . . . . . . 32 2.4 Fronteira de Custo e Eficiência Econômica . . . . . . . . . . . . . . . . . 33 2.4.1 Algumas Formas Funcionais para a Função de Custo . . . . . . . 35 2.4.1.1 Função de Custo Cobb-Douglas . . . . . . . . . . . . . . 35 2.4.1.2 Função de Custo Translog . . . . . . . . . . . . . . . . . 36 2.4.1.3 Comentário Sobre Essas Formas Funcionais . . . . . . . 36 2.5 Estimação da Fronteira Estocástica de Custo . . . . . . . . . . . . . . . . 37 2.5.1 Modelo de Custo com Fronteira Estocástica . . . . . . . . . . . . 38 2.5.2 Métodos Estatísticos Estocásticos de Estimação Paramétrica para a Eficiência Econômica . . . . . . . . . . . . . . . . . . . . . . . . 39 2.5.2.1 Considerações Iniciais . . . . . . . . . . . . . . . . . . . 39 2.5.2.2 Verificação Inicial da Assimetria de i . . . . . . . . . . . 41 2.5.2.3 Possíveis Comportamentos Probabilísticos Associados a ui 41 2.5.2.4 Enfoque Frequentista para a Estimação de e−ui . . . . . 47 2.5.2.5 Enfoque Bayesiano para a Estimação de e−ui . . . . . . 52 2.6 Incorporação de Variáveis Exógenas ao SFA . . . . . . . . . . . . . . . . 56 2.6.1 Contextualização para o SBDEE . . . . . . . . . . . . . . . . . . 57 2.6.2 Modelo Proposto por Kumbhakar et al. (1991) . . . . . . . . . . . 58 2.6.3 Modelo Proposto por Reifschneider e Stevenson (1991) . . . . . . 59 2.6.4 Lidando com Produtos Indesejados . . . . . . . . . . . . . . . . . 60 2.6.5 Considerações Gerais . . . . . . . . . . . . . . . . . . . . . . . . . 60 2.7 Síntese da Especificação de um Modelo de SFA . . . . . . . . . . . . . . 61 3 Parametrizações e Modelagens Propostas para o SFA 65 3.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.2 Proposta de Parametrizações para o SFA . . . . . . . . . . . . . . . . . . 66 3.3 Base de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.4 Proposta de Modelos para o SFA . . . . . . . . . . . . . . . . . . . . . . 71 3.4.1 Modelo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 3.4.2 Modelo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 3.4.3 Modelo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 3.4.4 Modelo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.4.5 Modelo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.4.6 Modelo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.4.7 Modelo 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 xiv SUMÁRIO xv 3.5 Implementação Computacional . . . . . . . . . . . . . . . . . . . . . . . 74 3.6 Critérios de Seleção de Modelos . . . . . . . . . . . . . . . . . . . . . . . 74 4 Resultados e Discussões 77 4.1 Verificação Inicial da Assimetria de i . . . . . . . . . . . . . . . . . . . . 77 4.2 Parâmetros Estimados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 4.3 Eficiências Estimadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 4.4 Critério de Convergência . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 5 Conclusão e Considerações de Prosseguimento 87 5.1 Histórico Contextual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5.2 Validação das Hipóteses sob Estudo . . . . . . . . . . . . . . . . . . . . . 88 5.3 Resultados Obtidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 5.4 Metodologias Complementares . . . . . . . . . . . . . . . . . . . . . . . . 90 5.5 Considerações de Prosseguimento . . . . . . . . . . . . . . . . . . . . . . 91 5.6 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 A Apêndice A 93 A.1 Obtenção da Expressão para o Cálculo de f() . . . . . . . . . . . . . . 93 A.2 Obtenção da Expressão para o Cálculo de E(u|) . . . . . . . . . . . . . 96 A.3 Obtenção da Expressão para o Cálculo de E(e−u|) . . . . . . . . . . . . 97 B Apêndice B 99 B.1 Procedimento Monte Carlo via Cadeias de Markov (MCMC) . . . . . . . 99 B.1.1 Cadeias de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . 100 B.1.1.1 Propriedade Markoviana . . . . . . . . . . . . . . . . . . 101 B.1.1.2 Probabilidades de Transição . . . . . . . . . . . . . . . . 101 B.1.1.3 Notação . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 B.1.1.4 Equações de Chapman-Kolmogorov . . . . . . . . . . . . 102 B.1.1.5 Classificação dos Estados em uma Cadeia de Markov . . 103 B.1.1.6 Probabilidade de Estado Estável . . . . . . . . . . . . . 103 B.1.2 Lógica do MCMC . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 B.1.3 Algoritmo Amostrador de Gibbs . . . . . . . . . . . . . . . . . . . 105 B.1.4 Critério de Convergência . . . . . . . . . . . . . . . . . . . . . . . 105 C Apêndice C 109 C.1 Critérios de Seleção de Modelos . . . . . . . . . . . . . . . . . . . . . . . 109 xv SUMÁRIO xvi C.1.1 Log-Pseudo Marginal Likelihood (LPML) . . . . . . . . . . . . . . 109 C.1.2 Deviance Information Criterion (DIC) . . . . . . . . . . . . . . . 110 C.1.3 Watanabe-Akaike Information Criterion (WAIC) . . . . . . . . . . 110 Referências Bibliográficas 111 Índice Remissivo 125 xvi Lista de Tabelas Tabela Página 3.1 Variáveis de entrada e saída disponíveis para as 61 DSOs brasileiras. . . . . . 70 4.1 Estimativas dos parâmetros médios a posteriori. . . . . . . . . . . . . . . . . 79 4.2 Escores de eficiência estimados utilizando os modelos de SFA propostos. . . . 82 4.3 Eficiências estimadas e custos eficientes utilizando DEA e SFA (Modelo 6), e diferenças entre custos eficientes utilizando DEA e o SFA proposto. . . . . . 85 xvii Lista de Figuras Figura Página 1.1 Distribuição geográfica das concessionárias distribuidoras de energia. . . . . 3 1.2 Regulação por incentivo no SBDEE. . . . . . . . . . . . . . . . . . . . . . . 6 1.3 Escores de eficiência das DSOs brasileiras no 4CPTR. . . . . . . . . . . . . . 7 1.4 Principais métodos de benchmarking para avaliação de eficiência. . . . . . . . 9 2.1 Representação genérica de um processo produtivo. . . . . . . . . . . . . . . . 27 2.2 Conjunto de Possibilidades de Produção (CPP) e fronteira de produção. . . . 28 2.3 Exemplo de uma função de produção e de isoquantas. . . . . . . . . . . . . . 29 2.4 Fronteira de custo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.5 Diferenças entre as funções de custo Cobb-Douglas e translog no SFA. . . . . 37 2.6 Exemplos de densidades de probabilidades para a Normal-Truncada. . . . . . 42 2.7 Densidades de probabilidades para o exemplo. . . . . . . . . . . . . . . . . . 44 2.8 Fronteira estocástica de custo e desvios para o exemplo. . . . . . . . . . . . . 45 2.9 Fronteiras de custo estimadas para o exemplo: OLS, COLS, DEA e SFA. . . 46 3.1 Gráfico de correlação de Spearman para as variáveis de entrada, saída, quali- dade e ambientais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 4.1 Boxplots comparando eficiências originais de DEA e eficiências propostas de SFA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 4.2 Matriz de correlação comparando eficiências originais de DEA e eficiências propostas de SFA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 4.3 Eficiências estimadas DEA e SFA em todo o território brasileiro. . . . . . . . 83 4.4 Similaridades e dissimilaridades entre DEA e SFA após ajustes de escala. . . 84 4.5 Gráficos de ACF para os parâmetros λ dos modelos propostos. . . . . . . . . 86 B.1 Algoritmo Amostrador de Gibbs. . . . . . . . . . . . . . . . . . . . . . . . . 106 B.2 Exemplo de um gráfico ACF para ψt|E. . . . . . . . . . . . . . . . . . . . . 106 xix Lista de Nomenclaturas αr Limite inferior atribuído ao peso ωj relativamente ao peso κi para o modelo DEA (1.1). βt Limite superior atribuído ao peso ωj relativamente ao peso κi para o modelo DEA (1.1). δ = λ√1+λ2 , isto é, uma reparametrização em função do parâmetro λ. δ1 Coeficiente associado à variável ambiental que exerce influência sobre a i-ésima DSO. iid Independentes e identicamente distribuídos. i Erro composto sobre i-ésimo produtor (i = νi ± ui). γ Estatística de teste para verificação de assimetria. Γ(·) Função gama. Γ(a,b) Distribuição de probabilidades Gama com parâmetros a e b. λˆ Estimador do parâmetro de forma (assimetria) da função densidade de probabili- dades f(). βˆ Estimador do vetor de parâmetros de tecnologia (coeficientes) da função estocástica de custo. ψˆ Estimador Bayesiano para o vetor de parâmetros ψ. Θˆ = [λˆ, σˆ2, βˆ], isto é, vetor de estimadores frequentistas para os parâmetros do SFA. σˆ2u Estimador do parâmetro de variância incondicional associada à distribuição das ineficiências econômicas dos produtores. xxi Lista de Figuras xxii σˆ2ν Estimador do parâmetro de variância incondicional associada à distribuição dos ruídos aleatórios. σˆ Estimador do parâmetro de escala da função densidade de probabilidades f(). uˆi Estimador para o componente de erro que objetiva capturar os efeitos da ineficiência sobre o i-ésimo produtor. κi Parâmetros de peso de entrada para o modelo DEA (1.1). λ Parâmetro de forma (assimetria) da função densidade de probabilidades f(). lnL Função de log-verossimilhança. β Vetor de parâmetros de tecnologia. δ Vetor de coeficientes para as variáveis exógenas associadas ao i-ésimo produtor. ψ Vetor de parâmetros a serem estimados a partir da abordagem Bayesiana. Θ = [λ, σ2,β], isto é, vetor de parâmetros do SFA a serem estimados. E Vetor de custos atuais para os produtores abordagem Bayesiana. w Vetor de preços dos inputs. wi Vetor de preços dos inputs associado ao i-ésimo produtor. x Vetor de entradas. xi Vetor de entradas associado ao i-ésimo produtor. x(−i) Conjunto de n dados sem a observação xi yi Vetor de saídas associado ao i-ésimo produtor zi Vetor de variáveis exógenas para o i-ésimo produtor. µ Média incondicional associada à distribuição das ineficiências econômicas dos produtores. µ∗ = σ 2 u σ2 . νi Componente de erro que objetiva capturar os efeitos do ruído aleatório sobre o i-ésimo produtor. xxii Lista de Figuras xxiii ωj Parâmetros de peso de saída ordinária para o modelo DEA (1.1). ωl Parâmetros de peso de saída indesejada para o modelo DEA (1.1). Φ(·) Função distribuição de probabilidades acumuladas normal padrão. φ(·) Função densidade de probabilidades normal padrão. pij Probabilidade de estado estável. ∝ Representa proporcionalidade na expressão (2.57). ∝ Representa um valor constante na equação (2.45). <+ Conjunto dos números reais não-negativos. 0. Desde a publicação destes três trabalhos iniciais até os dias atuais, muitas tem sido as contribuições de pesquisadores de várias partes do mundo. Podem-se destacar, entre outros: (i) - Forsund et al. (1980) e Jondrow et al. (1982) que atuaram para obter estimativas de eficiência específicas para os produtores considerados no estudo em questão; (ii) - Greene (1980a,b), Stevenson (1980) e Lee (1983) dedicaram-se ao desenvolvimento de distribuições de dois parâmetros mais flexíveis para o componente de erro de ineficiência; (iii) - Schmidt e Lovell (1979) e Kopp e Diewert (1982) procuraram decompor a estimativa de υ em estimativas dos custos separados de ineficiência técnica e alocativa, com êxitos parciais; (iv) - Pitt e Lee (1981) e Schmidt e Sickles (1984) estenderam as técnicas de estimativa da máxima verossimilhança aos dados de painel, tendo posteriormente, relaxamentos propostos por Cornwell et al. (1990), Kumbhakar (1990) e por Battese e Coelli (1992); (v) - Kumbhakar et al. (1991), Reifschneider e Stevenson (1991), Huang e Liu (1994) e Battese e Coelli (1995) propuseram abordagens onde as variáveis exógenas são incorporadas ao erro de ineficiência; (vi) - Wang (2002) apresenta modelos com heterocedasticidade e causas exógenas da ineficiência; (vii) - Kumbhakar e Wang (2005) discutem os modelos de crescimento econômico; (viii) - Greene (2005), Wang e Ho (2010), Kumbhakar et al. (2014) e Chen et al. (2014) apresentam avanços em modelos com dados em painel. Contudo, desses 40 anos de evolução no entendimento do SFA, desprendem-se algumas lacunas ainda não preenchidas ou até mesmo não exploradas a fundo, como é o caso da dificuldade de decomposição da estimativa de u em estimativas dos custos separados de ineficiência técnica e alocativa, ou como a maior parte dos estudos terem se concentrado sobre funções de produção, sendo timidamente estendido às funções de custos, receitas e lucros (Kumbhakar et al., 2015). Como já dito anteriormente, o objetivo desse capítulo perpassa pelo estudo, apro- 26 2.2. FRONTEIRA DE PRODUÇÃO E EFICIÊNCIA TÉCNICA 27 fundamento e melhor entendimento das metodologias de análise de fronteiras estocásticas, com possibilidade de sugerir melhorias para estas ou apresentar novas metodologias para o SBDEE. Sendo assim, as subseções que se seguem, trazem considerações gerais, julgadas importantes, para um melhor entendimento do método de SFA e futuro embasamento teórico para as proposições que advirem. 2.2 Fronteira de Produção e Eficiência Técnica De maneira geral, um processo produtivo é composto por um processo de transfor- mação (throughput), tendo insumos como entradas (inputs) e, produtos ou serviços como saídas (outputs) desse processamento, conforme se representa na Figura 2.1. Figura 2.1: Representação genérica de um processo produtivo. A transformação produtiva pode ser feita de diferentes maneiras, de acordo com o conjunto de possibilidades de produção (CPP), indicando todas as maneiras tecnologica- mente viáveis de se transformar os inputs x nos outputs y. De acordo com os princípios econômicos, há restrições tecnológicas que limitam o CPP. Nesse contexto, para uma certa tecnologia dada, a função fronteira de produção y = f(x), ou simplesmente função de produção, é uma função que indica a máxima quantidade de produto y que pode ser obtida a partir dos inputs x (orientação segundo outputs). Ou analogamente, y = f(x) indica o mínimo conjunto de inputs x necessários para produzir uma certa quantidade de outputs y (orientação segundo inputs). A Figura 2.2 ilustra essas noções. Baseando-se na observação da Figura 2.2, destaca-se que aqueles produtores que podem ser localizados sobre a função de produção y = f(x) possuem eficiência técnica, pois alcançaram a máxima produção para os recursos utilizados. Por outro lado, pro- dutores que por ventura sejam localizados abaixo de y = f(x) apresentam ineficiência 27 2.2. FRONTEIRA DE PRODUÇÃO E EFICIÊNCIA TÉCNICA 28 Figura 2.2: Conjunto de Possibilidades de Produção (CPP) e fronteira de produção. técnica, uma vez que não atingiram o máximo de produção possível para aqueles recur- sos utilizados, ou não conseguiriam produzir o mesmo nível atual, utilizando-se menos recursos. Esses conceitos de eficiência e ineficiência técnica condizem com a definição de eficiência de Pareto-Koopmans (Koopmans, 1951). Matematicamente, a função de produção pode ser expressa como: y = f(x1, x2, x3, . . . , xJ) ≡ f(x), (2.2) Sendo x um vetor J-dimensional não-negativo de inputs (escalares) e y representa o output (escalar) obtido a partir de f(·), isto é, a partir da tecnologia empregada. De acordo com Chambers (1988), uma função de produção bem definida deve satisfazer às seguintes condições: (i) f(x) deve ser monótona, isto é, f(x) ≥ f(x′) ∀ x ≥ x′; (ii) f(x) ∈ <+, finita e única ∀ x+; (iii) f(x) deve ser contínua e duas vezes diferenciável; (iv) f(0) = 0, ou seja, sem inputs não há outputs; (v) O conjunto de possibilidades de produção (CPP) deve ser fechado e não-vazio ∀ y > 0; 28 2.2. FRONTEIRA DE PRODUÇÃO E EFICIÊNCIA TÉCNICA 29 (vi) O CPP deve ser convexo, o que implica na quasi-concavidade de f(x). A Figura 2.3 a seguir, apresenta um exemplo de tecnologia de produção composto por dois inputs (x1 e x2) e um único output (y). A função de produção também está representada na parte (a) dessa figura. Figura 2.3: Exemplo de uma função de produção e de isoquantas. Segundo a orientação a outputs, a função de produção y = f(x1, x2), na Figura 2.3(a), representa a produção máxima para uma determinada combinação de inputs (x1, x2). Os produtores que estiverem situados sobre essa função (no caso, sobre a superfície do sólido) serão tecnicamente eficientes, como é o caso dos pontos A, C e D. Entretanto, pode haver desvios em relação à função de fronteira de produção, como representado pelo ponto B. Observe que utilizando os mesmos recursos do plano de produção dado em B, poder-se-ia alcançar um nível de produção maior, y2 > y1, dado em A, caracterizando com isso, a falta de eficiência do produtor em B. Debreu (1951) e Farrel (1957) propuseram uma métrica para quantificar a eficiência técnica de um produtor, denominada Métrica Radial de Debreu-Farrel. Segundo esta, a eficiência técnica com orientação a output é dada por: TE = y f(x) , ∀ x ∈ < n + e y ∈ <+, (2.3) sendo y a produção observada e f(x) a máxima quantidade de produto que pode ser obtida a partir do vetor de inputs x. Assim, observa-se que 0 < TE < 1 e que, a ineficiência técnica pode ser obtida através de TI = 1− TE. Além disso, estes autores 29 2.2. FRONTEIRA DE PRODUÇÃO E EFICIÊNCIA TÉCNICA 30 propuseram que o nível de produção y observado, sob a ótica da orientação a output, pode ser formulado matematicamente como: y = f(x) · TE, (2.4) isto é, o nível máximo de produção y sofre influência da eficiência técnica. Considerando valores pequenos de TI, pode-se fazer a aproximação TE = 1− TI ≈ e−TI (Kumbhakar et al., 2015). Assim, y = f(x) · e−TI . (2.5) A fim de simplificar um pouco mais a notação, seja considerar TI = u, o que leva ao seguinte resultado: y = f(x) · e−u, com u ≥ 0. (2.6) Observando a equação (2.6), conclui-se que a presença de ineficiência técnica (isto é, quando u > 0) acarreta uma produção aquém da máxima permitida pela função de produção f(x). Por outro lado, segundo a orientação a inputs, a função de produção y = f(x1, x2), na Figura 2.3(a), representa o mínimo conjunto de inputs necessários para produzir quantidades fixas do output y. Novamente, os produtores que estiverem situados sobre essa função serão tecnicamente eficientes, como é o caso dos produtores situados em A, C e D. Desvios também podem acontecer em relação à função de produção, caracterizando a presença de ineficiência técnica, como representado por B. Observa-se que o mesmo nível de produção alcançado por B, y1, poderia ser alcançado utilizando-se menos recursos, tal como em D. A Figura 2.3(b) apresenta o gráfico das isoquantas de produção. Observa-se que o mesmo nível de produção y1 pode ser alcançado ao deslocar-se de B para D, porém com redução de insumos. Nesse contexto de orientação a inputs, Debreu (1951) e Farrel (1957) propuseram que o nível de produção y observado, pode ser determinado como: y = f(x · TE), (2.7) isto é, a utilização dos insumos sofre influência da eficiência técnica. 30 2.2. FRONTEIRA DE PRODUÇÃO E EFICIÊNCIA TÉCNICA 31 Novamente, considerando valores pequenos de TI, pode-se fazer a aproximação TE = 1− TI ≈ e−TI (Kumbhakar et al., 2015), o que leva a: y = f(x · e−TI). (2.8) Simplificando a notação, pode-se escrever TI = u, gerando o seguinte resultado: y = f(x · e−u), com u ≥ 0. (2.9) Assim, verifica-se na equação (2.9) que, na ausência de ineficiência técnica, o nível de produção alcançado é aquele máximo dado pela função de produção f(x). 2.2.1 Algumas Formas Funcionais para a Função de Produção Existem várias formas funcionais para a função de produção apontadas pela lite- ratura micro e macroeconômica. Dentre elas, duas têm uso destacado no SFA: Função Cobb-Douglas e Função Logarítmica Transcendental (Translog). 2.2.1.1 Função de Produção Cobb-Douglas A função de produção de Cobb-Douglas é talvez, a mais proeminente na literatura, e teve sua estrutura atribuída ao trabalho de Cobb e Douglas (1928). Considerando xj como sendo os inputs, y o output e, βj os coeficientes, sua forma funcional é: y = f(x1, x2, x3, . . . , xJ) = β0 J∏ j=1 x βj j , onde (2.10) β0 > 0, 0 < βj,j 6=0 < 1 e J∑ j=1 βj = 1. Essa função é facilmente linearizável. Basta para isso, aplicar logaritmos a ambos os lados da igualdade, isto é: ln y = ln β0 + β1 ln x1 + β2 ln x2 + . . .+ βJ ln xJ . (2.11) 31 2.3. EFICIÊNCIA TÉCNICA VERSUS EFICIÊNCIA ALOCATIVA 32 2.2.1.2 Função de Produção Translog Uma alternativa à função de Cobb-Douglas é a função Logarítmica Transcendental de produção, ou mais comumente conhecida como função translog. Foi apresentada primeiramente por Christensen et al. (1971). Pode ser interpretada como a aproximação de uma função de produção arbitrária, y = f(x), por uma expansão de segunda ordem em série de Taylor de ln y, em potências de ln xj. Sua forma funcional é dada por: ln y = β0 + J∑ j=1 βj ln xj + 1 2 J∑ j=1 J∑ k=1 βjk ln xj ln xk, (2.12) onde: β0 é igual ao valor do logaritmo de f(x), no ponto de expansão a, isto é, β0 = ln f(a); βj (j 6= 0) são as primeiras derivadas parciais de ln f(x) com relação à variável xj ; e, βjk são as segundas derivadas parciais de ln f(x), medidas no ponto de expansão a. Pode-se observar também que, quando os produtos cruzados são nulos, a função translog se reduz à função Cobb-Douglas. Para que se possa testar hipóteses da teoria de produção, tais como homogeneidade, separabilidade e mudanças tecnológicas, devem-se impor as seguintes restrições aos paramêtros: βjk = βkj, J∑ j=1 βj = 1, J∑ j=1 J∑ k=1 βjk = 0, J∑ j=1 βjk = 0 ∀ k = 1, 2 . . . , J, e J∑ k=1 βjk = 0 ∀ j = 1, 2 . . . , J. Segundo Behr (2015), essa função apresenta uma flexibilidade maior quando com- parada com a função Cobb-Douglas descrita acima. Isso porquê, usando dualidade, pode-se mostrar que a função translog de produção é idêntica à função translog de custo, permitindo assim, análises simultâneas tanto do volume produzido quanto dos custos envolvidos (Albuquerque, 1987). Outra observação interessante diz respeito ao fato da função translog possuir mais variáveis que a função Cobb-Douglas. 2.3 Eficiência Técnica versus Eficiência Alocativa Do ponto de vista econômico, nem sempre um produtor que é tecnicamente eficiente também apresentará eficiência econômica, pois ele pode utilizar um conjunto de inputs que não é o de menor custo. Assim, para ser economicamente eficiente, o produtor além de 32 2.4. FRONTEIRA DE CUSTO E EFICIÊNCIA ECONÔMICA 33 ser tecnicamente eficiente, deve possuir eficiência alocativa, isto é, empregar os insumos de menor custo. Portanto, supondo que são conhecidos os preços w ∈ 0), o custo atual (expenditure), E = wxeu, pode ser maior que o custo mínimo, wx. De acordo com Chambers (1988), uma função de custo bem definida deve satisfazer às seguintes condições: (i) C(w, y) deve ser não decrescente em y, isto é, C(w, y) ≥ C(w, y′) ∀ y ≥ y′; (ii) C(w, y) deve ser não decrescente em w, isto é, C(w′, y) ≥ C(w, y) ∀ w′ ≥ w; (iii) C(w, y) deve ser não-negativa, isto é, C(w, y) > 0 ∀ w > 0 e y > 0; (iv) C(w, y) deve ser convexa e contínua em w; (v) C(w, 0) = 0, isto é, não há custos fixos; (vi) C(tw, y) = tC(w, y), com t > 0, isto é, se todos os custos forem multiplicados por uma constante t > 0, é equivalente a ter o custo mínimo multiplicado por t; (vii) xi(w, y) = ∂C(w,y)∂wi , isto é, o único vetor de minimização dos custos da demanda é igual ao gradiente de C(w, y) em w, desde que a função de custo seja diferenciável em wi. Também, pode-se escrever a seguinte expressão para o cálculo da eficiência econô- mica do i-ésimo produtor: EEi = Customin Custoatuali = Custo min Ei , = wx wxeui = e−ui ∀ x ∈ 0 é o vetor de preços dos inputs utilizados pelo produto i, β é o vetor de parâmetros de tecnologia (coeficientes) a serem estimados e, Ei como sendo a despesa (expenditure) incorrida pelo produtor i, a forma funcional da função de custos Cobb-Douglas para o caso de output único é definida como: Ei = C(wi, yi, β) · eui = β0yβyi J∏ j=1 w βj ji e i , onde (2.15) J∑ j=1 βj = 1 =⇒ βl = 1− J∑ j=1;j 6=l βj, e i = νi + ui é um termo de erro composto pelos ruídos aleatórios (νi) e pela ineficiência econômica (ui), associado ao produtor i. Essa função é facilmente linearizável. Basta para isso, aplicar logaritmos a ambos os lados da igualdade, isto é: lnEi = ln β0 + βy ln yi + J∑ j=1 βj lnwji + νi + ui (2.16) De acordo com Zanini (2004), a simplicidade é o maior trunfo dessa função. Porém, apresenta os incovenientes de não acomodar multi-outputs sem violar as propriedades de convexidade do espaço de produtos e, quando se trata de estruturas de produção mais complexas, resulta em estimativas tendenciosas para as ineficiências de custo. 35 2.4. FRONTEIRA DE CUSTO E EFICIÊNCIA ECONÔMICA 36 2.4.1.2 Função de Custo Translog Uma alternativa à função de Cobb-Douglas, e que permite acomodar múltiplos produtos sem incorrer em violações de convexidade, é a função translog de custo. Sua forma funcional é dada por: lnEi = β0 + M∑ m=1 αm ln ymi + J∑ j=1 βj lnwji + 1 2 M∑ m=1 M∑ h=1 αmh ln ymi ln yhi + + 12 J∑ j=1 J∑ h=1 βjh lnwji lnwhi + J∑ j=1 M∑ h=1 γjh lnwji ln yhi + νi + ui, (2.17) onde, βjh = βhj, αmh = αhm, J∑ j=1 βj = 1, J∑ j=1 βjh = 0 ∀ h = 1, 2 . . . , J e J∑ j=1 γjh = 0 ∀ h = 1, 2 . . . , J. Assim como no caso da produção, a função translog de custo apresenta mais variáveis que a função de Cobb-Douglas. Por isso, de acordo com Zanini (2004), a função translog, apesar de sua maior flexibilidade para acomodar múltiplos produtos, pode apresentar problemas de multicolinearidade, quando muitos regressores forem considerados. 2.4.1.3 Comentário Sobre Essas Formas Funcionais Como já dito, as funções paramétricas de Cobb-Douglas e translog são as mais comumente utilizadas no SFA. No entanto, a convexidade de custo é obtida com uma função translog. Isto é ilustrado na Figura 2.5, onde um SFA paramétrico que utiliza uma função translog possui uma convexidade mais suave em comparação com a função Cobb-Douglas e o atual modelo DEA-NDRS utilizado pela ANEEL. 36 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 37 (a) Ajuste DEA, Cobb-Douglas e Translog para o número de consumidores. (b) Ajuste DEA, Cobb-Douglas e Translog para a rede aérea. Figura 2.5: Diferenças entre as funções de custo Cobb-Douglas e translog no SFA. Uma vez tendo sido apresentadas algumas definições iniciais sobre fronteiras de produção e de custo, passa-se para as próximas seções, onde discutem-se algumas questões sobre os métodos de estimação das fronteiras de custo, já que estas fazem parte do objeto de estudo desse trabalho. 2.5 Estimação da Fronteira Estocástica de Custo De acordo com Zanini (2004), na prática não se conhece plenamente o CPP, dificul- tando também, o conhecimento da fronteira de custo. Logo, a eficiência de cada produtor não pode ser determinada. Todavia, métodos de estimação podem ser empregados a fim de contornar essa dificuldade. Segundo Kumbhakar e Lovell (2003) e Kumbhakar et al. (2015), esses métodos de estimação da fronteira de custo se baseiam em modelos estatísticos, que podem ser classificados como modelos estatísticos deterministas ou modelos estatísticos estocásticos, conforme classificação apresentada na seção 1.4. Nessa seção, será discutido o modelo de custo com fronteira estocástica, bem como as referidas possibilidades de estimação da eficiência econômica do produtor. Visando facilitar a exposição do tema, nas subseções que se seguem, serão abordados os seguintes assuntos: (i) - o modelo de custo com fronteira estocástica; (ii) - alguns 37 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 38 métodos estatísticos estocásticos de estimação paramétrica para a eficiência econômica; (iii) - síntese da especificação de um modelo SFA de custo; e, (iv) - considerações gerais. 2.5.1 Modelo de Custo com Fronteira Estocástica Como discutido na seção 2.4, o custo Ei observado para o produtor i, sob a ótica da orientação a inputs1, cuja eficiência econômica é dada por e−ui , pode ser formulado matematicamente como: Ei = C(wi, yi) · eui com ui ≥ 0. (2.18) De acordo com Kumbhakar et al. (2015), na equação (2.18), pode-se associar um vetor de parâmetros J-dimensional β que representa os parâmetros da tecnologia de produção, bem como acrescentar um termo de erro aleatório eνi , irrestrito em sinal e com média zero, obtendo-se a seguinte expressão: Ei = [C(wi, yi,β) · eνi ] · eui , com ui ≥ 0 e νi ∈ <. (2.19) Aplicando logaritmos a ambos os membros, vem: lnEi = lnC(wi, yi,β) + νi + ui, com ui ≥ 0 e νi ∈ <. (2.20) Por sua vez, admitindo que a função de custo seja linear nos logaritmos dos parâmetros β e, escrevendo i = νi + ui, chega-se ao seguinte resultado: lnEi = lnC(wi, yi,β) + i, i = νi + ui, com −∞ < νi < +∞ e ui ≥ 0. (2.21) Esse resultado é conhecido na literatura como Modelo de Custo com Fronteira Estocástica. Nele, destacam-se: (i) - o termo yi, que reprenta o nível de produção observado para o produtor i; (ii) - a função C(wi, yi,β), que representa a fronteira determinística de custo, comum a todos produtores, e define o mínimo custo de produção possível através da tecnologia em uso; e, (iii) - o termo i, que representa o erro composto. 1A orientação a inputs é mais indicada para a função de custo pois, de acordo com Altoé et al. (2017), nessa função, o principal objetivo não é decrescer o nível de outputs, mas sim decrescer os custos de operação. 38 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 39 O termo de erro composto (i) caracteriza conjuntamente, o termo νi, cuja finalidade é capturar o efeito dos choques aleatórios que afetam especificamente o i-ésimo produtor, e o termo ui, que descreve a ineficiência econômica apresentada por este. Além disso, pode-se rearranjar a equação (2.19) da seguinte maneira: e−ui = C(wi, yi,β) · e νi Ei . (2.22) Assim sendo, como a equação (2.22) traz a razão entre o custo mínimo C(wi, yi,β) ·eνi de produção possível e o custo de produção observado, deduz-se que a eficiência econômica do i-ésimo produtor pode ser mensurada através da expressão e−ui , tal qual proposto por Debreu (1951) e Farrel (1957). Se no modelo (2.21), a eficiência alocativa for assumida como total, então o termo ui será associado única e exclusivamente à ineficiência técnica do produtor. Porém se esta suposição não puder ser considerada, a interpretação de ui refletirá simultaneamente, os dois tipos de ineficiência: técnica e alocativa. Caso seja do interesse decompor o termo ui em suas componentes, torna-se necessário o emprego de equações simultâneas, como pode ser visto em Kumbhakar e Lovell (2003) e em Kumbhakar et al. (2015). 2.5.2 Métodos Estatísticos Estocásticos de Estimação Paramétrica para a Eficiência Econômica A estimação da eficiência econômica do produtor requer a estimação dos parâmetros da função de custo C(wi, yi,β). Uma abordagem possível consiste em considerar os desvios das posições observadas em relação à fronteira eficiente como resultado de uma possível ineficiência econômica do produtor e também, admite a influência de ruídos e eventos aleatórios, aos quais, tal produtor está sujeito. Além disso, se especifica suposições distributivas para os componentes de erros. Por isso, denomina-se tal abordagem como Métodos Estatísticos Estocásticos de Estimação Paramétrica. Dentre esses métodos, destaca-se o SFA, descrito a seguir. 2.5.2.1 Considerações Iniciais Com já descrito na subseção 2.5.1, o Modelo de Custo com Fronteira Estocástica possui a seguinte formulação matemática: 39 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 40 lnEi = lnC(wi, yi,β) + i, i = νi + ui, com −∞ < νi < +∞ e ui ≥ 0. (2.23) Os métodos de estimação paramétrica objetivam estimar os parâmetros deste modelo, partindo da suposição de comportamentos probabilísticos para os erros νi e ui, culminando na obtenção dos respectivos estimadores, como por exemplo, os de máxima verossimilhança. Logo, as suposições sobre esses comportamentos probabilísticos constituem o cerne desse processo de estimação. Vale então, ressaltar aqui, algumas premissas básicas que nortearão o entendimento das exposições feitas nas próximas seções. Primeiramente, seja considerar o erro aleatório νi. Este é tido como simétrico, a fim de capturar todo e qualquer choque aleatório ao qual o produtor esteja exposto. De acordo com Kumbhakar e Lovell (2003), a ideia de simetria é bem aceita pois, as condições externas favoráveis e desfavoráveis são igualmente prováveis. Assim, a suposição de uma distribuição simétrica, tal como a Normal, é uma boa indicação. Com relação ao erro ui, sabe-se que este objetiva capturar os efeitos da ineficiência econômica e, portanto, deve assumir valores não-negativos. Logo, devem-se considerar distribuições positivas como por exemplo, a Normal Truncada ou a Half -Normal. Já para o erro composto i, distribuições assimétricas são as mais indicadas, uma vez que, esse erro mede a soma entre um erro simétrico e um erro positivamente assimétrico. Por isso, modelos de regressão onde os erros sejam simetricamente distribuídos não são indicados para estimar a fronteira estocástica de custo. Outra questão diz respeito à independência entre νi e ui. Na maioria das vezes, esses erros são considerados independentes, uma vez que, choques aleatórios externos que estão fora do controle do produtor dificilmente são relacionados com a ineficiência econômica. Contudo, existem casos raros onde o contrário acontece, como por exemplo, flutuações sazonais influenciando a produção. Bandyopadhyay e Das (2006), Lai e Huang (2013) e Amsler et al. (2014) são alguns dos autores que trabalharam com essa problemática e apresentaram métodos de solução, baseados no emprego das funções Cópula, isto é, baseados em um método geral para formular distribuições multivariadas de maneira que diversos tipos de dependências possam ser representados. 40 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 41 2.5.2.2 Verificação Inicial da Assimetria de i Antes de se implementar o modelo de custo com fronteira estocástica para um determinado problema, vale a pena verificar se o contexto desse problema suporta a presença de ineficiência econômica (ui > 0). Caso não suporte, é desnecessário investir em técnicas mais caras de estimação. Pensando nisso, vários testes iniciais são apresentados na literatura. Basicamente, consistem em testar as seguintes hipóteses sobre o erro composto i = νi + ui: H0 :  é simétrico, H1 :  é assimétrico à direita. (2.24) Não rejeitar a hipótese nula implica assumir que o modelo não suporta a ineficiência econômica, isto é, ui = 0. Assim, i = νi passa a ser simétrico e o modelo se reduz a um modelo de regressão padrão, no qual a estimação por OLS é suficiente. Pensado nisso, algumas estatísticas de teste foram propostas na literatura, sendo a apresentada por Coelli (1995) a mais simples e também a mais utilizada. Nesta, após se calcular os resíduos OLS, obtém-se a seguinte estatística: M3T = m3√ 6m32 n ∼ sobH0 N(0, 12), (2.25) onde mi e n representam respectivamente, o i-ésimo momento dos resíduos e o tamanho amostral. Outras estatísticas também presentes na literatura são a √ b1 de Schmidt e Sickles (1984) e o teste LR (razão da verossimilhança da ineficência), descrito em Kumbhakar et al. (2015). Após verificada a presença de ineficiência econômica, pode-se seguir com o processo de estimação dos parâmetros do modelo de SFA. 2.5.2.3 Possíveis Comportamentos Probabilísticos Associados a ui Como dito anteriormente, uma vez sendo a ineficiência econômica positiva (ui > 0), devem-se considerar distribuições positivas. Na literatura, são apresentadas algumas opções, tais como Half -Normal (Aigner et al., 1977), Normal-Truncada (Stevenson, 1980), Gamma (Greene, 1990), Exponencial (Meeusen e van den Broeck, 1977), entre outras. Destas, por parcimônia, a Normal-Truncada e seu subcaso, Half -Normal, são as mais utilizadas. 41 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 42 A formulação para o modelo de custo com fronteira estocástica, baseada na suposição de que os erros ui seguem uma distribuição Normal-Truncada, se apresenta como: lnEi = lnC(wi, yi,β) + i, (2.26) lnEi = lnC(wi, yi,β) + νi + ui, (2.27) νi ∼ iid N(0, σ2ν), (2.28) ui ∼ iid N+(µ, σ2u), (2.29) ui e νi são independentes entre si, (2.30) ui e νi são independentes de xi. (2.31) A notação N+(µ, σ2u) representa o truncamento de uma distribuição normal N(µ, σ2u) com a seleção de valores acima de zero. Se µ = 0, reduz-se ao caso da distribuição Half - Normal. A Figura 2.6 ilustra algumas formas da distribuição Normal-Truncada para alguns valores selecionados de µ e σ2u. µ σ2u Figura 2.6: Exemplos de densidades de probabilidades para a Normal-Truncada. Fonte: adaptado de Kumbhakar et al. (2015). Quanto maior for a média µ da distribuição Normal-Truncada, mais ui se afasta de zero, ou seja, maior será o percentual de produtores com ineficiência econômica. Por outro lado, quando se optar por utilizar a distribuição Half -Normal (µ = 0), a moda será igual a zero e consequentemente, maior será o número de produtores totalmente 42 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 43 eficientes. A partir desse raciocínio, Kumbhakar et al. (2015) indicam o emprego da Normal-Truncada para produtores do setor público ou recém-privatizados, historicamente menos eficientes, e o emprego da Half -Normal para produtores pertencentes há mais tempo ao setor privado, geralmente mais eficientes por pertencerem a mercados mais competitivos. A fim de exemplificar a aplicação do modelo de custo com fronteira estocástica definido no conjunto de equações (2.26)-(2.31), seja considerar o caso simples de uma função de custo translog com inputs e outputs únicos, como segue: ln xi = β0 + β1 ln yi + β11 ln yi × ln yi + νi + ui. (2.32) Seja também, considerar os seguintes parâmetros de entrada para esse exemplo: n = 30 β0 = 0,40 β1 = 0,30 β11 = 0,20 ln yi = {0,05; 0,10; 0,15; . . . ; 2,00} νi ∼ iid N(0; 0,152) ui ∼ iid N+(0; 0,302) Os resultados obtidos para esta modelagem podem ser visualizados nas Figuras 2.7 e 2.8, apresentadas a seguir. 43 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 44 Figura 2.7: Densidades de probabilidades para o exemplo. 44 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 45 AB C D Figura 2.8: Fronteira estocástica de custo e desvios para o exemplo. Como pode ser observado nos resultados apresentados na Figura 2.7, o erro aleatório νi é simétrico em torno de zero e, o erro associado à ineficiência econômica, ui, é positivamente assimétrico. Consequentemente, o termo de erro composto i = νi + ui possuirá assimetria à direita, seguindo uma distribuição Skew-Normal (Azzalini, 1985, 2013). A Figura 2.8 apresenta o resultado gráfico da fronteira estocástica de custo para os 30 produtores em questão. Observa-se que os desvios em relação à fronteira são causados tanto pela aleatoriedade quanto pela ineficiência econômica. Existem alguns produtores que apresentam um grau de eficiência maior (mais próximos da fronteira), mas também, existem outros tantos menos eficientes (mais afastados da fronteira). Também é interessante ser observado que, “teoricamente” alguns produtores ultrapassaram a fronteira, caracterizando-os como “mais do que eficientes”, o que não faz sentido na prática. Isso se deveu única e exclusivamente à conjugação do ruído aleatório, ao qual estão expostos e sobre o qual não tem controle, com a ineficiência econômica. Seja, por exemplo, considerar no gráfico da Figura 2.8, os produtores representados pelos ponto A, B, C e D. O produtor situado em A apresenta ineficiência econômica (uA > 0) e encontra-se sob a influência de um ruído aleatório negativo (νA < 0). Logo, o produtor A situa-se abaixo da fronteira de custo C(wi, yi,β), uma vez que νA + uA < 0. 45 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 46 O produtor B, mesmo apresentando ineficiência econômica (uB > 0), situa-se sobre a fronteira de custo, pois sofre a influência do ruído aleatório negativo (νB < 0) e nesse caso, como νB = −uB, então νB +uB = 0. O produtor C apresenta ineficiência econômica (uC > 0) e está sob a influência de um ruído aleatório negativo menor que uC (uC > νC). Logo, este produtor está acima da fronteira de custo, uma vez que νC + uC > 0, porém foi beneficiado pelo ruído aleatório negativo. Já o produtor D apresenta ineficiência econômica (uD > 0) e está sob influência de um ruído aleatório positivo (νD > 0). Assim, como νD + uD > 0, este produtor situa-se acima da fronteira de custo e é penalizado um pouco mais pela influência positiva do ruído aleatório. A partir deste exemplo, pode-se concluir que diferentemente do que acontece no DEA, no SFA não se pode medir a ineficiência econômica diretamente a partir da distância do ponto à fronteira, uma vez que a componente aleatória νi pode exercer influência também. Como forma de ilustração, a Figura 2.9 a seguir, apresenta um resumo das fronteiras de custo estimadas para os dados do exemplo, utilizando as técnicas OLS, COLS, DEA e SFA. Figura 2.9: Fronteiras de custo estimadas para o exemplo: OLS, COLS, DEA e SFA. 46 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 47 2.5.2.4 Enfoque Frequentista para a Estimação de e−ui Seja agora, considerar um modelo de custo com fronteira estocástica baseado em Aigner et al. (1977), onde a ineficiência econômica ui é modelada através de uma distribuição de probabilidades Half -Normal, isto é, lnEi = lnC(wi, yi,β) + i, (2.33) lnEi = lnC(wi, yi,β) + νi + ui, (2.34) νi ∼ iid N(0, σ2ν), (2.35) ui ∼ iid N+(0, σ2u), (2.36) ui e νi são independentes entre si, (2.37) ui e νi são independentes de xi. (2.38) As funções densidade de probabilidade em questão são dadas por (o subscrito i será omitido): f(ν) = 1√ 2piσν exp ( − ν 2 2σ2ν ) , para −∞ < ν <∞, (2.39) f(u) = 2√ 2piσu exp ( − u 2 2σ2u ) , para u > 0. (2.40) Considerando a suposição de independência entre νi e ui, dada em (2.37), pode-se determinar a função densidade de probabilidade conjunta f(ν, u) da seguinte maneira: f(ν, u) = f(ν) · f(u), = 22piσνσu exp ( − ν 2 2σ2ν − u 2 2σ2u ) , para −∞ < ν <∞ e u > 0. (2.41) Uma vez que  = ν + u, a função densidade de probabilidade conjunta f(, u) pode ser obtida da equação anterior, resultando em: f(, u) = 22piσνσu exp [ −(− u) 2 2σ2ν − u 2 2σ2u ] , para −∞ <  <∞ e u > 0. (2.42) 47 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 48 A função densidade de probabilidade marginal f() pode ser obtida, integrando-se a função f(, u) dada em (2.42), isto é: f() = ∫ ∞ 0 f(, u)du = ∫ ∞ 0 fν(− u) · fu(u)du = ∫ ∞ 0 2 2piσνσu exp [ −(− u) 2 2σ2ν − u 2 2σ2u ] du = 2 σ φ (  σ ) Φ ( λ  σ ) , para −∞ <  <∞, (2.43) onde σ = √ σ2u + σ2ν é conhecido como parâmetro de escala, λ = σuσν representa o parâmetro de forma, φ(·) é a função densidade de probabilidades normal padrão e, Φ(·) é a função de distribuição de probabilidades acumuladas normal padrão. Maiores detalhes desse cálculo podem ser encontrados na seção A.1 do Apêndice A. De acordo com Kumbhakar e Lovell (2003), essa reparametrização para σ e λ, proposta por Battese e Corra (1977), é interessante pois, pode-se obter uma indicação das contribuições individuais de u e ν para . Se λ→ +∞, ou σ2u → +∞ ou σ2ν → 0, e com isso, o erro composto  é dominado pelo componente de erro assimétrico u. Caso contrário, se λ→ 0, ou σ2u → 0 ou σ2ν → +∞, o que faz o erro composto  ser dominado pelo componente de erro simétrico ν. A função densidade de probabilidade f() dada em 2.43 é assimétrica, sendo um caso particular da distribuição Skew-Normal (Azzalini, 1985, 2013). Sua média e variância são dadas por: E() = E(ν + u) = E(ν) + E(u) = σu √ 2 pi , V () = V (ν + u) = V (ν) + V (u) = pi − 2 pi σ2u + σ2ν . (2.44) Sabendo-se que i = Ei − C(wi, yi,β), que os i são independentes entre si e, utilizando a função densidade de probabilidade f() dada na equação (2.43), obtém-se a seguinte função de log-verossimilhança para uma amostra com I produtores independentes entre si: 48 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 49 lnL(1, 2, . . . , I ; β, λ, σ2) = ln[f(1; β, λ, σ2) · f(2; β, λ, σ2) · . . . · f(I ; β, λ, σ2)] = ln ∏ i f(i; β, λ, σ2) = ln ∏ i 2 σ φ ( i σ ) Φ ( λ i σ ) = ∑ i ln 2 σ φ ( i σ ) Φ ( λ i σ ) = ∑ i { ln2− ln σ + ln [ φ ( i σ )] + ln [ Φ ( λ i σ )]} = ∝ −I ln σ +∑ i ln [ φ ( i σ )] + ∑ i ln [ Φ ( λ i σ )] . (2.45) Derivando essa expressão e igualando as derivadas parciais a zero, obtém-se os estimadores de máxima verossimilhança para σ2, λ e β, isto é, σˆ2, λˆ e βˆ. As estimativas para σ2u e σ2ν podem ser obtidas a partir da resolução do seguinte sistema linear:  σˆ = √ σˆ2u + σˆ2ν λˆ = σˆu σˆν . (2.46) O que resulta em: σˆ2u = λˆ2 (1 + λˆ2) σˆ2, σˆ2ν = 1 (1 + λˆ2) σˆ2. (2.47) O estimador σˆ2u pode ser interpretado como a ineficiência econômica média dos produtores, sendo denominado média incondicional de ui. Observe que σˆ2u 6= σˆ2ui . Uma outra estatística de teste para a hipótese de ausência de ineficiência econômica nos dados é proposta por Llorca et al. (2014): 49 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 50 γ = σ 2 u σ2u + σ2ν = λ 2 1 + λ2 . (2.48) No entanto, apesar da semelhança desta expressão com a do coeficiente de determição R2 de um modelo de regressão, Kumbhakar et al. (2015) alertam que são conceitos bem diferentes. Logo, γ não deve ser interpretada como a proporção de variação atribuída à ineficiência econômica, uma vez que σˆ2u 6= σˆ2ui . Como o principal objetivo do modelo de custo com fronteira estocástica dado em (2.33)-(2.38) é permitir o cálculo das (in)eficiências individuais, torna-se necessário calcular os valores de uˆi e e−uˆi . A solução, proposta por Jondrow et al. (1982), consiste em estimar ui a partir do valor esperado de ui condicional ao erro composto do modelo, i = νi + ui. Para isso, primeiro torna-se necessária a definição da função de probabilidade condicional f(u|), conforme se segue (o subscrito i será omitido): f(u|) = f(u, ) f() = 1√ 2piσ∗ · Φ ( µ∗ σ∗ )exp[−12 ( u− µ∗ σ∗ )2] , para u > 0, (2.49) onde u| ∼ N+(µ∗, σ2∗), com µ∗ = σ 2 u σ2 e σ 2 ∗ = σ2νσ 2 u σ2 . Logo, uˆi = E(ui|i) = ∫ ∞ 0 u · f(u|)du = ∫ ∞ 0 u√ 2piσ∗ · Φ ( µ∗ σ∗ )exp[−12 ( u− µ∗ σ∗ )2] du = µ∗i + φ ( µ∗i σ∗ ) Φ ( µ∗i σ∗ )σ∗. (2.50) Os detalhes desse cálculo estão disponíveis na seção A.2 do Apêndice A. Outra alternativa também sugerida por Jondrow et al. (1982) diz que o estimador uˆi pode ser obtido a partir da moda de f(u|), isto é, 50 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 51 uˆi = M(ui|i) =  µ∗i, se i ≥ 00, caso contrário. (2.51) Por fim, a estimativa pontual para a eficiência econômica do i-ésimo produtor pode ser mensurada a partir de: EEi = e−uˆi . (2.52) Battese e Coelli (1988) propuseram outra alternativa para estimar a eficiência econômica do i-ésimo produtor: EEi = E(e−ui |i) = exp ( −µ∗ + 12σ 2 ∗ ) · Φ ( µ∗ σ∗ − σ∗ ) Φ ( µ∗ σ∗ ) . (2.53) Os detalhes desse cálculo também estão disponíveis na seção A.3 do Apêndice A. Uma vez que E[e−ui |i] 6= e−E(ui|i), observa-se que as estimativas dadas pelas equações (2.52) e (2.53) podem dar resultados diferentes. Entretanto, de acordo com Kumbhakar e Lovell (2003), o uso do estimador uˆi produz estimativas não tendenciosas (E(uˆi) = ui) para a eficiência econômica, porém inconsistentes em ambos casos, isto é, mesmo se aumentando o tamanho da amostra de produtores, a probabilidade de a estimativa estar próxima do valor verdadeiro do parâmetro da população é pequena. Do ponto de vista computacional, segundo Veronese (2015), para estimar os parâ- metros do modelo de custo com fronteira estocástica, é comum a utilização de algoritmos recursivos que tenham como objetivo maximizar a log-verossimilhança dessas funções. Assim, o algoritmo de Newton-Raphson e suas variantes, como é o caso do método de Broyden-Fletcher-Goldfarb-Shanno (BFGS) (ver Nocedal e Wright (2006)), são os mais empregados para estimação em modelos de erro composto, a partir da máxima verossimilhança, como é o caso do modelo SFA. Considerando um vetor Θ = [λ, σ2,β] de 51 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 52 parâmetros do SFA a serem estimados, a equação (2.54) a seguir, representa o conjunto de iterações s desse algoritmo: Θs+1 = Θs − [ ∂2l(Θs) ∂Θ2 ]−1 ∂l(Θs) ∂Θ , (2.54) onde l(Θ) é a função log-verossimilhança de erro composto. Porém, o algoritmo requer condições de inicialização, isto é, requer um vetor Θ0 = [λ0, (σ2)0,β0] de valores iniciais para ser executado. Geralmente, essa situação é resolvida, considerando-se que (σ2)0 e β0 são aqueles resultantes da regressão OLS, fixando λ = 0. Já para λ0, Bogetoft e Otto (2011) propõem considerar λ0 = 1. Apesar das boas propriedades da distribuição Skew-Normal, Sartori (2006) e Azzalini (2013) chamam a atenção para o fato de a estimativa de máxima verossimilhança para o parâmetro λ poder se tornar infinita, com probabilidade positiva. E isso não é bom, uma vez que λ é um parâmetro crítico para estimar a (in)eficiência econômica dos produtores. Se λ −→∞, então u domina o erro composto e as ineficiências estimadas tendem a 100%. Veronese (2015) identificou esse problema utilizando o banco de dados do SBDEE. Uma segunda preocupação diz respeito à possibilidade de existência de heterocedas- ticidade nos erros νi e ui, isto é, estes podem possuir variâncias σ2ν e σ2u não constantes. Isso compromete a estimativa das (in)eficiências econômicas do produtor. Exemplos de situações onde esse fato acontece, bem como métodos de solução para o problema podem ser encontrados nos trabalhos de Caudill e Ford (1993) e Hadri (1999). 2.5.2.5 Enfoque Bayesiano para a Estimação de e−ui Como dito anteriormente, as metodologias mais usuais de benchmarking (DEA, COLS, SFA e StoNED) apresentam dificuldades quando lidam com amostras consideradas pequenas, ou quando outliers se fazem presentes na base de dados, ou ainda quando os produtores sob análise não operam sob as mesmas condições tecnológicas de produção e de custo. Especificamente no caso do SFA, ainda existem os já relatados problemas de convergência de estimação. Frente a esses agravantes, uma metodologia baseada no método Bayesiano vem se mostrando eficaz para a estimação de fronteiras de eficiência, sem incorrer nos problemas das outras técnicas. Trata-se do Bayesian Stochastic Frontier Analysis (BSFA), cujo trabalho seminal foi proposto por van den Broeck et al. (1994). 52 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 53 O BSFA apresenta a vantagem de incorporar informações existentes a priori, isto é, conhecimentos, resultados ou particularidades prévias dos produtores podem ser incorporadas aos parâmetros do modelo atual (prioris informativas). Todas as inferências seguem o princípio de Bayes, e são combinadas com a informação oriunda dos dados (função de verossimilhança), tornando o método altamente confiável. Qualquer tamanho amostral pode ser considerado, independentemente deste ser pequeno ou grande, isto é, as estimações são imparciais em relação ao tamanho amostral (Chen et al., 2015). Fato esse que pode ser considerado um contraste em relação à inferência frequentista, que se torna mais tendenciosa à medida que o tamanho da amostra diminui do infinito. Além disso, o BSFA atende bem às situações que envolvem heterogeneidade e está mais próximo da realidade, garantindo assim que a eficiência seja corretamente estimada (Chen et al., 2015). E por fim, segundo Souza et al. (2007), a incerteza na distribuição de ui associado à ineficiência dos produtores e a incerteza sobre qual função de custo C(wi, yi, β) utilizar suportam o emprego de técnicas Bayesianas. A abordagem Bayesiana para estimação de um vetor ψ de parâmetros utiliza uma distribuição a priori para ψ, f(ψ), e uma distribuição de probabilidades da amostra (dis- tribuição amostral ou função de verossimilhança), f(E1, E2, . . . , EI |ψ), para determinar a distribuição a posteriori para ψ, isto é, f(ψ|E1, E2, . . . , EI). Assim, essa distribuição a posteriori de ψ contém informações provenientes tanto da amostra como dos conhe- cimentos prévios (priori). Para realizar inferência sobre ψ dado E = {E1, E2, . . . , EI}, torna-se necessário especificar a seguinte distribuição de probabilidades conjuntas: f(E,ψ) = f(E|ψ) · f(ψ). (2.55) Em seguida, após observar E, faz-se uso do Teorema de Bayes para se determinar a distribuição a posteriori: f(ψ|E) = f(E,ψ) f(E) = f(E|ψ)f(ψ)∫ ψ f(ψ,E)dψ = f(E|ψ)f(ψ)∫ ψ f(E|ψ)f(ψ)dψ = L(E|ψ) · f(ψ) f(E) . (2.56) 53 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 54 A partir desse último resultado, pode-se observar que: f(ψ|E) ∝ L(E|ψ) · f(ψ), (2.57) ou seja, a distribuição a posteriori é proporcional à distribuição amostral (verossimilhança) multiplicada pela distribuição a priori. Quando a priori é fracamente informativa2, essa proporcionalidade é dominada pela função de verossimilhança, principalmente nos casos de amostras grandes. Esta última associa a cada valor de ψ o valor f(E|ψ). Portanto, ao fixar um valor para E e variar os valores de ψ, pode ser observada a plausabilidade de cada um dos valores de ψ. A distribuição a posteriori resume todas as informações disponíveis sobre o vetor ψ de parâmetros, condicional aos dados observados. Além disso, a abordagem Bayesiana para a estimação de parâmetros permite revisar a priori com novas informações, aperfeiçoando o conhecimento a posteriori. O estimador pontual Bayesiano de ψ pode ser definido como o valor médio da distribuição a posteriori, isto é, ψˆ = E[ψ|E] = ∫ ψ ψf(ψ|E)dψ. (2.58) Infelizmente, na maioria das vezes o cálculo desta última integral é intratável analiticamente. De acordo com Souza (2008), esse fato atrasou por muito tempo o desenvolvimento de modelos Bayesianos. Somente nas últimas três décadas, com a evolução da simulação computacional, é que este cenário se reverteu. Devido à complexidade, os modelos Bayesianos necessitam na maioria das vezes, do suporte de métodos de simulação, tais como aqueles que usam o procedimento conhecido como Markov Chain Monte Carlo (MCMC)3. Dentre estes, van den Broeck et al. (1994) empregaram métodos de Monte Carlo via função de importância, e Koop et al. (1995) investigaram a utilização do Amostrador de Gibbs para a realização de inferências sobre a distribuição a posteriori, concluindo que o mesmo pode ser considerado como uma técnica numérica eficiente. Ainda segundo Souza (2008), esses dois trabalhos serviram de base para diversos outros estudos envolvendo fronteiras estocásticas e métodos de simulação. Osiewalski e Steel (1998) trazem um estudo com descrição detalhada sobre esses métodos numéricos de simulação. 2Quando o pesquisador acredita que a informação disponível a priori é pouca ou pobre. 3Uma síntese das principais ideias deste procedimento é apresentada no Apêndice B. 54 2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 55 Para exemplificar a abordagem Bayesiana para um modelo de custo com fronteira estocástica (BSFA), seja considerar o seguinte modelo já apresentado anteriormente: lnEi = C(wi, yi,β) + νi + ui. (2.59) A formulação se inicia com a especificação das distribuições de probabilidade a priori para os parâmetros do modelo. Por exemplo, seja considerar as seguintes opções: βk ∼ iid N+(0, σ2β), νi ∼ iid N(0, σ2ν), ui ∼ iid Γ(1, τ > 0), 1 σ2 ∼ Γ(a > 0, b > 0), τ ∼ Γ[1,−log(r∗)], sendo Γ(·) a função densidade de probabilidades Gama de dois parâmetros e r∗ = mediana da distribuição a priori da eficiência, tal que 0 < r∗ < 1. Como há interesse em se fazer inferências sobre e−ui dos produtores, a distribuição de Ei e ui, dado o vetor de parâmetros ψ = (βT , σ2ν , τ), é dada por: f(Ei, ui|ψ) = N(Ei|C(wi, yi,β) + ui, σ2ν) · Exponencial(ui|τ). (2.60) Uma vez que, f(ui|Ei,ψ) = f(Ei, ui|ψ) f(Ei|ψ) = f(Ei, ui|ψ)∫∞ 0 f(Ei, ui|ψ)dui , (2.61) pode-se escrever a seguinte distribuição de probabilidades a posteriori para ui: f(ui|Ei,ψ) = Φ C(wi, yi,β)− Ei − σ2ντ σν −1 ·N (ui|C(wi, yi,β)− Ei − σ2ν τ , σ2ν ) . (2.62) Assim, como a distribuição condicional a posteriori para ui é agora conhecida, e segundo Souza et al. (2007), é a mesma obtida por Jondrow et al. (1982), pode-se utilizar o Amostrador de Gibbs para gerar observações de ui. Logo, as (in)eficiências econômicas dos produtores podem ser assim estimadas. Como viés e ponto de preocupação com relação ao MCMC, é necessária uma monitoração fina da convergência dos parâmetros do modelo, isto é, após a simulação ser realizada, é crucial verificar a convergência das sequências simuladas. Cowles e Carlin (1996) apresentam alguns métodos propostos na literatura que permitem fazer essa 55 2.6. INCORPORAÇÃO DE VARIÁVEIS EXÓGENAS AO SFA 56 monitoração, sendo o mais simples e usual dentre eles, aquele que constrói um gráfico de autocorrelação amostral, onde se espera um decaimento rápido dos valores plotados à medida que se avança no eixo dos lags. Caso isso não aconteça, fato muito comum devido à natureza Markoviana das amostras, alternativas de correção4 são apresentadas em Gilks e Roberts (1996), tais como: reparametrização, thinning, cadeias paralelas, aumento do número de iterações e burn-in. De acordo com Dorfman e Koop (2005), os métodos econométricos que se baseiam em técnicas Bayesianas vêm sendo utilizados em maior escala ultimamente, em modelos que possuem vetores de grande dimensão, graças aos avanços do poder computacional nas últimas décadas e ao desenvolvimento de simuladores que aproveitam esse poder, como é o caso do MCMC. E devido ao fato dos modelos de SFA, muito comumente, se enquadrarem nesse contexto de grandes dimensões, há um aumento da motivação e uma crescente popularidade dos métodos Bayesianos na análise eficiência. Apesar dessa recente popularidade, infelizmente, segundo Souza et al. (2010b), são poucos os estudos com enfoque Bayesiano aplicados ao setor de regulação energética brasileira. Nesse sentido, destacam-se os trabalhos de Souza et al. (2007), Souza (2008) e Souza et al. (2010b), muito embora os autores afirmarem que esses estudos têm abertura para melhorias e aprofundamentos na abordagem empregada. 2.6 Incorporação de Variáveis Exógenas ao SFA Até o presente momento, foram apresentadas características dos modelos de estima- ção para a fronteira estocástica de custo, levando-se em consideração que a (in)eficiência econômica do produtor é determinada pelos inputs utilizados, pela tecnologia produtiva em questão e pelos outputs obtidos. Porém, em alguns cenários, existem variáveis ambien- tais ou exógenas ao contexto produtivo que podem exercer tanta ou até maior influência. São exemplos de variáveis exógenas: a competitividade do mercado, a estrutura gerencial, a cadeia de abastecimento e algumas variáveis ambientais. Mais especificamente, para o cenário de distribuição energética, Gil et al. (2017) elencam algumas possibilidades de variáveis exógenas: índice de precipitação pluviométrica, incidência de raios, altura da vegetação sob/sobre a rede elétrica, declividade do terreno, grau de pavimentação das estradas, duração média da interrupção de energia (DIE), frequência de interrupção de energia (FIE), área de concessão, entre outras. 4Alguns desses conceitos são apresentados no Apêndice B. 56 2.6. INCORPORAÇÃO DE VARIÁVEIS EXÓGENAS AO SFA 57 Além disso, Gil et al. (2017) propuseram uma nova variável, denominada e.variable, que é uma combinação linear das variáveis ambientais disponíveis. A variável e.variable é a variável mais correlacionada linearmente com as atuais eficiências das DSOs brasileiras, estimadas pelo regulador. 2.6.1 Contextualização para o SBDEE Em países que possuem dimensões continentais, como é o caso do Brasil, é grande a diversidade geográfica e climática. Haja vista, por exemplo, as várias diferenças entre as cinco regiões brasileiras: uma região norte muito úmida, com índices pluviométricos altíssimos, contrastando com uma região nordeste de clima semi-árido, onde a chuva ocorre raramente ou nunca ocorre. Também, pode-se citar as diferenças na infra-estrutura econômica e social entre as várias regiões: o sul e sudeste mais bem servidos nesse quesito, enquanto muitas cidades das demais regiões são desprovidas de uma infraestrutura mínima. Pode-se citar também, os vários biomas espalhados pelo país: regiões com florestas densas ao norte, vegetação de caatinga no nordeste, pantanal mais ao centro- oeste, mata atlântica e cerrado no sudeste e pampa ao sul. Isso sem falar na grandiosidade territorial: muitos dos 27 estados brasileiros são maiores que muitos países do mundo. Assim, ao se proceder com estudos de benchmarking, como é o caso do SFA, essas diferenças regionais contribuem para que o processo produtivo seja influenciado não somente por variáveis inerentes ao mesmo, mas também por variáveis exógenas. Por exemplo, considerando o SBDEE, é de se esperar que a variável exógena índice pluviométrico seja significativa para explicar a diferença entre os escores de eficiência de duas concessionárias situadas, respectivamente, uma em região úmida e outra em região do semi-árido nordestino. Em congruência, os escores de eficiência também podem ser atualizados por essas variáveis exógenas, uma vez que, no geral, produtores localizados em um ambiente de variáveis exógenas favoráveis devem ter seus escores de eficiência diminuídos, pois o ambiente contribui parcialmente para um maior escore de eficiência. Enquanto que aqueles produtores, localizados em um ambiente de variáveis exógenas não tão favoráveis, devem ter seus escores de eficiência aumentados, pois esse ambiente desfavorável impede que os produtores obtenham maiores escores de eficiência. Além disso, produtores que se encontram geograficamente mais próximos podem estar sujeitos às mesmas influências exógenas, permitindo a configuração de clusters. Especificamente, no caso da regulação tarifária energética brasileira, estudos recentes 57 2.6. INCORPORAÇÃO DE VARIÁVEIS EXÓGENAS AO SFA 58 de Veronese et al. (2018) e Gil et al. (2017) demonstram a significância de variáveis exógenas para a estimação dos escores de eficiência, via DEA, das várias concessionárias de distribuição, espalhadas pelo país. Utilizando conceitos de estatística espacial, os autores discorrem sobre as várias possibilidades de influência dessas variáveis exógenas e mensuram seu índice de correlação com os escores de eficiência das distribuidoras, encontrando resultados com alta significância. Também compararam os escores de eficiência calculados pelo regulador com os escores obtidos a partir da incorporação de variáveis exógenas. Os resultados demonstram diferenças paupáveis entre esses escores, além de concluírem que as DSOs localizadas no norte do Brasil podem ter suas eficiências de custo aumentadas usando informações ambientais. No caso do SFA, existe uma variedade de estudos na literatura concebidos com o intuito de incluir variáveis exógenas ao SFA. Podem-se destacar os trabalhos pioneiros de Deprins e Simar (1989b,a), Kumbhakar et al. (1991), Reifschneider e Stevenson (1991), Huang e Liu (1994) e Battese e Coelli (1995), além de trabalhos mais recentes como os de Alvarez et al. (2006) e Llorca et al. (2016). Os estudos de Kumbhakar et al. (1991) e Reifschneider e Stevenson (1991) são os mais disseminados, sendo por isso, descritos a seguir. 2.6.2 Modelo Proposto por Kumbhakar et al. (1991) Kumbhakar et al. (1991) apresentaram o seguinte modelo para a fronteira estocástica de custo, com inserção de variáveis exógenas: lnEi = lnC(wi, yi,β) + νi + ui, (2.63) ui = ziδ + ζi, com ui ≥ 0 (2.64) lnEi = lnC(wi, yi,β) + νi + (ziδ + ζi), (2.65) onde, Ei é o custo observado para o i-ésimo produtor, lnC(wi, yi,β) + νi representa a fronteira estocástica de custo, νi e ui continuam representando os termos que visam capturar, respectivamente, os efeitos da aleatoriedade sobre o processo produtivo e da ineficiência econômica. A novidade reside na introdução do vetor zi de variáveis exógenas com seus respectivos coeficientes δ, que podem ter influência sobre a ineficiência econômica (ui está parametrizado linearmente em função de zi). Por fim, o termo ζi representa um componente de erro aleatório associado a ui, entretanto não é levado em 58 2.6. INCORPORAÇÃO DE VARIÁVEIS EXÓGENAS AO SFA 59 consideração nessa modelagem. Os comportamentos probabilísticos destes componentes de erro são dados por: νi ∼ iid N(0, σ2ν), (2.66) ui ∼ N+(ziδ, σ2u), (2.67) ui e νi são independentes entre si, (2.68) (2.69) Segundo Kumbhakar e Lovell (2003), pode-se observar a partir de (2.67) que: (i) - as ineficiências ui não são identicamente distribuídas; (ii) - se zi1 = 1, zi2 = 0, . . . , ziZ = 0 e δ1 = constante, δ2 = 0, . . . , δZ = 0, o modelo (2.64)-(2.66) reduz-se ao modelo de Stevenson (1980), dado em (2.26)-(2.31), com ui seguindo uma distribuição Normal- Truncada de média δ1. E, se inclusive, δ1 = 0, o modelo de reduz ao proposto por Aigner et al. (1977), baseado na distribuição Half-Normal; e, (iii) - a suposição de que a média de ui é ziδ faz com que cada observação i tenha uma média específica, sendo por isso, uma modelagem mais flexível que o modelo de Stevenson (1980), que considera média µ fixa para todas as observações (Kumbhakar e Lovell, 2003). Os parâmetros do modelo dado em (2.63)-(2.65) podem ser estimados, permitindo assim, obter as estimativas para as (in)eficiências econômicas. 2.6.3 Modelo Proposto por Reifschneider e Stevenson (1991) Uma alternativa ao modelo de Kumbhakar et al. (1991) é apresentada por Reifsch- neider e Stevenson (1991). Nesta, a estrutura geral para o modelo de fronterira estocástica para o custo é dada por: lnEi = lnC(wi, yi,β) + νi + ui, (2.70) ui = g(zi; δ) + ζi, com ui ≥ 0, g(zi; δ) ≥ 0, ζi ≥ 0 (2.71) lnEi = lnC(wi, yi,β) + g(zi; δ) + νi + ζi, (2.72) onde ui = g(zi; δ)+ζi, representando a eficiência econômica ajustada. Os comportamentos probabilísticos são dados por: 59 2.6. INCORPORAÇÃO DE VARIÁVEIS EXÓGENAS AO SFA 60 νi ∼ iid N(0, σ2ν), (2.73) ζi ∼ iid N+(0, σ2ζ ). (2.74) Com isso, as seguintes observações podem ser feitas: (i) - os procedimentos de estimação seguem a mesma lógica do modelo de Kumbhakar et al. (1991), com as devidas alterações necessárias; (ii) - a vantagem desse modelo reside na consideração do termo aleatório da ineficiência econômica, ζi, desprezado por Kumbhakar et al. (1991); e, (ii) - em (2.71), se ζi ≥ 0, então ui ≥ g(zi; δ), ou seja, g(zi; δ) pode ser interpretada como uma fronteira determinística para a ineficiência econômica, em um ambiente caracterizado pela influência de variáveis exógenas zi. 2.6.4 Lidando com Produtos Indesejados De acordo com Kumbhakar et al. (2015), em geral, se um produtor é totalmente eficiente economicamente, então uma redução na saída de um produto indesejado só é possível se a saída de produtos desejáveis também for reduzida. Porém, essa propriedade de monotocidade não é sempre satisfeita em modelos nos quais a mesma tecnologia de produção é empregada para produzir tanto saídas boas quanto ruins em conjunto. Segundo esses autores, não há um consenso a respeito de como lidar com a questão. A princípio, tentou-se modelar esses produtos como insumos, porém segundo Färe et al. (2005), essa tentativa retornaria um conjunto de resultados ilimitado, o que é fisicamente impossível, caso os insumos tradicionais fossem utilizados. Outra abordagem busca separar as saídas desejáveis das indesejáveis e, a partir disso, utilizar o modelo de fonteira estocástica para cada tecnologia. Assim, consegue-se separar a eficiência econômica da eficiência ambiental. Todavia, segundo Atkinson e Dorfman (2005), essa separação não é muito consistente com os resultados empíricos. Alguns trabalhos nessa linha podem ser encontrados em Forsund (2009) e Kumbhakar e Tsionas (2013). 2.6.5 Considerações Gerais Segundo a Cambridge Economic Policy Associates (CEPA (2013)) , uma instituição internacional ligada à regulação econômica de serviços públicos, alguns critérios para avaliação do processo de benchmarking devem ser considerados. Dentre eles, destacam- se: praticidade de aplicação, robustez da metodologia, transparência e verificabilidade, 60 2.7. SÍNTESE DA ESPECIFICAÇÃO DE UM MODELO DE SFA 61 captura de fatores específicos do setor, mínima restrição ao formato da fronteira, con- sistência com outras abordagens e com a teoria econômica. Logo, a consideração de variáveis exógenas no processo de obtenção dos escores de eficiência vai ao encontro do critério de captura dos fatores específicos do setor. Consoante à essa ideia, Nieswand e Seifert (2018) alertam que as estimativas de fronteiras de custos precisam incorporar condições operacionais quando elas afetam as possibilidades de produção. Caso contrário, as estimativas de eficiência não têm sentido. No entanto, apesar de muitas serem as orientações e sugestões sobre a importância de se considerar a influência de variáveis exógenas, no 4CRTP, a ANEEL decidiu não promover nenhum ajuste dos escores de eficiência nesse sentido, contrariando a prática de agentes reguladores mais maduros. Lopes et al. (2016) apresentam críticas construtivas quanto a essa postura e sugerem que o regulador deve repensar sua metodologia. Ao se identificar a magnitude dos efeitos das variáveis exógenas sobre os escores de eficiência, o produtor pode tomar decisões e adotar políticas que minimizem os efeitos negativos dessas variáveis. Outro bônus apontado na literatura é a possibilidade de poder identificar variáveis faltantes no modelo. Todavia, no caso da ANEEL, vale destacar o argumento apresentado por Lopes et al. (2016), afirmando que as variáveis exógenas e endógenas tem alta dispersão, ou seja, as diferenças nessas variáveis, de acordo com as várias regiões atendidas pelas DSOs, são bem significativas. Logo, pode-se perceber que, além das diferenças operacionais, essas diferenças ameaçam a premissa básica da metodologia DEA empregada pelo regulador, de que as DMUs devem ser comparáveis em relação aos seus inputs e outputs. 2.7 Síntese da Especificação de um Modelo de SFA Até aqui, foram apresentadas definições e discussões sobre alguns dos mais im- portantes modelos de SFA. Logo, antes de dar prosseguimento às demais ideias deste trabalho, julga-se válido fazer uma síntese da especificação geral para estes modelos, conforme a seguir. O modelo SFA deve ser capaz de explicar o comportamento estocástico das fronteiras de produção ou de custo, com consequente avaliação das eficiências apresentadas pelos produtores, levando-se em consideração: (i) a função determinística de produção ou de custo, comum a todos os produtores; (ii) os efeitos dos choques aleatórios que afetam especificamente o i-ésimo produtor; e, (iii) os efeitos gerados pelas ineficiências técnica 61 2.7. SÍNTESE DA ESPECIFICAÇÃO DE UM MODELO DE SFA 62 ou alocativa do i-ésimo produtor. Sendo assim, é de extrema importância observar como se dá a especificação de cada uma dessas considerações. Com esse propósito, a seguir, listam-se algumas premissas básicas. Existem várias formas funcionais para as funções de produção e de custo. Algumas são mais simples, como é o caso da Cobb-Douglas, outras mais sistêmicas e flexíveis, como é o caso da Translog. A forma a ser escolhida tem impacto direto nos resultados almejados. Por isso, é aconselhável fazer um estudo prévio do problema que se pretende modelar e de quais formas funcionais melhor se adequam à situação em questão. Deixar de considerar a influência dos choques aleatórios inerentes ao processo, sobre o desempenho do produtor, é assumir que todo e qualquer desvio em relação à fronteira de produção ou de custo, se deve única e exclusivamente às ineficiências técnicas e/ou alocativas. Premissa essa, pouco provável. Assim, ao se atribuir um termo que capture os choques aleatórios, consegue-se modelar a realidade de maneira mais verossímil. Além disso, a atribuição de um comportamento probabilístico simétrico, centrado em zero, homocedástico, permite que tanto influências favoráveis quanto desfavoráveis sejam igualmente prováveis. Com relação aos efeitos gerados pelas ineficiências técnicas e/ou alocativas, sabe- se que estes devem assumir valores não-negativos. Logo, é aconselhável a escolha de distribuições positivas, como por exemplo, a Normal-Truncada, a Half -Normal ou a Exponencial. Algumas delas vão permitir um maior número de produtores com escores maiores de eficiência e, outras vão dificultar essa situação. A escolha deve-se basear sempre na premisa de maior aderência aos dados, levando-se também em conta o princípio da parcimônia. Também, deve-se garantir a homocedasticidade desses efeitos. O termo composto pelos erros aleatórios e pelos erros de ineficiência terá comporta- mento com assimetria à esquerda no caso dos modelos de produção e, comportamento com assimetria à direita para os modelos de custo. Além disso, possuem, em ambos os casos, médias não-nulas. A partir deste erro composto, é possível montar toda a estrutura de estimação dos parâmetros do modelo em questão. Geralmente, opta-se pela estimação via máxima verossimilhança. Suposições erradas, podem destruir toda a estrutura de estimação e inflacionar os escores de (in)eficiência do produtor. No entanto, o SFA tem grandes problemas de estimativa estatística, como problemas de convergência para pequenas amostras, conforme relatado por Azzalini (2013) e Sartori (2006). Os problemas de convergência podem ser superados usando uma abordagem Bayesiana (BSFA) (Bayes e Branco, 2007). No entanto, os modelos de BSFA tendem a 62 2.7. SÍNTESE DA ESPECIFICAÇÃO DE UM MODELO DE SFA 63 ser complexos, exigindo o apoio de métodos de simulação computacional, tais como o Markov Chain Monte Carlo (van den Broeck et al., 1994). Por fim, é perceptível na literatura de SFA, um maior avanço nos estudos de métodos paramétricos para estimação das fronteiras de produção e de custo, tanto em profundidade quanto em extensão. Isso se deve, em grande parte, à capacidade dos modelos paramétricos de se aproximarem mais da realidade dos produtores, absorvendo e incorporando elementos antes desprezados pelos métodos não-paramétricos, como é o caso, por exemplo, da influência de eventos aleatórios na produção. E um desses avanços diz respeito à icorporação de variáveis exógenas ou ambientais ao modelo de SFA. Essas variáveis são externas ao processo produtivo, mas podem exercer influência sobre a (in)eficiência técnica do produtor. De uma maneira geral, as considerações feitas acima, constituem uma síntese estrutural para os modelos de SFA, a fim de que os mesmos sejam bem definidos e possam alcançar seus objetivos. Todavia, isso não impede que adaptações possam ser feitas ou melhorias possam ser sugeridas, como as que são propostas e expostas no próximo capítulo desse trabalho. 63 C a p ít u l o 3 Parametrizações e Modelagens Propostas para o SFA Nesse terceiro capítulo, são apresentadas as propostas de parametrizações alterna-tivas e sete modelagens para o SFA de custo, todas com abordagem Bayesiana.Também, são apresentadas algumas características da base de dados utilizada. 3.1 Preliminares Como foi discutido nos capítulos anteriores, as metodologias mais usuais de ben- chmarking (DEA, COLS e SFA) apresentam dificuldades quando lidam com amostras consideradas pequenas, ou quando outliers se fazem presentes na base de dados, ou ainda quando as distribuidoras sob análise não operam sob as mesmas condições tecnológicas de produção e de custo. Especificamente no caso do SFA, ainda existem os já relatados problemas de convergência de estimação. Entretanto, algumas alternativas às parametrizações clássicas do modelo SFA são apresentadas na literatura, visando dar robustez à metodologia. Dentre elas, podem-se citar: Sartori (2006) propõe um estimador para corrigir o viés de forma, denominado fator M ; Liseo e Loperfido (2006) propõem um modelo de inferência Bayesiana; Bayes e Branco (2007) propõem uma aproximação para o fator M e um modelo alternativo de inferência Bayesiana; Griffin e Steel (2007) primeiro aplicaram um modelo de SFA robusto utilizando uma distribuição t-Student para o componente de ruído e, em seguida, os parâmetros 65 3.2. PROPOSTA DE PARAMETRIZAÇÕES PARA O SFA 66 do SFA foram estimados utilizando uma abordagem Bayesiana; recentemente, Stead et al. (2017) aplicaram a distribuição t-Student para o termo de ruído no modelo SFA, a fim de aumentar a robustez do modelo para outliers. Nesse caso, a função densidade de probabilidades do erro composto foi escrita como: f() = ∫ ∞ 0 Γ ( a+1 2 ) Γ ( a 2 )√ pia σν [ 1 + 1 a ( − u σν )]−a+12 √2√ pi σu φ ( u σu ) du, (3.1) onde a é o grau de liberdade da distribuição t-Student e Γ(·) é a função Gama. À medida que a → ∞, a distribuição t-Student aproxima-se da distribuição Normal. A equação (3.1) é intratável analiticamente. No entanto, aproximações usando métodos de simulação numérica podem ser aplicadas (Train, 2009). Em consonância, esse trabalho apresenta algumas propostas de parametrizações alternativas e inéditas para o SFA, conforme descrito a seguir. 3.2 Proposta de Parametrizações para o SFA Os modelos de SFA propostos baseiam-se na parametrização alternativa da dis- tribuição Skew-Normal, descrita a seguir. Como introduzido inicialmente por Azzalini (1985), uma variável aleatória Z tem uma distribuição Skew-Normal1 padrão com função densidade de probabilidade dada por: fZ(z) = 2φ (z) Φ (λz) , z ∈ <, λ ∈ <, (3.2) onde φ e Φ são, respectivamente, a função de densidade e a função de distribuição acumulada de uma Normal Padrão, e λ é o parâmetro de assimetria. Uma nova variável X pode ser construída a partir de Z, acrescentando-se um parâmetro de localização (ξ) e um parâmetro de escala (σ), isto é, X = ξ + σZ. Por causa da presença desses parâmetros, X se torna mais flexível que Z (X possui mais parâmetros que Z). Observe que, a partir de X, pode-se obter Z, isto é, Z = X−ξ σ . Vamos considerar Z ∼ iid SN(λ) e X ∼ iid SN(ξ, σ2, λ). Então, X tem uma função densidade de probabilidades dada por: 1Azzalini (1985) chegou a este resultado, somando-se uma variável Normal Padrão, N(0, 12), com uma variável Half -Normal, N+(0, 12). 66 3.2. PROPOSTA DE PARAMETRIZAÇÕES PARA O SFA 67 fX(x) = 2 σ φ ( x− ξ σ ) Φ ( λ x− ξ σ ) , ξ ∈ IR, σ > 0, (3.3) conhecida como modelo Skew-Normal de três parâmentros. Observa-se que essa expressão é exatamente igual à expressão que foi obtida na equação (2.43), isto é, f() = ∫ ∞ 0 f(u, )du (3.4) = 2 σ φ (  σ ) Φ ( λ  σ ) , uma vez que  = ν + u = X − ξ. O modelo SFA de custo assume que λ ∈ <+ e ξ(y) é a função de custo paramétrica, isto é, uma função Cobb-Douglas ou uma função Translog. Esse modelo assume que: Xi = ξ(yi) + νi + ui ou Xi = ξ(yi) + σzi, (3.5) onde σzi = νi+ui, νi ∼ iid N(0, σ2ν), ui ∼ iid N+(0, σ2u) and σ2 = σ2ν +σ2u. Com essa abordagem para o modelo de SFA de custo, deduz-se que Xi ∼ iid SN(ξ(yi), σ2, λ), σ2 = σ2ν + σ2u, e λ = σu σν , segundo a parametrização proposta por Battese e Corra (1977). Vale lembrar que ξ(yi) é o parâmetro de localização (função de custo Translog ou Cobb-Douglas), σ é o parâmetro de escala e, λ é o parâmetro de assimetria. Conforme já foi discutido no capítulo 2, inferências sobre os parâmetros baseadas no método de máxima verossimilhança apresentam alguns problemas. Por exemplo, λ pode se tornar infinito com probabilidade positiva. Para resolver essa problemática, Bayes e Branco (2007), baseando-se em Henze (1986), propuseram uma nova reparametrização para uma variável aleatória Skew-Normal padrão: Z = √ (1− δ2)V + δU, (3.6) onde V ∼ iid N(0, 12), U ∼ iid N+(0, 12) e δ = λ√1+λ2 . Além disso, se λ > 0 para o modelo SFA de custo, δ ∈ ]0,1[. Também pode ser mostrado que: λ = δ√ 1− δ2 . (3.7) Vale ressaltar aqui que, esse é um diferencial desse trabalho, uma vez que pelo princípio de Bayes-Laplace, uma escolha natural de priori não-informativa para δ seria uma 67 3.2. PROPOSTA DE PARAMETRIZAÇÕES PARA O SFA 68 distribuição uniforme, isto é, δ ∼ U(−1, 1). Como no SFA de custo, ui ≥ 0 implica em λ > 0, então δ = λ√1+λ2 ∈ ]0,1[, levando a δ ∼ U(0, 1). Também, observa-se que: E(Xi) = ξ(yi) + σδ √ 2 pi , e V (Xi) = σ2(1− 2 pi δ2), (3.8) ou seja, σ2 não é a variância de Xi, mas sim um parâmetro de escala que compõe a variância de Xi. Além disso, como νi + ui = σzi, pode-se escrever que νi + ui = σ (√ 1− δ2Vi + δUi ) ou νi = σ √ 1− δ2Vi e ui = σδUi. Observa-se que ui ∼ iid N+(0, σ2u) mede a ineficiência econômica da i-ésima DSO e Ui ∼ iid N+(0,12) descreve uma Half -Normal padrão, não tendo interpretação prática, servindo apenas para manipulação. O termo νi ∼ iid N(0, σ2ν) captura a aleatoriedade sobre essa DSO e Vi ∼ iid N(0, 12) descreve uma Normal padrão, também não tendo interpretação prática. Essas manipulações oferecem maneiras alternativas de se escrever ui e νi. Agora, tem-se: Xi = ξ(yi) + σ √ 1− δ2Vi + σδUi, (3.9) com Ui ∼ iid N+(0,12), Vi ∼ iid N(0, 12), σ = √ σ2ν + σ2u e δ = λ√1+λ2 . Utilizando a estrutura Bayesiana e a representação estocástica para a distribuição Skew-Normal proposta por Henze (1986), o modelo SFA de custo proposto, pode ser escrito como2: Xi|Ui, ξ(yi), σ, δ(λ) ∼ iid N [ ξ(yi) + σδUi; σ2(1− δ2) ] , Ui ∼ iid N+ ( 0, 12 ) , i = 1,...,n. (3.10) Seguindo Gil et al. (2017) e Bayes e Branco (2007), as seguintes especificações a priori fracamente informativas foram escolhidas para os parâmetros do SFA: 2Observe que Xi está condicionado ao conhecimento prévio de Ui, ξ(yi), σ e δ(λ). Logo esses valores passam a ser considerados como constantes e somente Vi é variável. 68 3.3. BASE DE DADOS 69 1 σ2 ∼ Γ(0,01; 0,01), (3.11) δ ∼ U(0, 1), (3.12) βj ∼ iid N(0; 1002), (3.13) onde o segundo argumento na expressão (3.13) representa a variância de βj , o que implica em uma precisão de 0,0001. O modelo descrito na equação (3.10) pode ser implementado usando softwares que utilizam Markov Chain Monte Carlo (MCMC), como por exemplo, o WinBUGS (Albert, 2009; Cowles, 2004; Spiegelhalter et al., 2003) ou o JAGS (Plummer, 2017), como descrito em Bayes e Branco (2007). Esses softwares retornam os valores de ui, σ e λ, utilizando estimação pelo contexto Bayesiano, sem precisar recorrer a métodos de verossimilhança, escapando assim das problemáticas de estimação. 3.3 Base de Dados Um resumo das variáveis de entrada e saída disponíveis para as 61 DSOs brasileiras é apresentado na Tabela 3.1 e na Figura 3.1. As variáveis compreendem os valores médios dos anos de 2014 a 2016. A variável de entrada é o custo operacional (OPEX ou PMSO ajustado), ajustado pela inflação, e as variáveis de saída são os seguintes cost drivers: (a) número de consumidores como proxy para a quantidade de serviços prestados; (b) o mercado ponderado (energia distribuída - MWh) como proxy da produção total; (c) rede aérea; (d) rede de alta tensão; e, (e) rede subterrânea como medidas de dispersão de consumidores dentro da área de concessão (Souza et al., 2010a). Além disso, o consumidor-hora de energia interrompida é a variável de qualidade e a e.variable é a variável ambiental. Correlações positivas são representadas por elipses com declives positivos. As correlações negativas são representadas por elipses com declives negativos. Quanto maior a correlação, mais estreita é a elipse. A Figura 3.1 mostra que o número de consumidores apresenta a maior correlação com os custos operacionais (PMSO ajustado), seguido por mercado ponderado e rede aérea. Além disso, o número de consumidores e o mercado ponderado estão fortemente correlacionados. Aparentemente, a variável ambiental está fracamente correlacionada aos custos operacionais. 69 3.3. BASE DE DADOS 70 Tabela 3.1: Variáveis de entrada e saída disponíveis para as 61 DSOs brasileiras. Variável Sigla Notação Espécie Unidade Proxy PMSO ajustado (OPEX) PMSOa x Input R$ Pessoal, material,serviços e outros Número de consumidores Cons y1 Outputs ordinários un Quantidade de ser-viços prestados Mercado ponderado Wmkt y2 MWh Produção total Rede aérea Over y3 Km Disseminação dos consumidores dentro da área de concessão Rede de alta tensão High y4 Rede subterrânea Under y5 Consumidor-hora de energia interrompida CHI y6 Outputs indesejados h Qualidade dos serviços prestados Perdas não-técnicas NTL y7 MWh Variável ambiental e.variable z Variável exógena ∗ Informações ambi-entais Figura 3.1: Gráfico de correlação de Spearman para as variáveis de entrada, saída, qualidade e ambientais. Vale ressaltar que a decisão quanto ao modelo recai sobre o regulador. Portanto, com base no atual modelo DEA-NDRS, este trabalho propõe modelos de benchmarking SFA utilizando as mesmas entradas e saídas. Imita-se o uso de outputs negativos no SFA, utilizando distribuições a priori Half -Normal negativas para os coeficientes das variáveis 70 3.4. PROPOSTA DE MODELOS PARA O SFA 71 de qualidade. No entanto, propõe-se a agregação das perdas não-técnicas (variável de qualidade) ao mercado ponderado. As perdas não-técnicas são estimadas apenas para o mercado de baixa tensão, ou seja, principalmente para consumidores residenciais. Portanto, essas perdas podem ser deduzidas do mercado de baixa tensão antes de se calcular o mercado ponderado. Assim, apenas uma variável de qualidade, consumidor-hora de energia interrompida, é avaliada. Além disso, Gil et al. (2017) e Veronese et al. (2018) investigaram variáveis ambientais usando o DEA de segundo estágio e concluíram que o índice ambiental (e.variable) é uma proxy razoável para informações ambientais. Portanto, são propostos sete modelos SFA de custo, que utilizam ou não e.variable como a variável ambiental, conforme descrito a seguir. 3.4 Proposta de Modelos para o SFA 3.4.1 Modelo 1 Esse modelo de SFA utiliza uma função de custo translog, sendo o custo operacional a variável de entrada e número de consumidores, mercado ponderado (variável original), rede aérea, rede de alta tensão e rede subterrânea são as variáveis de saída. Esse modelo não inclui variáveis de qualidade ou ambientais. Sua estrutura é dada por: ln xi = ln β0 + 5∑ j=1 βj ln yij + 5∑ j=1 5∑ k=1 βjk ln yij ln yik + i = β0 + β1 ln yi1 + β2 ln yi2 + β3 ln yi3 + β4 ln yi4 + β5 ln yi5 + + β11(ln yi1)2 + β22(ln yi2)2 + β33(ln yi3)2 + β44(ln yi4)2 + β55(ln yi5)2 + + β12(ln yi1 · ln yi2) + β13(ln yi1 · ln yi3) + β14(ln yi1 · ln yi4) + β15(ln yi1 · ln yi5) + + β23(ln yi2 · ln yi3) + β24(ln yi2 · ln yi4) + β25(ln yi2 · ln yi5) + + β34(ln yi3 · ln yi4) + β35(ln yi3 · ln yi5) + + β45(ln yi4 · ln yi5) + νi + ui ∀ i = 1, 2, . . . , 61. (3.14) 71 3.4. PROPOSTA DE MODELOS PARA O SFA 72 3.4.2 Modelo 2 Esse modelo de SFA utiliza uma função de custo translog, com as mesmas variáveis do Modelo 1. No entanto, o mercado ponderado é recalculado deduzindo-se as perdas técnicas. Além disso, o consumidor-hora de energia interrompida é utilizado como a variável de qualidade e, a e.variable é utilizada como a variável ambiental. A seguinte estrutura de função de custo é usada: ln xi = lnC(yi;β) + g(zi; δ) + νi + ui (3.15) onde lnC(yi;β) é a função de custo Translog e g(zi; δ) = δ0 + δ1zi é a componente contextual ou ambiental. Logo, a estrutura do modelo fica assim: ln xi = ln β0 + 6∑ j=1 βj ln yij + 5∑ j=1 5∑ k=1 βjk ln yij ln yik + (δ0 + δ1zi) + i = β0 + β1 ln yi1 + β2 ln yi2 + β3 ln yi3 + β4 ln yi4 + β5 ln yi5 + β6 ln yi6 + + β11(ln yi1)2 + β22(ln yi2)2 + β33(ln yi3)2 + β44(ln yi4)2 + β55(ln yi5)2 + + β12(ln yi1 · ln yi2) + β13(ln yi1 · ln yi3) + β14(ln yi1 · ln yi4) + β15(ln yi1 · ln yi5) + + β23(ln yi2 · ln yi3) + β24(ln yi2 · ln yi4) + β25(ln yi2 · ln yi5) + + β34(ln yi3 · ln yi4) + β35(ln yi3 · ln yi5) + + β45(ln yi4 · ln yi5) + (δ0 + δ1zi) + νi + ui ∀ i = 1, 2, . . . , 61. (3.16) 3.4.3 Modelo 3 Esse é um modelo de SFA híbrido que utiliza uma estrutura de custo translog para número de consumidores e mercado ponderado, juntamente com uma estrutura de custo Cobb-Douglas para rede aérea, rede de alta tensão e rede subterrânea. Além disso, o consumidor-hora de energia interrompida é utilizado como variável de qualidade e a e.variable é utilizada como variável ambiental. Sua estrutura é dada por: 72 3.4. PROPOSTA DE MODELOS PARA O SFA 73 ln xi = ln β0 + 6∑ j=1 βj ln yij + 2∑ j=1 2∑ k=1 βjk ln yij ln yik + (δ0 + δ1zi) + i = β0 + β1 ln yi1 + β2 ln yi2 + β3 ln yi3 + β4 ln yi4 + β5 ln yi5 + β6 ln yi6 + + β11(ln yi1)2 + β22(ln yi2)2 + + β12(ln yi1 · ln yi2) + (δ0 + δ1zi) + νi + ui ∀ i = 1, 2, . . . , 61. (3.17) 3.4.4 Modelo 4 Trata-se de um modelo SFA híbrido que utiliza uma estrutura de custo translog para número de consumidores, mercado ponderado e rede aérea, juntamente com uma estrutura de custo Cobb-Douglas para rede de alta tensão e rede subterrânea. Além disso, o consumidor-hora de energia interrompida é utilizado como variável de qualidade e a e.variable é utilizada como variável ambiental. Sua estrutura é dada por: ln xi = ln β0 + 6∑ j=1 βj ln yij + 3∑ j=1 3∑ k=1 βjk ln yij ln yik + (δ0 + δ1zi) + i = β0 + β1 ln yi1 + β2 ln yi2 + β3 ln yi3 + β4 ln yi4 + β5 ln yi5 + β6 ln yi6 + + β11(ln yi1)2 + β22(ln yi2)2 + β33(ln yi3)2 + + β12(ln yi1 · ln yi2) + β13(ln yi1 · ln yi3) + + β23(ln yi2 · ln yi3) + (δ0 + δ1zi) + νi + ui ∀ i = 1, 2, . . . , 61. (3.18) 3.4.5 Modelo 5 Esse é um modelo de SFA, semelhante ao Modelo 2, porém utiliza uma distribuição de probabilidades t-Student para o componente de ruído. Como indicado por Juárez e 73 3.5. IMPLEMENTAÇÃO COMPUTACIONAL 74 Steel (2010), é utilizada a seguinte distribuição a priori Gama para o parâmetro grau de liberdade a da distribuição t-Student: a ∼ Γ(2; 0,1). 3.4.6 Modelo 6 Trata-se de um modelo híbrido de SFA, similar ao Modelo 3, porém utiliza uma distribuição de probabilidades t-Student para o componente de ruído e a distribuição a priori Gama para o parâmetro grau de liberdade proposta no modelo 5. 3.4.7 Modelo 7 Esse é um modelo híbrido de SFA, similar ao Modelo 4, porém utiliza uma distri- buição de probabilidades t-Student para o componente de ruído e a distribuição a priori Gama para o parâmetro grau de liberdade proposta no modelo 5. 3.5 Implementação Computacional As parametrizações e as modelagens propostas foram implementadas a partir do software livre JAGS (Just Another Gibbs Sampler) (Plumer, 2003), em conjunto com os pacotes computacionais rjags (Plummer, 2016) e mcmc (Geyer e Johnson, 2017), que são interfaces do R para a biblioteca JAGS MCMC. Em todos os modelos BSFA propostos, inicialmente foram realizadas 40 milhões de iterações (burn-in). Em seguida, executaram-se outras 40 milhões de iterações, com uma defasagem (lag) de 20 mil iterações entre as sucessivas amostras geradas para os parâmetros do modelo. A monitoração empregada para a convergência do Amostrador de Gibbs foi a indicada por Cowles e Carlin (1996), isto é, a utilização de gráficos de Autocorrelation Function (ACF), construídos a partir das amostras a posteriori. 3.6 Critérios de Seleção de Modelos Os modelos BSFA propostos foram comparados utilizando-se as estatísticasWatanabe- Akaike Information Criterion (WAIC), Deviance Information Criterion (DIC) e Log- Pseudo Marginal Likelihood (LPML). Os modelos com menor valor de DIC e maiores valores de WAIC e LPML alcançam melhor ajuste aos dados. No Apêndice C, é apresen- 74 3.6. CRITÉRIOS DE SELEÇÃO DE MODELOS 75 tada uma síntese destes critérios. Entretanto, para maiores detalhes, são indicadas as obras de Gelman et al. (2014) e Gamerman e Lopes (2006). Os resultados computacionais encontrados para as parametrizações e modelagens aqui descritas, são apresentados no próximo capítulo. 75 C a p ít u l o 4 Resultados e Discussões Nesse quarto capítulo, são apresentados os resultados e as discussões a respeitodas parametrizações e modelagens propostas no capítulo anterior. 4.1 Verificação Inicial da Assimetria de i Antes que os modelos BSFA propostos no capítulo anterior fossem implementados, foi pertinente verificar se o contexto do SBDEE suportava a presença de ineficiência econômica (ui > 0). Caso não suportasse, seria desnecessário investir em técnicas mais caras de estimação. Logo, foram testadas as seguintes hipóteses sobre i = νi + ui: H0 :  é simétrico, H1 :  é assimétrico. (4.1) Em seguida, utilizou-se a estatística de teste M3T de Coelli (1995): M3T = m3√ 6m32 n ∼ sobH0 N(0, 12), (4.2) onde mi e n representam respectivamente, o i-ésimo momento dos resíduos e o tamanho amostral. Com esse propósito, implementou-se os modelos OLS para as variáveis de 77 4.2. PARÂMETROS ESTIMADOS 78 todos os sete modelos propostos, obtendo-se níveis descritivos p-values = 0,000 em todos os sete casos. Assim, rejeitou-se a hipótese de simetria dada em (4.1), a um nível de 5% de significância, isto é, os dados em questão suportavam a presença de ineficiência econômica, e os modelos de BSFA de custos puderam ser ajustados a partir disso. 4.2 Parâmetros Estimados Além dos modelos selecionados, descritos no capítulo 3, os coeficientes estimados usando o modelo OLS Cobb-Douglas com variáveis de produção, qualidade e ambientais são apresentados na Tabela 4.1. O modelo OLS ilustra como essas variáveis afetam os custos operacionais médios. A partir desses resultados, pode-se observar que, utilizando todas as variáveis de produção, qualidade e ambientais, apenas o número de consumi- dores, o mercado ponderado e as variáveis ambientais são estatisticamente significantes. Provavelmente, isso se deve ao pequeno tamanho da amostra de 61 DSOs. Os resultados também corroboram com as conclusões de Veronese et al. (2018) e Gil et al. (2017), que alegam que o ambiente afeta as eficiências de custo das DSOs brasileiras. Além disso, todos os coeficientes de produção e ambientais são positivos, como esperado. Curiosa- mente, o modelo OLS apresenta um coeficiente negativo de qualidade (coeficiente de y6, isto é, do consumidor-hora de energia interrompida), embora nenhuma restrição tenha sido imposta. Este resultado indica o efeito da multicolinearidade e fornece evidências de que um coeficiente de qualidade negativo melhora a estimativa do custo médio. A Tabela 4.1 também mostra os coeficientes estimados para os modelos 1 a 7. Vale ressaltar que o modelo 1 possui 21 coeficientes, os modelos 2 e 5 possuem 23 coeficientes, os modelos 3 e 6 possuem 11 coeficientes e os modelos 4 e 7 tem 14 coeficientes. Vale a pena observar que, embora a propriedade de convexidade seja obtida usando a Translog, ela aumenta o número de coeficientes e compromete a análise estatística. Em conclusão, há um trade-off entre propriedade de convexidade e significância estatística usando SFA. 78 4.2. PA R  M E T R O S E ST IM A D O S 79 Tabela 4.1: Estimativas dos parâmetros médios a posteriori. Estimativas dos parâmetros médios a posteriori. Normal - Half-Normal SFA t-Student - Half-Normal SFA OLS Cobb-Douglas* Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6 Modelo 7 Variáveis Parâmetros Estimativas SD Média SD Média SD Média SD Média SD Média SD Média SD Média SD Constante β0 -0,1472 0,5738 5,5200 7,4887 -4,8662 6,5478 -3,5543 2,6209 -3,0444 3,4081 -5,3726 7,4029 -2,7410 2,7074 -1,8267 3,2774 lnCons β1 0,5223 0,1439 4,3133 2,5213 0,6031 2,0994 -1,4997 0,8683 -1,2721 1,3672 -2,1378 1,8600 -1,2172 0,7318 -0,8151 1,2540 lnWmkt β2 0,3288 0,1464 -3,5861 2,3781 1,6581 1,9922 2,7101 1,0580 2,1682 1,5471 3,9641 2,4197 2,3239 0,9316 1,5418 1,3449 lnOver β3 0,0225 0,0540 -1,1629 1,1865 -1,2917 1,2105 0,0143 0,0596 0,3838 0,6003 -0,8886 1,1089 0,0198 0,0595 0,4234 0,5527 lnHigh β4 0,0303 0,0226 0,8602 0,7632 0,5449 0,7300 0,0242 0,0230 0,0187 0,0257 0,7057 0,6182 0,0225 0,0231 0,0152 0,0249 lnUnder β5 0,0240 0,0215 0,4135 0,4491 -0,1691 0,4568 0,0461 0,0256 0,0448 0,0253 -0,3026 0,4913 0,0445 0,0255 0,0427 0,0243 (lnCons * lnCons) β11 0,0770 0,6107 0,3634 0,3177 -0,0525 0,1215 0,4233 0,3496 0,4835 0,2363 0,0063 0,0777 0,4521 0,2482 (lnWmkt * lnWmkt) β22 0,1860 0,3151 -0,0270 0,1682 -0,2150 0,1320 0,0592 0,2695 -0,2591 0,2702 -0,1408 0,0795 0,1395 0,1325 (lnOver * lnOver) β33 0,0379 0,0593 0,0404 0,0507 0,0774 0,0462 0,0639 0,0499 0,0788 0,0434 (lnHigh * lnHigh) β44 -0,0124 0,0194 -0,0140 0,0164 -0,0133 0,0163 (lnUnder * lnUnder) β55 0,0301 0,0144 0,0152 0,0132 0,0091 0,0128 lnCons * lnWmkt β12 -0,2604 0,9049 -0,3793 0,4258 0,2597 0,2433 -0,4176 0,5654 -0,1986 0,4565 0,1300 0,1439 -0,5220 0,3065 lnCons * lnOver β13 -0,5217 0,2983 -0,5793 0,2778 -0,3248 0,2462 -0,8295 0,2331 -0,3014 0,2591 lnCons * lnHigh β14 0,4377 0,2428 0,2553 0,1694 0,2084 0,1070 lnCons * lnUnder β15 0,1347 0,1165 0,0552 0,0984 -0,0194 0,1000 lnWmkt * lnOver β23 0,5271 0,2762 0,5875 0,2936 0,1717 0,2132 0,7467 0,2401 0,1463 0,2173 lnWmkt * lnHigh β24 -0,4594 0,2538 -0,2672 0,1838 -0,2578 0,1204 lnWmkt * lnUnder β25 -0,1649 0,1113 -0,0294 0,0990 0,0509 0,1114 lnOver * lnHigh β34 -0,0007 0,0712 -0,0003 0,0606 0,0303 0,0583 lnOver * lnUnder β35 -0,0116 0,0492 -0,0213 0,0504 -0,0248 0,0455 lnHigh * lnUnder β45 0,0153 0,0394 0,0036 0,0372 0,0116 0,0330 lnCHI β6 -0,0103 0,0088 -0,0124 0,0074 -0,0120 0,0069 -0,0098 0,0066 -0,0108 0,0067 -0,0109 0,0070 -0,0089 0,0062 e,variable δ1 0,0214 0,0049 0,0226 0,0053 0,0249 0,0050 0,0225 0,0052 0,0226 0,0053 0,0246 0,0050 0,0221 0,0049 a 18,9171 13,5916 21,7003 14,2939 19,7428 14,0988 σ 0,3224 0,0615 0,3226 0,0671 0,3113 0,0601 0,3277 0,0647 0,3058 0,0759 0,2928 0,0600 0,2953 0,0661 λ 0,9746 2,6313 1,8544 6,4711 1,0190 1,7999 1,4571 2,4012 1,9301 3,2776 0,9535 1,1257 1,2302 1,6212 WAIC -17,87839 -14,48895 -9,145846 -9,679834 -15,00923 -8,838742 -9,716204 DIC 44,75155 43,79012 22,22629 27,7508 44,69681 21,61173 25,06897 LPML -17,79408 -13,53134 -10,07233 -10,48291 -12,48827 -9,318436 -10,92601 Nota: os parâmetros estatísticos significativos a 5% estão em negrito. *R2aj = 0,9795 79 4.3. EFICIÊNCIAS ESTIMADAS 80 Os Modelos 3, 4, 6 e 7 aplicam a estrutura híbrida da Translog Cobb-Douglas para reduzir o número de parâmetros. Os resultados WAIC, DIC e LPML indicam os modelos 3 e 6 como os melhores modelos, ou seja, com o melhor ajuste aos dados. Os resultados também mostram que os coeficientes de produção utilizando uma estrutura de Cobb- Douglas apresentam estimativas positivas, como esperado. Além disso, os coeficientes estimados nos Modelos 3 e 6 são muito semelhantes, e resultados semelhantes para o parâmetro λ são encontrados. O parâmetro λ representa a proporção entre componentes de ineficiência e ruído. Valores estimados para λ utilizando os Modelos 3 e 6 estão próximos de um. O Modelo 6 alcança resultados um pouco melhores de WAIC, DIC e LPML quando comparado ao Modelo 3. Isso é esperado, já que o Modelo 6 usa uma distribuição t-Student para o componente de erro. De acordo com Stead et al. (2017), a distribuição t-Student leva em conta a presença outliers na base de dados. 4.3 Eficiências Estimadas A Figura 4.1 compara as eficiências estimadas pelo DEA e pelo SFA proposto. Os resultados mostram que as eficiências estimadas do SFA são muito maiores do que as eficiências do DEA. As eficiências do DEA têm média de 70,87% e valor mínimo de 27,90%, enquanto as eficiências de SFA têm média de 86,87% e valor mínimo de 66,34%. Como descrito anteriormente, menores eficiências de DEA foram fortemente criticadas. Além disso, no último CRTP, o regulador adotou uma redução máxima de custo de 5% ao ano, o que indica uma eficiência de custo mínima de 20% em cada CRTP. Portanto, os resultados do SFA estimados apoiam a decisão do regulador brasileiro no último CRTP. A Figura 4.2 mostra a correlação linear das eficiências estimadas. O modelo SFA 1, daqui em diante denominado SFA 1, apresenta a maior correlação com as eficiências originais do DEA (ρ = 0,6531). Vale ressaltar que o SFA 1 não inclui variáveis de qualidade ou ambientais. Espera-se também que os modelos de SFA alcancem diferentes eficiências, pois entre outras questões técnicas, dependem de diferentes fronteiras paramétricas e as estimativas de eficiência são baseadas em máxima verossimilhança. No entanto, as eficiências do SFA estão positivamente correlacionadas com as eficiências do DEA, como esperado. Além disso, a Figura 4.2 mostra que as eficiências estimadas pelos Modelos 4 e 7 são altamente correlacionadas (ρ = 0.9974), assim como nos Modelos 3 e 6 (ρ = 0.9957). As eficiências estimadas para cada modelo são apresentadas na Tabela 4.2. 80 4.3. EFICIÊNCIAS ESTIMADAS 81 Figura 4.1: Boxplots comparando eficiências originais de DEA e eficiências propostas de SFA. Figura 4.2: Matriz de correlação comparando eficiências originais de DEA e eficiências propostas de SFA. 81 4.3. EFICIÊNCIAS ESTIMADAS 82 Tabela 4.2: Escores de eficiência estimados utilizando os modelos de SFA propostos. DSO Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6 Modelo 7 DMED 0,7657 0,6789 0,7474 0,6634 0,6971 0,7737 0,7241 BOA VISTA 0,7643 0,7213 0,7800 0,7019 0,7193 0,7943 0,7498 JOAO CESA 0,8344 0,7142 0,7886 0,7005 0,7113 0,8156 0,7578 CERON 0,8521 0,8015 0,8186 0,7801 0,8029 0,8285 0,8097 ETO 0,8505 0,8141 0,8219 0,8198 0,8300 0,8289 0,8432 CEPISA 0,8511 0,7824 0,8207 0,7900 0,7865 0,8364 0,8203 LIGHT 0,8843 0,8586 0,8262 0,7915 0,8616 0,8419 0,8192 AMPLA 0,8718 0,7668 0,8303 0,8018 0,7957 0,8428 0,8235 EMT 0,8918 0,8439 0,8306 0,8379 0,8425 0,8430 0,8605 ENF 0,8563 0,8092 0,8363 0,7960 0,8246 0,8439 0,8187 CEB 0,8390 0,8089 0,8363 0,7922 0,7995 0,8492 0,8187 CEEE 0,8207 0,8123 0,8478 0,7906 0,8073 0,8500 0,8169 CEAL 0,8519 0,8275 0,8391 0,8227 0,8416 0,8508 0,8465 COPEL 0,8521 0,8085 0,8465 0,8061 0,8097 0,8539 0,8350 CHESP 0,8694 0,7981 0,8435 0,8163 0,8210 0,8553 0,8427 FORCEL 0,8873 0,8690 0,8455 0,8725 0,8805 0,8555 0,8872 IGUAÇU 0,8700 0,8256 0,8468 0,8079 0,8243 0,8564 0,8392 URUSSANGA 0,8722 0,8758 0,8422 0,8173 0,8916 0,8584 0,8455 COCEL 0,8145 0,7706 0,8538 0,8011 0,7682 0,8585 0,8289 BRAGANTINA 0,9046 0,8449 0,8527 0,8173 0,8463 0,8608 0,8368 CEMIG 0,8821 0,8460 0,8547 0,8119 0,8471 0,8663 0,8343 ELETROPAULO 0,8923 0,8720 0,8559 0,8429 0,8869 0,8694 0,8656 CELG 0,8630 0,8489 0,8603 0,8305 0,8469 0,8723 0,8542 CELESC 0,8658 0,8378 0,8692 0,8349 0,8436 0,8761 0,8587 CELPE 0,8475 0,8118 0,8695 0,8429 0,8266 0,8804 0,8602 EMS 0,9097 0,8749 0,8816 0,8779 0,8905 0,8834 0,8869 EMG 0,8949 0,8786 0,8807 0,8525 0,8777 0,8835 0,8698 DEMEI 0,8551 0,8140 0,8806 0,8377 0,8276 0,8872 0,8608 SULGIPE 0,8911 0,8967 0,8755 0,8756 0,8797 0,8907 0,8988 AMAZONAS 0,8542 0,8271 0,8853 0,8629 0,8374 0,8910 0,8817 COOPERALIANÇA 0,8726 0,8518 0,8872 0,8415 0,8514 0,8936 0,8689 RGE SUL 0,9016 0,8484 0,8858 0,8694 0,8495 0,8937 0,8860 ELETROACRE 0,8371 0,8806 0,8886 0,8589 0,8876 0,8954 0,8789 ELETROCAR 0,8771 0,8697 0,8855 0,8554 0,8913 0,8955 0,8718 CAIUÁ 0,9181 0,8887 0,8927 0,8661 0,8886 0,8962 0,8819 ESCELSA 0,8982 0,8400 0,8887 0,8653 0,8446 0,8976 0,8822 CPEE 0,9322 0,9101 0,8938 0,8806 0,9141 0,9011 0,8980 VALE PARANAPANEMA 0,9254 0,9150 0,9029 0,8842 0,9187 0,9048 0,8968 COELBA 0,9011 0,8978 0,8980 0,8772 0,8956 0,9063 0,8900 ESE 0,8880 0,8754 0,8992 0,8819 0,8813 0,9071 0,8933 SANTA MARIA 0,8935 0,8871 0,9121 0,9029 0,9020 0,9099 0,9104 BANDEIRANTE 0,8894 0,8464 0,9059 0,8945 0,8548 0,9128 0,9034 NACIONAL 0,9172 0,8995 0,9084 0,8814 0,8986 0,9132 0,8939 EPB 0,8885 0,8740 0,9021 0,8951 0,8814 0,9142 0,9069 SANTA CRUZ 0,9242 0,9164 0,9127 0,8971 0,9185 0,9168 0,9088 CSPE 0,9270 0,9112 0,9107 0,8979 0,9161 0,9172 0,9084 HIDROPAN 0,8922 0,9069 0,9143 0,8697 0,9081 0,9196 0,8901 EBO 0,8877 0,9135 0,9105 0,9069 0,9202 0,9207 0,9195 JAGUARI 0,8967 0,8574 0,9156 0,9062 0,8388 0,9215 0,9194 COSERN 0,9089 0,8950 0,9141 0,9049 0,9050 0,9218 0,9140 ELEKTRO 0,8889 0,8560 0,9166 0,9049 0,8679 0,9230 0,9175 CPFL PAULISTA 0,9101 0,8895 0,9198 0,9027 0,8976 0,9242 0,9162 MOCOCA 0,9069 0,8867 0,9224 0,9104 0,8871 0,9247 0,9176 COELCE 0,9279 0,9073 0,9225 0,9121 0,9087 0,9281 0,9229 NOVA PALMA 0,8545 0,8650 0,9223 0,9212 0,8716 0,9289 0,9271 CELPA 0,8672 0,9153 0,9293 0,9151 0,9186 0,9324 0,9221 CFLO 0,8566 0,8892 0,9294 0,9112 0,8925 0,9325 0,9195 RGE 0,9179 0,9291 0,9314 0,9304 0,9337 0,9337 0,9330 CEMAR 0,8991 0,9231 0,9296 0,9263 0,9269 0,9354 0,9306 PIRATININGA 0,9164 0,9136 0,9306 0,9250 0,9181 0,9357 0,9293 MUXFELDT 0,9382 0,9322 0,9457 0,9363 0,9312 0,9439 0,9382 Nota: os escores de eficiência foram classificados em ordem crescente do Modelo 6. 82 4.3. EFICIÊNCIAS ESTIMADAS 83 A Figura 4.3 mostra a distribuição das eficiências DEA e SFA (Modelo 6) em todo o território brasileiro. Esquemas de cores foram ajustados para a faixa de eficiência DEA e SFA para minimizar as diferenças de escala. Os resultados mostram padrões semelhantes entre as eficiências DEA e SFA nas regiões sul e sudeste. Além disso, as eficiências de SFA são maiores no norte, ao contrário das eficiências de DEA que são extremamente mais baixas nessa região. Isso ocorre porque o modelo SFA inclui ajustes ambientais. Veronese et al. (2018) e Gil et al. (2017) também concluíram que a região norte do Brasil enfrenta condições ambientais adversas que exigem atualizações de eficiência de custos. Diferenças significativas entre DEA e SFA são encontradas nos estados de Mato Grosso e Tocantins (centro-oeste/norte). Ao contrário do DEA, as eficiências de SFA para as DSOs localizadas nesses estados foram menores em comparação com as eficiências de SFA em todo o território brasileiro. Em geral, apesar das diferenças de escala mostradas na Figura 4.3, tanto o DEA quanto o SFA proposto apresentaram padrões similares de maior e menor eficiência na maioria das DSOs brasileiros. Mudanças específicas são principalmente devidas a ajustes ambientais. Figura 4.3: Eficiências estimadas DEA e SFA em todo o território brasileiro. A Figura 4.4 também ilustra semelhanças e diferenças entre eficiências de DEA e SFA após ajustes de escala. As DSOs foram classificados em ordem crescente de dissimilaridade. Dois eixos y diferentes são mostrados. Os valores de eficiência de SFA estão localizados no eixo y esquerdo, enquanto os valores de eficiência DEA estão localizados no eixo y direito. Pode-se concluir que, após o escalonamento, tanto a eficiência DEA quanto a SFA 83 4.3. EFICIÊNCIAS ESTIMADAS 84 são similares a um grande grupo de DSOs. Como mencionado anteriormente, grandes dissimilaridades estão associadas a algumas DSOs localizadas na região norte. Figura 4.4: Similaridades e dissimilaridades entre DEA e SFA após ajustes de escala. A Tabela 4.3 mostra as eficiências DEA e SFA para todos as DSOs e seus respectivos custos eficientes. Os resultados são classificados em ordem crescente das eficiências de DEA. Como as eficiências de SFA são, em média, maiores que as eficiências de DEA, a maioria dos custos eficientes de SFA são maiores do que os custos eficientes de DEA. No entanto, as maiores eficiências de SFA estão abaixo de 100%. Isso ocorre porque as eficiências de SFA são estimadas usando a média a posteriori. Como consequência, as DSOs que alcançaram 100% utilizando DEA apresentarão eficiências mais baixas usando SFA. Isso é mostrado na parte inferior da Tabela 4.3. Uma alternativa para superar essa limitação é usar o valor máximo de eficiências de DEA e SFA como a eficiência final, como sugerido em Agrell e Bogetoft (2017). Os resultados mostram uma grande diferença de escala entre as eficiências DEA e SFA. A eficiência média do DEA é de 70,5%, enquanto a eficiência média do SFA é de 88,5%. Essa diferença representa uma receita total de R$ 3.175.509.926,81 ou U$ 971,1 milhões (considerando uma taxa de câmbio média de R$ 3,27 por U$ 1,00 no ano de 2016), que atualmente é contabilizada como ineficiência. Como mencionado anteriormente, isso ocorre porque o SFA decompõe a distância da fronteira de custo em duas componentes, ruído e ineficiência econômica, enquanto a DEA assume apenas a ineficiência econômica. 84 4.3. EFICIÊNCIAS ESTIMADAS 85 Tabela 4.3: Eficiências estimadas e custos eficientes utilizando DEA e SFA (Modelo 6), e diferenças entre custos eficientes utilizando DEA e o SFA proposto. DSO DEA SFA 6 OPEX Eficiente OPEX Eficiente SFA DEA (R$) SFA 6 (R$) Mudança (R$) BOA VISTA 0,2788 0,7943 25 556 579,36 72 799 267,22 47 242 687,86 N DMED 0,2925 0,7737 13 701 384,11 36 245 575,96 22 544 191,84 N AMAZONAS 0,3385 0,8910 158 480 620,50 417 078 259,35 258 597 638,85 N CEEE 0,4402 0,8500 283 298 377,35 546 996 095,14 263 697 717,78 N URUSSANGA 0,4706 0,8584 2 919 625,37 5 325 596,45 2 405 971,08 N CERON 0,4723 0,8285 150 896 328,24 264 709 589,97 113 813 261,73 N ENF 0,4773 0,8439 17 060 734,43 30 163 298,44 13 102 564,01 N ELETROACRE 0,4822 0,8954 55 397 088,80 102 870 328,87 47 473 240,07 N CEAL 0,5111 0,8508 165 651 311,27 275 729 011,15 110 077 699,87 N COCEL 0,5194 0,8585 10 667 825,64 17 631 314,62 6 963 488,97 N IGUAÇU 0,5282 0,8564 9 299 509,27 15 078 296,51 5 778 787,23 N DEMEI 0,5294 0,8872 6 029 224,84 10 104 630,19 4 075 405,36 N FORCEL 0,5374 0,8555 2 302 945,15 3 666 038,41 1 363 093,26 N HIDROPAN 0,5405 0,9196 4 091 106,17 6 960 079,05 2 868 972,88 N ELETROCAR 0,5475 0,8955 8 875 619,78 14 517 352,05 5 641 732,27 N CEB 0,5490 0,8492 209 422 109,05 323 972 674,46 114 550 565,41 N COOPERALIANÇA 0,5615 0,8936 7 401 912,74 11 779 949,76 4 378 037,02 N SULGIPE 0,5638 0,8907 24 258 769,21 38 326 417,50 14 067 648,28 N AMPLA 0,5918 0,8428 389 547 727,90 554 762 283,73 165 214 555,83 N CELPA 0,5963 0,9324 404 356 427,10 632 251 584,55 227 895 157,46 N BRAGANTINA 0,6334 0,8608 30 400 514,76 41 312 652,39 10 912 137,63 N ESE 0,6413 0,9071 119 207 414,10 168 621 656,90 49 414 242,80 N CELPE 0,6593 0,8804 567 757 907,55 758 101 234,45 190 343 326,90 N CEPISA 0,6686 0,8364 262 940 893,06 328 930 688,56 65 989 795,50 N CELG 0,6716 0,8723 636 942 966,74 827 262 789,91 190 319 823,18 N CHESP 0,6842 0,8553 10 684 709,04 13 357 742,40 2 673 033,36 N CEMIG 0,6898 0,8663 1 559 382 615,03 1 958 305 749,20 398 923 134,17 N COPEL 0,6944 0,8539 921 299 620,68 1 132 916 200,47 211 616 579,79 N CAIUÁ 0,6996 0,8962 46 718 956,27 59 847 115,45 13 128 159,19 N CFLO 0,6998 0,9325 11 053 894,68 14 730 208,08 3 676 313,40 N NACIONAL 0,7024 0,9132 22 979 857,74 29 877 638,54 6 897 780,80 N EMG 0,7071 0,8835 89 328 273,51 111 606 719,88 22 278 446,37 N COELBA 0,7086 0,9063 950 382 640,99 1 215 600 160,69 265 217 519,70 N CELESC 0,7283 0,8761 610 036 189,83 733 803 079,84 123 766 890,01 N LIGHT 0,7289 0,8419 672 705 722,42 776 933 929,47 104 228 207,04 N EBO 0,7380 0,9207 33 049 261,01 41 228 536,01 8 179 275,00 N COSERN 0,7546 0,9218 222 182 274,39 271 427 489,22 49 245 214,84 N VALE PARANAPANEMA 0,7683 0,9048 36 862 519,27 43 413 501,52 6 550 982,25 N SANTA CRUZ 0,7697 0,9168 40 051 305,05 47 706 033,02 7 654 727,97 N EPB 0,7762 0,9142 236 460 129,38 278 509 035,37 42 048 905,99 N ESCELSA 0,7986 0,8976 268 519 911,39 301 804 022,53 33 284 111,15 N SANTA MARIA 0,8002 0,9098 27 837 424,60 31 653 267,84 3 815 843,24 N CEMAR 0,8102 0,9354 402 967 994,29 465 223 348,83 62 255 354,54 N ELETROPAULO 0,8269 0,8694 1 205 490 658,03 1 267 417 389,74 61 926 731,71 N CSPE 0,8300 0,9172 17 652 782,24 19 509 075,30 1 856 293,06 N CPEE 0,8332 0,9011 14 468 400,13 15 646 143,08 1 177 742,95 N RGE SUL 0,8373 0,8937 272 950 518,08 291 329 041,91 18 378 523,83 N MOCOCA 0,8406 0,9247 10 061 842,95 11 068 833,69 1 006 990,73 N EMS 0,8494 0,8834 293 097 953,73 304 825 180,45 11 727 226,72 N BANDEIRANTE 0,8852 0,9128 311 776 392,00 321 493 834,80 9 717 442,80 N EMT 0,9145 0,8430 486 714 829,63 448 667 715,08 -38 047 114,55 H JOAO CESA 0,9302 0,8156 2 134 654,07 1 871 801,38 -262 852,69 H CPFL PAULISTA 0,9786 0,9242 776 723 186,65 733 518 498,73 -43 204 687,92 H ETO 0,9833 0,8289 246 388 940,33 207 698 637,64 -38 690 302,69 H ELEKTRO 0,9844 0,9230 514 851 312,42 482 743 777,86 -32 107 534,56 H JAGUARI 1,0000 0,9215 12 324 819,00 11 356 950,96 -967 868,04 H COELCE 1,0000 0,9281 571 992 828,00 530 849 383,88 -41 143 444,12 H PIRATININGA 1,0000 0,9357 300 814 765,00 281 468 525,18 -19 346 239,82 H MUXFELDT 1,0000 0,9439 2 304 748,00 2 175 443,57 -129 304,43 H RGE 1,0000 0,9337 304 029 938,00 283 885 491,97 -20 144 446,03 H NOVA PALMA 1,0000 0,9289 5 762 588,00 5 353 135,95 -409 452,05 H 85 4.4. CRITÉRIO DE CONVERGÊNCIA 86 4.4 Critério de Convergência Segundo Cowles e Carlin (1996), um método eficiente e relativamente simples para monitorar a convergência do Amostrador de Gibbs , é o gráfico de Autocorrelation Function (ACF) construído a partir das amostras geradas para λ. A função de autocorrelação é uma medida da correlação entre as observações de uma série temporal que estão separadas por k unidades de tempo (lag), isto é, entre λt e λt−k. Quanto mais rápido for o decaimento dos valores dessa função de autocorrelação em relação ao aumento do lag, melhor é o mixing (mistura) das cadeias geradas. A Figura 4.5 a seguir, apresenta os gráficos para os modelos propostos. Nota: com limites de significância de 5% para autocorrelações. Figura 4.5: Gráficos de ACF para os parâmetros λ dos modelos propostos. Conforme pode ser observado na Figura 4.5, as correlações entre as amostras geradas λt e λt−k decaem à medida que aumenta-se o valor de k (lag), isto é, essas correlações vão diminuindo à medida que as amostras geradas vão se tornando mais afastadas temporalmente uma da outra. Esse fato indica baixa autocorrelação da cadeia, mixing apropriado e confiabilidade dos estimadores gerados, isto é, de λˆ para todos os modelos propostos. 86 C a p ít u l o 5 Conclusão e Considerações de Prosseguimento Nesse último capítulo, apresentam-se as conclusões obtidas a partir da concepçãoe execução desse estudo, perpassando pela validação das hipóteses associadasà questão-problema. Também são sugeridas algumas considerações para um possível prosseguimento do trabalho. 5.1 Histórico Contextual Como já mencionado anteriormente, para cumprir o compromisso de levar energia elétrica aos seus consumidores, as DSOs brasileiras têm custos que devem ser cobertos pela tarifa de energia. Por essa razão, a ANEEL atua para que esta seja composta apenas pelos custos que efetivamente se relacionam com os serviços prestados, de forma a torná-la justa, blindando os consumidores das voracidades do mercado e das ineficiências na gestão da concessionária. A partir de 2010, a ANEEL iniciou debates com a sociedade sobre as regras e metodologias para definir as receitas das DSOs, através de audiências públicas. A partir disso, a agência reguladora propôs uma revisão completa do modelo que calcula os custos operacionais das concessionárias, convergindo para a prática de custos eficientes. Partindo do pressuposto de que os escores de eficiência devem ser suficientemente precisos e efetivos, a fim de balizar políticas gerenciais e tomadas de decisão mais acertadas, tornam-se cruciais o desenvolvimento e o emprego, pelo regulador, de metodologias que se 87 5.2. VALIDAÇÃO DAS HIPÓTESES SOB ESTUDO 88 mostrem consistentes na definição de custos operacionais, como por exemplo, o emprego dos denominados métodos de benchmarking (ou de fronteira), favorecendo assim, tanto as DSOs quanto os próprios consumidores. Em muitos países, tem sido aplicado o state- of-the-art benchmarking, que segundo Bogetoft e Otto (2011), já é responsável por um considerável impacto econômico positivo em países europeus. Estes métodos têm proporcionado aos analistas de diferentes setores da economia moderna, em especial àqueles do setor de regulação de energia elétrica, a identificação do nível máximo de produto ou dos níveis mínimos de custo, dada a quantidade de recursos produtivos empregados, bem como a avaliação do desvio de um determinado grupo em relação aos padrões de referência. Sendo assim, a ANEEL começou a utilizar modelos de DEA (atual) e COLS Cobb-Douglas (não mais utilizado) para as DSOs brasileiras. Porém, existem algumas lacunas e discrepâncias na metodologia empregada e, infelizmente, a ANEEL ainda não possui uma metodologia livre de distorções, que possa apresentar resultados capazes de incentivar uma análise mais verossímil da realidade. Apesar das grandes melhorias do modelo de benchmarking de distribuição de eletricidade no Brasil nos últimos ciclos periódicos de revisão tarifária, as eficiências de custo estimadas apresentaram grande variabilidade de um ciclo de revisão anterior para o seguinte. Infelizmente, mesmo com preciosas e fundadas sugestões ofertadas à ANEEL, a problemática da ausência de implementação de uma metodologia acurada ainda persiste. Com isso, a definição dos escores de eficiência das DSOs fica prejudicada, e consequentemente, tomadas de decisão se mantêm deficientes. Logo, existe uma lacuna a ser preenchida pela ANEEL: qual metodologia utilizar e/ou ser desenvolvida, de maneira que se possa definir satisfatoriamente, uma fronteira de custos eficientes para as DSOs brasileiras? A busca por metodologias que pudessem suprir as deficiências dos métodos atuais, como por exemplo, a utilização de modelos de fronteira estocática (SFA), motivaram as pesquisas que foram desdobradas nesse trabalho de doutoramento. Além disso, a associação entre a modelagem e o método de resolução pode resultar em uma valiosa ferramenta para o processo de tomada de decisão. 5.2 Validação das Hipóteses sob Estudo Ajustar um modelo de fronteira estocástica a um conjunto de dados limitado não é uma tarefa trivial, como demonstrado nesse trabalho. Usando uma abordagem tradicional 88 5.3. RESULTADOS OBTIDOS 89 de máxima verossimilhança, o parâmetro de assimetria pode convergir para o infinito com probabilidade positiva, comprometendo a estimativa da eficiência de custo. Como alternativa, a abordagem Bayesiana fornece um mecanismo adequado para a estimativa do parâmetro de assimetria e pode impor restrições nos coeficientes do modelo. No entanto, a abordagem Bayesiana proposta tem limitações e mais investigações ainda são necessárias. O processo de estimação Bayesiano aplicado foi o Markov Chain Monte Carlo (MCMC). Para avaliar a convergência, são necessárias múltiplas execuções e, portanto, os resultados finais podem apresentar pequenas diferenças. As estatísticas WAIC, DIC e LPML foram utilizadas para avaliar o ajuste do modelo. O objetivo desse estudo foi duplo: primeiro replicar o mais próximo possível, as eficiências estimadas para as DSOs brasileiras, utilizando uma abordagem robusta de SFA, ou seja, utilizando as mesmas entradas e saídas do modelo empregado atualmente pelo regulador. Segundo, propor uma abordagem alternativa e robusta de SFA utilizando a informação disponível, incluindo a componente ambiental. Uma correlação linear máxima de ρ = 0,6531 foi obtida usando um modelo SFA com uma função de custo Translog. No entanto, o modelo original de DEA inclui restrições adicionais de peso que ainda exigem estudos adicionais para desenvolver uma proposta de SFA semelhante. Esse trabalho estimou, com sucesso, um método de benchmarking de SFA para estimar os custos eficientes das DSOs brasileiras, validando as duas hipóteses levantadas na seção (1.9) desse texto. 5.3 Resultados Obtidos Os resultados mostram uma grande diferença de escala entre as eficiências DEA e SFA. A eficiência média do DEA é de 70,5%, enquanto a eficiência média do SFA é de 88,5%. Essa diferença representa uma receita total de R$ 3.175.509.926,81 ou U$ 971,1 milhões (considerando uma taxa de câmbio média de R$ 3,27 por U$ 1,00 no ano de 2016), que atualmente é contabilizada como ineficiência. Como mencionado anteriormente, isso ocorre porque o SFA decompõe a distância da fronteira de custo em duas componentes, ruído e ineficiência econômica, enquanto a DEA assume apenas a ineficiência econômica. Apesar da diferença de escala, tanto DEA e SFA apresentam semelhanças importantes e algumas diferenças são encontradas em DSOs localizadas no norte do Brasil. Vale ressaltar que, embora as pontuações originais do DEA variem de 28 a 100%, o regulador aplicou ad-hoc restrições adicionais para forçar as eficiências no intervalo de 80 89 5.4. METODOLOGIAS COMPLEMENTARES 90 a 100% . A ANEEL aplicou um procedimento de padronização simples. Usando o SFA ou o máximo de SFA e DEA como a nova estimativa de eficiência, as eficiências estarão aproximadamente dentro do intervalo de 80 a 100%, como esperado pelo regulador. Até onde se sabe, este é o primeiro trabalho que apresenta com sucesso um modelo robusto de SFA, utilizando técnicas Bayesianas, para as DSOs brasileiras aplicando as mesmas entradas, saídas e incluindo informações ambientais. Os resultados e discussões aqui apresentados foram submetidos para apreciação e publicação no periódico Energy Economics.1 5.4 Metodologias Complementares Na literatura, duas metodologias principais concorrem entre si quanto à maneira de se definir as fronteiras de eficiência. O DEA utiliza técnicas de programação linear determinista, enquanto o SFA faz uso de técnicas econométricas. O DEA é mais difundido e possui a vantagem de não impor formas funcionais aos dados. Porém, a fronteira calculada pode ser influenciada negativamente caso os dados sejam contaminados por erros aleatórios e/ou apresentem valores discrepantes (outliers). Com isso, a mensuração das eficiências fica comprometida. O SFA tem uma natureza estocástica e, ao permitir a acomodação de ruídos e outliers na base de dados, inferências estatísticas sobre os parâmetros da função de fronteira podem ser realizadas. Todavia, esse método requer considerações de formas funcionais e distribuições probabilísticas sobre os parâmetros envolvidos na estimação, além de exigir especialização estatística avançada em comparação com o DEA. Também, Lampe e Hilgers (2015) chamam a atenção para o fato da atividade de pesquisa no DEA não ser tão rápida na adoção de novos métodos como no SFA. Apesar dessas significativas diferenças metodológicas entre os dois métodos, in- dependentemente de qual será escolhido pelo regulador, é interessante avaliar os dois, pois um complementa o outro e permite uma maior robustez dos resultados. Logo, como resposta para a questão-problema apresentada nesse trabalho, pode-se dizer que DEA e SFA devem ser vistas como metodologias não-excludentes e complementares, que podem ser utilizadas e desenvolvidas pelo regulador brasileiro, visando definir satisfatoriamente, uma fronteira de custos eficientes para as DSOs brasileiras. 1https://www.journals.elsevier.com/energy-economics 90 5.5. CONSIDERAÇÕES DE PROSSEGUIMENTO 91 5.5 Considerações de Prosseguimento Para além do escopo desse trabalho, mas com desejo de prosseguimento nos estudos, podem-se elencar as seguintes sugestões para trabalhos futuros: • Investigar a metodologia do M-factor (Sartori, 2006) como possibilidade de estimar o parâmetro λ, criando uma penalização (M-factor) para a verossimilhança e permitindo assim, o emprego de técnicas frequentistas para a estimação desse parâmetro; • Investigar formas de estimar o modelo SFA a fim de aproximá-lo do atual modelo DEA, caso assim seja proposto pelo regulador; • Investigar modelos alternativos, como por exemplo, StoNED. 5.6 Considerações Finais Ao se chegar nessa parte final, julga-se oportuno destacar a observação feita por Haney e Pollit (2011), de que quanto mais fortes e maduras forem as instituições políticas, mais provável é que um país tenha um alto índice de boas práticas de regulação, pois se garante um regulador independente. E por fim, ressalta-se que o presente trabalho consiste em uma pequena, porém importante contribuição alternativa num cenário já tão amplamente pesquisado via DEA. Não se pretende com ele, desmentir ou desqualificar os trabalhos e metodologias já realizados, mas sim, criar uma sinergia entre as partes. E nesse sentido, vale parafrasear Paradi (2015): “Os métodos de engenharia para resolver problemas, melhorar sistemas e até mesmo evitar desastres não permitem que simplesmente se rejeite o que outros criaram, mas devem, em vez disso, apresentar alternativas viáveis e suportáveis.” 91 A p ê n d ic e Apêndice A Nesse primeiro apêndice, serão apresentados os procedimentos metodológicosnecessários para a obtenção das expressões matemáticas que foram discutidasao longo desse trabalho. A.1 Obtenção da Expressão para o Cálculo de f () Na seção 2.5.2.4 do capítulo 2, foi considerado o seguinte modelo de custo com fronteira estocástica baseado em Aigner et al. (1977): lnEi = lnC(wi, yi,β) + i, (A.1) lnEi = C(wi, yi,β) + νi + ui, (A.2) νi ∼ iid N(0, σ2ν), (A.3) ui ∼ iid N+(0, σ2u), (A.4) ui e νi são independentes entre si, (A.5) ui e νi são independentes de xi. (A.6) A função densidade de probabilidade marginal f() pode ser obtida, integrando-se a função f(, u) dada em (2.42), isto é: 93 A.1. OBTENÇÃO DA EXPRESSÃO PARA O CÁLCULO DE F () 94 f() = ∫ ∞ 0 f(, u)du = ∫ ∞ 0 2 2piσνσu exp [ −(− u) 2 2σ2ν − u 2 2σ2u ] du = ∫ ∞ 0 2 2piσνσu exp { −12 [( − u σν )2 + ( u σu )2]} du. (A.7) Pode ser feita a seguinte simplificação: ( − u σν )2 + ( u σu )2 =  2 − 2u+ u2 σ2ν + u 2 σ2u =  2 σ2ν − 2u σ2ν + u2 ( 1 σ2ν + 1 σ2u ) =  2 σ2ν + σ 2 ν + σ2u σ2νσ 2 u (−2uσ2u σ2ν + σ2u + u2 ) . (A.8) Definindo µ∗ =  σ 2 u σ2ν+σ2u e σ2∗ = σ2νσ 2 u σ2ν+σ2u , a equação (A.8) pode ser reescrita como: ( − u σν )2 + ( u σu )2 =  2 σ2ν + σ 2 ν + σ2u σ2νσ 2 u (−2uσ2u σ2ν + σ2u + u2 ) =  2 σ2ν + 1 σ2∗ ( −2uµ∗ + u2 ) =  2 σ2ν + 1 σ2∗ ( −2uµ∗ + u2 ) + µ 2 ∗ σ2∗ − µ 2 ∗ σ2∗ =  2 σ2ν + 1 σ2∗ ( −2uµ∗ + u2 + µ2∗ ) − µ 2 ∗ σ2∗ =  2 σ2ν + ( u− µ∗ σ∗ )2 −  2σ2u σ2ν (σ2ν + σ2u) = ( u− µ∗ σ∗ )2 +  2 σ2ν + σ2u . (A.9) Com isso, a expressão (A.7) é simplificada para: 94 A.1. OBTENÇÃO DA EXPRESSÃO PARA O CÁLCULO DE F () 95 f() = ∫ ∞ 0 f(, u)du = ∫ ∞ 0 2 2piσνσu exp { −12 [( u− µ∗ σ∗ )2 +  2 σ2ν + σ2u ]} du = ∫ ∞ 0 2 2piσνσu exp [ −12 ( u− µ∗ σ∗ )2] · exp [ −12 ( 2 σ2ν + σ2u )] du = 2√ 2piσνσu exp [ −12 2 σ2ν + σ2u ] ∫ ∞ 0 1√ 2pi exp [ −12 ( u− µ∗ σ∗ )2] du. (A.10) Agora seja considerar u˜ = u−µ∗ σ∗ , o que implica em u˜ ∈ [−µ∗/σ∗,∞) e du˜du = 1σ∗ ∴ du = σ∗du˜. Logo, a integral dada em (A.10) pode ser resolvida como: ∫ ∞ 0 1√ 2pi exp [ −12 ( u− µ∗ σ∗ )2] du = ∫ ∞ −µ∗ σ∗ 1√ 2pi exp ( −12 u˜ 2 ) σ∗du˜ = σ∗Φ ( µ∗ σ∗ ) .(A.11) Por fim, f() = 2√ 2piσνσu exp [ −12 ( 2 σ2ν + σ2u )] ∫ ∞ 0 1√ 2pi exp [ −12 [ (u− µ∗ σ∗ )2] du = 2√ 2piσνσu exp [ −12 ( 2 σ2ν + σ2u )] σ∗Φ ( µ∗ σ∗ ) = 2√ 2pi √ σ2ν + σ2u [ 1 Φ(µ∗σ∗ ) ]exp[−12 ( 2 σ2ν + σ2u )] = φ ( √ σ2ν+σ2u ) √ σ2ν + σ2u · [ 1 Φ(µ∗σ∗ ) ] = 2 σ φ (  σ ) Φ ( λ  σ ) , (A.12) onde σ = √ σ2u + σ2ν é conhecido como parâmetro de escala, λ = σuσν representa o parâmetro de forma, φ(·) é a função densidade de probabilidades normal padrão e, Φ(·) é a função de distribuição de probabilidades acumuladas normal padrão. 95 A.2. OBTENÇÃO DA EXPRESSÃO PARA O CÁLCULO DE E(U |) 96 A.2 Obtenção da Expressão para o Cálculo de E(u|) Na subseção 2.5.2.4 do capítulo 2, foi apresentada uma expressão, proposta por Jondrow et al. (1982), para o cálculo da ineficiência econômica de um dado produtor, conforme cálculos a seguir (o subscrito i foi omitido). uˆ = E(u|) = ∫ ∞ 0 u · f(u|)du = ∫ ∞ 0 u√ 2piσ∗ · Φ ( µ∗ σ∗ ) · exp[−12 ( u− µ∗ σ∗ )2] du. (A.13) Novamente, seja considerar u˜ = u− µ∗ σ∗ , o que implica em u˜ ∈ [−µ∗/σ∗,∞) e du˜du = 1σ∗ ∴ du = σ∗du˜. Então, uˆ = E(u|) = ∫ ∞ −µ∗ σ∗ µ∗ + u˜σ∗√ 2piΦ ( µ∗ σ∗ )exp(−12 u˜2 ) du˜ = µ∗ Φ ( µ∗ σ∗ ) ∫ ∞ −µ∗ σ∗ 1√ 2pi exp ( −12 u˜ 2 ) du˜+ σ∗ Φ ( µ∗ σ∗ ) ∫ ∞ −µ∗ σ∗ u˜√ 2pi exp ( −12 u˜ 2 ) du˜ = µ∗ + σ∗ Φ ( µ∗ σ∗ ) · 1√ 2pi exp [ −12 ( µ∗ σ∗ )2] = µ∗i + φ ( µ∗i σ∗ ) Φ ( µ∗i σ∗ )σ∗. (A.14) 96 A.3. OBTENÇÃO DA EXPRESSÃO PARA O CÁLCULO DE E(E−U |) 97 A.3 Obtenção da Expressão para o Cálculo de E(e−u|) Na subseção 2.5.2.4 do capítulo 2, foi apresentada uma expressão, proposta por Battese e Coelli (1988), para o cálculo da eficiência econômica de um dado produtor, conforme cálculos a seguir (o subscrito i foi omitido). EE = E(e−u|) = ∫ ∞ 0 e−u · f(u|)du = ∫ ∞ 0 1√ 2piσ∗ · Φ ( µ∗ σ∗ ) · exp[−12 ( u− µ∗ σ∗ )2 − u ] du = 1 σ∗Φ ( µ∗ σ∗ ) ∫ ∞ 0 1√ 2pi · exp [ −12 ( u− µ∗ σ∗ )2 − u ] du. (A.15) Considerando que, −12 ( u− µ∗ σ∗ )2 − u = −12 ( u2 − 2uµ∗ + µ2∗ σ2∗ ) − u = − [u− (µ∗ − σ 2 ∗)]2 2σ2∗ − 12(2µ∗ − σ 2 ∗), (A.16) então, a equação (A.15) pode ser simplificada para: EE = 1 σ∗Φ ( µ∗ σ∗ ) ∫ ∞ 0 1√ 2pi exp { − [u− (µ∗ − σ 2 ∗)] 2 2σ2∗ − 12 ( 2µ∗ − σ2∗ )} du = exp [ −12 (2µ∗ − σ2∗) ] σ∗Φ ( µ∗ σ∗ ) ∫ ∞ 0 1√ 2pi exp { −12 [u− (µ∗ − σ2∗)]2 σ2∗ } . (A.17) Agora seja considerar u˜ = u−(µ∗−σ2∗) σ∗ , o que implica em u˜ ∈ [(−µ∗/σ∗) + σ∗,∞) e du˜ du = 1 σ∗ ∴ du = σ∗du˜. 97 A.3. OBTENÇÃO DA EXPRESSÃO PARA O CÁLCULO DE E(E−U |) 98 Logo, a integral dada em (A.17) pode ser resolvida como: EE = E(e−u|) = exp [ −12 (2µ∗ − σ2∗) ] σ∗Φ ( µ∗ σ∗ ) ∫ ∞ −µ∗ σ∗ +σ∗ 1√ 2pi σ∗exp { −12 u˜ 2 } du˜ = exp ( −µ∗ + 12σ 2 ∗ ) · Φ ( µ∗ σ∗ − σ∗ ) Φ ( µ∗ σ∗ ) . (A.18) 98 A p ê n d ic e B Apêndice B Nesse segundo apêndice, é apresentada uma síntese do procedimento de simulaçãocomputacional conhecido como Monte Carlo via Cadeias de Markov (MCMC),bem como um de seus algoritmos, conhecido como Amostrador de Gibbs. B.1 Procedimento Monte Carlo via Cadeias de Markov (MCMC) Conforme foi apresentado na subseção 2.5.2.5, o estimador Bayesiano de um vetor ψ de parâmetros a serem estimados é definido como o valor médio da distribuição a posteriori, f(ψ|E), isto é, ψˆ = E[ψ|E] = ∫ ψ ψf(ψ|E)dψ. (B.1) Infelizmente, na maioria das vezes o cálculo desta última integral é intratável analiticamente. De acordo com Souza (2008), esse fato atrasou por muito tempo o desenvolvimento de modelos Bayesianos. Somente nas últimas três décadas, com a evolução da simulação computacional, é que este cenário se reverteu. Devido à complexidade, os modelos Bayesianos necessitam na maioria das vezes, do suporte de métodos de simulação, tais como aqueles que usam o procedimento conhecido como Monte Carlo1 via Cadeias 1Simulações de Monte Carlo referem-se àquelas simulações que utilizam números aleatórios. 99 B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 100 de Markov (MCMC). Dentre estes, destaca-se o Amostrador de Gibbs para a realização de inferências sobre a distribuição a posteriori, sendo considerado uma técnica numérica eficiente. Basicamente, a ideia desse método é poder gerar variáveis aleatórias de uma distribuição marginal, sem ter de resolvê-la diretamente. Osiewalski e Steel (1998) trazem um estudo com descrição detalhada sobre esses método numérico de simulação. Uma maneira aparentemente plausível de se resolver a integral da equação (B.1) consiste em gerar amostras aleatórias independentes e identicamente distribuídas {ψt, t = 1, 2, , . . . , T} da distribuição a posteriori f(ψ|E) e realizar a seguinte aproximação: E[ψ|E] = 1 T T∑ t=1 ψt, (B.2) que converge para E[ψ|E] com probabilidade um, quando T →∞. Entretanto, apesar de ser considerada uma ideia simples, o custo dessa simplicidade é que além da variância ser alta, em diversos casos, é praticamente impossível amostrar diretamente da distribuição a posteriori (Tierney, 1994). Porém, uma poderosa alternativa é fazer uso do procedimento MCMC, descrito a seguir. O MCMC (Metropolis et al., 1953) é um procedimento eficiente para gerar variáveis aleatórias, baseando-se em processos estocásticos denominados Cadeias de Markov. Logo, antes de se apresentar o método propriamente dito, vale a pena definir alguns conceitos referentes a estes processos. B.1.1 Cadeias de Markov O conteúdo dessa subseção foi baseado nas obras de Anton e Busby (2006); Hines et al. (2006); Taha (2008); Hillier e Lieberman (2010). Um processo estocástico é definido como um conjunto indexado de variáveis aleató- rias, {Xt}, em que o índice t percorre dado conjunto T . Normalmente, admite-se que T seja o conjunto de inteiros não-negativos e Xt represente uma característica mensurável de interesse no instante t. Por exemplo, Xt poderia representar o nível de estoque de determinado produto no final da semana t (Hillier e Lieberman, 2010). Um processo estocástico normalmente apresenta a seguinte estrutura: O estado atual do sistema pode cair em qualquer uma das M + 1 categorias mutuamente exclusivas denominadas estados. Para facilitar a notação, esses estados são identificados como 0, 1, . . . ,M . A variável aleatória Xt representa o estado do sistema 100 B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 101 no instante t, de modo que seus únicos valores possíveis sejam 0, 1, 2, . . . ,M . Os sistema é observado em pontos determinados do tempo, identificados por t = 0, 1, 2, . . . , T . Portanto, o processo estocástico Xt = X0, X1, X2, . . . , XT fornece uma representação matemática de como o estado do sistema físico evolui ao longo do tempo. Esse tipo de processo é conhecido como um processo estocástico em tempo discreto com um espaço de estado finito. B.1.1.1 Propriedade Markoviana Um processo estocástico Xt é dito ter propriedade markoviana se: P (Xt+1 = j|X0 = k0, X1 = k1, . . . , Xt−1 = kt−1, Xt = i) = P (Xt+1 = j|Xt = i), (B.3) para t = 0, 1, 2, . . . , T e toda sequência i, j, k0, k1, . . . , kt−1. Traduzindo isso em palavras, essa propriedade markoviana diz que a probabilidade condicional de qualquer “evento” futuro, dados “quaisquer” eventos passados e o estado presente Xt = i, é independente dos eventos passados e depende apenas do estado atual. Um processo estocástico Xt(t = 0, 1, 2, . . . , T ) é uma Cadeia de Markov se possuir a propriedade markoviana. B.1.1.2 Probabilidades de Transição As probabilidades condicionais P (Xt+1 = j|Xt = i) para uma Cadeia de Markov são chamadas probabilidades de transição ou Kernel de Transição em uma etapa. Se, para cada i e j, P (Xt+1 = j|Xt = i) = P (X1 = j|X0 = i), para todo t = 1, 2, . . . , T , então as probabilidades de transição são ditas estacionárias. Portanto, ter probabilidades de transição estacionárias implica que as probabilidades de transição não mudam ao longo do tempo. A existência de probabilidades de transição (em uma etapa) estacionárias também implica o mesmo, isto é, para cada i, j e n (n = 0, 1, 2, . . . , N), P (Xt+n = j|Xt = i) = P (Xn = j|X0 = i) para todo t = 0, 1, 2, . . . , T . Essas probabilidades condicionais são denominadas probabilidades de transição em n etapas. B.1.1.3 Notação Para simplificar a notação com probabilidades de transição estacionárias, façamos com que: pij = P (Xt+1 = j|Xt = i) p (n) ij = P (Xt+n = j|Xt = i). (B.4) 101 B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 102 Assim, a probabilidade de transição em n etapas p(n)ij é simplesmente a probabilidade condicional de que o sistema estará no estado j após exatamente n etapas (unidades de tempo), dado que ele inicia no estado i a qualquer instante t. Quando n = 1, note que p (1) ij = pij. Para n = 0, p (0) ij é apenas P (X0 = j|X0 = i) e, consequentemente, é 1 quando i = j e 0 quando i 6= j. Como as p(n)ij são probabilidades condicionais, elas devem satisfazer as seguintes propriedades: p (n) ij ≥ 0 , ∀i, j, n, M∑ j=0 p (n) ij = 1 , ∀i, n. (B.5) Uma maneira conveniente de mostrar todas as probabilidades de transição em n etapas é o formato de matriz a seguir: Essa matriz é denominada de matriz de transição em n etapas. Note que a probabi- lidade de transição em determinada linha e coluna é para a transição do estado de linha para o estado de coluna. B.1.1.4 Equações de Chapman-Kolmogorov As equações de Chapman-Kolmogorov fornecem um método para calcular as proba- bilidades de transição em n etapas: p (n) ij = M∑ k=0 p (m) ik p (n−m) kj , (B.6) para todo i, j = 0, 1, 2, . . . ,M e quaisquer m = 1,2, . . . , n− 1 e n = m+ 1,m+ 2, . . . , n. Na equação (B.6), p(m)ik p (n−m) kj indica que, dado um ponto de partida de estado i, o processo vai ao estado k após m etapas e depois para o estado j em n−m etapas. Logo, a soma das probabilidades sobre todos os possíveis k leva a p(n)ij . No entanto, pode-se mostrar que P(n) = Pn. Assim, a matriz de probabilidades de transição em n etapas P(n) pode ser obtida calculando-se a n-ésima potência da matriz de de transição em uma etapa P . 102 B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 103 B.1.1.5 Classificação dos Estados em uma Cadeia de Markov Em uma Cadeia de Markov, é usual dar a seguinte nomenclatura para os estados:: Estado Absorvente - um estado j é absorvente caso, após adentrar esse estado, o processo jamais deixará este estado novamente. Portanto, pjj = 1; Estado Transiente - um estado i é transiente se, após entrar nesse estado, existir a possibilidade de se alcançar outro estado j, mas não será possível voltar ao estado i em que se estava; Estado Recorrente - o estado i é dito ser recorrente se, após entrar neste estado, o processo com certeza for retornar a este estado novamente em outra etapa. Para isso, este estado não pode ser transiente; Estado Periódico - o período do estado i é definido como o inteiro t,(t > 1), tal que p (n) ii = 0 para todos os valores de n diferentes de t, 2t, 3t, . . ., e t é o maior inteiro com essa propriedade; Estado Aperiódico - se existirem dois números consecutivos s e s + 1 tais que, o processo possa se encontrar no estado i nos instantes s e s + 1, o estado é dito como tendo período 1 e é dito aperiódico; Estado Ergódico - em uma Cadeia de Markov de estados finitos, os estados recorrentes que forem aperiódicos são denominados estados ergódigos; Cadeia Ergódica - uma Cadeia de Markov é dita ergódiga se todos os seus estados forem ergódigos, isto é, se todos os estados forem recorrentes e aperiódicos; Cadeia Irredutível - uma Cadeia de Markov é dita irredutível se todos os seus estados se comunicam entre si. B.1.1.6 Probabilidade de Estado Estável Para qualquer Cadeia de Markov ergódica e irredutível, tem-se que: lim n→+∞ p (n) ij = pij > 0, (B.7) 103 B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 104 e é independente de i. Os pij são chamados probabilidades de estado estável de uma Cadeia de Markov e satisfazem às seguintes equações de estado estável: pij = M∑ i=0 piipij, ∀ j = 0, 1, . . . ,M, M∑ j=0 pij = 1. (B.8) Após essa síntese de alguns dos conceitos referentes às Cadeias de Markov, podem ser apresentadas a ideias que estão por trás do MCMC. B.1.2 Lógica do MCMC Seja considerar uma sequência de variáveis aleatórias {ψt, t = 1, 2, . . . , T}, tal que em cada momento t ≥ 0, o próximo estado ψt+1 é gerado da distribuição condicional f(ψt+1|ψt), que representa a probabilidade de transição entre os estados, e não depende de t se a cadeia for homogênea no tempo. Uma realização desta sequência de variáveis aleatórias {ψt, t = 1, 2, . . . , T} constitui uma Cadeia de Markov, com ψ0 representando uma condição inicial. Se essa cadeia for ergódica e irredutível, então limn→+∞ p(n)ij = pij > 0, implicando na existência de uma distribuição estacionária para pij. Assim, se ψt for gerado a partir desta distribuição, então todos os valores seguintes também o serão (Roberts, 1996). Considerando f(ψ|E) dada na equação (B.1) como sendo a distribuição estacionária, isto é, f(ψ|E) ≡ f(pi), (B.9) pode ser observado que se t→∞, os pontos amostrados ψt se parecerão cada vez mais com as amostras de f(ψ|E) (Gilks et al., 1996). Ignorando as primeiras tb iterações da cadeia (período de burn-in2), pode-se utilizar a Cadeia de Markov para estimar E[ψ|E], sendo ψ|E ∼ f(ψ|E), da seguinte maneira: E[ψ|E] = 1 T − tb T∑ t=tb+1 (ψt|E), (B.10) 2O período de burn-in representa as primeiras tb iterações da Cadeia de Markov que serão desprezadas, porém necessárias para dar estabilidade e confiabilidade ao procedimento MCMC. 104 B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 105 com probabilidade de convergência tendendo a um (Roberts, 1996). Assim, torna-se possível encontrar o estimador ψˆ descrito na equação (B.1). Uma última questão a se tratar diz respeito à construção de uma Cadeia de Markov tal que f(ψ|E) ≡ f(pi), isto é, a distribuição estacionária, f(pi), seja equivalente à distribuição a posteriori, f(ψ|E). Uma possível solução para essa questão faz uso do algoritmo conhecido como Amostrador de Gibbs, descrito a seguir. B.1.3 Algoritmo Amostrador de Gibbs De acordo com Gamerman e Lopes (2006), o Amostrador de Gibbs (Geman e Geman, 1984) é um esquema iterativo de amostragem de uma Cadeia de Markov, cujas probabilidades de transição são formadas pelas distribuições condicionais completas. Casella e George (1992) descrevem o funcionamento deste algoritmo da seguinte maneira: seja estudar o comportamento da distribuição marginal da variável aleatória ψ1 em um contexto de mais variáveis (ψ2, ψ3, . . . , ψd). A marginal em questão é dada por: f(ψ1) = ∫ ψd ∫ ψd−1 . . . ∫ ψ3 ∫ ψ2 f(ψ1, ψ2, . . . , ψd)dψ2dψ3 . . . dψd. (B.11) O cálculo dessas integrais pode ser impossível de ser realizado. Felizmente, o Amos- trador de Gibbs permite contornar essa situação, estimando as distribuições marginais através de simulação, conforme o algoritmo descrito na Figura B.1. Conforme pode ser observado nesse algoritmo, cada iteração se completará após d movimentos. Após um critério de convergência ser atendido, os valores resultantes para ψ(t) = (ψ(t)1 , ψ (t) 2 , . . . , ψ (t) d ) formam uma amostra para f(ψ). Se o mesmo raciocínio for aplicado a f(ψ|E), a equação (B.1) pode ser resolvida diretamente. B.1.4 Critério de Convergência Segundo Cowles e Carlin (1996), um método eficiente e relativamente simples para monitorar a convergência do Amostrador de Gibbs , é o gráfico de Autocorrelation Function (ACF) construído a partir das amostras geradas para f(ψ|E). A função de autocorrelação é uma medida da correlação entre as observações de uma série temporal que estão separadas por k unidades de tempo (lag), isto é, entre f(ψt|E) e f(ψt−k|E). Quanto mais rápido for o decaimento dos valores dessa função de autocorrelação em 105 B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 106 procedimento Amostrador de Gibbs 1 {Inicialização} 2 t← 1; 3 ψ(0) ← (ψ(0)1 , ψ(0)2 , . . . , ψ(0)d ); 4 {Iterações} 5 para t = 1 até T (passo = t) faça 6 se Critério de Convergência Não Satisfeito 7 então 8 ψ(t) ← (ψ(t)1 , ψ(t)2 , . . . , ψ(t)d ), onde: 9 ψ(t)1 = f(ψ1|ψ(t−1)2 , ψ(t−1)3 , . . . , ψ(t−1)d ); 10 ψ(t)2 = f(ψ2|ψ(t)1 , ψ(t−1)3 , . . . , ψ(t−1)d ); 11 ... 12 ψ(t)d = f(ψd|ψ(t)1 , ψ(t)2 , . . . , ψ(t)d−1); 13 senão 14 Pare; 15 f(ψ)← ψ(t) ← (ψ(t)1 , ψ(t)2 , . . . , ψ(t)d ); 16 fim-se; 17 fim-para fim Amostrador de Gibbs; Figura B.1: Algoritmo Amostrador de Gibbs. relação ao aumento do lag, melhor é o mixing (mistura) das cadeias geradas. A Figura B.2 a seguir, ilustra esse tipo de gráfico. Figura B.2: Exemplo de um gráfico ACF para ψt|E. 106 B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 107 Conforme pode ser observado na Figura B.2, as correlações entre as amostras geradas f(ψt|E) e f(ψt−k|E) decaem à medida que aumenta-se o valor de k (lag), isto é, essas correlações vão diminuindo à medida que as amostras geradas vão se tornando mais afastadas temporalmente uma da outra. Esse fato indica baixa autocorrelação da cadeia, mixing apropriado e confiabilidade dos estimadores gerados, isto é, de ψˆ. 107 A p ê n d ic e C Apêndice C Conforme foi discutido no capítulo 3, os modelos BSFA propostos foram com-parados utilizando-se as estatísticas Watanabe-Akaike Information Criterion(WAIC), Deviance Information Criterion (DIC) e Log-Pseudo Marginal Like- lihood (LPML). Os modelos com menor valor de DIC e maiores valores de WAIC e LPML alcançam melhor ajuste aos dados. Nesse terceiro apêndice, é apresentada uma síntese destes critérios. C.1 Critérios de Seleção de Modelos C.1.1 Log-Pseudo Marginal Likelihood (LPML) Esse critério funciona como uma validação cruzada do modelo, do tipo leave-one-out, utilizando o logaritmo da função de verossimilhança como critério de comparação entre os vários modelos de BSFA disponíveis, isto é, para cada modelo, calcula-se: LPML = n∑ i ln f(xi|x(−i)), (C.1) onde x(−i) é o conjunto de n dados sem a observação xi. Escolhe-se o modelo com maior valor de LPML. 109 C.1. CRITÉRIOS DE SELEÇÃO DE MODELOS 110 C.1.2 Deviance Information Criterion (DIC) Esse critério penaliza simultaneamente, a falta de ajuste e a complexidade do modelo, conforme a seguinte equação: DIC = E [D(x|Θ)] + { E [D(x|Θ)]−D(x|Θˆ) } , (C.2) onde: • Θ e Θˆ são os parâmetros e os estimadores de máxima verossimilhança do modelo; • D(x|Θ) = −2 ln [f(x|Θ) é o deviance, isto é, a soma de quadrados dos resíduos do ajuste obtido por máxima verossimilhança, ao invés de mínimos quadrados ordinários (OLS); • E [D(x|Θ)] é a média a posteriori para o deviance e penaliza a falta de ajuste; • D(x|Θˆ) é o deviance avaliado na média ou na mediana a posteriori de Θˆ; • E [D(x|Θ)]−D(x|Θˆ) é o tamanho efetivo do modelo e penaliza a complexidade. Escolhe-se o modelo com menor valor de DIC. C.1.3 Watanabe-Akaike Information Criterion (WAIC) Esse critério também é composto por duas componentes: uma que penaliza a falta de ajuste do modelo e outra que penaliza a complexidade do mesmo, da seguinte maneira: WAIC = −2 · { n∑ i=1 lnE[f(xi|Θ)] + n∑ i=1 V [ln f(xi|Θ)]}. (C.3) Escolhe-se o modelo com maior valor de WAIC. 110 Referências Bibliográficas Agrell, P., Bogetoft, P., 2017. Regulatory benchmarking: models, analyses and applications. Data Envelopment Analysis Journal 3, 49–91. Aigner, D., Lovell, C., Schmidt, P., 1977. Formulation and estimation of stochastic frontier production function models. Journal of Economics 6 (1), 21–37. Albert, J., 2009. Bayesian Computation with R. New York: Springer. Albuquerque, M., 1987. Uma análise translog sob mudança tecnológica e efeitos de escala: um caso de modernização ineficiente. Pesquisa em Planejamento Econômico 17 (1), 191–220. Altoé, A., Costa, N., Lopes, A., Veloso, T., Saurin, V., 2017. Technical efficiency and financial performance in the brazilian distribution service operators. Socio-Economic Planning Sciences 1 (1), 1–14. Alvarez, A., Amsler, C., Orea, L., Schmidt, P., 2006. Interpreting and testing the scaling property in models where inefficiency depends on firm characteristics. Journal of Productivity Analysis 25 (1), 201–212. Amsler, C., Prokorov, A., Schmidt, P., 2014. Using copulas to model time dependence in stochastic frontier models. Econometric Reviews 33 (1), 497–522. ANEEL, 2006. NT 262/2006: segundo cliclo de revisão tarifária periódica das concessionárias de distribuição de energia elétrica do Brasil. Technical note, SER/SFF/SRD/SFE/SRC/ANEEL. ANEEL, 2015. NT 66/2015: metodologia de custos operacionais. Technical note, SRM- SGT-ANEEL. 111 REFERÊNCIAS BIBLIOGRÁFICAS 112 ANEEL, 2017. NT 162/2017: abertura de audiência pública para atualização dos parâ- metros relacionados à definição dos custos operacionais regulatórios (submódulos 2.2 e 2.2a dos procedimentos de regulação tarifária - proret). Technical note, SRM-ANEEL. Anton, H., Busby, R., 2006. Álgebra Linear Contemporânea. Porto Alegre: Bookman. Arcoverde, F., Tannuri-Pianto, M., Sousa, M., 2005. Mensuração das eficiências das distribuidoras do setor energético brasileiro usando fronteiras estocásticas. Anais do Encontro Nacional de Economia XXXIII (1), 1–18. Atkinson, S., Dorfman, J., 2005. Bayesian measurement of productivity and efficiency in the presence of undesirable outputs: crediting electric utilities for reducing air pollution. Journal of Econometrics 126, 445–468. Azzalini, A., 1985. A class of distributions which includes the normal ones. Scandinavian Journal of Statistics 12 (1), 219–230. Azzalini, A., 2013. The Skew-Normal and Related Families. New York: Cambridge University Press. Bandyopadhyay, D., Das, A., 2006. On measures of technical inefficiency and production uncertainty in stochastic frontier production model with correlated error components. Journal of Productivity Analysis 26 (1), 165–180. Banker, R., 2011. Report on aneels proposal for electricity distribution tariff regulation. Technical note, Technical Note, 101/2011. Banker, R., Charnes, A., Cooper, W., 1984. Some models for estimating technical and scale inefficiencies in data envelopment analysis. Management Science 30 (9), 1078–1092. Banker, R., Forsund, F., Zhang, D., 2017. Use of data envelopment analysis for incentive regulation of electric distribution firms. Data Envelopment Analysis Journal 3, 1–47. Banker, R., Natarajan, R., 2008. Evaluating contextual variables affecting productivity using data envelopment analysis. Operations Research 56 (1), 48–58. Banker, R., Zhang, D., 2016. Improvement in efficiency under dea-based incentive regu- lation of electric utilities in Brazil. Technical note based on Ph.D. Thesis of Daqun Zhang, Temple University. 112 REFERÊNCIAS BIBLIOGRÁFICAS 113 Battese, G., Coelli, T., 1988. Prediction of firm level technical efficiencies with a ge- neralized frontier production function and panel data. Journal of Econometrics 38, 387–399. Battese, G., Coelli, T., 1992. Frontier production functions, technical efficiency and panel data: with aplication to paddy farmers in India. Journal of Productivity Analysis 3 (1), 153–169. Battese, G., Coelli, T., 1995. A model for technical inefficiency effects in a stochastic frontier production function for panel data. Empirical Economics 20 (1), 325–332. Battese, G., Corra, G., 1977. Estimation of a production frontier model: with aplication to the pastoral zone of eastern Australia. Australian Journal of Agricultural Economics 21 (3), 169–179. Bauer, P., 1990. Recent developments in the econometric estimation of frontiers. Journal of Econometrics 46, 39–56. Bayes, C. L., Branco, M. D., 2007. Bayesian inference for the skewness parameter of the scalar skew-normal distribution. Brazilian Journal of Probability and Statistics, 141–163. Behr, A., 2015. Production and Efficiency Analysis with R. New York: Springer. Bogetoft, P., 2014. Comments on the brazilian benchmarking model for energy distribution regulation. forth cycle of tariff review, NT 192 2014. Tech. rep. Bogetoft, P., Lopes, A. L. M., 2015. Comments on the brazilian benchmarking model for energy distribution regulation forth cycle tariff review technical note 407/2014. Tech. rep. Bogetoft, P., Otto, L., 2011. Benchmarking with DEA, SFA and R. International Series in Operations Research and Management Science. New York: Springer. Casella, G., George, E., 1992. Explaining the Gibbs Sampler. The American Statistician 46. Caudill, S., Ford, J., 1993. Biases in frontier estimation due to heteroscedasticity. Econo- mics Letters 41 (1), 17–20. 113 REFERÊNCIAS BIBLIOGRÁFICAS 114 CEPA, 2013. Assessing Efficiency for the 2005 Distribution Price Control Review. London: OFGEM. Chambers, R., 1988. Applied Production Analysis: a dual approach. New York: Cambridge University Press. Charnes, A., Cooper, W., Rhodes, E., 1978. Measuring the efficiency of decision making units. European Journal of Operational Research 2 (6), 429–444. Chen, Y., Schmidt, P., Wang, H., 2014. Consistent estimation of the fixed effects stochastic frontier model. Journal of Econometrics 18 (2), 65–76. Chen, Z., Barros, C., Borges, M., 2015. A Bayesian stochastic frontier analysis of chinese fossil-fuel electricity generation companies. Energy Economics 48, 136–144. Christensen, L., Jorgenson, R., Lau, L., 1971. Conjugate duality and transcendental logarithmic function. Econometrica 39 (1), 255–256. Cobb, C., Douglas, P., 1928. A theory of production. The American Economic Review 18 (1), 139–165. Coelli, T., 1995. Estimators and hypothesis tests for a stochastic frontier function: A monte carlo analysis. Journal of Productivity Analysis 6 (1), 247–268. Colin, E., 2018. Pesquisa Operacional: 170 aplicações em estratégia, finanças, logística, produção, marketing e vendas. Rio de Janeiro: LTC. Cook, W., Zhu, J., 2013. Data Envelopment Analysis: balanced benchmarking. San Bernardino: Cook and Zhu. Cornwell, C., Schmidt, P., Sickles, R., 1990. Production frontiers with cross-sectional and time-series variation in efficiency levels. Journal of Econometrics 46 (1), 185–200. Costa, M., Lopes, A., Matos, G., 2015a. Statistical evaluation of data envelopment analysis versus cols cobb-douglas benchmarking models for the 2011 brazilian tariff revision. Socio-Economic Planning Sciences 49, 47–60. Costa, M., Rodrigues, T., Costa, A., Natowics, R., Braga, A., 2015b. Sequential selection of variables using short permutation procedures and multiple adjustments: an application to genomic data. Statistical Methods in Medical Research, 1–24. Cowles, K., 2004. Review of winbugs 1.4. The American Statistician 58, 330–336. 114 REFERÊNCIAS BIBLIOGRÁFICAS 115 Cowles, M., Carlin, B., 1996. Markov chain monte carlo convergence diagnostics: A comparative review. Journal of the American Statistical Association 91 (434), 883–904. Debreu, G., 1951. The coefficient of resource utilization. Econometrica 19 (3), 273–292. Deprins, D., Simar, L., 1989a. Estimating technical inefficiencies with corrections for environmental conditions with an application to railway companies. Annals of Public and Cooperative Economics 60 (1), 81–102. Deprins, D., Simar, L., 1989b. Estimation de frontières déterministes avec facteurs exogènes d’inefficacité. Annales d’Economie et de Statistique 14 (1), 117–150. Dey, D., Gelfand, A., Peng, F., 1997. Overdispersed generalized linear models. Journal of Statistical Planning and Inference 64 (1), 93–107. Dorfman, J., Koop, G., 2005. Current developments in productivity and efficiency measurement. Journal of Econometrics 126, 233–240. Douglas, P., 1976. The cobb-douglas production function once again: its history, its testing, and some new empirical values. Journal of Political Economy 84 (5), 903–915. Draper, N., Smith, H., Pownell, E., 1966. Applied regression analysis. New York: Wiley. Edvardsen, P., 2006. Productivity and regulatory reform of norwegian electricity dis- tribution utilities. Performance Measurement and Regulation of Network Utilities 1, 97–131. Efron, B., 1979. Bootstrap methods: another look at the jackknife. The Annals of Statistics 7 (1), 1–26. Emrouznejad, A., Yang, G., 2017. A survey and analysis of the first 40 years of scholarly literature in dea: 1978 e 2016. Socio-Economic Planning Sciences 1 (1), 1–5. Farrel, M., 1957. The measurement of productive efficiency. Journal of the Royal Statitical Society 120 (3), 253–281. Forsund, F., 2009. Good modelling of bad outputs: pollution and multiple-output pro- duction. International Review of Environmental and Resource Economics 3, 1–38. Forsund, F., Lovell, C., Schimidt, P., 1980. A survey of frontier production functions and of their relationship to efficiency measurement. Journal of Econometrics 13 (1), 5–25. 115 REFERÊNCIAS BIBLIOGRÁFICAS 116 Franco, F., Fortuna, M., 2003. The stochastic frontier method in measuring the efficiency of hospital services: a literature review. Portuguese Association of Economics and Health 2, 4–33. Färe, R., Grosskopf, S., Noh, D., Weber, W., 2005. Characteristics of a polluting techno- logy: theory and practice. Journal of Econometrics 126, 469–492. Gamerman, D., Lopes, H., 2006. Markov Chain Monte Carlo: stochastic simulation for Bayesian inference. London: Chapman and Hall. Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., Rubin, D. B., 2014. Bayesian data analysis. Vol. 2. FL: CRC press Boca Raton. Geman, S., Geman, D., 1984. Stochastic relaxation, gibbs distributions and bayesian restoration of images. IEEE Transactions on Pattern Analysis and Machine Intelligence PAMI-6. Geyer, C. J., Johnson, L. T., 2017. Markov Chain Monte Carlo. R package version 0.9-5. URL https://CRAN.R-project.org/package=mcmc Gil, G., Costa, M., Lopes, A., Mayrink, V., 2017. Spatial statistical methods applied to the 2015 brazilian energy distribution benchmarking model: accountig for unobserved determinants of inneficieies. Energy Economics 64 (1), 373–383. Gilks, W., Richardson, S., Spiegelhalter, D., 1996. Introducing Markov chain monte carlo. In: Chapman, L., Hall (Eds.), Markov Chain Monte Carlo in Practice. Vol. 1. W. Gilks and S. Richardson and D. Spiegelhalter. Gilks, W., Roberts, G., 1996. Strategies for improving mcmc. In: Gilks, W., Richardson, S., Spiegelhalter, D. (Eds.), Markov Chain Monte Carlo in Practice. Chapman and Hall, pp. 89–114. Greene, W., 1980a. Maximun likelihood estimation of econometric frontier functions. Journal of Econometrics 13 (1), 27–56. Greene, W., 1980b. On the estimation of a flexible frontier production model. Journal of Econometrics 13 (1), 101–115. Greene, W., 1990. A gamma-distributed stochastic frontier model. Journal of Econometrics 46 (1/2), 141–64. 116 REFERÊNCIAS BIBLIOGRÁFICAS 117 Greene, W., 2005. Fixed and random effects in stochastic frontier models. Journal of Productivity Analysis 23 (1), 7–32. Griffin, E., Steel, J., 2007. Bayesian stochastic frontier analysis using winbugs. Journal of Productivity Analysis 27 (3), 163–176. Hadri, K., 1999. Estimation of a doubly heteroscedastic stochastic frontier cost function. Business and Economic Statistics 17 (1), 359–363. Haney, A., Pollit, M., 2009. Efficiency analysis of energy networks: an international survey of regulators. Energy Policy 37 (12), 5814–5830. Haney, A., Pollit, M., 2011. Exploring the determinants of best practice benchmarking in electricity network regulation. Energy Policy 39, 7739–7746. Henze, N., 1986. A probabilistic representation of the skew-normal distribution. Scandi- navian journal of statistics, 271–275. Hillier, F., Lieberman, G., 2010. Introdução à Pesquisa Operacional. Porto Alegre: McGraw Hill. Hines, W., Montgomery, D., Goldsman, D., Borror, C., 2006. Probabilidade e Estatística na Engenharia. Rio de Janeiro: LTC. Hu, J., Wang, S., 2006. Total-factor energy efficiency of regions in china. Energy Policy 34 (17), 3206–3217. Huang, C., Liu, J., 1994. Estimation of a non-neutral stochastic frontier production function. Journal of Productivity Analysis 5 (2), 171–180. Jamasb, T., Pollitt, M., 2001. Benchmarking and regulation: international electricity experience. Utilities Policy 9, 107–130. Jondrow, J., Lovell, C., Materov, I., Schmidt, P., 1982. On the estimation of techinical inef- ficiency in the stochastic frontier production function model. Journal of Econometrics 19 (2), 233–238. Juárez, M. A., Steel, M. F., 2010. Model-based clustering of non-Gaussian panel data based on skew-t distributions. Journal of Business & Economic Statistics 28 (1), 52–66. Koop, G., Osiewalski, J., Steel, M., 1995. Posterior analysis of stochastic frontier models using gibbs sampling. Computational Statistics 10, 353–373. 117 REFERÊNCIAS BIBLIOGRÁFICAS 118 Koopmans, T., 1951. An an analysis of production as an efficient combination of activities. In: Wiley, N. Y. (Ed.), Activity Analysis of Production and Allocatio. Vol. 13. Cowles Comission for Research in Economics. Kopp, R., Diewert, W., 1982. The decomposition of frontier cost function deviations into measures of technical and allocative efficiency. Journal of Econometrics 19 (2), 319–331. Kumbhakar, S., 1990. Production frontiers, panel data, and time-varyng technical ineffi- ciency. Journal of Econometrics 46 (1), 201–212. Kumbhakar, S., Glosh, S., McGuckin, J., 1991. A generalized production frontier approach for estimating determinants of inefficiency in us dairy farms. Journal of Business and Economic Statistics 9 (3), 279–286. Kumbhakar, S., Lien, G., Hardarker, J., 2014. Technical efficiency in competing panel data models: A study of norwegian grain farming. Journal of Productivity Analysis 41 (2), 321–337. Kumbhakar, S., Lovell, C., 2003. Stochastic Frontier Analysis. New York: Cambridge University Press. Kumbhakar, S., Tsionas, E., 2013. The good, the bad and the ugly: a system approach to good modeling of bad outputs. Working paper. Kumbhakar, S., Wang, H., 2005. Estimation of growth convergence using a stochastic production frontier approach. Economics Letters 88 (1), 300–305. Kumbhakar, S., Wang, H., Horncastle, A., 2015. Stochastic Frontier Analysis Using Stata. New York: Cambridge University Press. Kuosmanen, T., 2012. Stochastic semi-nonparametric frontier estimation of electricity distribution networks: application of the stoned method in the finnish regulatory model. Energy Economics 34, 2189–2199. Kuosmanen, T., Kortelainen, M., 2012. Stochastic non-smooth envelopment of data: semi- parametric frontier estimation subject to shape constraints. Journal of Productivity Analysis 38 (1), 11–28. 118 REFERÊNCIAS BIBLIOGRÁFICAS 119 Kuosmanen, T., Saastamonein, A., Sipilainen, T., 2013. What is the best practice for benchmark regulation of electricity distribution? comparison of dea,sfa and stoned methods. Energy Policy 61, 740–750. Lai, H., Huang, C., 2013. Maximum likelihood estimation of seeminggly unrelated stochastic frontier regressions. Journal of Productivity Analysis 40 (1), 1–14. Lampe, H., Hilgers, D., 2015. Trajectories of efficiency measurement: a bibliometric analysis of dea and sfa. European Journal of operational Research 240, 1–21. Land, K., Lovell, C., Thore, S., 1993. Chance-constrained data envelopment analysis. Managerial and Decision Economics 14 (1), 541–554. Lee, L., 1983. A test for distributional assumptions for the stochastic frontier functions. Journal of Econometrics 22 (3), 245–267. Liseo, B., Loperfido, N., 2006. A note on reference priors for the scalar skew-normal distribution. Journal of Statistical Planning and Inference 136 (2), 373–389. Llorca, M., Orea, L., Pollit, M., 2014. Using the latent class approach to cluster firms in benchmarking: an application to the us electricity transmission industry. Operations Research Perspectives 1 (1), 6–17. Llorca, M., Orea, L., Pollit, M., 2016. Efficiency and environmental factors in the us electricity transmission industry. Energy Economics 55 (1), 234–246. Lopes, A., 2015. Benchmarking Using Data Envelopment Analysis (DEA) in Regulating Electricity: the brazilian case. NESP-FACE/UFMG, Belo Horizonte. Lopes, A., Vilela, B., Costa, M., Lanzer, E., 2016. Critical evaluation of the efficient costs assessment model used in the regulation of brazilian energy distribution service operator. Revista Gestão e Tecnologia 16 (3), 5–30. Meeusen, W., van den Broeck, J., 1977. Efficiency estimation from Cobb-Douglas produc- tion functions with composed error. International Economic Review 18 (2), 435–444. Mesquita, R., 2017. Regulação de custos de distribuição de energia elétrica: uma análise comparativa das abordagens de benchmarking utilizadas em países europeus e latino- americanos. Ph.D. thesis, UFMG. 119 REFERÊNCIAS BIBLIOGRÁFICAS 120 Metropolis, N., Rosenbluth, A., Rosenbluth, M., Teller, A., Teller, E., 1953. Equation of state calculations by fast computing machines. The Journal of Chemical Physics 21 (6), 1087–1092. Nieswand, M., Seifert, S., 2018. Environmental factors in frontier estimation: A monte carlo analysis. European Journal of Operational Research 265, 133–148. Nocedal, J., Wright, S., 2006. Numerical Optimization. New York: Springer. Olesen, O., Petersen, N., 2016. Stochastic data envelopment analysis - a review. European Journal of Operational Research 251 (1), 2–21. Osiewalski, J., Steel, M., 1998. Numerical tools for the bayesian analysis of frontier models. Journal of Productivity Analysis 10, 103–117. Paradi, J., 2015. Comments on aneel’s models. In: Lopes, A. (Ed.), Benchmarking Using Data Envelopment Analysis - DEA in Regulating Electricity: the Brazilian case. Vol. 1. NESP-FACE/UFMG. Pitt, M., Lee, L., 1981. The measurement and sources of techinical inefficiency in the indonesian weaving industry. Journal of Development Economics 9 (1), 43–64. Plumer, M., 2003. Jags: A program for analysis of bayesian graphical models using gibbs sampling. In: K. Hornik, F. L., Zeileis, A. (Eds.), Proceedings of the 3rd International Workshop on Distributed Statistical Computing. pp. 1–10. Plummer, M., 2016. Bayesian Graphical Models using MCMC. R package version 4-6. URL https://CRAN.R-project.org/package=rjags Plummer, M., 2017. Just another gibbs sampler (JAGS) version 4.3.0. Software manual. Ray, S., 2004. Data Envelopment Analysis: theory and techniques for Economics and Operation Research. Cambridge: Cambridge University Press. Ray, S., 2015. A critical review of aneel’s dea methodology. In: Lopes, A. (Ed.), Ben- chmarking Using Data Envelopment Analysis - DEA in Regulating Electricity: the Brazilian case. Vol. 1. NESP-FACE/UFMG. Reifschneider, D., Stevenson, R., 1991. Systematic departures from the frontier: a fra- mework for the analysis of firm inefficiency. International Economic Review 32 (3), 715–723. 120 REFERÊNCIAS BIBLIOGRÁFICAS 121 Roberts, G., 1996. Markov chains concepts related to sample algorithms monte carlo. In: Chapman, L., Hall (Eds.), Markov Chain Monte Carlo in Practice. Vol. 3. W. Gilks and S. Richardson and D. Spiegelhalter. Saastamoinen, A., Kuosmanen, T., 2016. Quality frontier of electricity distribution: supply security, best practices, and underground cabling in finland. Energy Economics 53, 281–292. Sartori, N., 2006. Bias prevention of maximum likelihood estimates for scalar skew- normal and skew-t distributions. Journal of Statistical Planning and Inference 136 (12), 4259–4275. Schmidt, P., Lovell, C., 1979. Estimating technical and allocative inefficiency relative to stochastic production and cost frontiers. Journal of Econometrics 9 (1), 343–366. Schmidt, P., Sickles, R., 1984. Production frontiers and panel data. Journal of B. and E. Statistics 2 (4), 367–374. Seber, A., Lee, A., 2012. Linear regression analysis. New York: Wiley. Semolini, R., 2014. Eficiência dos custos operacionais das empresas de distribuição de energia elétrica no brasil. Ph.D. thesis, Unicamp. Sherphard, R., 1953. Cost and Production Functions. New Jersey: Princeton University Press. Simar, L., Wilson, P., 2007. Estimation and inference in two-stage, semi-parametric models of production processes. Journal of Econometrics 136 (1), 31–64. Souza, M., 2008. Uma abordagem Bayesiana para o cálculo dos custos operacionais eficientes das distribuidoras de energia elétrica. Ph.D. thesis, PUC-RJ. Souza, M., Diallo, M., Souza, R., Baydia, T., 2010a. The cost efficiency of the brazi- lian electricity distribution utilities: a comparassion of Bayesian sfa and dea models. Mathematical Problems in Engineering 2010, 1–20. Souza, M., Souza, R., Pessanha, J., 2007. Avaliação dos custos operacionais eficientes das distribuidoras de energia elétrica: um exercício com modelos de fronteira estocástica bayesiana. SPOLM 1, 1–14. 121 REFERÊNCIAS BIBLIOGRÁFICAS 122 Souza, M., Souza, R., Pessanha, J., 2010b. Custos operacionais eficientes das distribuidoras de energia elétrica: um estudo comparativo dos modelos dea e sfa. Gestão e Produção 17, 653–667. Spiegelhalter, D., Thomas, A., Best, N., Lunn, D., 2003. WinBUGS 1.4. Software manual. Stead, A., Wheat, P., Greene, W., 2017. Robust stochastic frontier analysis: A student’s t-half normal model with application to highways maintenance costs in England. Tech. rep., Working Paper. University of Leeds, Insitute for Transport Studies. Stevenson, R., 1980. Likelihood functions for generalized stochastic frontier estimation. Journal of Econometrics 13 (1), 57–66. Sueyoshi, T., Yuan, Y., Goto, M., 2017. A literature study for dea applied to energy and environment. Energy Economics 62, 104–124. Taha, H., 2008. Pesquisa Operacional. Porto Alegre: Pearson Prentice Hall. Tannuri-Pianto, M., Sousa, M., Arcoverde, F., 2009. Fronteiras de eficiência estocásticas para empresas de distribuição de energia elétrica no Brasil: uma análise de dados de painel. Estudos Econômicos 39 (1), 221–247. Tierney, L., 1994. Markov chains for exploring posterior distributions. The Annals of Statistics 22 (4), 1701–1728. Tobin, J., 1958. Estimation of relationships for limited dependent variables. Econometrica 26 (1), 24–36. Train, E., 2009. Discrete Choice Methods with Simulation. Cambrigge: Cambridge university press. Tsionas, E. G., 2002. Stochastic frontier models with random coefficients. Journal of Applied Econometrics 17 (2), 127–147. van den Broeck, J., Koop, G., Osiewalski, J., Steel, M., 1994. Stochastic frontier models: a baysesian perspective. Journal of Econometrics 61, 273–303. Vaninsky, A., 2006. Efficiency of electric power generation in the united states: analysis and forecast based on data envelopment analysis. Energy Economics 28 (3), 326–338. 122 REFERÊNCIAS BIBLIOGRÁFICAS 123 Veronese, A., 2015. Estimação paramétrica de escores de eficiência em 2 estágios: impacto das variáveis ambientais no ajuste das eficiências regulatórias das empresas brasileiras de distribuição de energia elétrica para o 4crtp. Ph.D. thesis, UFMG. Veronese, A., Costa, M., Lopes, A., Carmo, G., 2018. A close look at second stage data envelopment analysis using compound error models and the tobit model. Socio- Economic Planning Sciences xx (xx), xx–xx, no prelo. Wang, H., 2002. Heteroscedasticity and non-monotonic efficiency effects of a stochastic frontier model. Journal of Productivity Analysis 18 (1), 241–253. Wang, H., Ho, C., 2010. Estimating fixed-effect panel stochastic frontier models by model transformation fixed and random effects in stochastic frontier models. Journal of Econometrics 157 (1), 286–296. Zaja, M., Banker, R., Fang, S., Hunjet, D., Neralic, L., Wendell, R., 2017. Efficiency gains in Croatia’s electricity distribution centers following industry structure changes. Data Envelopment Analysis Journal 3, 119–150. Zanini, A., 2004. Regulação econômica no setor elétrico brasileiro: uma metodologia para definição de fronteiras de eficiência e cálculo do fator x para empresas distribuidoras de energia elétrica. Ph.D. thesis, PUC-RJ. Zhou, P., Ang, B., Poh, K., 2008. A survey of data envelopment analysis in energy and environmental studies. European Journal of Operational Research 189 (1), 1–18. 123 Índice Remissivo A Agências Reguladoras, 2 C Cadeias de Markov, 98 classificação dos estados, 101 equações de Chapman-Kolmogorov, 100 matriz de transição, 100 probabilidade de estado estável, 101 probabilidade de transição, 99 propriedade markoviana, 99 Critérios de Seleção dos Modelos, 107 DIC, 72, 108 LPML, 72, 107 WAIC, 72, 108 Custos custos gerenciáveis, 5 custos não-gerenciáveis, 5 D Despesas CAPEX, 15 OPEX, 15 TOTEX, 15 Deviance, 108 E Empresas de Distribuição autorizadas, 2 concessionárias, 2 cooperativas de eletrificação rural, 2 permissionárias, 2 Estatísticas γ, 48 M3T, 39, 75 Estimador Bayesiano ψˆ, 52, 97 Estimador Frequentista λˆ, 47 Θˆ, 50 βˆ, 47 σˆ2u, 47 σˆ2ν , 47 σˆ, 47 uˆi, 49 Estimativas, 76, 78 Estimação da fronteira estocática de custo, 35 paramétrica para e−ui , 37 enfoque Bayesiano, 50 enfoque frequentista, 45 F Fronteira de custo, 31 de produção, 25 125 ÍNDICE REMISSIVO 126 Função de Custo Cobb-Douglas, 33 Reparametrizada ξ(yi), 65 Translog, 34 Função de Produção, 29 Cobb-Douglas, 29 Translog, 30 Função de Verossimilhança L(E,ψ), 52 função de log-verossimilhança, 47 Função Densidade de Probabilidades f(i), 46, 91 f(E cond ψ), 52 f(ψ), 52, 103 f(ψ cond E), 52 f(νi), 45 f(u cond ), 48 f(u,), 48 f(ui), 45 fX(x), 65 fZ(z), 64 f(), 64 M MCMC, 97 amostrador de Gibbs, 103 critério de convergência, 103 ACF, 84, 104 Modelo de Custo com fronteira estocástica, 36 Modelos Propostos para o SFA de Custos modelo 1, 69 modelo 2, 70 modelo 3, 70 modelo 4, 71 modelo 5, 71 modelo 6, 72 modelo 7, 72 Monópolio Natural, 1 Métodos de Benchmarking, 8 Goal Programming, 8 CMAD, 9 COLS, 12 DEA, 11 Empresa de referência, 14 MOLS, 9 OLS, 9 REA, 8 SDEA, 8 SFA, 13 StoNED, 13 TFA, 9 Métricas eficiência, 5, 94, 95 alocativa, 30 econômica, 31 técnica, 25 eficácia, 5 escores de eficiência, 7 ineficência técnica, 27 produtividade, 5 P Parâmetro δ, 65 δ1, 69 λ, 46, 65 Θ, 50 δ, 56 ψ, 52 126 ÍNDICE REMISSIVO 127 µ, 40 µ∗, 48 νi, 66 σ, 46, 65 σ2u, 40 σ2∗, 48 σ2ν , 40 ξ, 64 ζi, 56 a, 64 ui, 49, 66 R Regulação, 2 price cap, 5 distribuição, 4 geração, 4 regulação por incentivo, 5 tarifária, 2 transmissão, 4 Revisões Tarifárias, 4 1o ciclo, 4 2o ciclo, 4 3o ciclo, 5 4o ciclo, 5 S Setor de distribuição de energia elétrica, 2 elétrico brasileiro, 1 V Variáveis de entrada PMSOa (x), 68 de saída indesejada CHI (y6), 68 NTL (y7), 68 de saída ordinária Cons (y1), 68 High (y4), 68 Over (y3), 68 Under (y5), 68 Wmkt (y2), 68 exógenas, 54 zi, 68 e.variable, 68 127