Tese Doutoral
Uma análise robusta de benchmarking utilizando o método de
fronteira estocástica Bayesiano aplicado às empresas
brasileiras de distribuição de energia
Por
Magno Silvério Campos
Orientador: Prof. Dr. Marcelo Azevedo Costa
Departamento de Engenharia de Produção
Escola de Engenharia
Trabalho apresentado ao Programa de Pós-Graduação em En-
genharia de Produção, em conformidade com os requisitos para
obtenção do grau de Doutor em Engenharia de Produção,
na Escola de Engenharia da Universidade Federal de Minas Gerais.
Novembro de 2018


Campos, Magno Silvério. 
C198a                  Uma análise robusta de benchmarking utilizando o método de 
fronteira estocástica bayesiano aplicado às empresas brasileiras de 
distribuição de energia [manuscrito] / Magno Silvério Campos. – 2018. 
                            xxviii, 125 f., enc.: il. 
  
      Orientador: Marcelo Azevedo Costa. 
                    
                           Tese (doutorado) - Universidade Federal de Minas Gerais, 
                     Escola de Engenharia. 
 
                            Apêndices: f. 91-108. 
 
                            Bibliografia: f. 109-121. 
                             
     1. Engenharia de produção - Teses. 2. Análise envoltória de dados - 
Teses. I. Costa, Marcelo Azevedo. II. Universidade Federal de Minas 
Gerais. Escola de Engenharia. III. Título. 
 
                                                                                                       CDU: 658.5(043) 
 
 
Resumo
Um modelo de Análise Envoltória de Dados (DEA) é aplicado pelo reguladorbrasileiro para definir os custos operacionais regulatórios para 61 concessionáriasde distribuição de eletricidade ou DSOs, desde 2015. O modelo atual DEA
compreende retornos não decrescentes de escala, um insumo, sete produtos e restrições
aos pesos. Os custos regulatórios foram estimados utilizando valores médios de 2011 a
2013. Em 2017, novos custos regulatórios foram estimados utilizando um conjunto de
dados atualizado e o modelo DEA anterior. Resultados recentes são semelhantes aos
resultados obtidos em 2015 e mostram evidências de que o atual modelo de benchmarking
ainda requer melhorias. Em suma, algumas DSOs têm baixíssimas eficiências, perto
de 25%, e as análises estatísticas mostram a presença de outliers na base de dados.
Além disso, o modelo ainda carece de ajustes ambientais. Esse estudo avalia o uso da
Análise de Fronteira Estocástica (SFA) como um modelo alternativo para definir custos
operacionais regulatórios. Prós e contras do modelo SFA são destacados. Os resultados
mostram que o SFA é mais flexível para lidar com outliers. No entanto, o SFA tem
grandes problemas de convergência se aplicado a amostras limitadas. Os problemas de
convergência podem ser superados utilizando métodos de computação Bayesiana ou de
verossimilhança penalizada. Em particular, é proposto um modelo SFA Bayesiano que é
robusto a problemas de convergência. Esse estudo defende o uso do DEA e do SFA como
as melhores alternativas para definir os custos operacionais regulatórios para as empresas
brasileiras de distribuição de eletricidade, conforme indicado pelos reguladores europeus.
Palavras-chave: Análise Envoltória de Dados, Análise de Fronteira Estocástica, Análise
Bayesiana.
iii

Abstract
A Data Envelopment Analysis (DEA) model is applied by the Brazilian regulatorto set regulatory operational costs for 61 electricity distribution utilities or DSOs,since 2015. The current DEA model comprises non-decreasing returns to scale,
one input, seven outputs and weight restrictions. Regulatory costs were estimated using
average values from 2011 to 2013. In 2017, new regulatory costs were estimated using
an updated data set and the previous DEA model. Recent results are similar to results
achieved in 2015 and show evidence that the current benchmarking model still requires
improvements. In short, some DSOs have inconsistent low efficiencies, close to 25%, and
standard statistical analysis shows the presence of outliers in the data base. Furthermore,
the model still lacks environmental adjustments. This study evaluates the use of Stochastic
Frontier Analysis (SFA) as an alternative model to set regulatory operational costs. Pros
and cons of the SFA model are highlighted. Results show that the SFA is more flexible to
deal with outliers. However, the SFA has major convergence problems if applied to limited
samples. Convergence issues can be overcome using Bayesian computation or penalized
likelihood methods. In particular, a Bayesian SFA model is proposed that is robust
to convergence problems. This study advocates the use of both DEA and SFA as the
best alternatives to set regulatory operational costs for Brazilian electricity distribution
companies, as indicated by European regulators.
Keywords: Data Envelopment Analysis, Stochastic Frontier Analysis, Bayesian Analysis.
v

Dedicatória e Agradecimentos
Dedico esse trabalho aos meus pais, Mozart e Floripes, doutores honoris causaem minha vida.
Agradeço àqueles que, cada qual à sua maneira, foram de extrema importânciapara que tudo acontecesse:
• Pais, irmãos, cunhados e sobrinhos, sempre alegres e presentes;
• Marcelle, sempre amorosa, entusiasta e compreensiva;
• Professores, sempre apontando para frente e para o alto;
• Alunos, sempre inspirando crescimento;
• Colegas de estudo e de trabalho, sempre parceiros;
• Marcelo, um gigante que me apoiou nos ombros para eu poder ver mais longe.
Ao Deus de bondade infinita,
criador e protetor de toda minha
vida, muito obrigado!
Magno
vii

“Não sei o que posso parecer aos
olhos do mundo, mas aos meus,
pareço apenas ter sido como um
menino brincando à beira-mar,
divertindo-me em encontrar de
vez em quando um seixo mais
liso ou uma concha mais bonita
que o normal, enquanto o
grande oceano da verdade
permanece completamente
desconhecido à minha frente.”
Sir Isaac Newton
ix

Declaração
Declaro que o trabalho dessa tese doutoral foi realizado de acordo comas exigências do Regulamento do Programa de Pós-Graduação emEngenharia de Produção da Universidade Federal de Minas Gerais
e que o mesmo não foi submetido a nenhum outro prêmio acadêmico. Exceto
quando indicado por referência específica, esse texto é próprio do autor. O
trabalho feito em colaboração ou com a assistência de outros é indicado como
tal. Quaisquer opiniões expressas na tese são de responsabilidade do autor.
Assinatura: Data: novembro de 2018
xi

Sumário
Página
Lista de Tabelas xvii
Lista de Figuras xix
1 Contextualização do Estudo 1
1.1 Monopólio Natural Regulado . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 O Setor Brasileiro de Distribuição de Energia Elétrica . . . . . . . . . . . 2
1.3 Regulação Tarifária no SBDEE . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Métodos de Benchmarking para Avaliação de Eficiência . . . . . . . . . . 8
1.5 Métodos de Benchmarking no Setor Distribuição de Energia Elétrica . . . 10
1.5.1 DEA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5.2 COLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5.3 SFA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5.4 StoNED . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5.5 Empresa de Referência . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6 Modelo de Benchmarking Vigente no SBDEE . . . . . . . . . . . . . . . 14
1.7 O Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.8 Motivações para o Estudo do Problema . . . . . . . . . . . . . . . . . . . 19
1.9 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.10 Organização do Texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2 Análise de Fronteira Estocástica (SFA) 25
2.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Fronteira de Produção e Eficiência Técnica . . . . . . . . . . . . . . . . . 27
2.2.1 Algumas Formas Funcionais para a Função de Produção . . . . . 31
2.2.1.1 Função de Produção Cobb-Douglas . . . . . . . . . . . . 31
2.2.1.2 Função de Produção Translog . . . . . . . . . . . . . . . 32
xiii
SUMÁRIO xiv
2.3 Eficiência Técnica versus Eficiência Alocativa . . . . . . . . . . . . . . . 32
2.4 Fronteira de Custo e Eficiência Econômica . . . . . . . . . . . . . . . . . 33
2.4.1 Algumas Formas Funcionais para a Função de Custo . . . . . . . 35
2.4.1.1 Função de Custo Cobb-Douglas . . . . . . . . . . . . . . 35
2.4.1.2 Função de Custo Translog . . . . . . . . . . . . . . . . . 36
2.4.1.3 Comentário Sobre Essas Formas Funcionais . . . . . . . 36
2.5 Estimação da Fronteira Estocástica de Custo . . . . . . . . . . . . . . . . 37
2.5.1 Modelo de Custo com Fronteira Estocástica . . . . . . . . . . . . 38
2.5.2 Métodos Estatísticos Estocásticos de Estimação Paramétrica para
a Eficiência Econômica . . . . . . . . . . . . . . . . . . . . . . . . 39
2.5.2.1 Considerações Iniciais . . . . . . . . . . . . . . . . . . . 39
2.5.2.2 Verificação Inicial da Assimetria de i . . . . . . . . . . . 41
2.5.2.3 Possíveis Comportamentos Probabilísticos Associados a ui 41
2.5.2.4 Enfoque Frequentista para a Estimação de e−ui . . . . . 47
2.5.2.5 Enfoque Bayesiano para a Estimação de e−ui . . . . . . 52
2.6 Incorporação de Variáveis Exógenas ao SFA . . . . . . . . . . . . . . . . 56
2.6.1 Contextualização para o SBDEE . . . . . . . . . . . . . . . . . . 57
2.6.2 Modelo Proposto por Kumbhakar et al. (1991) . . . . . . . . . . . 58
2.6.3 Modelo Proposto por Reifschneider e Stevenson (1991) . . . . . . 59
2.6.4 Lidando com Produtos Indesejados . . . . . . . . . . . . . . . . . 60
2.6.5 Considerações Gerais . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.7 Síntese da Especificação de um Modelo de SFA . . . . . . . . . . . . . . 61
3 Parametrizações e Modelagens Propostas para o SFA 65
3.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.2 Proposta de Parametrizações para o SFA . . . . . . . . . . . . . . . . . . 66
3.3 Base de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.4 Proposta de Modelos para o SFA . . . . . . . . . . . . . . . . . . . . . . 71
3.4.1 Modelo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4.2 Modelo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.4.3 Modelo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.4.4 Modelo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.4.5 Modelo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.4.6 Modelo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.4.7 Modelo 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
xiv
SUMÁRIO xv
3.5 Implementação Computacional . . . . . . . . . . . . . . . . . . . . . . . 74
3.6 Critérios de Seleção de Modelos . . . . . . . . . . . . . . . . . . . . . . . 74
4 Resultados e Discussões 77
4.1 Verificação Inicial da Assimetria de i . . . . . . . . . . . . . . . . . . . . 77
4.2 Parâmetros Estimados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.3 Eficiências Estimadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.4 Critério de Convergência . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5 Conclusão e Considerações de Prosseguimento 87
5.1 Histórico Contextual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.2 Validação das Hipóteses sob Estudo . . . . . . . . . . . . . . . . . . . . . 88
5.3 Resultados Obtidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.4 Metodologias Complementares . . . . . . . . . . . . . . . . . . . . . . . . 90
5.5 Considerações de Prosseguimento . . . . . . . . . . . . . . . . . . . . . . 91
5.6 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
A Apêndice A 93
A.1 Obtenção da Expressão para o Cálculo de f() . . . . . . . . . . . . . . 93
A.2 Obtenção da Expressão para o Cálculo de E(u|) . . . . . . . . . . . . . 96
A.3 Obtenção da Expressão para o Cálculo de E(e−u|) . . . . . . . . . . . . 97
B Apêndice B 99
B.1 Procedimento Monte Carlo via Cadeias de Markov (MCMC) . . . . . . . 99
B.1.1 Cadeias de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . 100
B.1.1.1 Propriedade Markoviana . . . . . . . . . . . . . . . . . . 101
B.1.1.2 Probabilidades de Transição . . . . . . . . . . . . . . . . 101
B.1.1.3 Notação . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
B.1.1.4 Equações de Chapman-Kolmogorov . . . . . . . . . . . . 102
B.1.1.5 Classificação dos Estados em uma Cadeia de Markov . . 103
B.1.1.6 Probabilidade de Estado Estável . . . . . . . . . . . . . 103
B.1.2 Lógica do MCMC . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
B.1.3 Algoritmo Amostrador de Gibbs . . . . . . . . . . . . . . . . . . . 105
B.1.4 Critério de Convergência . . . . . . . . . . . . . . . . . . . . . . . 105
C Apêndice C 109
C.1 Critérios de Seleção de Modelos . . . . . . . . . . . . . . . . . . . . . . . 109
xv
SUMÁRIO xvi
C.1.1 Log-Pseudo Marginal Likelihood (LPML) . . . . . . . . . . . . . . 109
C.1.2 Deviance Information Criterion (DIC) . . . . . . . . . . . . . . . 110
C.1.3 Watanabe-Akaike Information Criterion (WAIC) . . . . . . . . . . 110
Referências Bibliográficas 111
Índice Remissivo 125
xvi
Lista de Tabelas
Tabela Página
3.1 Variáveis de entrada e saída disponíveis para as 61 DSOs brasileiras. . . . . . 70
4.1 Estimativas dos parâmetros médios a posteriori. . . . . . . . . . . . . . . . . 79
4.2 Escores de eficiência estimados utilizando os modelos de SFA propostos. . . . 82
4.3 Eficiências estimadas e custos eficientes utilizando DEA e SFA (Modelo 6), e
diferenças entre custos eficientes utilizando DEA e o SFA proposto. . . . . . 85
xvii

Lista de Figuras
Figura Página
1.1 Distribuição geográfica das concessionárias distribuidoras de energia. . . . . 3
1.2 Regulação por incentivo no SBDEE. . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Escores de eficiência das DSOs brasileiras no 4CPTR. . . . . . . . . . . . . . 7
1.4 Principais métodos de benchmarking para avaliação de eficiência. . . . . . . . 9
2.1 Representação genérica de um processo produtivo. . . . . . . . . . . . . . . . 27
2.2 Conjunto de Possibilidades de Produção (CPP) e fronteira de produção. . . . 28
2.3 Exemplo de uma função de produção e de isoquantas. . . . . . . . . . . . . . 29
2.4 Fronteira de custo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5 Diferenças entre as funções de custo Cobb-Douglas e translog no SFA. . . . . 37
2.6 Exemplos de densidades de probabilidades para a Normal-Truncada. . . . . . 42
2.7 Densidades de probabilidades para o exemplo. . . . . . . . . . . . . . . . . . 44
2.8 Fronteira estocástica de custo e desvios para o exemplo. . . . . . . . . . . . . 45
2.9 Fronteiras de custo estimadas para o exemplo: OLS, COLS, DEA e SFA. . . 46
3.1 Gráfico de correlação de Spearman para as variáveis de entrada, saída, quali-
dade e ambientais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.1 Boxplots comparando eficiências originais de DEA e eficiências propostas de
SFA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.2 Matriz de correlação comparando eficiências originais de DEA e eficiências
propostas de SFA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.3 Eficiências estimadas DEA e SFA em todo o território brasileiro. . . . . . . . 83
4.4 Similaridades e dissimilaridades entre DEA e SFA após ajustes de escala. . . 84
4.5 Gráficos de ACF para os parâmetros λ dos modelos propostos. . . . . . . . . 86
B.1 Algoritmo Amostrador de Gibbs. . . . . . . . . . . . . . . . . . . . . . . . . 106
B.2 Exemplo de um gráfico ACF para ψt|E. . . . . . . . . . . . . . . . . . . . . 106
xix

Lista de Nomenclaturas
αr Limite inferior atribuído ao peso ωj relativamente ao peso κi para o modelo DEA
(1.1).
βt Limite superior atribuído ao peso ωj relativamente ao peso κi para o modelo DEA
(1.1).
δ = λ√1+λ2 , isto é, uma reparametrização em função do parâmetro λ.
δ1 Coeficiente associado à variável ambiental que exerce influência sobre a i-ésima
DSO.
iid Independentes e identicamente distribuídos.
i Erro composto sobre i-ésimo produtor (i = νi ± ui).
γ Estatística de teste para verificação de assimetria.
Γ(·) Função gama.
Γ(a,b) Distribuição de probabilidades Gama com parâmetros a e b.
λˆ Estimador do parâmetro de forma (assimetria) da função densidade de probabili-
dades f().
βˆ Estimador do vetor de parâmetros de tecnologia (coeficientes) da função estocástica
de custo.
ψˆ Estimador Bayesiano para o vetor de parâmetros ψ.
Θˆ = [λˆ, σˆ2, βˆ], isto é, vetor de estimadores frequentistas para os parâmetros do SFA.
σˆ2u Estimador do parâmetro de variância incondicional associada à distribuição das
ineficiências econômicas dos produtores.
xxi
Lista de Figuras xxii
σˆ2ν Estimador do parâmetro de variância incondicional associada à distribuição dos
ruídos aleatórios.
σˆ Estimador do parâmetro de escala da função densidade de probabilidades f().
uˆi Estimador para o componente de erro que objetiva capturar os efeitos da ineficiência
sobre o i-ésimo produtor.
κi Parâmetros de peso de entrada para o modelo DEA (1.1).
λ Parâmetro de forma (assimetria) da função densidade de probabilidades f().
lnL Função de log-verossimilhança.
β Vetor de parâmetros de tecnologia.
δ Vetor de coeficientes para as variáveis exógenas associadas ao i-ésimo produtor.
ψ Vetor de parâmetros a serem estimados a partir da abordagem Bayesiana.
Θ = [λ, σ2,β], isto é, vetor de parâmetros do SFA a serem estimados.
E Vetor de custos atuais para os produtores abordagem Bayesiana.
w Vetor de preços dos inputs.
wi Vetor de preços dos inputs associado ao i-ésimo produtor.
x Vetor de entradas.
xi Vetor de entradas associado ao i-ésimo produtor.
x(−i) Conjunto de n dados sem a observação xi
yi Vetor de saídas associado ao i-ésimo produtor
zi Vetor de variáveis exógenas para o i-ésimo produtor.
µ Média incondicional associada à distribuição das ineficiências econômicas dos
produtores.
µ∗ = σ
2
u
σ2 .
νi Componente de erro que objetiva capturar os efeitos do ruído aleatório sobre o
i-ésimo produtor.
xxii
Lista de Figuras xxiii
ωj Parâmetros de peso de saída ordinária para o modelo DEA (1.1).
ωl Parâmetros de peso de saída indesejada para o modelo DEA (1.1).
Φ(·) Função distribuição de probabilidades acumuladas normal padrão.
φ(·) Função densidade de probabilidades normal padrão.
pij Probabilidade de estado estável.
∝ Representa proporcionalidade na expressão (2.57).
∝ Representa um valor constante na equação (2.45).
<+ Conjunto dos números reais não-negativos.
<m+ Conjunto dos números reais não-negativos associados ao espaço m-dimensional
(saídas)
<n+ Conjunto dos números reais não-negativos associados aos espaço n-dimensional
(entradas).
σ Parâmetro de escala da função densidade de probabilidades f().
σ2ui Variância associada à distribuição das ineficiências econômicas do i-ésimo produtor.
σ2∗ =
σ2νσ
2
u
σ2 .
σ2ν Variância incondicional associada à distribuição dos ruídos aleatórios.
σ2u Variância incondicional associada à distribuição das ineficiências econômicas dos
produtores.
P(n) Matriz de transição a n etapas em uma Cadeia de Markov.
ϕ Parâmetro de retornos não-decrescentes à escala no modelo DEA (1.1).
ξ Parâmetro de localização da Skew-Normal.
ξ(yi) Função de custo reparametrizada.
ζi Componente de erro aleatório associado a ui.
a Parâmetro grau de liberdade da distribuição t-Student.
xxiii
Lista de Figuras xxiv
C(wi, yi,β) · eν+u Fronteira estocástica de custo.
C(wi, yi,β) Fronteira determinística de custo.
D(x cond Θ) Deviance
e−ui Eficiência técnica e/ou alocativa do i-ésimo produtor.
Ei Custo atual do i-ésimo produtor.
EEi Eficiência Econômica do i-ésimo produtor.
EIi Ineficiência Econômica do i-ésimo produtor.
f(x;β) Fronteira determinística de produção.
f(x;β) · eν−u Fronteira estocástica de produção.
f(i) Função densidade de probabilidades do termo de erro composto do i-ésimo produ-
tor.
f(ψ) Distribuição de probabilidades a priori para o vetor de parâmetros ψ.
f(ψ cond E) Distribuição de probabilidades a posteriori para o vetor de parâmetros ψ.
f(E cond ψ) Distribuição de probabilidades conjuntas da amostra (distribuição amostral
ou função de verossimilhança) para o vetor de parâmetro ψ.
f(νi) Função densidade de probabilidades do termo de ruído aleatório do i-ésimo produ-
tor.
f(u cond ) Função densidade de probabilidades da ineficiência condicional ao erro
composto.
f(u, ) Função densidade de probabilidades conjunta da ineficiência e do erro composto.
f(ui) Função densidade de probabilidades do termo de ineficiência do i-ésimo produtor.
fX(x) Função densidade de probabilidades Skew-Normal de três parâmetros.
fZ(z) Função densidade de probabilidades Skew-Normal.
f() Função densidade de probabilidades do erro composto para distribuição t-Student.
xxiv
Lista de Figuras xxv
g(zi; δ) Componente de erro da ineficiência que captura os efeitos do ambiente sobre o
i-ésimo produtor.
hk Eficiência DEA estimada para a DSO k em questão no modelo (1.1).
L Função de verossimilhança.
L(E,ψ) Distribuição amostral (ou verossimilhança) para o vetor de parâmetros ψ.
M Número de estados em uma Cadeia de Markov.
M3T Estatística de teste para verificação de assimetria.
mi I-ésimo momento dos resíduos OLS.
n Tamanho amostral
N(µ;σ2) Distribuição de probabilidades Normal com média µ e variância σ2.
N+(0;σ2) Distribuição de probabilidades Half -Normal truncada à esquerda de 0 com
variância σ2.
N+(µ;σ2) Distribuição de probabilidades Normal-Truncada à esquerda com média µ e
variância σ2.
p
(n)
ij Probabidade de se passar de um estado inicial i a um estado final j, após n etapas
em uma Cadeia de Markov.
SN(ξ, σ2, λ) Distribuição de probabilidades Skew-Normal com parâmetros de localização
ξ, de escala σ e de assimetria λ.
TEi Eficiência Técnica do i-ésimo produtor.
TIi Ineficiência Técnica do i-ésimo produtor.
U(0, 1) Função densidade de probabilidades Uniforme no intervalo [0, 1].
ui Componente de erro que objetiva capturar os efeitos da ineficiência sobre o i-ésimo
produtor.
xi Custo operacional associado à i-ésima DSO nos modelos propostos para o SFA de
custos.
xi Entradas (i = 1, . . . ,m) para o modelo DEA (1.1).
xxv
Lista de Figuras xxvi
Xt Estado do sistema no instante t.
yi Saída (i = 1, . . . , n) associada ao i-ésimo produtor.
yj Saídas (j = 1, . . . , s) para o modelo DEA (1.1).
yij j-ésima saída associada à i-ésima DSO nos modelos propostos para o SFA de
custos.
Z Variável aleatória Skew-Normal.
zi Variável Exógena que exerce influência sobre o i-ésimo produtor.
e.variable Índice Ambiental.
xxvi
Lista de Siglas
ACF Autocorrelation Function
ANEEL Agência Nacional de Energia Elétrica
BFGS Algoritmo Broyden-Fletcher-Goldfarb-Shanno
BSFA Bayesian Stochastic Frontier Analysis
CAPEX Capital Expenditure
CEPA Cambridge Economic Policy Associates
CMAD Corrected Median Absolute Deviation
COLS Corrected Ordinary Least Square
CPP Conjunto de Possibilidades de Produção
CRTP Ciclo de Revisão Tarifária Periódica
DEA Data Envelopment Analysis
DIC Deviance Information Criterion
DIE Duração da Interrupção de Energia
DMU Decision Making Unit
DSO Distribution Service Operator
FIE Frequência da Interrupção de Energia
LPML Log-Pseudo Marginal Likelihood
OLS Ordinary Least Square
xxvii
Lista de Figuras xxviii
MOLS Modified Ordinary Least Square
NDRS Non-Decreasing Returns to Scale
OPEX Operational Expenditure
PMSO Pessoal, Material, Serviços e Outros
RC Reference Companies
REA Ratio-based Efficiency Analysis
SBDEE Setor Brasileiro de Distribuição de Energia Elétrica
SDEA Stochastic Data Envelopment Analysis
SEB Setor Elétrico Brasileiro
SFA Stochastic Frontier Analysis
SRD Superintendência de Regulação dos Serviços de Distribuição
TFA Thick Frontier Approach
TOTEX Total Expenditure
WAIC Watanabe-Akaike Information Criterion
xxviii
C
a
p
ít
u
l
o 1
Contextualização do Estudo
Nesse capítulo de contextualização do estudo, são apresentados, em caráter intro-dutório, aspectos gerais do problema sob estudo, alguns tratamentos encontradosna literatura, bem como as motivações e justificativas para a concepção e exe-
cução do trabalho, além dos objetivos e das respectivas contribuições do mesmo.
1.1 Monopólio Natural Regulado
O Setor Elétrico Brasileiro (SEB) é um dos setores mais importantes da economia
nacional, englobando as atividades de geração, transmissão, distribuição e comercialização
de energia elétrica. Nesse trabalho, será tomado por base, o segmento de distribuição,
responsável pela entrega aos consumidores finais, da energia recebida do segmento de
transmissão. Geralmente, esse segmento constitui um monopólio natural, termo da
economia utilizado para referenciar situações de mercado que lidam com bens exclusivos,
com pouca ou nenhuma concorrência e com demanda inelástica. Além disso, são requeridos
investimentos elevados, porém com custos marginais baixos. Assim, seria normal se
pensar que esse segmento teria conforto em produzir menos que a demanda, impondo
injustamente, tarifas mais altas aos seus produtos e serviços prestados.
Entretanto, para se evitar esse viés, alguns governos, como é o caso do Brasil,
passaram a regular tal setor, criando uma proxy de mercados competitivos, com restrições
às tarifas e modalidades de produção. Tal regulação funciona como uma espécie de força
1
1.2. O SETOR BRASILEIRO DE DISTRIBUIÇÃO DE ENERGIA ELÉTRICA 2
disciplinadora. Daí, advém o fato da regulação desse monopólio natural ser necessária,
sendo que nesse contexto é que surgiram as agências reguladoras . Como bônus dessa
atividade reguladora, destacam-se uma maior estabilidade do setor, resguardando os
produtores e consumidores dos oportunismos políticos e de mercado, além de incentivar
aumentos de eficiência técnica e alocativa, com investimentos adequados.
1.2 O Setor Brasileiro de Distribuição de Energia
Elétrica
Segundo dados da Agência Nacional de Energia Elétrica (ANEEL), disponíveis em
seu site1, o Setor Brasileiro de Distribuição de Energia Elétrica (SBDEE) é o responsável
pelas operações de rebaixamento da tensão proveniente do sistema de transmissão, para
uma tensão que possa ser distribuída aos consumidores finais, sem maiores riscos e danos.
Atualmente, esse setor é composto por 63 empresas concessionárias, 38 permissionárias e
13 autorizadas, totalizando 114 empresas, entre públicas, privadas e de economia mista.
A diferença entre elas reside no fato de as concessionárias receberem uma concessão do
governo brasileiro para prestar serviços ao cidadão, com direitos e obrigações resguardados.
Já as permissionárias recebem permissões para usufruirem dos serviços de distribuição
em benefício próprio. Ainda existem as cooperativas de eletrificação rural, que atuam sob
autorizações precárias e aguardam os processos de regularização para serem promovidas
a concessionárias ou permissionárias. A Figura 1.1 representa a distribuição geográfica
das concessionárias pelo território brasileiro.
O SBDEE é composto pela rede elétrica e pelo conjunto de instalações e equipa-
mentos elétricos que operam em níveis de alta tensão (superior a 69 kV e inferior a 230
kV), média tensão (superior a 1 kV e inferior a 69 kV) e baixa tensão (inferior a 1 kV).
A regulação técnica da distribuição é conduzida pela Superintendência de Regulação
dos Serviços de Distribuição (SRD), vinculada à ANEEL.
1.3 Regulação Tarifária no SBDEE
Como já introduzido, a produção, a transmissão, a distribuição e a comercialização
de energia elétrica, na grande maioria dos países, são reguladas e fiscalizadas por agências
ditas reguladoras. No Brasil, esse papel é desempenhado pela ANEEL, que é uma
1http://www.aneel.gov.br
2
1.3. REGULAÇÃO TARIFÁRIA NO SBDEE 3
Figura 1.1: Distribuição geográfica das concessionárias distribuidoras de energia.
Fonte: adaptado de ANEEL (2017).
autarquia vinculada ao Ministério de Minas e Energia, fundada em 1996. Entre suas
competências, de acordo com a Lei Federal no 9.427/96, destacam-se: implementar as
diretrizes para a exploração da energia elétrica; licitar concessões de geração, transmissão
e distribuição de energia elétrica; cumprir e fazer cumprir as disposições regulamentares
do serviço de concessão; definir os valores das tarifas dos sistemas elétricos de transmissão
e distribuição; homologar reajustes e proceder à revisão das tarifas, normas e concessões;
estimular a qualidade, produtividade e preservação do meio ambiente.
Nesse tocante, ainda segundo dados da ANEEL em seu site, até 1993, os consumi-
dores dos diversos estados brasileiros pagavam a mesma tarifa pela energia. Esse valor
garantia a remuneração das empresas concessionárias, independentemente de sua eficiên-
cia, e aquelas não lucrativas eram mantidas por subsídios do governo federal, onerando
3
1.3. REGULAÇÃO TARIFÁRIA NO SBDEE 4
todo o sistema. Para corrigir essa falha, a partir de 1994, a tarifa passou a ser fixada por
concessionária, conforme características específicas da área de concessão de cada empresa,
refletindo peculiaridades de cada região, tais como o número de consumidores, tamanho
da rede de distribuição, custo da energia e tributos, entre outros.
No que diz respeito ao valor da energia gerada, vendida para as concessionárias
distribuidoras, para posteriormente ser revendida aos consumidores, a regulação passou a
contar com leilões públicos, aumentando assim, a transparência nos custos, a competição
e a oferta de melhores preços. Já a transmissão da energia, do ponto de geração às
subestações de tratamento, configura-se num monopólio natural, pois a competição nesse
segmento, segundo a Agência Nacional, não traz benefícios econômicos. Por outro lado,
a distribuição da energia para os consumidores finais possui características que tornam
necessária uma maior regulação das concessionárias em questão, uma vez que são essas
as que tem maiores reflexos e impactos na economia da população.
Para cumprir o compromisso de levar energia elétrica aos seus consumidores, as
concessionárias distribuidoras, daqui em diante denominadas DSOs (Operadoras do
Serviço de Distribuição), têm custos que devem ser cobertos pela tarifa de energia. Por
essa razão, a Agência Nacional atua para que as tarifas sejam compostas apenas pelos
custos que efetivamente se relacionam com os serviços prestados, de forma a torná-las
justas, blindando os consumidores das voracidades do mercado.
E é nesse contexto, que a partir de 2010, a ANEEL iniciou debates com a sociedade
sobre as regras e metodologias para definir as receitas das DSOs, através de audiências
públicas. A partir disso, o regulador propôs uma revisão completa do modelo que calcula
os custos operacionais destas DSOs, convergindo para a prática de custos eficientes.
A regulação passou a requerer a definição de níveis de receitas ou taxas por um
período de tempo pré-fixado em contrato formal. A partir desses níveis de receitas ou
taxas reguladas pela ANEEL, as DSOs passaram a ser encorajadas a reduzirem seus
custos, visando incrementar seus retornos financeiros. Após o término do contrato, os
custos são revistos e se necessário, a agência define novos níveis de receitas ou taxas,
pautando sempre pelo equilíbrio econômico e fincanceiro do setor.
De acordo com informações da ANEEL, também disponíveis em seu site, até 2014, as
revisões tarifárias eram delimitadas temporalmente por ciclos, que ocorriam a cada quatro
ou cinco anos, nos quais havia uniformidade de regras. Além dessas revisões periódicas,
também ocorriam ajustes anuais. O primeiro ciclo de revisões tarifárias periódicas
(1CRTP) aconteceu entre 2003 e 2006, o segundo (2CRTP) entre 2007 e 2010 e o terceiro
4
1.3. REGULAÇÃO TARIFÁRIA NO SBDEE 5
(3CRTP) entre 2011 e 2014. O quarto ciclo (4CRTP) iniciou-se em 2015 e se estenderá até
o final de 2018. Todas as metodologias de definição dos custos gerenciáveis eram revistas
conjuntamente para serem aplicadas, uniformemente, nas revisões de todas as DSOs.
Porém, a partir de 2015, de acordo com orientações da ANEEL, decidiu-se modificar
esse procedimento, uma vez que a duração do ciclo tarifário varia de concessionária para
concessionária. Atualmente, a metodologia para cada componente dos custos gerenciáveis
pode ser revisada separadamente, visando maior efetividade. Também, a partir do 4CRTP,
decidiu-se que os índices de eficiência das DSOs serão calculados de dois em dois anos, e
a metodologia será revista a cada quatro anos.
No que diz respeito ao modelo de regulação adotado pelo SBDEE, destaca-se
que, a partir de 1996, optou-se pelo regime por preço máximo (price cap), no qual é
imposto um preço limite máximo que uma DSO pode cobrar dos consumidores pela
energia, sendo passível de revisões periódicas, levando-se em consideração a inflação do
período, a produtividade, a eficiência e a eficácia dessa DSO2. Nesse tipo de regime, uma
alteração nos custos operacionais não necessariamente resultará em alterações das tarifas
cobradas. Assim, devido à fixação da tarifa para um dado período de tempo, as DSOs
são incentivadas (regulação por incentivo) a reduzirem seus custos, uma vez que, lucros
adicionais podem resultar das reduções de custos alcançadas até a próxima revisão.
A Figura 1.2 ilustra, em linhas gerais, a ideia desse processo de revisão e reajuste
tarifário no SBDEE, a partir da revisão ocorrida entre dois ciclos de revisão tarifária
periódica. Segundo esse processo, para fins de cálculo tarifário, os custos das DSOs
são compostos por duas parcelas: a parcela A, que engloba os custos não-gerenciáveis
(compra de energia e encargos setoriais), e a parcela B, que engloba os custos gerenciáveis
(mão-de-obra, material, depreciação e remuneração aos investidores).
2Embora seja comum a permutação entre produtividade, eficácia e eficiência, há de se tomar cuidado
com o uso indiscriminado destes termos. A produtividade está relacionada à razão entre o que foi
produzido e o que foi utilizado para se produzir. A eficácia diz respeito ao que é produzido, não levando
em conta os recursos utilizados. Já a eficiência compara o que foi produzido, dados os recursos disponíveis,
com o máximo que poderia ter sido produzido com os mesmos recursos, ou vice-versa: compara o custo
atual de produção com o mínimo custo possível. Além disso, de acordo com Ray (2004), produtividade é
uma medida descritiva de desempenho, enquanto eficiência é uma medida normativa (ou relativa) de
desempenho.
5
1.3. REGULAÇÃO TARIFÁRIA NO SBDEE 6
Figura 1.2: Regulação por incentivo no SBDEE.
Fonte: adaptado de ANEEL (2015).
Como dito anteriormente e exemplificado na Figura 1.2, as tarifas são corrigidas
anualmente e revisadas a cada ciclo de quatro ou cinco anos, com a finalidade de garantir
o equilíbrio econômico-financeiro do sistema. Inicialmente, a tarifa foi fixada em T0
pelo contrato de concessão, cobrindo os custos gerenciáveis e não-gerenciáveis de uma
dada DSO. Até o quarto ano, os ganhos de eficiência foram compartilhados entre os
usuários e a DSO, aumentando assim, sua remuneração. No quinto ano, iniciou-se o
CRTP e o regulador reposicionou a tarifa em um novo nível compatível, T1. Também
houve uma projeção de metas de eficiência a serem perseguidas pela DSO. Novamente,
essas metas incidem apenas sobre os custos gerenciáveis e permitem compartilhar com os
consumidores os possíveis ganhos a serem obtidos (projeção de ganhos não apropriados
pela concessionária). Caso a DSO consiga ultrapassar a meta estabelecida pelo regulador,
é possível ocorrer a apropriação dos resultados extras obtidos (projeção de ganhos de
eficiência apropriados pela concessionária). Com isso, as DSOs são incentivadas a melhorar
seu níveis de eficiência, pois quanto maior for a diferença entre a meta estabelecida e os
custos realmente praticados, maiores serão os benefícios econômicos alcançados.
Como ilustração e exemplificação, na Figura 1.3, são apresentados os escores de
eficiência de 61 DSOs brasileiras, calculados no 4CRTP.
6
1.3. REGULAÇÃO TARIFÁRIA NO SBDEE 7
Figura 1.3: Escores de eficiência das DSOs brasileiras no 4CPTR.
Fonte: adaptado de ANEEL (2017).
Conforme pode-se desprender da Figura 1.3, se por um lado, existem DSOs que
são consideradas full-eficientes, com escores de eficiência iguais a 100%, por outro lado,
existem tantas outras com escores bem aquém dos padrões mínimos desejados. Aquelas
mais eficientes passam a ser referenciadas como benchmarks para as demais. Assim,
as menos eficientes são incentivadas a melhorarem seus níveis de eficiência, visando
incremento nos benefícios econômicos e financeiros.
Partindo do pressuposto de que os escores de eficiência devem ser suficientemente
precisos e efetivos, a fim de balizar políticas gerenciais e tomadas de decisão mais acertadas,
tornam-se cruciais o desenvolvimento e o emprego, pelo regulador, de metodologias que
se mostrem consistentes na definição de custos operacionais eficientes, como por exemplo,
o emprego dos denominados métodos de benchmarking (ou de fronteira) (Jamasb e
Pollitt, 2001), favorecendo assim, tanto as DSOs quanto os próprios consumidores. Em
muitos países, tem sido aplicado o state-of-the-art benchmarking, que segundo Bogetoft e
Otto (2011), já é responsável por um considerável impacto econômico positivo em países
europeus. Assim sendo, esses métodos são melhor apresentados a seguir.
7
1.4. MÉTODOS DE BENCHMARKING PARA AVALIAÇÃO DE EFICIÊNCIA 8
1.4 Métodos de Benchmarking para Avaliação de
Eficiência
Os chamados métodos de benchmarking (ou de fronteira) para avaliação de eficiência
são métodos que têm proporcionado aos analistas de diferentes setores da economia
moderna, em especial àqueles do setor de regulação tarifária de energia elétrica, a
identificação do nível máximo de produto, dada a quantidade de recursos produtivos
empregados, ou a identificação do custo mínimo de produção, dada a quantidade de
produtos esperados, bem como a avaliação do desvio de um determinado grupo de
observações em relação aos padrões de referência (benchmarks).
Existem razões para que tais métodos venham sendo utilizados com mais frequência.
Segundo Bauer (1990), algumas delas são: a ideia de fronteira condiz com a teoria
econômica do comportamento otimizador; os desvios da fronteira são interpretados como
ineficiências do produtor; além de existir uma relação forte entre a informação passível
de se obter pelos modelos de benchmarking e as políticas econômicas exequíveis.
Tais métodos de benchmarking são divididos, de acordo com Franco e Fortuna
(2003), em cinco grandes grupos:
(i) Métodos de Programação Matemática Não-Paramétrica;
(ii) Métodos de Programação Matemática Paramétrica;
(iii) Métodos Estatísticos Deterministas;
(iv) Métodos Estatísticos Estocásticos; e,
(v) Métodos de Engenharia.
Os métodos baseados em programação matemática utilizam uma sequência de
programas lineares ou quadráticos, distinguindo-se pelo fato de os paramétricos adotarem
uma forma funcional na estimação da função objetivo do modelo matemático. O método
não-paramétrico mais conhecido na literatura é o Data Envelopment Analysis (DEA),
contando com algumas variantes mais recentes, como é o caso do Stochastic Data
Envelopment Analysis (SDEA) e do Ratio-based Efficiency Analysis (REA). O Goal
Programming é o método paramétrico mais usual.
Já a diferença entre os métodos estatísticos reside na forma como o método trata os
desvios das posições observadas em relação à fronteira eficiente. O determinista considera
8
1.4. MÉTODOS DE BENCHMARKING PARA AVALIAÇÃO DE EFICIÊNCIA 9
tais desvios como resultado exclusivo de ineficiência operacional. Por outro lado, o método
estatístico estocástico admite a influência de ruídos e eventos aleatórios, aos quais, a
organização produtiva está sujeita e não tem controle. Dentre os deterministas, os métodos
mais empregados são: Ordinary Least Square (OLS), Corrected Ordinary Least Square
(COLS), Corrected Median Absolute Deviation (CMAD), Modified Ordinary Least Square
(MOLS) e o Thick Frontier Approach (TFA). Dentre os métodos estocásticos, os mais
usual é o Stochastic Frontier Analysis (SFA). Também existe um método denominado
Stochastic Non-smooth Envelopment of Data (StoNED), que combina em sua estrutura,
tanto a abordagem determinista quanto a estocástica.
Por fim, existem os denominados Métodos de Engenharia, que criam um proxy
virtual do mercado real de operação do produtor, sendo o mais utilizado aquele que se
baseia na metodologia das Reference Companies (RC).
A Figura 1.4 apresenta um síntese estrutural desses métodos.
Figura 1.4: Principais métodos de benchmarking para avaliação de eficiência.
Na seção seguinte, serão apresentadas as características dos principais métodos
de benchmarking para avaliação de eficiência aplicados ao setor de regulação tarifária
elétrica, bem como a indicação de alguns estudos já realizados nesse contexto.
9
1.5. MÉTODOS DE BENCHMARKING NO SETOR DISTRIBUIÇÃO DE ENERGIA ELÉTRICA 10
1.5 Métodos de Benchmarking no Setor
Distribuição de Energia Elétrica
A estimação de práticas de custos eficientes na distribuição de energia elétrica tem
sido um grande desafio para empresas, reguladores e pesquisadores (Haney e Pollit, 2011,
2009). Os custos eficientes devem representar um equilíbrio adequado entre os lucros
da DSO, a qualidade dos serviços e tarifas de eletricidade justas. Assim, os métodos de
benchmarking podem ser aplicados para estimar tais custos ou eficiências de custo.
Os métodos de benchmarking fornecem aos analistas, em particular aos do setor de
regulação de tarifas de eletricidade, ferramentas matemáticas e estatísticas para estimar o
custo mínimo de produção, dada uma quantidade observada de produtos ou outputs. Além
disso, para DSOs ineficientes, modelos de benchmarking podem identificar as melhores
práticas, ou seja, DSOs observadas identificadas como full-eficientes. Agrell e Bogetoft
(2017) alegam que as aplicações mais proeminentes das técnicas de benchmarking estão
relacionadas à regulação tarifária no setor elétrico. Não é à toa que a utilização de tais
métodos vem crescendo significativamente nesse setor.
Um estudo internacional realizado por Haney e Pollit (2009) em 40 países, mostra
que entre os reguladores de energia, 51% aplicavam métodos de benchmarking. Outros
estudos mais recentes também detectam e descrevem esse crescimento, tais como: Haney
e Pollit (2011) exploram os determinantes da melhor prática de benchmarking nesse
setor, chamando a atenção para o fato de a distribuição de energia ter muitas perdas,
especialmente nos países latino-americanos, como é o caso do Brasil, indicando enorme
potencial para melhoria de eficiência; Kuosmanen et al. (2013) apresentam um estudo onde
chamam a atenção para o fato de muitos países europeus já utilizarem tais métodos; Zaja
et al. (2017) e Agrell e Bogetoft (2017) elencam pesquisas e descrevem análises relacionadas
sobre os impactos da regulação no setor elétrico de diversos países; Mesquita (2017)
apresenta um estudo sobre uma análise comparativa das abordagens de benchmarking
utilizadas em países europeus e latino-americanos; entre outros importantes trabalhos
que referendam a afirmação desse crescimento.
De acordo com Haney e Pollit (2009), 34,8% dos reguladores de distribuição
de energia elétrica aplicavam DEA, 13% aplicavam modelos de regressão estatísticos
adaptados (deterministas), como o método COLS e 8,7% aplicavam métodos de fronteira
estocástica (estocásticos), como o SFA. No Brasil, o DEA e o COLS foram utilizados
pelo regulador para estimar eficiências de custo em 2011 (Costa et al., 2015a). Estudos
10
1.5. MÉTODOS DE BENCHMARKING NO SETOR DISTRIBUIÇÃO DE ENERGIA ELÉTRICA 11
recentes de Agrell e Bogetoft (2017) e Mesquita (2017) mostram que, entre os países
europeus e latino-americanos, 30% dos reguladores de distribuição de energia elétrica
aplicam DEA, 15% aplicam COLS e 10 % aplicam SFA. O restante se divide entre
outros métodos, como o emprego de empresas de referência, ou ausência de métodos de
benchmarking. A seguir, são apresentadas algumas das principais características desses
métodos de fronteira, bem como alguns estudos no setor elétrico sobre regulação tarifária.
1.5.1 DEA
O método Data Envelopment Analysis (DEA) foi primeiramente introduzido por
Charnes et al. (1978) e posteriormente estendido por Banker et al. (1984). Uma inte-
ressante revisão sucinta sobre DEA, inclusive com críticas, pode ser encontrada nos
trabalhos de Altoé et al. (2017) e de Emrouznejad e Yang (2017). Em linhas gerais, o
DEA avalia problemas com múltiplos recursos (necessários para gerar produtos e/ou
serviços) e múltiplas saídas (os produtos ou serviços gerados) para cada unidade produ-
tiva, denominadas Decision Making Units (DMUs). A capacidade com que as DMUs
conseguem gerar saídas para determinadas entradas define sua eficiência operacional. As
eficiências DEA dessas DMUs são estimadas pela avaliação da razão entre uma soma
ponderada das saídas (produtos gerados) e uma soma ponderada das entradas (recursos
necessários para gerar produtos e/ou serviços). Os pesos de entrada e saída são estimados
por meio de um problema de programação linear não-paramétrica. As DMUs eficientes
têm razão estimada, ou eficiência, igual a um. Os pesos estimados podem ser utilizados
para definir metas eficientes. Dados os insumos fixos, uma DMU pode aumentar sua
produção para atingir a eficiência técnica, ao passo que, dadas as saídas fixas, uma DMU
pode diminuir sua entrada para obter a máxima eficiência alocativa. Logo, supõe-se
que as DMUs menos eficientes possam melhorar sua eficiência até o limite das melhores
DMUs. Mais especificamente, segundo Colin (2018), o DEA pode determinar:
(i) O grupo de DMUs mais eficientes, isto é, as melhores práticas (benchmarks);
(ii) O grupo de DMUs menos eficientes;
(iii) A quantidade de recursos desperdiçados pelas DMUs menos eficientes;
Alguns estudos começaram a indicar um maior emprego dos modelos de DEA na
análise de eficiência do setor de distribuição de energia. Segundo Zhou et al. (2008), o
DEA é o mais popular dos modelos de benchmarking utilizados pelos reguladores do
11
1.5. MÉTODOS DE BENCHMARKING NO SETOR DISTRIBUIÇÃO DE ENERGIA ELÉTRICA 12
setor elétrico. De acordo com Lampe e Hilgers (2015), 11% de todas as aplicações globais
da DEA, entre 1978 e 2012, estavam no setor elétrico. Por exemplo, Edvardsen (2006)
descreve o modelo de regulação utilizado pela Agência Reguladora Norueguesa, que foi
uma das primeiras agências européias a utilizar DEA. Vaninsky (2006) utilizou o DEA
para medir a eficiência da geração de energia elétrica nos Estados Unidos. Hu e Wang
(2006) analisam a eficiência energética de 19 regiões administrativas da China, no período
de 1995 a 2002, utilizando DEA. Bogetoft e Otto (2011) descrevem um modelo baseado em
DEA aplicado ao setor de regulação energética na Alemanha. Mais recentemente, Lopes
(2015), Paradi (2015), Ray (2015), Lopes et al. (2016) e Banker e Zhang (2016) descrevem
o modelo DEA no qual se baseia a regulação do setor de distribuição brasileiro. Mesquita
(2017) aponta que metade dos países europeus pesquisados utilizam DEA, contra 30%
no caso dos países latino-americanos pesquisados. Sueyoshi et al. (2017) apresentam um
levantamento global de aplicações de DEA nos setores energético e ambiental.
1.5.2 COLS
Outra metodologia utilizada por algumas agências reguladoras é o Corrected Or-
dinary Least Square (COLS). Esse método estima os parâmetros de uma equação de
regressão, utilizando mínimos quadrados ordinários (Draper et al., 1966; Seber e Lee,
2012). Na sequência, para o caso da fronteira de custo, o modelo de regressão é deslocado
para o menor valor observado entre os resíduos. Assim, o limite inferior ou a fronteira de
eficiência do custo operacional é determinado. Nesse método, a equação do modelo de
regressão utilizado é a função de Cobb-Douglas, apresentada primeiramente por Cobb
e Douglas (1928) e aperfeiçoada por Douglas (1976). A metodologia COLS, segundo
estudos de Costa et al. (2015a), é frequentemente utilizada por agências reguladoras
da Dinamarca e da Grã-Bretanha. Vale citar também, os levantamentos de Agrell e
Bogetoft (2017) e de Mesquita (2017), que indicam o uso do COLS, respectivamente,
por 17% e 12% dos países europeus e latino-americanos pesquisados. Especificamente no
caso brasileiro, segundo Costa et al. (2015b), o uso dessa metodologia se deu durante o
3CRTP, sendo preterida depois pelo emprego do DEA no 4CRTP.
1.5.3 SFA
Na estimação da fronteira de eficiência pelos modelos DEA e COLS, as ineficiências
são estimadas como desvios dessa fronteira. Um modelo de benchmarking alternativo,
conhecido como Stochastic Frontier Analysis (SFA) (Meeusen e van den Broeck, 1977;
12
1.5. MÉTODOS DE BENCHMARKING NO SETOR DISTRIBUIÇÃO DE ENERGIA ELÉTRICA 13
Aigner et al., 1977), decompõe os desvios da fronteira em duas componentes: ruído
aleatório e ineficiência técnica e/ou alocativa. O SFA assume que os desvios da fronteira
podem estar além da ineficiência puramente técnica e/ou alocativa. Distúrbios causados
por fatores não gerenciáveis, como fatores contextuais, são incorporados ao componente
de ruído. De acordo com Kumbhakar e Lovell (2003), na reformulação com modelos de
fronteiras estocáticas, as fronteiras de produção, custo, receita e lucro são estocásticas
devido à variação aleatória no ambiente operacional. Os desvios dessas fronteiras estocás-
ticas são unilaterais, devido a vários tipos de ineficiência. Assim, haverá componentes de
erro simétrico, com a finalidade de capturar os efeitos da variação aleatória no ambiente
operacional, e componentes de erro unilaterais, com a finalidade de modelar os efeitos
das possíveis ineficiências técnicas e/ou alocativas.
Os estudos de Kuosmanen et al. (2013) descrevem aplicações do SFA no contexto
global de regulação elétrica. Alguns estudos abordaram o uso de SFA no SBDEE: Zanini
(2004) aplicou DEA e SFA com dados do 1CRTP e relatou grandes discrepâncias entre
as eficiências estimadas por cada método; Arcoverde et al. (2005) e Tannuri-Pianto et al.
(2009) aplicaram a metodologia SFA para 22 distribuidoras, de 1993 a 2001. Informações
socioeconômicas para cada distribuidora foram incluídas no modelo. Souza et al. (2010b)
aplicaram DEA e SFA a dados de 40 distribuidoras brasileiras, referentes ao ano de 2001,
fazendo comparações entre os resultados obtidos.
1.5.4 StoNED
Kuosmanen e Kortelainen (2012) desenvolveram uma técnica, intitulada Stochastic
Non-smooth Envelopment of Data (StoNED), cujo objetivo é combinar uma fronteira
não-paramétrica do tipo DEA com um erro composto como o apresentado no SFA. Os
trabalhos de Kuosmanen (2012), Kuosmanen et al. (2013) e Saastamoinen e Kuosmanen
(2016) apresentam aplicações dessa metodologia no setor elétrico. Entretanto, de acordo
com Chen et al. (2015), apesar de promissora, essa é uma técnica que possui limitações,
necessitando investigações mais aprofundadas em suas bases axiomáticas, nas propriedades
estatísticas e no seu desempenho.
1.5.5 Empresa de Referência
Além dos métodos listados acima, baseados em fronteiras de eficiência, existe
também o método da empresa de referência, onde se simula uma empresa virtual,
operando nas mesmas condições que uma empresa real. De acordo com Souza et al.
13
1.6. MODELO DE BENCHMARKING VIGENTE NO SBDEE 14
(2007), para uma dada faixa de qualidade exigida pelo regulador, a empresa de referência
procura utilizar eficientemente os recursos, permitindo a obtenção de estimativas dos
custos operacionais eficientes, tornando-se benchmark para as empresas reais.
Alguns estudos apontam o emprego dessa metodologia em alguns poucos países, tais
como Chile, Espanha e Suécia (Banker et al., 2017). No Brasil, de acordo com Souza et al.
(2007), essa metodologia foi utilizada durante o 1CRTP. Porém, por ser um metodologia
complexa, que consome recursos e tempo na coleta de informações detalhadas sobre todo
o processo de distribuição, geralmente é uma metodologia preterida por outras. Além
disso, segundo a ANEEL (2006), é uma metodologia que “abre a possibilidade de imiscuir
o regulador em uma espécie de micro-gestão da empresa, justamente o oposto do que
recomenda boas práticas de ações reguladoras”.
Além dos estudos apresentados nessa seção, existem também, outros que comparam
a utilização de diferentes metodologias para obtenção de fronteiras de eficiência no
setor de regulação de energia elétrica. Por exemplo, o estudo de Souza et al. (2010b)
compara métodos baseados em DEA a métodos estocásticos para medir a eficiência
de 40 concessionárias de distribuição de energia elétrica no Brasil. Costa et al. (2015a)
apresentam um estudo onde fazem uma avaliação estatística da utilização do DEA versus
a utilização do modelo COLS Cobb-Douglas para a revisão tarifária no Brasil em 2011.
Por fim, como mencionado anteriormente, DEA, SFA e COLS são os métodos de
benchmarking mais comuns na regulação de energia. Cada método baseia-se em algumas
suposições estatísticas, paramétricas ou não-paramétricas e pode alcançar diferentes
eficiências. Consequentemente, os reguladores podem usar dois ou mais métodos e estimar
a eficiência de custo final, combinando as eficiências de cada método. O regulador
brasileiro propôs uma eficiência média DEA e COLS Cobb-Douglas durante o 3CRTP.
O regulador alemão usa as eficiências best of DEA e SFA, ou seja, a eficiência final é
estimada usando o valor máximo entre DEA e SFA (Agrell e Bogetoft, 2017).
Na próxima seção, serão apresentadas algumas características do modelo de bench-
marking vigente no SBDEE, bem como alguns estudos que discutem tal modelo.
1.6 Modelo de Benchmarking Vigente no SBDEE
Desde o 1CRTP, a ANEEL utiliza métodos matemáticos e estatísticos para estimar
custos operacionais eficientes. De acordo com Mesquita (2017), durante o 1CRTP e o
2CRTP, que se deram entre 2003-2006 e 2007-2011, respectivamente, a ANEEL optou
14
1.6. MODELO DE BENCHMARKING VIGENTE NO SBDEE 15
por fazer uso da metodologia baseada em empresa de referência para os estabelecimento
dos custos eficientes para as DSOs.
Em seguida, no 3CRTP (2011-2014), a ANEEL passou a utilizar metodologias
julgadas capazes de definir fronteiras de eficiência para as DSOs. Na época, optou-se pela
utilização das metodologias DEA e COLS, por serem técnicas que apresentavam casos
de aplicações de sucesso em agências reguladoras de outros países, tais como Áustria,
Inglaterra e Finlândia, entre outros. DEA também já havia sido utilizado pela ANEEL
em 2007, porém para a regulação de empresas de transmissão de energia elétrica.
O modelo DEA utilizado no 3CRTP foi o de retornos não-decrescentes à escala
(NDRS), enquanto o modelo COLS se baseou em uma função de produção do tipo Cobb-
Douglas. Os escores de eficiência para cada DSO foram obtidos com as duas metodologias,
calculados usando como input o custo operacional (OPEX)3 e como outputs, o número
de consumidores, a extensão da rede e o mercado ponderado de tensão atendido por cada
DSO. Ambas as metodologias se basearam em dados de painel do período compreendido
entre 2003 e 2009. Segundo o regulador, outras variáveis foram analisadas, porém foram
descartadas por não possuírem significância estatística, tais como as porcentagens de
linhas subterrâneas, de mercado industrial, de estradas pavimentadas e de clientes rurais,
entre outras. Em um primeiro estágio, o regulador aplicava o valor médio dos escores de
eficiência obtidos pelas duas metodologias (DEA e COLS). Num segundo estágio, esses
escores obtidos eram corrigidos por variáveis ambientais que impactavam a operação das
DSOs, tais como índice pluviométrico, unidades consumidoras por quilômetro de rede e
salário médio. Três metodologias distintas eram utilizadas para compor essa correção:
uma proposta por Simar e Wilson (2007), outra proposta por Banker e Natarajan (2008)
e uma que se baseia na regressão Tobit (Tobin, 1958).
No 4CRTP, de 2015 a 2018, apenas o modelo de benchmarking DEA foi aplicado sem
qualquer análise de segundo estágio. O atual modelo de benchmarking é apresentado na
Nota Técnica 66/2015 (ANEEL, 2015) e reproduzido a seguir. A eficiência com retornos
não-decrescentes na escala (NDRS), orientada à entrada de uma dada DSO, é calculada
utilizando o seguinte problema de programação linear:
1. Dados:
• xki : quantidade consumida do input i pela concessionária k, ∀ i = 1,2, . . . , I
e k = 1,2, . . . , K;
3O OPEX (Operational Expenditure) refere-se às despesas operacionais da DSO. Já o CAPEX
(Capital Expenditure) diz respeito às despesas com capital ou investimentos em bens de capital pela
DSO. A soma do OPEX com o CAPEX resulta no TOTEX (Total Expenditure).
15
1.6. MODELO DE BENCHMARKING VIGENTE NO SBDEE 16
• ykj : quantidade produzida do output j pela concessionária k, ∀ j = 1,2, . . . , J ;
• ykl : quantidade produzida do output indesejado l pela concessionária k, ∀ l =
1,2, . . . , L;
• R: total de restrições de limite inferior aos pesos do modelo;
• T : total de restrições de limite superior aos pesos dos modelos;
• αr: limite inferior atribuído ao peso ωj relativamente ao peso κi, ∀ r =
1,2, . . . , R;
• βt: limite superior atribuído ao peso ωj relativamente ao peso κi, ∀ t =
1,2, . . . , T ;
2. Variáveis:
• κi: peso atribuído ao input i,
• ωj: peso atribuído ao output ordinário j, ;
• ωl: peso atribuído ao output indesejado l;
• ϕ: fator para retornos não-decrescentes de escala econômica.
3. Função objetivo:
hk: escore de eficiência da concessionária k sob análise.
4. Modelo:
hk = max{
J∑
j=1
ωjy
k
j +
L∑
l=1
ωl(−ykl ) + ϕ}
sujeito à
I∑
i=1
κix
k
i ≤ 1
J∑
j=1
ωjy
k
j +
L∑
l=1
ωl(−ykl )−
I∑
i=1
κix
k
i + ϕ ≤ 0
−ωr + αrκi ≤ 0 ∀ r = 1, 2, . . . , R
ωt − βtκi ≤ 0 ∀ t = 1, 2, . . . , T
κi, ωj, ωl, ϕ ≥ 0 (1.1)
A função objetivo do modelo expresso em (1.1) maximiza o escore de eficiência da
concessionária k sob análise, levando-se em consideração os inputs envolvidos (xki ), a
quantidade produzida dos outputs ordinários (ykj ), a incorporação de outputs indesejados
16
1.6. MODELO DE BENCHMARKING VIGENTE NO SBDEE 17
(ykl ) que impactam os custos eficientes, e o fator para retornos não-decrescentes de escala
econômica (ϕ). O sinal negativo de ykl se justifica pela necessidade de se validar uma
hipótese básica do modelo, que é a de se assumir uma relação positiva entre inputs e
outputs, e como os outputs indesejados se relacionam de maneira negativa com os custos,
a solução foi multiplicar essa variável por (-1).
A primeira restrição do modelo (1.1) é a condição necessária para que o problema
possa ser resolvido por programação linear, em substituição à alternativa não-linear
fracionária (mais complicada). Ela assume, arbitrariamente, que o somatório do va-
lor de mercado dos inputs consumidos seja no máximo, igual a 1. A segunda restri-
ção garante que a concessionária k deverá ter eficiência de no máximo 100%, isto é,∑J
j=1 ωjy
k
j+
∑L
l=1 ωl(−ykl )+ϕ∑I
i=1 κix
k
i
≤ 1. Os conjuntos de restrições que vêm na sequência do modelo
(1.1) trazem restrições de limites inferiores e superiores para os pesos no modelo, que
segundo o regulador, minimizam os efeitos de vieses nas estimativas em decorrência
das limitações do método DEA. As condições de não-negatividade para as variáveis são
expressas na última restrição.
O modelo DEA vigente proposto pela ANEEL utiliza custos operacionais (OPEX)
como entrada e número de consumidores, consumo ponderado de energia, extensão de
rede de alta tensão, extensão de rede de baixa tensão, extensão de rede subterrânea,
perdas não-técnicas e duração de interrupção de energia como variáveis de saída. As
perdas não-técnicas e a duração da interrupção de energia são incluídas como saídas
negativas, o que é uma representação alternativa para insumos não desejados no modelo
DEA (Cook e Zhu, 2013). As variáveis de entrada e saída estão disponíveis como valores
médios de 2011 a 2013 e de 2014 a 2016 para 61 DSOs. Além disso, restrições de peso
também são incluídas no modelo de programação linear.
Utilizando o DEA, os custos operacionais de cada DSO são comparados com os
custos e as saídas das DSOs restantes por meio de um sistema de equações lineares.
Portanto, uma fronteira eficiente é estimada. O resultado final do DEA são os escores de
eficiência, ou simplesmente eficiências, que indicam a capacidade de cada DSO transformar
recursos (custo) em produtos (serviços prestados). As DSOs mais eficientes são nomeadas
como benchmarks. As eficiências estimadas no último período variam de 27,8% a 100%
e têm uma média de 70,6%. Mais detalhes sobre o modelo brasileiro de benchmarking
DEA são encontrados em ANEEL (2015) e Lopes et al. (2016).
Embora o modelo proposto pela ANEEL no 4CRTP esteja sendo utilizado atual-
mente, o modelo ainda requer melhorias, conforme se descreve na próxima seção.
17
1.7. O PROBLEMA 18
1.7 O Problema
Após 2010, quando a ANEEL iniciou debates com a sociedade sobre as regras e
metodologias para definir as receitas das DSOs através de audiências públicas, além do
DEA, também foi indicado o uso de outra metodologia: o COLS Cobb-Douglas. Tal
metodologia, baseada em modelos de regressão, determina a fronteira de eficiência do
custo operacional das DSOs. Porém, esse modelo impõe uma estrutura de variância que
é mais complexa que a estrutura de variância observada nos dados, além de apresentar a
desvantagem da subdispersão, como descrito em Dey et al. (1997). Costa et al. (2015a)
demonstraram que quanto maior a amostra de dados utilizados, menores os escores de
eficiência são, o que se tornou uma importante deficiência do modelo para a ANEEL.
Além disso, de acordo com Bogetoft e Otto (2011), essa metodologia é mais restritiva,
isto é, penaliza as DSOs que não estão na fronteira. Também, vale ressaltar que, por se
basear em modelos de regressão para a média, a metodologia apresenta desvantagem
quando se quer estudar outros parâmetros diferentes da média.
Por outro lado, a opção baseada em DEA utiliza programação matemática para
obter avaliações da eficiência relativa dos resultados, sendo por isso, uma avaliação ex post
facto, posterior aos resultados já obtidos. Pressupõe conhecidos os valores dos insumos
e dos produtos gerados e busca, para cada DSO em questão, pesos relativos entre os
insumos e entre os produtos gerados que maximizem a sua eficiência relativa. Ainda, por
ser uma técnica não-paramétrica, o DEA não permite a extrapolação de suas conclusões,
que estão restritas às DSOs e às variáveis em análise.
De acordo com Costa et al. (2015a), para superar as limitações dos dois métodos
(DEA e COLS Cobb-Douglas), a ANEEL aplicava o valor médio das pontuações de
eficiência obtidos nos dois casos, não sendo por isso, garantia de melhores resultados.
Outro estudo iniciado em Costa et al. (2015a) aponta discrepâncias entre as duas
metodologias. A priori, os modelos baseados em DEA se mostraram mais consistentes em
relação aos modelos estatísticos deterministas, porém, ainda com algumas deficiências.
Até os dias atuais (vigência do 4CRTP), a ANEEL ainda não possui uma metodo-
logia livre de distorções, capaz de apresentar resultados e análises mais verossímeis da
realidade. Se por um lado, o método baseado em DEA apresenta algumas incoerências, a
metodologia alternativa considerada anteriormente pela agência, o COLS Cobb-Douglas,
também apresentava discrepâncias danosas à análise de resultados.
Algumas inconsistências ainda permanecem na metodologia atualmente empregada.
18
1.8. MOTIVAÇÕES PARA O ESTUDO DO PROBLEMA 19
Por exemplo, de acordo com Banker (2011), uma das maiores preocupações é o uso de um
modelo DEA - NDRS como um substituto para um modelo mais frequentemente utilizado,
com retornos variáveis à escala. Em congruência, Bogetoft (2014), Bogetoft e Lopes (2015)
e Lopes et al. (2016) dissertam e sugerem que as medidas utilizadas pela ANEEL podem
ser refinadas por meio de: inclusão de variáveis ambientais no modelo DEA, visando
corrigir os escores de eficiência; não utilização de restrições aos pesos do modelo; remoção
de variáveis com dados zerados; tratamento de outliers; estudo de consistência das
variáveis; e, correção das distorções entre as premissas do DEA e o modelo implementado.
Veronese (2015), Gil et al. (2017) e Veronese et al. (2018) apontam que as eficiências
das DSOs brasileiras mudam significativamente se uma análise de segundo estágio for
conduzida. Além destes, Semolini (2014), Ray (2015), Paradi (2015), Banker e Zhang
(2016) e Banker et al. (2017) também apontam algumas inconsistências consideradas
graves na metodologia atual do regulador brasileiro. Vale ressaltar também que, de acordo
com Tsionas (2002), é inapropriada a utilização de um modelo de benchmarking isolado,
sugerindo o emprego de múltiplos modelos para uma análise mais consistente.
Apesar das grandes melhorias do modelo de benchmarking de distribuição de
eletricidade no Brasil nos últimos ciclos periódicos de revisão tarifária, as eficiências
de custo estimadas apresentaram grande variabilidade de um ciclo de revisão anterior
para o seguinte. Infelizmente, mesmo com preciosas e fundadas sugestões ofertadas à
ANEEL, a problemática da ausência de implementação de uma metodologia acurada
ainda persiste! Com isso, a definição dos escores de eficiência das DSOs fica prejudicada,
e consequentemente, tomadas de decisão se mantêm deficientes. Logo, existe uma lacuna
a ser preenchida pela ANEEL: qual metodologia utilizar e/ou ser desenvolvida,
de maneira que se possa definir satisfatoriamente, uma fronteira de custos
eficientes para as DSOs brasileiras?
1.8 Motivações para o Estudo do Problema
De acordo com Haney e Pollit (2009), o problema de definição de fronteiras de
benchmark é um problema importante e desafiador tanto para os profissionais responsáveis
pela gestão dos custos e tarifas de vários setores da economia, quanto para os pesquisadores
de áreas afins. Uma das razões de sua importância é por este ser um problema comum a
um grande número de situações reais de tomada de decisão, tais como os problemas de
tarifação que surgem na maioria das agências reguladoras do setor elétrico, espalhadas
pelo mundo. Tão importante quanto, o problema também diz respeito aos custos da
19
1.8. MOTIVAÇÕES PARA O ESTUDO DO PROBLEMA 20
energia, que serão repassados ao mercado, acarretando em possíveis benefícios ou prejuízos
para os produtores e consumidores finais.
Do ponto de vista teórico, o problema é desafiador por pertencer à classe dos
problemas de benchmarking para avaliação de eficiência, discutidos com mais detalhes
em Jamasb e Pollitt (2001) e em Franco e Fortuna (2003), os quais vêm sendo utilizados
em ascendência nos últimos anos, por agências reguladoras do setor de energia elétrica,
conforme destacado por Costa et al. (2015a).
Devido à complexidade do problema de tarifação de energia pelas agências re-
guladoras, segundo Zhou et al. (2008), trabalhos foram desenvolvidos baseando-se em
procedimentos diversos para solucioná-lo, especialmente no que tange aos métodos não-
paramétricos para definição de benchmarks, como é o caso do DEA. Porém, esses métodos
podem apresentar inconsistências, e não conseguem garantir análises mais verossímeis da
realidade, como já apontado anteriormente.
No entanto, apesar dessa alta complexidade, é motivador o estudo de situações em
que se possa investigar métodos alternativos ou aprofundar os atualmente empregados,
com a finalidade de se esclarecer dados, variáveis e modelos, para que as barreiras
encontradas até o momento possam ser transpostas. A ANEEL vem implementando
metodologias, sem contudo, resultar numa solução refinada do problema de definição de
custos eficientes para a tarifação energética. Logo, existem possibilidades de melhorias e
proposições de novas metodologias.
É sabido que o DEA é uma metodologia determinista descritiva, isto é, as DSOs
observadas são comparadas com benchmarks determinados como combinações lineares
dessas DSOs. Caso se queira fazer especulações e inferências sobre DSOs não observadas,
o método determinista falha. Uma boa alternativa seria considerar o Stochastic Data
Envelopment Analysis (SDEA), introduzido inicialmente por Land et al. (1993), cuja
ideia básica reside no fato de que seria mais provável encontrar mais benchmarks, se mais
DSOs fossem observadas. Logo, a partir de técnicas de reamostragem, como é o caso do
bootstrap de Efron (1979), e de inferências estatísticas, o SDEA amplia estocasticamente o
número de DSOs consideradas. Uma boa revisão sobre esse método, considerado recente,
pode ser encontrada em Olesen e Petersen (2016).
Também vale a pena destacar que, nos modelos de benchmarking determinísticos,
como é o caso do DEA utilizado pela ANEEL, os desvios em relação às fronteiras de custo
são atribuídos única e exclusivamente à ineficiência técnica e/ou alocativa da DSO em
questão. Porém, sabe-se que pertubações aleatórias que estão fora do controle da DSO,
20
1.8. MOTIVAÇÕES PARA O ESTUDO DO PROBLEMA 21
tais como intempéries climáticas, greves e crises políticas, têm influência significativa no
cenário produtivo. Uma proposta alternativa consiste na implementação de modelos de
benchmarking estocásticos, tal como o Stochastic Frontier Analysis (SFA), nos moldes
daqueles introduzidos por Meeusen e van den Broeck (1977) e Aigner, Lovell, e Schmidt
(1977), cujas vantagens residem justamente no fato destes reconhecerem que os desvios
das fronteiras podem ser de ordem técnica, alocativa ou também aleatória.
De acordo com Kumbhakar e Lovell (2003), na reformulação com modelos de
benchmarking estocáticos, as fronteiras de custo são estocásticas devido à variação aleatória
no ambiente operacional. Os desvios dessas fronteiras estocásticas são unilaterais, devido a
vários tipos de ineficiência. Assim, haverá componentes de erro simétrico, com a finalidade
de capturar os efeitos da variação aleatória no ambiente operacional, e componentes de
erro unilaterais, com a finalidade de modelar os efeitos das possíveis ineficiências técnicas
e/ou alocativas. Na literatura, existem alguns trabalhos que abordaram a temática do SFA
no setor de regulação elétrica brasileira, podendo-se citar: Zanini (2004) aplicou o DEA e
o SFA conjuntamente a dados disponibilizados no 1CRTP, tendo encontrado discrepâncias
entre os escores medidos pelas duas metodologias, apontando como justificativa que
mais testes, formas funcionais diferentes para as funções de custo e outras suposições
probabilísticas deveriam ser investigadas no futuro; Arcoverde et al. (2005) e Tannuri-
Pianto et al. (2009) aplicaram a metodologia SFA para dados de 22 distribuidoras, do
período compreendido entre 1993 e 2001, levando-se em consideração indicadores sócio-
econômicos da área de atuação de cada empresa; Souza et al. (2010b) aplicaram tanto o
DEA quanto o SFA a dados de 40 distribuidoras brasileiras, referentes ao ano de 2001,
fazendo comparações entre os resultados obtidos. Porém apontam para a necessidade de
uma melhor especificação dos modelos de SFA e do próprio DEA.
Apesar de significativas contribuições, de acordo com Arcoverde et al. (2005), os
desdobramentos e as possibilidades ofertadas pelo SFA ainda são pouco explorados e
pouco empregados no setor de regulação energética brasileira, quase sempre configurando-
se em estudos pontuais, desprovidos de aprofundamentos e visão sistêmica. Tal fato
também contribui para a motivação desse estudo.
Por fim, uma motivação a mais diz respeito ao fato de que, muito embora os
incentivos à regulação no setor energético estejam bem disseminados no contexto global,
por outro lado, de acordo com Haney e Pollit (2011, 2009), o mesmo não se pode dizer
sobre as boas práticas na aplicação de métodos de benchmarking. Apenas alguns poucos
países seguem os princípios dessas melhores práticas, e muitos parecem ser influenciados
21
1.9. OBJETIVO 22
por práticas regionais, independentemente destas serem as melhores, ou se deparam
com complicações na escolha do método mais adequado para o contexto em que estão
inseridos. Prova disso pode ser encontrada no trabalho de Haney e Pollit (2011), que
apresentam uma espécie de índice capaz de traduzir o grau de utilização de boas práticas
de benchmarking dos reguladores de 40 países amostrados. Desses, 30 países (75% da
amostra) apresentam tal índice abaixo de 3, numa escala que varia de 0 a 8, em ordem
crescente de boas práticas. Tristemente, o Brasil apresenta índice igual a 2,25. Também
não há uma conclusão clara sobre qual método é melhor ou superior. Fato este que,
segundo Kuosmanen et al. (2013), levanta preocupações sobre a adequação do emprego
de qualquer método único. Além disso, estes autores observam que, apesar dos escores
de eficiência de diferentes métodos serem usualmente altamente correlacionados, as
implicações econômicas dos resultados são substanciais.
1.9 Objetivo
Partindo da questão-problema sob estudo4, objetiva-se validar a aceitação das
seguintes hipóteses associadas:
H1: pode-se replicar, o mais próximo possível, as eficiências estimadas das DSOs brasi-
leiras, utilizando uma abordadem robusta de SFA para as mesmas entradas e saídas
do modelo empregado atualmente pelo regulador.
H2: é possível propor uma abordagem alternativa e robusta de SFA, utilizando a infor-
mação disponível, incluindo uma componente ambiental.
1.10 Organização do Texto
Além desse capítulo introdutório de contextualização do estudo, esse texto foi
dividido em capítulos temáticos com a finalidade de facilitar o entendimento do trabalho
por parte do leitor. São apresentados, nessa ordem: no Capítulo 2, conceituam-se e
discutem-se as chamadas fronteiras de produção e de custo, as eficiências técnicas e
alocativas, apresentando métodos de estimação frequentista e Bayesiana para a estimação
da fronteira estocástica de custo, discutindo-se também a possibilidade da inserção
de variáveis exógenas ao SFA. No Capítulo 3, são apresentadas as parametrizações e
4“Qual metodologia utilizar e/ou ser desenvolvida, de maneira que se possa definir satisfatoriamente,
uma fronteira de custos eficientes para as DSOs brasileiras?”
22
1.10. ORGANIZAÇÃO DO TEXTO 23
modelagens propostas por esse trabalho. As discussões e comentários sobre os resultados
estão presentes no Capítulo 4. Por fim, o Capítulo 5 traz as considerações finais.
23

C
a
p
ít
u
l
o 2
Análise de Fronteira Estocástica (SFA)
Nesse segundo capítulo, são apresentadas as principais características do SFA,um poderoso e promissor método de benchmarking estocástico, bem como umarevisão da literatura sobre o mesmo, abrindo caminho para um maior e melhor
entendimento da metodologia proposta por esse trabalho, a fim de se obter possíveis
respostas e validações para o questionamento e hipóteses levantadas no capítulo anterior.
2.1 Preliminares
Kumbhakar e Lovell (2003) apresentam um rico detalhamento dos antecedentes
intelectuais dos modelos de análise da fronteira estocástica, com destaque aqui, para o
fato de a literatura teórica sobre eficiência produtiva, que começou na década de 1950
com os trabalhos de Koopmans (1951), Debreu (1951), Sherphard (1953) e Farrel (1957),
ser a que mais influenciou diretamente no desenvolvimento do SFA.
As origens do SFA remetem aos trabalhos de Meeusen e van den Broeck (1977) e
Aigner, Lovell, e Schmidt (1977), publicados com diferença de um mês entre si. Pouco
tempo depois, também surgiu um terceiro artigo, publicado por Battese e Corra (1977),
autores estes que foram revisores dos dois trabalhos anteriores. Estes três modelos de
SFA originais, segundo Kumbhakar e Lovell (2003), compartilham uma estrutura de erros
aleatórios e erros causados por ineficiências. De maneira geral, em ambos trabalhos, o
modelo pode ser expresso como:
25
2.1. PRELIMINARES 26
y = f(x;β) · eν−u, (2.1)
onde y é saída escalar da produção, x é um vetor de entradas e β é um vetor de parâmetros
de tecnologia. O primeiro componente de erro ν ∼ N(0, σ2ν) objetiva capturar os efeitos
do ruído aleatório, enquanto o segundo componente de erro u ≥ 0 destina-se a capturar
os efeitos da ineficiência técnica, tendo seu comportamento descrito por distribuições de
probabilidades distintas em cada um dos três trabalhos acima. Com isso, os produtores
operam sobre ou abaixo da sua fronteira de produção estocástica y = f(x;β) · eν de
acordo com u = 0 ou u > 0.
Desde a publicação destes três trabalhos iniciais até os dias atuais, muitas tem
sido as contribuições de pesquisadores de várias partes do mundo. Podem-se destacar,
entre outros: (i) - Forsund et al. (1980) e Jondrow et al. (1982) que atuaram para obter
estimativas de eficiência específicas para os produtores considerados no estudo em questão;
(ii) - Greene (1980a,b), Stevenson (1980) e Lee (1983) dedicaram-se ao desenvolvimento de
distribuições de dois parâmetros mais flexíveis para o componente de erro de ineficiência;
(iii) - Schmidt e Lovell (1979) e Kopp e Diewert (1982) procuraram decompor a estimativa
de υ em estimativas dos custos separados de ineficiência técnica e alocativa, com êxitos
parciais; (iv) - Pitt e Lee (1981) e Schmidt e Sickles (1984) estenderam as técnicas
de estimativa da máxima verossimilhança aos dados de painel, tendo posteriormente,
relaxamentos propostos por Cornwell et al. (1990), Kumbhakar (1990) e por Battese e
Coelli (1992); (v) - Kumbhakar et al. (1991), Reifschneider e Stevenson (1991), Huang e
Liu (1994) e Battese e Coelli (1995) propuseram abordagens onde as variáveis exógenas
são incorporadas ao erro de ineficiência; (vi) - Wang (2002) apresenta modelos com
heterocedasticidade e causas exógenas da ineficiência; (vii) - Kumbhakar e Wang (2005)
discutem os modelos de crescimento econômico; (viii) - Greene (2005), Wang e Ho (2010),
Kumbhakar et al. (2014) e Chen et al. (2014) apresentam avanços em modelos com dados
em painel.
Contudo, desses 40 anos de evolução no entendimento do SFA, desprendem-se
algumas lacunas ainda não preenchidas ou até mesmo não exploradas a fundo, como
é o caso da dificuldade de decomposição da estimativa de u em estimativas dos custos
separados de ineficiência técnica e alocativa, ou como a maior parte dos estudos terem
se concentrado sobre funções de produção, sendo timidamente estendido às funções de
custos, receitas e lucros (Kumbhakar et al., 2015).
Como já dito anteriormente, o objetivo desse capítulo perpassa pelo estudo, apro-
26
2.2. FRONTEIRA DE PRODUÇÃO E EFICIÊNCIA TÉCNICA 27
fundamento e melhor entendimento das metodologias de análise de fronteiras estocásticas,
com possibilidade de sugerir melhorias para estas ou apresentar novas metodologias para
o SBDEE. Sendo assim, as subseções que se seguem, trazem considerações gerais, julgadas
importantes, para um melhor entendimento do método de SFA e futuro embasamento
teórico para as proposições que advirem.
2.2 Fronteira de Produção e Eficiência Técnica
De maneira geral, um processo produtivo é composto por um processo de transfor-
mação (throughput), tendo insumos como entradas (inputs) e, produtos ou serviços como
saídas (outputs) desse processamento, conforme se representa na Figura 2.1.
Figura 2.1: Representação genérica de um processo produtivo.
A transformação produtiva pode ser feita de diferentes maneiras, de acordo com o
conjunto de possibilidades de produção (CPP), indicando todas as maneiras tecnologica-
mente viáveis de se transformar os inputs x nos outputs y.
De acordo com os princípios econômicos, há restrições tecnológicas que limitam o
CPP. Nesse contexto, para uma certa tecnologia dada, a função fronteira de produção
y = f(x), ou simplesmente função de produção, é uma função que indica a máxima
quantidade de produto y que pode ser obtida a partir dos inputs x (orientação segundo
outputs). Ou analogamente, y = f(x) indica o mínimo conjunto de inputs x necessários
para produzir uma certa quantidade de outputs y (orientação segundo inputs). A Figura
2.2 ilustra essas noções.
Baseando-se na observação da Figura 2.2, destaca-se que aqueles produtores que
podem ser localizados sobre a função de produção y = f(x) possuem eficiência técnica,
pois alcançaram a máxima produção para os recursos utilizados. Por outro lado, pro-
dutores que por ventura sejam localizados abaixo de y = f(x) apresentam ineficiência
27
2.2. FRONTEIRA DE PRODUÇÃO E EFICIÊNCIA TÉCNICA 28
Figura 2.2: Conjunto de Possibilidades de Produção (CPP) e fronteira de produção.
técnica, uma vez que não atingiram o máximo de produção possível para aqueles recur-
sos utilizados, ou não conseguiriam produzir o mesmo nível atual, utilizando-se menos
recursos. Esses conceitos de eficiência e ineficiência técnica condizem com a definição
de eficiência de Pareto-Koopmans (Koopmans, 1951). Matematicamente, a função de
produção pode ser expressa como:
y = f(x1, x2, x3, . . . , xJ) ≡ f(x), (2.2)
Sendo x um vetor J-dimensional não-negativo de inputs (escalares) e y representa o
output (escalar) obtido a partir de f(·), isto é, a partir da tecnologia empregada. De
acordo com Chambers (1988), uma função de produção bem definida deve satisfazer às
seguintes condições:
(i) f(x) deve ser monótona, isto é, f(x) ≥ f(x′) ∀ x ≥ x′;
(ii) f(x) ∈ <+, finita e única ∀ x+;
(iii) f(x) deve ser contínua e duas vezes diferenciável;
(iv) f(0) = 0, ou seja, sem inputs não há outputs;
(v) O conjunto de possibilidades de produção (CPP) deve ser fechado e não-vazio
∀ y > 0;
28
2.2. FRONTEIRA DE PRODUÇÃO E EFICIÊNCIA TÉCNICA 29
(vi) O CPP deve ser convexo, o que implica na quasi-concavidade de f(x).
A Figura 2.3 a seguir, apresenta um exemplo de tecnologia de produção composto
por dois inputs (x1 e x2) e um único output (y). A função de produção também está
representada na parte (a) dessa figura.
Figura 2.3: Exemplo de uma função de produção e de isoquantas.
Segundo a orientação a outputs, a função de produção y = f(x1, x2), na Figura
2.3(a), representa a produção máxima para uma determinada combinação de inputs
(x1, x2). Os produtores que estiverem situados sobre essa função (no caso, sobre a superfície
do sólido) serão tecnicamente eficientes, como é o caso dos pontos A, C e D. Entretanto,
pode haver desvios em relação à função de fronteira de produção, como representado
pelo ponto B. Observe que utilizando os mesmos recursos do plano de produção dado em
B, poder-se-ia alcançar um nível de produção maior, y2 > y1, dado em A, caracterizando
com isso, a falta de eficiência do produtor em B.
Debreu (1951) e Farrel (1957) propuseram uma métrica para quantificar a eficiência
técnica de um produtor, denominada Métrica Radial de Debreu-Farrel. Segundo esta, a
eficiência técnica com orientação a output é dada por:
TE = y
f(x) , ∀ x ∈ <
n
+ e y ∈ <+, (2.3)
sendo y a produção observada e f(x) a máxima quantidade de produto que pode ser
obtida a partir do vetor de inputs x. Assim, observa-se que 0 < TE < 1 e que, a
ineficiência técnica pode ser obtida através de TI = 1− TE. Além disso, estes autores
29
2.2. FRONTEIRA DE PRODUÇÃO E EFICIÊNCIA TÉCNICA 30
propuseram que o nível de produção y observado, sob a ótica da orientação a output,
pode ser formulado matematicamente como:
y = f(x) · TE, (2.4)
isto é, o nível máximo de produção y sofre influência da eficiência técnica. Considerando
valores pequenos de TI, pode-se fazer a aproximação TE = 1− TI ≈ e−TI (Kumbhakar
et al., 2015). Assim,
y = f(x) · e−TI . (2.5)
A fim de simplificar um pouco mais a notação, seja considerar TI = u, o que leva
ao seguinte resultado:
y = f(x) · e−u, com u ≥ 0. (2.6)
Observando a equação (2.6), conclui-se que a presença de ineficiência técnica (isto
é, quando u > 0) acarreta uma produção aquém da máxima permitida pela função de
produção f(x).
Por outro lado, segundo a orientação a inputs, a função de produção y = f(x1, x2),
na Figura 2.3(a), representa o mínimo conjunto de inputs necessários para produzir
quantidades fixas do output y. Novamente, os produtores que estiverem situados sobre
essa função serão tecnicamente eficientes, como é o caso dos produtores situados em A, C
e D. Desvios também podem acontecer em relação à função de produção, caracterizando a
presença de ineficiência técnica, como representado por B. Observa-se que o mesmo nível
de produção alcançado por B, y1, poderia ser alcançado utilizando-se menos recursos, tal
como em D. A Figura 2.3(b) apresenta o gráfico das isoquantas de produção. Observa-se
que o mesmo nível de produção y1 pode ser alcançado ao deslocar-se de B para D, porém
com redução de insumos.
Nesse contexto de orientação a inputs, Debreu (1951) e Farrel (1957) propuseram
que o nível de produção y observado, pode ser determinado como:
y = f(x · TE), (2.7)
isto é, a utilização dos insumos sofre influência da eficiência técnica.
30
2.2. FRONTEIRA DE PRODUÇÃO E EFICIÊNCIA TÉCNICA 31
Novamente, considerando valores pequenos de TI, pode-se fazer a aproximação
TE = 1− TI ≈ e−TI (Kumbhakar et al., 2015), o que leva a:
y = f(x · e−TI). (2.8)
Simplificando a notação, pode-se escrever TI = u, gerando o seguinte resultado:
y = f(x · e−u), com u ≥ 0. (2.9)
Assim, verifica-se na equação (2.9) que, na ausência de ineficiência técnica, o nível
de produção alcançado é aquele máximo dado pela função de produção f(x).
2.2.1 Algumas Formas Funcionais para a Função de Produção
Existem várias formas funcionais para a função de produção apontadas pela lite-
ratura micro e macroeconômica. Dentre elas, duas têm uso destacado no SFA: Função
Cobb-Douglas e Função Logarítmica Transcendental (Translog).
2.2.1.1 Função de Produção Cobb-Douglas
A função de produção de Cobb-Douglas é talvez, a mais proeminente na literatura,
e teve sua estrutura atribuída ao trabalho de Cobb e Douglas (1928). Considerando xj
como sendo os inputs, y o output e, βj os coeficientes, sua forma funcional é:
y = f(x1, x2, x3, . . . , xJ)
= β0
J∏
j=1
x
βj
j , onde (2.10)
β0 > 0, 0 < βj,j 6=0 < 1 e
J∑
j=1
βj = 1.
Essa função é facilmente linearizável. Basta para isso, aplicar logaritmos a ambos
os lados da igualdade, isto é:
ln y = ln β0 + β1 ln x1 + β2 ln x2 + . . .+ βJ ln xJ . (2.11)
31
2.3. EFICIÊNCIA TÉCNICA VERSUS EFICIÊNCIA ALOCATIVA 32
2.2.1.2 Função de Produção Translog
Uma alternativa à função de Cobb-Douglas é a função Logarítmica Transcendental
de produção, ou mais comumente conhecida como função translog. Foi apresentada
primeiramente por Christensen et al. (1971). Pode ser interpretada como a aproximação
de uma função de produção arbitrária, y = f(x), por uma expansão de segunda ordem
em série de Taylor de ln y, em potências de ln xj. Sua forma funcional é dada por:
ln y = β0 +
J∑
j=1
βj ln xj +
1
2
J∑
j=1
J∑
k=1
βjk ln xj ln xk, (2.12)
onde: β0 é igual ao valor do logaritmo de f(x), no ponto de expansão a, isto é, β0 = ln f(a);
βj (j 6= 0) são as primeiras derivadas parciais de ln f(x) com relação à variável xj ; e, βjk
são as segundas derivadas parciais de ln f(x), medidas no ponto de expansão a. Pode-se
observar também que, quando os produtos cruzados são nulos, a função translog se
reduz à função Cobb-Douglas. Para que se possa testar hipóteses da teoria de produção,
tais como homogeneidade, separabilidade e mudanças tecnológicas, devem-se impor as
seguintes restrições aos paramêtros:
βjk = βkj,
J∑
j=1
βj = 1,
J∑
j=1
J∑
k=1
βjk = 0,
J∑
j=1
βjk = 0 ∀ k = 1, 2 . . . , J, e
J∑
k=1
βjk = 0 ∀ j = 1, 2 . . . , J.
Segundo Behr (2015), essa função apresenta uma flexibilidade maior quando com-
parada com a função Cobb-Douglas descrita acima. Isso porquê, usando dualidade,
pode-se mostrar que a função translog de produção é idêntica à função translog de custo,
permitindo assim, análises simultâneas tanto do volume produzido quanto dos custos
envolvidos (Albuquerque, 1987). Outra observação interessante diz respeito ao fato da
função translog possuir mais variáveis que a função Cobb-Douglas.
2.3 Eficiência Técnica versus Eficiência Alocativa
Do ponto de vista econômico, nem sempre um produtor que é tecnicamente eficiente
também apresentará eficiência econômica, pois ele pode utilizar um conjunto de inputs
que não é o de menor custo. Assim, para ser economicamente eficiente, o produtor além de
32
2.4. FRONTEIRA DE CUSTO E EFICIÊNCIA ECONÔMICA 33
ser tecnicamente eficiente, deve possuir eficiência alocativa, isto é, empregar os insumos
de menor custo.
Portanto, supondo que são conhecidos os preços w ∈ <n+ do vetor de inputs x ∈ <n+,
um produtor procurará, racionalmente, produzir o conjunto de outputs y ∈ <m+ com o
menor custo possível. Logo, segundo Kumbhakar e Lovell (2003) e Kumbhakar et al.
(2015), o padrão contra o qual a performance do i-ésimo produtor passa a ser avaliado,
migra da fronteira de produção para a denominada fronteira de custo e a eficiência
passa a ter duas componentes: uma técnica e outra alocativa. Juntas, essas componentes
constituem a eficiência econômica do produtor. Maiores detalhes são apresentados na
seção que se segue.
2.4 Fronteira de Custo e Eficiência Econômica
A fronteira de custo indica o mínimo custo necessário para produzir um conjunto de
outputs, a partir do preço dos inputs e da tecnologia de produção empregada. A Figura 2.4
representa essa noção. Como pode se observar, os produtores eficientes estão localizados
sobre a fronteira de custo, enquanto que os produtores ineficientes estão localizados acima
dela, pois seus custos são maiores que o mínimo definido pela fronteira.
Figura 2.4: Fronteira de custo.
Assim como ocorre com a fronteira de produção, a fronteira de custo também
funciona como benchmark, contra a qual podem ser comparados os desempenhos de
33
2.4. FRONTEIRA DE CUSTO E EFICIÊNCIA ECONÔMICA 34
todos os produtores (ou DMUs). Matematicamente, a função fronteira de custo pode ser
expressa como:
C(w, y) = wx · eu, com u ≥ 0. (2.13)
Nessa expressão, w é o vetor de preços dos inputs x, y é o nível observado de output e u
representa uma eventual ineficiência do produtor.
Observa-se em (2.13) que, a função de custo mede o custo de produzir y quando os
inputs são ajustados pela sua eficiência. Assim, na presença de ineficiências (u > 0), o
custo atual (expenditure), E = wxeu, pode ser maior que o custo mínimo, wx.
De acordo com Chambers (1988), uma função de custo bem definida deve satisfazer
às seguintes condições:
(i) C(w, y) deve ser não decrescente em y, isto é, C(w, y) ≥ C(w, y′) ∀ y ≥ y′;
(ii) C(w, y) deve ser não decrescente em w, isto é, C(w′, y) ≥ C(w, y) ∀ w′ ≥ w;
(iii) C(w, y) deve ser não-negativa, isto é, C(w, y) > 0 ∀ w > 0 e y > 0;
(iv) C(w, y) deve ser convexa e contínua em w;
(v) C(w, 0) = 0, isto é, não há custos fixos;
(vi) C(tw, y) = tC(w, y), com t > 0, isto é, se todos os custos forem multiplicados por
uma constante t > 0, é equivalente a ter o custo mínimo multiplicado por t;
(vii) xi(w, y) = ∂C(w,y)∂wi , isto é, o único vetor de minimização dos custos da demanda é
igual ao gradiente de C(w, y) em w, desde que a função de custo seja diferenciável
em wi.
Também, pode-se escrever a seguinte expressão para o cálculo da eficiência econô-
mica do i-ésimo produtor:
EEi =
Customin
Custoatuali
= Custo
min
Ei
,
= wx
wxeui
= e−ui ∀ x ∈ <n+ e y ∈ <+. (2.14)
34
2.4. FRONTEIRA DE CUSTO E EFICIÊNCIA ECONÔMICA 35
Assim, observa-se que 0 < EEi < 1 e que, a ineficiência econômica pode ser obtida
através de EIi = 1− EEi.
2.4.1 Algumas Formas Funcionais para a Função de Custo
Tal como visto para a função de produção, existem na literatura, algumas formas
funcionais para a função de custo C(w, y). Dentre elas, destacam-se a função de custo
Cobb-Douglas e a função de custo Translog.
2.4.1.1 Função de Custo Cobb-Douglas
Considerando x como sendo o vetor de inputs, yi = (y1i, y2i, . . . , yMi), com todas
as componentes não-negativas, como sendo o vetor de outputs gerados pelo produtor i,
wi = (w1i, w2i, . . . , wNi) > 0 é o vetor de preços dos inputs utilizados pelo produto i, β é
o vetor de parâmetros de tecnologia (coeficientes) a serem estimados e, Ei como sendo a
despesa (expenditure) incorrida pelo produtor i, a forma funcional da função de custos
Cobb-Douglas para o caso de output único é definida como:
Ei = C(wi, yi, β) · eui
= β0yβyi
J∏
j=1
w
βj
ji e
i , onde (2.15)
J∑
j=1
βj = 1 =⇒ βl = 1−
J∑
j=1;j 6=l
βj, e
i = νi + ui é um termo de erro composto pelos ruídos aleatórios (νi) e pela ineficiência
econômica (ui), associado ao produtor i. Essa função é facilmente linearizável. Basta
para isso, aplicar logaritmos a ambos os lados da igualdade, isto é:
lnEi = ln β0 + βy ln yi +
J∑
j=1
βj lnwji + νi + ui (2.16)
De acordo com Zanini (2004), a simplicidade é o maior trunfo dessa função. Porém,
apresenta os incovenientes de não acomodar multi-outputs sem violar as propriedades de
convexidade do espaço de produtos e, quando se trata de estruturas de produção mais
complexas, resulta em estimativas tendenciosas para as ineficiências de custo.
35
2.4. FRONTEIRA DE CUSTO E EFICIÊNCIA ECONÔMICA 36
2.4.1.2 Função de Custo Translog
Uma alternativa à função de Cobb-Douglas, e que permite acomodar múltiplos
produtos sem incorrer em violações de convexidade, é a função translog de custo. Sua
forma funcional é dada por:
lnEi = β0 +
M∑
m=1
αm ln ymi +
J∑
j=1
βj lnwji +
1
2
M∑
m=1
M∑
h=1
αmh ln ymi ln yhi +
+ 12
J∑
j=1
J∑
h=1
βjh lnwji lnwhi +
J∑
j=1
M∑
h=1
γjh lnwji ln yhi + νi + ui, (2.17)
onde,
βjh = βhj, αmh = αhm,
J∑
j=1
βj = 1,
J∑
j=1
βjh = 0 ∀ h = 1, 2 . . . , J e
J∑
j=1
γjh = 0 ∀ h = 1, 2 . . . , J.
Assim como no caso da produção, a função translog de custo apresenta mais variáveis
que a função de Cobb-Douglas. Por isso, de acordo com Zanini (2004), a função translog,
apesar de sua maior flexibilidade para acomodar múltiplos produtos, pode apresentar
problemas de multicolinearidade, quando muitos regressores forem considerados.
2.4.1.3 Comentário Sobre Essas Formas Funcionais
Como já dito, as funções paramétricas de Cobb-Douglas e translog são as mais
comumente utilizadas no SFA. No entanto, a convexidade de custo é obtida com uma
função translog. Isto é ilustrado na Figura 2.5, onde um SFA paramétrico que utiliza
uma função translog possui uma convexidade mais suave em comparação com a função
Cobb-Douglas e o atual modelo DEA-NDRS utilizado pela ANEEL.
36
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 37
(a) Ajuste DEA, Cobb-Douglas e Translog
para o número de consumidores.
(b) Ajuste DEA, Cobb-Douglas e Translog
para a rede aérea.
Figura 2.5: Diferenças entre as funções de custo Cobb-Douglas e translog no SFA.
Uma vez tendo sido apresentadas algumas definições iniciais sobre fronteiras de
produção e de custo, passa-se para as próximas seções, onde discutem-se algumas questões
sobre os métodos de estimação das fronteiras de custo, já que estas fazem parte do objeto
de estudo desse trabalho.
2.5 Estimação da Fronteira Estocástica de Custo
De acordo com Zanini (2004), na prática não se conhece plenamente o CPP, dificul-
tando também, o conhecimento da fronteira de custo. Logo, a eficiência de cada produtor
não pode ser determinada. Todavia, métodos de estimação podem ser empregados a fim
de contornar essa dificuldade.
Segundo Kumbhakar e Lovell (2003) e Kumbhakar et al. (2015), esses métodos
de estimação da fronteira de custo se baseiam em modelos estatísticos, que podem ser
classificados como modelos estatísticos deterministas ou modelos estatísticos estocásticos,
conforme classificação apresentada na seção 1.4.
Nessa seção, será discutido o modelo de custo com fronteira estocástica, bem
como as referidas possibilidades de estimação da eficiência econômica do produtor.
Visando facilitar a exposição do tema, nas subseções que se seguem, serão abordados
os seguintes assuntos: (i) - o modelo de custo com fronteira estocástica; (ii) - alguns
37
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 38
métodos estatísticos estocásticos de estimação paramétrica para a eficiência econômica;
(iii) - síntese da especificação de um modelo SFA de custo; e, (iv) - considerações gerais.
2.5.1 Modelo de Custo com Fronteira Estocástica
Como discutido na seção 2.4, o custo Ei observado para o produtor i, sob a ótica
da orientação a inputs1, cuja eficiência econômica é dada por e−ui , pode ser formulado
matematicamente como:
Ei = C(wi, yi) · eui com ui ≥ 0. (2.18)
De acordo com Kumbhakar et al. (2015), na equação (2.18), pode-se associar um
vetor de parâmetros J-dimensional β que representa os parâmetros da tecnologia de
produção, bem como acrescentar um termo de erro aleatório eνi , irrestrito em sinal e com
média zero, obtendo-se a seguinte expressão:
Ei = [C(wi, yi,β) · eνi ] · eui , com ui ≥ 0 e νi ∈ <. (2.19)
Aplicando logaritmos a ambos os membros, vem:
lnEi = lnC(wi, yi,β) + νi + ui, com ui ≥ 0 e νi ∈ <. (2.20)
Por sua vez, admitindo que a função de custo seja linear nos logaritmos dos
parâmetros β e, escrevendo i = νi + ui, chega-se ao seguinte resultado:
lnEi = lnC(wi, yi,β) + i,
i = νi + ui, com −∞ < νi < +∞ e ui ≥ 0. (2.21)
Esse resultado é conhecido na literatura como Modelo de Custo com Fronteira
Estocástica. Nele, destacam-se: (i) - o termo yi, que reprenta o nível de produção
observado para o produtor i; (ii) - a função C(wi, yi,β), que representa a fronteira
determinística de custo, comum a todos produtores, e define o mínimo custo de produção
possível através da tecnologia em uso; e, (iii) - o termo i, que representa o erro composto.
1A orientação a inputs é mais indicada para a função de custo pois, de acordo com Altoé et al.
(2017), nessa função, o principal objetivo não é decrescer o nível de outputs, mas sim decrescer os custos
de operação.
38
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 39
O termo de erro composto (i) caracteriza conjuntamente, o termo νi, cuja finalidade
é capturar o efeito dos choques aleatórios que afetam especificamente o i-ésimo produtor,
e o termo ui, que descreve a ineficiência econômica apresentada por este. Além disso,
pode-se rearranjar a equação (2.19) da seguinte maneira:
e−ui = C(wi, yi,β) · e
νi
Ei
. (2.22)
Assim sendo, como a equação (2.22) traz a razão entre o custo mínimo C(wi, yi,β) ·eνi de
produção possível e o custo de produção observado, deduz-se que a eficiência econômica
do i-ésimo produtor pode ser mensurada através da expressão e−ui , tal qual proposto
por Debreu (1951) e Farrel (1957).
Se no modelo (2.21), a eficiência alocativa for assumida como total, então o termo
ui será associado única e exclusivamente à ineficiência técnica do produtor. Porém se esta
suposição não puder ser considerada, a interpretação de ui refletirá simultaneamente, os
dois tipos de ineficiência: técnica e alocativa. Caso seja do interesse decompor o termo
ui em suas componentes, torna-se necessário o emprego de equações simultâneas, como
pode ser visto em Kumbhakar e Lovell (2003) e em Kumbhakar et al. (2015).
2.5.2 Métodos Estatísticos Estocásticos de Estimação
Paramétrica para a Eficiência Econômica
A estimação da eficiência econômica do produtor requer a estimação dos parâmetros
da função de custo C(wi, yi,β). Uma abordagem possível consiste em considerar os desvios
das posições observadas em relação à fronteira eficiente como resultado de uma possível
ineficiência econômica do produtor e também, admite a influência de ruídos e eventos
aleatórios, aos quais, tal produtor está sujeito. Além disso, se especifica suposições
distributivas para os componentes de erros. Por isso, denomina-se tal abordagem como
Métodos Estatísticos Estocásticos de Estimação Paramétrica. Dentre esses métodos,
destaca-se o SFA, descrito a seguir.
2.5.2.1 Considerações Iniciais
Com já descrito na subseção 2.5.1, o Modelo de Custo com Fronteira Estocástica
possui a seguinte formulação matemática:
39
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 40
lnEi = lnC(wi, yi,β) + i,
i = νi + ui, com −∞ < νi < +∞ e ui ≥ 0. (2.23)
Os métodos de estimação paramétrica objetivam estimar os parâmetros deste
modelo, partindo da suposição de comportamentos probabilísticos para os erros νi e
ui, culminando na obtenção dos respectivos estimadores, como por exemplo, os de
máxima verossimilhança. Logo, as suposições sobre esses comportamentos probabilísticos
constituem o cerne desse processo de estimação. Vale então, ressaltar aqui, algumas
premissas básicas que nortearão o entendimento das exposições feitas nas próximas seções.
Primeiramente, seja considerar o erro aleatório νi. Este é tido como simétrico, a
fim de capturar todo e qualquer choque aleatório ao qual o produtor esteja exposto.
De acordo com Kumbhakar e Lovell (2003), a ideia de simetria é bem aceita pois, as
condições externas favoráveis e desfavoráveis são igualmente prováveis. Assim, a suposição
de uma distribuição simétrica, tal como a Normal, é uma boa indicação.
Com relação ao erro ui, sabe-se que este objetiva capturar os efeitos da ineficiência
econômica e, portanto, deve assumir valores não-negativos. Logo, devem-se considerar
distribuições positivas como por exemplo, a Normal Truncada ou a Half -Normal.
Já para o erro composto i, distribuições assimétricas são as mais indicadas, uma vez
que, esse erro mede a soma entre um erro simétrico e um erro positivamente assimétrico.
Por isso, modelos de regressão onde os erros sejam simetricamente distribuídos não são
indicados para estimar a fronteira estocástica de custo.
Outra questão diz respeito à independência entre νi e ui. Na maioria das vezes, esses
erros são considerados independentes, uma vez que, choques aleatórios externos que estão
fora do controle do produtor dificilmente são relacionados com a ineficiência econômica.
Contudo, existem casos raros onde o contrário acontece, como por exemplo, flutuações
sazonais influenciando a produção. Bandyopadhyay e Das (2006), Lai e Huang (2013)
e Amsler et al. (2014) são alguns dos autores que trabalharam com essa problemática
e apresentaram métodos de solução, baseados no emprego das funções Cópula, isto é,
baseados em um método geral para formular distribuições multivariadas de maneira que
diversos tipos de dependências possam ser representados.
40
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 41
2.5.2.2 Verificação Inicial da Assimetria de i
Antes de se implementar o modelo de custo com fronteira estocástica para um
determinado problema, vale a pena verificar se o contexto desse problema suporta a
presença de ineficiência econômica (ui > 0). Caso não suporte, é desnecessário investir
em técnicas mais caras de estimação.
Pensando nisso, vários testes iniciais são apresentados na literatura. Basicamente,
consistem em testar as seguintes hipóteses sobre o erro composto i = νi + ui:
H0 :  é simétrico,
H1 :  é assimétrico à direita. (2.24)
Não rejeitar a hipótese nula implica assumir que o modelo não suporta a ineficiência
econômica, isto é, ui = 0. Assim, i = νi passa a ser simétrico e o modelo se reduz a um
modelo de regressão padrão, no qual a estimação por OLS é suficiente.
Pensado nisso, algumas estatísticas de teste foram propostas na literatura, sendo a
apresentada por Coelli (1995) a mais simples e também a mais utilizada. Nesta, após se
calcular os resíduos OLS, obtém-se a seguinte estatística:
M3T = m3√
6m32
n
∼
sobH0
N(0, 12), (2.25)
onde mi e n representam respectivamente, o i-ésimo momento dos resíduos e o tamanho
amostral. Outras estatísticas também presentes na literatura são a
√
b1 de Schmidt
e Sickles (1984) e o teste LR (razão da verossimilhança da ineficência), descrito em
Kumbhakar et al. (2015). Após verificada a presença de ineficiência econômica, pode-se
seguir com o processo de estimação dos parâmetros do modelo de SFA.
2.5.2.3 Possíveis Comportamentos Probabilísticos Associados a ui
Como dito anteriormente, uma vez sendo a ineficiência econômica positiva (ui > 0),
devem-se considerar distribuições positivas. Na literatura, são apresentadas algumas
opções, tais como Half -Normal (Aigner et al., 1977), Normal-Truncada (Stevenson, 1980),
Gamma (Greene, 1990), Exponencial (Meeusen e van den Broeck, 1977), entre outras.
Destas, por parcimônia, a Normal-Truncada e seu subcaso, Half -Normal, são as mais
utilizadas.
41
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 42
A formulação para o modelo de custo com fronteira estocástica, baseada na suposição
de que os erros ui seguem uma distribuição Normal-Truncada, se apresenta como:
lnEi = lnC(wi, yi,β) + i, (2.26)
lnEi = lnC(wi, yi,β) + νi + ui, (2.27)
νi ∼
iid
N(0, σ2ν), (2.28)
ui ∼
iid
N+(µ, σ2u), (2.29)
ui e νi são independentes entre si, (2.30)
ui e νi são independentes de xi. (2.31)
A notação N+(µ, σ2u) representa o truncamento de uma distribuição normal N(µ, σ2u)
com a seleção de valores acima de zero. Se µ = 0, reduz-se ao caso da distribuição Half -
Normal. A Figura 2.6 ilustra algumas formas da distribuição Normal-Truncada para
alguns valores selecionados de µ e σ2u.
µ σ2u
Figura 2.6: Exemplos de densidades de probabilidades para a Normal-Truncada.
Fonte: adaptado de Kumbhakar et al. (2015).
Quanto maior for a média µ da distribuição Normal-Truncada, mais ui se afasta
de zero, ou seja, maior será o percentual de produtores com ineficiência econômica. Por
outro lado, quando se optar por utilizar a distribuição Half -Normal (µ = 0), a moda
será igual a zero e consequentemente, maior será o número de produtores totalmente
42
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 43
eficientes. A partir desse raciocínio, Kumbhakar et al. (2015) indicam o emprego da
Normal-Truncada para produtores do setor público ou recém-privatizados, historicamente
menos eficientes, e o emprego da Half -Normal para produtores pertencentes há mais
tempo ao setor privado, geralmente mais eficientes por pertencerem a mercados mais
competitivos.
A fim de exemplificar a aplicação do modelo de custo com fronteira estocástica
definido no conjunto de equações (2.26)-(2.31), seja considerar o caso simples de uma
função de custo translog com inputs e outputs únicos, como segue:
ln xi = β0 + β1 ln yi + β11 ln yi × ln yi + νi + ui. (2.32)
Seja também, considerar os seguintes parâmetros de entrada para esse exemplo:
n = 30 β0 = 0,40 β1 = 0,30 β11 = 0,20 ln yi = {0,05; 0,10; 0,15; . . . ; 2,00}
νi ∼
iid
N(0; 0,152) ui ∼
iid
N+(0; 0,302)
Os resultados obtidos para esta modelagem podem ser visualizados nas Figuras 2.7
e 2.8, apresentadas a seguir.
43
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 44
Figura 2.7: Densidades de probabilidades para o exemplo.
44
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 45
AB
C
D
Figura 2.8: Fronteira estocástica de custo e desvios para o exemplo.
Como pode ser observado nos resultados apresentados na Figura 2.7, o erro aleatório
νi é simétrico em torno de zero e, o erro associado à ineficiência econômica, ui, é
positivamente assimétrico. Consequentemente, o termo de erro composto i = νi + ui
possuirá assimetria à direita, seguindo uma distribuição Skew-Normal (Azzalini, 1985,
2013). A Figura 2.8 apresenta o resultado gráfico da fronteira estocástica de custo para
os 30 produtores em questão. Observa-se que os desvios em relação à fronteira são
causados tanto pela aleatoriedade quanto pela ineficiência econômica. Existem alguns
produtores que apresentam um grau de eficiência maior (mais próximos da fronteira), mas
também, existem outros tantos menos eficientes (mais afastados da fronteira). Também
é interessante ser observado que, “teoricamente” alguns produtores ultrapassaram a
fronteira, caracterizando-os como “mais do que eficientes”, o que não faz sentido na
prática. Isso se deveu única e exclusivamente à conjugação do ruído aleatório, ao qual
estão expostos e sobre o qual não tem controle, com a ineficiência econômica.
Seja, por exemplo, considerar no gráfico da Figura 2.8, os produtores representados
pelos ponto A, B, C e D. O produtor situado em A apresenta ineficiência econômica
(uA > 0) e encontra-se sob a influência de um ruído aleatório negativo (νA < 0). Logo, o
produtor A situa-se abaixo da fronteira de custo C(wi, yi,β), uma vez que νA + uA < 0.
45
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 46
O produtor B, mesmo apresentando ineficiência econômica (uB > 0), situa-se sobre a
fronteira de custo, pois sofre a influência do ruído aleatório negativo (νB < 0) e nesse
caso, como νB = −uB, então νB +uB = 0. O produtor C apresenta ineficiência econômica
(uC > 0) e está sob a influência de um ruído aleatório negativo menor que uC (uC > νC).
Logo, este produtor está acima da fronteira de custo, uma vez que νC + uC > 0, porém
foi beneficiado pelo ruído aleatório negativo. Já o produtor D apresenta ineficiência
econômica (uD > 0) e está sob influência de um ruído aleatório positivo (νD > 0). Assim,
como νD + uD > 0, este produtor situa-se acima da fronteira de custo e é penalizado um
pouco mais pela influência positiva do ruído aleatório.
A partir deste exemplo, pode-se concluir que diferentemente do que acontece no
DEA, no SFA não se pode medir a ineficiência econômica diretamente a partir da distância
do ponto à fronteira, uma vez que a componente aleatória νi pode exercer influência
também.
Como forma de ilustração, a Figura 2.9 a seguir, apresenta um resumo das fronteiras
de custo estimadas para os dados do exemplo, utilizando as técnicas OLS, COLS, DEA e
SFA.
Figura 2.9: Fronteiras de custo estimadas para o exemplo: OLS, COLS, DEA e SFA.
46
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 47
2.5.2.4 Enfoque Frequentista para a Estimação de e−ui
Seja agora, considerar um modelo de custo com fronteira estocástica baseado
em Aigner et al. (1977), onde a ineficiência econômica ui é modelada através de uma
distribuição de probabilidades Half -Normal, isto é,
lnEi = lnC(wi, yi,β) + i, (2.33)
lnEi = lnC(wi, yi,β) + νi + ui, (2.34)
νi ∼
iid
N(0, σ2ν), (2.35)
ui ∼
iid
N+(0, σ2u), (2.36)
ui e νi são independentes entre si, (2.37)
ui e νi são independentes de xi. (2.38)
As funções densidade de probabilidade em questão são dadas por (o subscrito i será
omitido):
f(ν) = 1√
2piσν
exp
(
− ν
2
2σ2ν
)
, para −∞ < ν <∞, (2.39)
f(u) = 2√
2piσu
exp
(
− u
2
2σ2u
)
, para u > 0. (2.40)
Considerando a suposição de independência entre νi e ui, dada em (2.37), pode-se
determinar a função densidade de probabilidade conjunta f(ν, u) da seguinte maneira:
f(ν, u) = f(ν) · f(u),
= 22piσνσu
exp
(
− ν
2
2σ2ν
− u
2
2σ2u
)
, para −∞ < ν <∞ e u > 0. (2.41)
Uma vez que  = ν + u, a função densidade de probabilidade conjunta f(, u) pode ser
obtida da equação anterior, resultando em:
f(, u) = 22piσνσu
exp
[
−(− u)
2
2σ2ν
− u
2
2σ2u
]
, para −∞ <  <∞ e u > 0. (2.42)
47
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 48
A função densidade de probabilidade marginal f() pode ser obtida, integrando-se
a função f(, u) dada em (2.42), isto é:
f() =
∫ ∞
0
f(, u)du =
∫ ∞
0
fν(− u) · fu(u)du
=
∫ ∞
0
2
2piσνσu
exp
[
−(− u)
2
2σ2ν
− u
2
2σ2u
]
du
= 2
σ
φ
(

σ
)
Φ
(
λ

σ
)
, para −∞ <  <∞, (2.43)
onde σ =
√
σ2u + σ2ν é conhecido como parâmetro de escala, λ = σuσν representa o parâmetro
de forma, φ(·) é a função densidade de probabilidades normal padrão e, Φ(·) é a função
de distribuição de probabilidades acumuladas normal padrão. Maiores detalhes desse
cálculo podem ser encontrados na seção A.1 do Apêndice A.
De acordo com Kumbhakar e Lovell (2003), essa reparametrização para σ e λ,
proposta por Battese e Corra (1977), é interessante pois, pode-se obter uma indicação
das contribuições individuais de u e ν para . Se λ→ +∞, ou σ2u → +∞ ou σ2ν → 0, e
com isso, o erro composto  é dominado pelo componente de erro assimétrico u. Caso
contrário, se λ→ 0, ou σ2u → 0 ou σ2ν → +∞, o que faz o erro composto  ser dominado
pelo componente de erro simétrico ν.
A função densidade de probabilidade f() dada em 2.43 é assimétrica, sendo um
caso particular da distribuição Skew-Normal (Azzalini, 1985, 2013). Sua média e variância
são dadas por:
E() = E(ν + u) = E(ν) + E(u) = σu
√
2
pi
,
V () = V (ν + u) = V (ν) + V (u) = pi − 2
pi
σ2u + σ2ν . (2.44)
Sabendo-se que i = Ei − C(wi, yi,β), que os i são independentes entre si e,
utilizando a função densidade de probabilidade f() dada na equação (2.43), obtém-se a
seguinte função de log-verossimilhança para uma amostra com I produtores independentes
entre si:
48
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 49
lnL(1, 2, . . . , I ; β, λ, σ2) = ln[f(1; β, λ, σ2) · f(2; β, λ, σ2) · . . . · f(I ; β, λ, σ2)]
= ln
∏
i
f(i; β, λ, σ2)
= ln
∏
i
2
σ
φ
(
i
σ
)
Φ
(
λ
i
σ
)
=
∑
i
ln 2
σ
φ
(
i
σ
)
Φ
(
λ
i
σ
)
=
∑
i
{
ln2− ln σ + ln
[
φ
(
i
σ
)]
+ ln
[
Φ
(
λ
i
σ
)]}
= ∝ −I ln σ +∑
i
ln
[
φ
(
i
σ
)]
+
∑
i
ln
[
Φ
(
λ
i
σ
)]
. (2.45)
Derivando essa expressão e igualando as derivadas parciais a zero, obtém-se os estimadores
de máxima verossimilhança para σ2, λ e β, isto é, σˆ2, λˆ e βˆ.
As estimativas para σ2u e σ2ν podem ser obtidas a partir da resolução do seguinte
sistema linear:
 σˆ =
√
σˆ2u + σˆ2ν
λˆ = σˆu
σˆν
.
(2.46)
O que resulta em:
σˆ2u =
λˆ2
(1 + λˆ2)
σˆ2,
σˆ2ν =
1
(1 + λˆ2)
σˆ2. (2.47)
O estimador σˆ2u pode ser interpretado como a ineficiência econômica média dos
produtores, sendo denominado média incondicional de ui. Observe que σˆ2u 6= σˆ2ui . Uma
outra estatística de teste para a hipótese de ausência de ineficiência econômica nos dados
é proposta por Llorca et al. (2014):
49
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 50
γ = σ
2
u
σ2u + σ2ν
= λ
2
1 + λ2 . (2.48)
No entanto, apesar da semelhança desta expressão com a do coeficiente de determição
R2 de um modelo de regressão, Kumbhakar et al. (2015) alertam que são conceitos bem
diferentes. Logo, γ não deve ser interpretada como a proporção de variação atribuída à
ineficiência econômica, uma vez que σˆ2u 6= σˆ2ui .
Como o principal objetivo do modelo de custo com fronteira estocástica dado
em (2.33)-(2.38) é permitir o cálculo das (in)eficiências individuais, torna-se necessário
calcular os valores de uˆi e e−uˆi .
A solução, proposta por Jondrow et al. (1982), consiste em estimar ui a partir do
valor esperado de ui condicional ao erro composto do modelo, i = νi + ui. Para isso,
primeiro torna-se necessária a definição da função de probabilidade condicional f(u|),
conforme se segue (o subscrito i será omitido):
f(u|) = f(u, )
f()
= 1√
2piσ∗ · Φ
(
µ∗
σ∗
)exp[−12
(
u− µ∗
σ∗
)2]
, para u > 0, (2.49)
onde u| ∼ N+(µ∗, σ2∗), com µ∗ = σ
2
u
σ2 e σ
2
∗ =
σ2νσ
2
u
σ2 . Logo,
uˆi = E(ui|i)
=
∫ ∞
0
u · f(u|)du
=
∫ ∞
0
u√
2piσ∗ · Φ
(
µ∗
σ∗
)exp[−12
(
u− µ∗
σ∗
)2]
du
= µ∗i +
φ
(
µ∗i
σ∗
)
Φ
(
µ∗i
σ∗
)σ∗. (2.50)
Os detalhes desse cálculo estão disponíveis na seção A.2 do Apêndice A. Outra
alternativa também sugerida por Jondrow et al. (1982) diz que o estimador uˆi pode ser
obtido a partir da moda de f(u|), isto é,
50
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 51
uˆi = M(ui|i)
=
 µ∗i, se i ≥ 00, caso contrário. (2.51)
Por fim, a estimativa pontual para a eficiência econômica do i-ésimo produtor pode
ser mensurada a partir de:
EEi = e−uˆi . (2.52)
Battese e Coelli (1988) propuseram outra alternativa para estimar a eficiência
econômica do i-ésimo produtor:
EEi = E(e−ui |i)
= exp
(
−µ∗ + 12σ
2
∗
)
· Φ
(
µ∗
σ∗ − σ∗
)
Φ
(
µ∗
σ∗
) . (2.53)
Os detalhes desse cálculo também estão disponíveis na seção A.3 do Apêndice A.
Uma vez que E[e−ui |i] 6= e−E(ui|i), observa-se que as estimativas dadas pelas
equações (2.52) e (2.53) podem dar resultados diferentes. Entretanto, de acordo com
Kumbhakar e Lovell (2003), o uso do estimador uˆi produz estimativas não tendenciosas
(E(uˆi) = ui) para a eficiência econômica, porém inconsistentes em ambos casos, isto
é, mesmo se aumentando o tamanho da amostra de produtores, a probabilidade de a
estimativa estar próxima do valor verdadeiro do parâmetro da população é pequena.
Do ponto de vista computacional, segundo Veronese (2015), para estimar os parâ-
metros do modelo de custo com fronteira estocástica, é comum a utilização de algoritmos
recursivos que tenham como objetivo maximizar a log-verossimilhança dessas funções.
Assim, o algoritmo de Newton-Raphson e suas variantes, como é o caso do método
de Broyden-Fletcher-Goldfarb-Shanno (BFGS) (ver Nocedal e Wright (2006)), são os
mais empregados para estimação em modelos de erro composto, a partir da máxima
verossimilhança, como é o caso do modelo SFA. Considerando um vetor Θ = [λ, σ2,β] de
51
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 52
parâmetros do SFA a serem estimados, a equação (2.54) a seguir, representa o conjunto
de iterações s desse algoritmo:
Θs+1 = Θs −
[
∂2l(Θs)
∂Θ2
]−1
∂l(Θs)
∂Θ , (2.54)
onde l(Θ) é a função log-verossimilhança de erro composto. Porém, o algoritmo requer
condições de inicialização, isto é, requer um vetor Θ0 = [λ0, (σ2)0,β0] de valores iniciais
para ser executado. Geralmente, essa situação é resolvida, considerando-se que (σ2)0 e
β0 são aqueles resultantes da regressão OLS, fixando λ = 0. Já para λ0, Bogetoft e Otto
(2011) propõem considerar λ0 = 1.
Apesar das boas propriedades da distribuição Skew-Normal, Sartori (2006) e Azzalini
(2013) chamam a atenção para o fato de a estimativa de máxima verossimilhança para o
parâmetro λ poder se tornar infinita, com probabilidade positiva. E isso não é bom, uma
vez que λ é um parâmetro crítico para estimar a (in)eficiência econômica dos produtores.
Se λ −→∞, então u domina o erro composto e as ineficiências estimadas tendem a 100%.
Veronese (2015) identificou esse problema utilizando o banco de dados do SBDEE.
Uma segunda preocupação diz respeito à possibilidade de existência de heterocedas-
ticidade nos erros νi e ui, isto é, estes podem possuir variâncias σ2ν e σ2u não constantes.
Isso compromete a estimativa das (in)eficiências econômicas do produtor. Exemplos de
situações onde esse fato acontece, bem como métodos de solução para o problema podem
ser encontrados nos trabalhos de Caudill e Ford (1993) e Hadri (1999).
2.5.2.5 Enfoque Bayesiano para a Estimação de e−ui
Como dito anteriormente, as metodologias mais usuais de benchmarking (DEA,
COLS, SFA e StoNED) apresentam dificuldades quando lidam com amostras consideradas
pequenas, ou quando outliers se fazem presentes na base de dados, ou ainda quando os
produtores sob análise não operam sob as mesmas condições tecnológicas de produção e
de custo. Especificamente no caso do SFA, ainda existem os já relatados problemas de
convergência de estimação.
Frente a esses agravantes, uma metodologia baseada no método Bayesiano vem se
mostrando eficaz para a estimação de fronteiras de eficiência, sem incorrer nos problemas
das outras técnicas. Trata-se do Bayesian Stochastic Frontier Analysis (BSFA), cujo
trabalho seminal foi proposto por van den Broeck et al. (1994).
52
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 53
O BSFA apresenta a vantagem de incorporar informações existentes a priori, isto
é, conhecimentos, resultados ou particularidades prévias dos produtores podem ser
incorporadas aos parâmetros do modelo atual (prioris informativas). Todas as inferências
seguem o princípio de Bayes, e são combinadas com a informação oriunda dos dados
(função de verossimilhança), tornando o método altamente confiável. Qualquer tamanho
amostral pode ser considerado, independentemente deste ser pequeno ou grande, isto é, as
estimações são imparciais em relação ao tamanho amostral (Chen et al., 2015). Fato esse
que pode ser considerado um contraste em relação à inferência frequentista, que se torna
mais tendenciosa à medida que o tamanho da amostra diminui do infinito. Além disso,
o BSFA atende bem às situações que envolvem heterogeneidade e está mais próximo
da realidade, garantindo assim que a eficiência seja corretamente estimada (Chen et al.,
2015). E por fim, segundo Souza et al. (2007), a incerteza na distribuição de ui associado
à ineficiência dos produtores e a incerteza sobre qual função de custo C(wi, yi, β) utilizar
suportam o emprego de técnicas Bayesianas.
A abordagem Bayesiana para estimação de um vetor ψ de parâmetros utiliza uma
distribuição a priori para ψ, f(ψ), e uma distribuição de probabilidades da amostra (dis-
tribuição amostral ou função de verossimilhança), f(E1, E2, . . . , EI |ψ), para determinar
a distribuição a posteriori para ψ, isto é, f(ψ|E1, E2, . . . , EI). Assim, essa distribuição
a posteriori de ψ contém informações provenientes tanto da amostra como dos conhe-
cimentos prévios (priori). Para realizar inferência sobre ψ dado E = {E1, E2, . . . , EI},
torna-se necessário especificar a seguinte distribuição de probabilidades conjuntas:
f(E,ψ) = f(E|ψ) · f(ψ). (2.55)
Em seguida, após observar E, faz-se uso do Teorema de Bayes para se determinar
a distribuição a posteriori:
f(ψ|E) = f(E,ψ)
f(E)
= f(E|ψ)f(ψ)∫
ψ f(ψ,E)dψ
= f(E|ψ)f(ψ)∫
ψ f(E|ψ)f(ψ)dψ
= L(E|ψ) · f(ψ)
f(E) . (2.56)
53
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 54
A partir desse último resultado, pode-se observar que:
f(ψ|E) ∝ L(E|ψ) · f(ψ), (2.57)
ou seja, a distribuição a posteriori é proporcional à distribuição amostral (verossimilhança)
multiplicada pela distribuição a priori. Quando a priori é fracamente informativa2, essa
proporcionalidade é dominada pela função de verossimilhança, principalmente nos casos
de amostras grandes. Esta última associa a cada valor de ψ o valor f(E|ψ). Portanto,
ao fixar um valor para E e variar os valores de ψ, pode ser observada a plausabilidade
de cada um dos valores de ψ.
A distribuição a posteriori resume todas as informações disponíveis sobre o vetor ψ
de parâmetros, condicional aos dados observados. Além disso, a abordagem Bayesiana para
a estimação de parâmetros permite revisar a priori com novas informações, aperfeiçoando
o conhecimento a posteriori. O estimador pontual Bayesiano de ψ pode ser definido como
o valor médio da distribuição a posteriori, isto é,
ψˆ = E[ψ|E] =
∫
ψ
ψf(ψ|E)dψ. (2.58)
Infelizmente, na maioria das vezes o cálculo desta última integral é intratável
analiticamente. De acordo com Souza (2008), esse fato atrasou por muito tempo o
desenvolvimento de modelos Bayesianos. Somente nas últimas três décadas, com a evolução
da simulação computacional, é que este cenário se reverteu. Devido à complexidade, os
modelos Bayesianos necessitam na maioria das vezes, do suporte de métodos de simulação,
tais como aqueles que usam o procedimento conhecido como Markov Chain Monte Carlo
(MCMC)3. Dentre estes, van den Broeck et al. (1994) empregaram métodos de Monte
Carlo via função de importância, e Koop et al. (1995) investigaram a utilização do
Amostrador de Gibbs para a realização de inferências sobre a distribuição a posteriori,
concluindo que o mesmo pode ser considerado como uma técnica numérica eficiente.
Ainda segundo Souza (2008), esses dois trabalhos serviram de base para diversos outros
estudos envolvendo fronteiras estocásticas e métodos de simulação. Osiewalski e Steel
(1998) trazem um estudo com descrição detalhada sobre esses métodos numéricos de
simulação.
2Quando o pesquisador acredita que a informação disponível a priori é pouca ou pobre.
3Uma síntese das principais ideias deste procedimento é apresentada no Apêndice B.
54
2.5. ESTIMAÇÃO DA FRONTEIRA ESTOCÁSTICA DE CUSTO 55
Para exemplificar a abordagem Bayesiana para um modelo de custo com fronteira
estocástica (BSFA), seja considerar o seguinte modelo já apresentado anteriormente:
lnEi = C(wi, yi,β) + νi + ui. (2.59)
A formulação se inicia com a especificação das distribuições de probabilidade a
priori para os parâmetros do modelo. Por exemplo, seja considerar as seguintes opções:
βk ∼
iid
N+(0, σ2β), νi ∼
iid
N(0, σ2ν), ui ∼
iid
Γ(1, τ > 0), 1
σ2
∼ Γ(a > 0, b > 0), τ ∼ Γ[1,−log(r∗)],
sendo Γ(·) a função densidade de probabilidades Gama de dois parâmetros e r∗ =
mediana da distribuição a priori da eficiência, tal que 0 < r∗ < 1. Como há interesse em
se fazer inferências sobre e−ui dos produtores, a distribuição de Ei e ui, dado o vetor de
parâmetros ψ = (βT , σ2ν , τ), é dada por:
f(Ei, ui|ψ) = N(Ei|C(wi, yi,β) + ui, σ2ν) · Exponencial(ui|τ). (2.60)
Uma vez que,
f(ui|Ei,ψ) = f(Ei, ui|ψ)
f(Ei|ψ) =
f(Ei, ui|ψ)∫∞
0 f(Ei, ui|ψ)dui
, (2.61)
pode-se escrever a seguinte distribuição de probabilidades a posteriori para ui:
f(ui|Ei,ψ) =
Φ
C(wi, yi,β)− Ei − σ2ντ
σν
−1 ·N (ui|C(wi, yi,β)− Ei − σ2ν
τ
, σ2ν
)
.
(2.62)
Assim, como a distribuição condicional a posteriori para ui é agora conhecida, e
segundo Souza et al. (2007), é a mesma obtida por Jondrow et al. (1982), pode-se utilizar
o Amostrador de Gibbs para gerar observações de ui. Logo, as (in)eficiências econômicas
dos produtores podem ser assim estimadas.
Como viés e ponto de preocupação com relação ao MCMC, é necessária uma
monitoração fina da convergência dos parâmetros do modelo, isto é, após a simulação ser
realizada, é crucial verificar a convergência das sequências simuladas. Cowles e Carlin
(1996) apresentam alguns métodos propostos na literatura que permitem fazer essa
55
2.6. INCORPORAÇÃO DE VARIÁVEIS EXÓGENAS AO SFA 56
monitoração, sendo o mais simples e usual dentre eles, aquele que constrói um gráfico de
autocorrelação amostral, onde se espera um decaimento rápido dos valores plotados à
medida que se avança no eixo dos lags. Caso isso não aconteça, fato muito comum devido
à natureza Markoviana das amostras, alternativas de correção4 são apresentadas em Gilks
e Roberts (1996), tais como: reparametrização, thinning, cadeias paralelas, aumento do
número de iterações e burn-in.
De acordo com Dorfman e Koop (2005), os métodos econométricos que se baseiam
em técnicas Bayesianas vêm sendo utilizados em maior escala ultimamente, em modelos
que possuem vetores de grande dimensão, graças aos avanços do poder computacional
nas últimas décadas e ao desenvolvimento de simuladores que aproveitam esse poder,
como é o caso do MCMC. E devido ao fato dos modelos de SFA, muito comumente, se
enquadrarem nesse contexto de grandes dimensões, há um aumento da motivação e uma
crescente popularidade dos métodos Bayesianos na análise eficiência.
Apesar dessa recente popularidade, infelizmente, segundo Souza et al. (2010b), são
poucos os estudos com enfoque Bayesiano aplicados ao setor de regulação energética
brasileira. Nesse sentido, destacam-se os trabalhos de Souza et al. (2007), Souza (2008) e
Souza et al. (2010b), muito embora os autores afirmarem que esses estudos têm abertura
para melhorias e aprofundamentos na abordagem empregada.
2.6 Incorporação de Variáveis Exógenas ao SFA
Até o presente momento, foram apresentadas características dos modelos de estima-
ção para a fronteira estocástica de custo, levando-se em consideração que a (in)eficiência
econômica do produtor é determinada pelos inputs utilizados, pela tecnologia produtiva
em questão e pelos outputs obtidos. Porém, em alguns cenários, existem variáveis ambien-
tais ou exógenas ao contexto produtivo que podem exercer tanta ou até maior influência.
São exemplos de variáveis exógenas: a competitividade do mercado, a estrutura gerencial,
a cadeia de abastecimento e algumas variáveis ambientais. Mais especificamente, para o
cenário de distribuição energética, Gil et al. (2017) elencam algumas possibilidades de
variáveis exógenas: índice de precipitação pluviométrica, incidência de raios, altura da
vegetação sob/sobre a rede elétrica, declividade do terreno, grau de pavimentação das
estradas, duração média da interrupção de energia (DIE), frequência de interrupção de
energia (FIE), área de concessão, entre outras.
4Alguns desses conceitos são apresentados no Apêndice B.
56
2.6. INCORPORAÇÃO DE VARIÁVEIS EXÓGENAS AO SFA 57
Além disso, Gil et al. (2017) propuseram uma nova variável, denominada e.variable,
que é uma combinação linear das variáveis ambientais disponíveis. A variável e.variable é
a variável mais correlacionada linearmente com as atuais eficiências das DSOs brasileiras,
estimadas pelo regulador.
2.6.1 Contextualização para o SBDEE
Em países que possuem dimensões continentais, como é o caso do Brasil, é grande
a diversidade geográfica e climática. Haja vista, por exemplo, as várias diferenças entre
as cinco regiões brasileiras: uma região norte muito úmida, com índices pluviométricos
altíssimos, contrastando com uma região nordeste de clima semi-árido, onde a chuva
ocorre raramente ou nunca ocorre. Também, pode-se citar as diferenças na infra-estrutura
econômica e social entre as várias regiões: o sul e sudeste mais bem servidos nesse quesito,
enquanto muitas cidades das demais regiões são desprovidas de uma infraestrutura
mínima. Pode-se citar também, os vários biomas espalhados pelo país: regiões com
florestas densas ao norte, vegetação de caatinga no nordeste, pantanal mais ao centro-
oeste, mata atlântica e cerrado no sudeste e pampa ao sul. Isso sem falar na grandiosidade
territorial: muitos dos 27 estados brasileiros são maiores que muitos países do mundo.
Assim, ao se proceder com estudos de benchmarking, como é o caso do SFA,
essas diferenças regionais contribuem para que o processo produtivo seja influenciado
não somente por variáveis inerentes ao mesmo, mas também por variáveis exógenas.
Por exemplo, considerando o SBDEE, é de se esperar que a variável exógena índice
pluviométrico seja significativa para explicar a diferença entre os escores de eficiência de
duas concessionárias situadas, respectivamente, uma em região úmida e outra em região
do semi-árido nordestino.
Em congruência, os escores de eficiência também podem ser atualizados por essas
variáveis exógenas, uma vez que, no geral, produtores localizados em um ambiente de
variáveis exógenas favoráveis devem ter seus escores de eficiência diminuídos, pois o
ambiente contribui parcialmente para um maior escore de eficiência. Enquanto que
aqueles produtores, localizados em um ambiente de variáveis exógenas não tão favoráveis,
devem ter seus escores de eficiência aumentados, pois esse ambiente desfavorável impede
que os produtores obtenham maiores escores de eficiência. Além disso, produtores que se
encontram geograficamente mais próximos podem estar sujeitos às mesmas influências
exógenas, permitindo a configuração de clusters.
Especificamente, no caso da regulação tarifária energética brasileira, estudos recentes
57
2.6. INCORPORAÇÃO DE VARIÁVEIS EXÓGENAS AO SFA 58
de Veronese et al. (2018) e Gil et al. (2017) demonstram a significância de variáveis
exógenas para a estimação dos escores de eficiência, via DEA, das várias concessionárias de
distribuição, espalhadas pelo país. Utilizando conceitos de estatística espacial, os autores
discorrem sobre as várias possibilidades de influência dessas variáveis exógenas e mensuram
seu índice de correlação com os escores de eficiência das distribuidoras, encontrando
resultados com alta significância. Também compararam os escores de eficiência calculados
pelo regulador com os escores obtidos a partir da incorporação de variáveis exógenas. Os
resultados demonstram diferenças paupáveis entre esses escores, além de concluírem que
as DSOs localizadas no norte do Brasil podem ter suas eficiências de custo aumentadas
usando informações ambientais.
No caso do SFA, existe uma variedade de estudos na literatura concebidos com o
intuito de incluir variáveis exógenas ao SFA. Podem-se destacar os trabalhos pioneiros de
Deprins e Simar (1989b,a), Kumbhakar et al. (1991), Reifschneider e Stevenson (1991),
Huang e Liu (1994) e Battese e Coelli (1995), além de trabalhos mais recentes como os
de Alvarez et al. (2006) e Llorca et al. (2016). Os estudos de Kumbhakar et al. (1991) e
Reifschneider e Stevenson (1991) são os mais disseminados, sendo por isso, descritos a
seguir.
2.6.2 Modelo Proposto por Kumbhakar et al. (1991)
Kumbhakar et al. (1991) apresentaram o seguinte modelo para a fronteira estocástica
de custo, com inserção de variáveis exógenas:
lnEi = lnC(wi, yi,β) + νi + ui, (2.63)
ui = ziδ + ζi, com ui ≥ 0 (2.64)
lnEi = lnC(wi, yi,β) + νi + (ziδ + ζi), (2.65)
onde, Ei é o custo observado para o i-ésimo produtor, lnC(wi, yi,β) + νi representa
a fronteira estocástica de custo, νi e ui continuam representando os termos que visam
capturar, respectivamente, os efeitos da aleatoriedade sobre o processo produtivo e
da ineficiência econômica. A novidade reside na introdução do vetor zi de variáveis
exógenas com seus respectivos coeficientes δ, que podem ter influência sobre a ineficiência
econômica (ui está parametrizado linearmente em função de zi). Por fim, o termo ζi
representa um componente de erro aleatório associado a ui, entretanto não é levado em
58
2.6. INCORPORAÇÃO DE VARIÁVEIS EXÓGENAS AO SFA 59
consideração nessa modelagem. Os comportamentos probabilísticos destes componentes
de erro são dados por:
νi ∼
iid
N(0, σ2ν), (2.66)
ui ∼ N+(ziδ, σ2u), (2.67)
ui e νi são independentes entre si, (2.68)
(2.69)
Segundo Kumbhakar e Lovell (2003), pode-se observar a partir de (2.67) que: (i) -
as ineficiências ui não são identicamente distribuídas; (ii) - se zi1 = 1, zi2 = 0, . . . , ziZ = 0
e δ1 = constante, δ2 = 0, . . . , δZ = 0, o modelo (2.64)-(2.66) reduz-se ao modelo de
Stevenson (1980), dado em (2.26)-(2.31), com ui seguindo uma distribuição Normal-
Truncada de média δ1. E, se inclusive, δ1 = 0, o modelo de reduz ao proposto por Aigner
et al. (1977), baseado na distribuição Half-Normal; e, (iii) - a suposição de que a média
de ui é ziδ faz com que cada observação i tenha uma média específica, sendo por isso,
uma modelagem mais flexível que o modelo de Stevenson (1980), que considera média µ
fixa para todas as observações (Kumbhakar e Lovell, 2003). Os parâmetros do modelo
dado em (2.63)-(2.65) podem ser estimados, permitindo assim, obter as estimativas para
as (in)eficiências econômicas.
2.6.3 Modelo Proposto por Reifschneider e Stevenson (1991)
Uma alternativa ao modelo de Kumbhakar et al. (1991) é apresentada por Reifsch-
neider e Stevenson (1991). Nesta, a estrutura geral para o modelo de fronterira estocástica
para o custo é dada por:
lnEi = lnC(wi, yi,β) + νi + ui, (2.70)
ui = g(zi; δ) + ζi, com ui ≥ 0, g(zi; δ) ≥ 0, ζi ≥ 0 (2.71)
lnEi = lnC(wi, yi,β) + g(zi; δ) + νi + ζi, (2.72)
onde ui = g(zi; δ)+ζi, representando a eficiência econômica ajustada. Os comportamentos
probabilísticos são dados por:
59
2.6. INCORPORAÇÃO DE VARIÁVEIS EXÓGENAS AO SFA 60
νi ∼
iid
N(0, σ2ν), (2.73)
ζi ∼
iid
N+(0, σ2ζ ). (2.74)
Com isso, as seguintes observações podem ser feitas: (i) - os procedimentos de
estimação seguem a mesma lógica do modelo de Kumbhakar et al. (1991), com as devidas
alterações necessárias; (ii) - a vantagem desse modelo reside na consideração do termo
aleatório da ineficiência econômica, ζi, desprezado por Kumbhakar et al. (1991); e, (ii) -
em (2.71), se ζi ≥ 0, então ui ≥ g(zi; δ), ou seja, g(zi; δ) pode ser interpretada como uma
fronteira determinística para a ineficiência econômica, em um ambiente caracterizado
pela influência de variáveis exógenas zi.
2.6.4 Lidando com Produtos Indesejados
De acordo com Kumbhakar et al. (2015), em geral, se um produtor é totalmente
eficiente economicamente, então uma redução na saída de um produto indesejado só é
possível se a saída de produtos desejáveis também for reduzida. Porém, essa propriedade
de monotocidade não é sempre satisfeita em modelos nos quais a mesma tecnologia de
produção é empregada para produzir tanto saídas boas quanto ruins em conjunto.
Segundo esses autores, não há um consenso a respeito de como lidar com a questão.
A princípio, tentou-se modelar esses produtos como insumos, porém segundo Färe et al.
(2005), essa tentativa retornaria um conjunto de resultados ilimitado, o que é fisicamente
impossível, caso os insumos tradicionais fossem utilizados. Outra abordagem busca
separar as saídas desejáveis das indesejáveis e, a partir disso, utilizar o modelo de fonteira
estocástica para cada tecnologia. Assim, consegue-se separar a eficiência econômica da
eficiência ambiental. Todavia, segundo Atkinson e Dorfman (2005), essa separação não é
muito consistente com os resultados empíricos. Alguns trabalhos nessa linha podem ser
encontrados em Forsund (2009) e Kumbhakar e Tsionas (2013).
2.6.5 Considerações Gerais
Segundo a Cambridge Economic Policy Associates (CEPA (2013)) , uma instituição
internacional ligada à regulação econômica de serviços públicos, alguns critérios para
avaliação do processo de benchmarking devem ser considerados. Dentre eles, destacam-
se: praticidade de aplicação, robustez da metodologia, transparência e verificabilidade,
60
2.7. SÍNTESE DA ESPECIFICAÇÃO DE UM MODELO DE SFA 61
captura de fatores específicos do setor, mínima restrição ao formato da fronteira, con-
sistência com outras abordagens e com a teoria econômica. Logo, a consideração de
variáveis exógenas no processo de obtenção dos escores de eficiência vai ao encontro do
critério de captura dos fatores específicos do setor. Consoante à essa ideia, Nieswand e
Seifert (2018) alertam que as estimativas de fronteiras de custos precisam incorporar
condições operacionais quando elas afetam as possibilidades de produção. Caso contrário,
as estimativas de eficiência não têm sentido.
No entanto, apesar de muitas serem as orientações e sugestões sobre a importância
de se considerar a influência de variáveis exógenas, no 4CRTP, a ANEEL decidiu não
promover nenhum ajuste dos escores de eficiência nesse sentido, contrariando a prática de
agentes reguladores mais maduros. Lopes et al. (2016) apresentam críticas construtivas
quanto a essa postura e sugerem que o regulador deve repensar sua metodologia.
Ao se identificar a magnitude dos efeitos das variáveis exógenas sobre os escores de
eficiência, o produtor pode tomar decisões e adotar políticas que minimizem os efeitos
negativos dessas variáveis. Outro bônus apontado na literatura é a possibilidade de poder
identificar variáveis faltantes no modelo.
Todavia, no caso da ANEEL, vale destacar o argumento apresentado por Lopes
et al. (2016), afirmando que as variáveis exógenas e endógenas tem alta dispersão, ou seja,
as diferenças nessas variáveis, de acordo com as várias regiões atendidas pelas DSOs, são
bem significativas. Logo, pode-se perceber que, além das diferenças operacionais, essas
diferenças ameaçam a premissa básica da metodologia DEA empregada pelo regulador,
de que as DMUs devem ser comparáveis em relação aos seus inputs e outputs.
2.7 Síntese da Especificação de um Modelo de SFA
Até aqui, foram apresentadas definições e discussões sobre alguns dos mais im-
portantes modelos de SFA. Logo, antes de dar prosseguimento às demais ideias deste
trabalho, julga-se válido fazer uma síntese da especificação geral para estes modelos,
conforme a seguir.
O modelo SFA deve ser capaz de explicar o comportamento estocástico das fronteiras
de produção ou de custo, com consequente avaliação das eficiências apresentadas pelos
produtores, levando-se em consideração: (i) a função determinística de produção ou de
custo, comum a todos os produtores; (ii) os efeitos dos choques aleatórios que afetam
especificamente o i-ésimo produtor; e, (iii) os efeitos gerados pelas ineficiências técnica
61
2.7. SÍNTESE DA ESPECIFICAÇÃO DE UM MODELO DE SFA 62
ou alocativa do i-ésimo produtor. Sendo assim, é de extrema importância observar como
se dá a especificação de cada uma dessas considerações. Com esse propósito, a seguir,
listam-se algumas premissas básicas.
Existem várias formas funcionais para as funções de produção e de custo. Algumas
são mais simples, como é o caso da Cobb-Douglas, outras mais sistêmicas e flexíveis,
como é o caso da Translog. A forma a ser escolhida tem impacto direto nos resultados
almejados. Por isso, é aconselhável fazer um estudo prévio do problema que se pretende
modelar e de quais formas funcionais melhor se adequam à situação em questão.
Deixar de considerar a influência dos choques aleatórios inerentes ao processo,
sobre o desempenho do produtor, é assumir que todo e qualquer desvio em relação à
fronteira de produção ou de custo, se deve única e exclusivamente às ineficiências técnicas
e/ou alocativas. Premissa essa, pouco provável. Assim, ao se atribuir um termo que
capture os choques aleatórios, consegue-se modelar a realidade de maneira mais verossímil.
Além disso, a atribuição de um comportamento probabilístico simétrico, centrado em
zero, homocedástico, permite que tanto influências favoráveis quanto desfavoráveis sejam
igualmente prováveis.
Com relação aos efeitos gerados pelas ineficiências técnicas e/ou alocativas, sabe-
se que estes devem assumir valores não-negativos. Logo, é aconselhável a escolha de
distribuições positivas, como por exemplo, a Normal-Truncada, a Half -Normal ou a
Exponencial. Algumas delas vão permitir um maior número de produtores com escores
maiores de eficiência e, outras vão dificultar essa situação. A escolha deve-se basear sempre
na premisa de maior aderência aos dados, levando-se também em conta o princípio da
parcimônia. Também, deve-se garantir a homocedasticidade desses efeitos.
O termo composto pelos erros aleatórios e pelos erros de ineficiência terá comporta-
mento com assimetria à esquerda no caso dos modelos de produção e, comportamento
com assimetria à direita para os modelos de custo. Além disso, possuem, em ambos os
casos, médias não-nulas. A partir deste erro composto, é possível montar toda a estrutura
de estimação dos parâmetros do modelo em questão. Geralmente, opta-se pela estimação
via máxima verossimilhança. Suposições erradas, podem destruir toda a estrutura de
estimação e inflacionar os escores de (in)eficiência do produtor.
No entanto, o SFA tem grandes problemas de estimativa estatística, como problemas
de convergência para pequenas amostras, conforme relatado por Azzalini (2013) e Sartori
(2006). Os problemas de convergência podem ser superados usando uma abordagem
Bayesiana (BSFA) (Bayes e Branco, 2007). No entanto, os modelos de BSFA tendem a
62
2.7. SÍNTESE DA ESPECIFICAÇÃO DE UM MODELO DE SFA 63
ser complexos, exigindo o apoio de métodos de simulação computacional, tais como o
Markov Chain Monte Carlo (van den Broeck et al., 1994).
Por fim, é perceptível na literatura de SFA, um maior avanço nos estudos de
métodos paramétricos para estimação das fronteiras de produção e de custo, tanto em
profundidade quanto em extensão. Isso se deve, em grande parte, à capacidade dos
modelos paramétricos de se aproximarem mais da realidade dos produtores, absorvendo
e incorporando elementos antes desprezados pelos métodos não-paramétricos, como é o
caso, por exemplo, da influência de eventos aleatórios na produção. E um desses avanços
diz respeito à icorporação de variáveis exógenas ou ambientais ao modelo de SFA. Essas
variáveis são externas ao processo produtivo, mas podem exercer influência sobre a
(in)eficiência técnica do produtor.
De uma maneira geral, as considerações feitas acima, constituem uma síntese
estrutural para os modelos de SFA, a fim de que os mesmos sejam bem definidos e possam
alcançar seus objetivos. Todavia, isso não impede que adaptações possam ser feitas
ou melhorias possam ser sugeridas, como as que são propostas e expostas no próximo
capítulo desse trabalho.
63

C
a
p
ít
u
l
o 3
Parametrizações e Modelagens Propostas para o
SFA
Nesse terceiro capítulo, são apresentadas as propostas de parametrizações alterna-tivas e sete modelagens para o SFA de custo, todas com abordagem Bayesiana.Também, são apresentadas algumas características da base de dados utilizada.
3.1 Preliminares
Como foi discutido nos capítulos anteriores, as metodologias mais usuais de ben-
chmarking (DEA, COLS e SFA) apresentam dificuldades quando lidam com amostras
consideradas pequenas, ou quando outliers se fazem presentes na base de dados, ou ainda
quando as distribuidoras sob análise não operam sob as mesmas condições tecnológicas
de produção e de custo. Especificamente no caso do SFA, ainda existem os já relatados
problemas de convergência de estimação.
Entretanto, algumas alternativas às parametrizações clássicas do modelo SFA são
apresentadas na literatura, visando dar robustez à metodologia. Dentre elas, podem-se
citar: Sartori (2006) propõe um estimador para corrigir o viés de forma, denominado fator
M ; Liseo e Loperfido (2006) propõem um modelo de inferência Bayesiana; Bayes e Branco
(2007) propõem uma aproximação para o fator M e um modelo alternativo de inferência
Bayesiana; Griffin e Steel (2007) primeiro aplicaram um modelo de SFA robusto utilizando
uma distribuição t-Student para o componente de ruído e, em seguida, os parâmetros
65
3.2. PROPOSTA DE PARAMETRIZAÇÕES PARA O SFA 66
do SFA foram estimados utilizando uma abordagem Bayesiana; recentemente, Stead
et al. (2017) aplicaram a distribuição t-Student para o termo de ruído no modelo SFA, a
fim de aumentar a robustez do modelo para outliers. Nesse caso, a função densidade de
probabilidades do erro composto foi escrita como:
f() =
∫ ∞
0
Γ
(
a+1
2
)
Γ
(
a
2
)√
pia σν
[
1 + 1
a
(
− u
σν
)]−a+12 √2√
pi σu
φ
(
u
σu
)
du, (3.1)
onde a é o grau de liberdade da distribuição t-Student e Γ(·) é a função Gama. À medida
que a → ∞, a distribuição t-Student aproxima-se da distribuição Normal. A equação
(3.1) é intratável analiticamente. No entanto, aproximações usando métodos de simulação
numérica podem ser aplicadas (Train, 2009).
Em consonância, esse trabalho apresenta algumas propostas de parametrizações
alternativas e inéditas para o SFA, conforme descrito a seguir.
3.2 Proposta de Parametrizações para o SFA
Os modelos de SFA propostos baseiam-se na parametrização alternativa da dis-
tribuição Skew-Normal, descrita a seguir. Como introduzido inicialmente por Azzalini
(1985), uma variável aleatória Z tem uma distribuição Skew-Normal1 padrão com função
densidade de probabilidade dada por:
fZ(z) = 2φ (z) Φ (λz) , z ∈ <, λ ∈ <, (3.2)
onde φ e Φ são, respectivamente, a função de densidade e a função de distribuição
acumulada de uma Normal Padrão, e λ é o parâmetro de assimetria.
Uma nova variável X pode ser construída a partir de Z, acrescentando-se um
parâmetro de localização (ξ) e um parâmetro de escala (σ), isto é, X = ξ + σZ. Por
causa da presença desses parâmetros, X se torna mais flexível que Z (X possui mais
parâmetros que Z). Observe que, a partir de X, pode-se obter Z, isto é, Z = X−ξ
σ
. Vamos
considerar Z ∼
iid
SN(λ) e X ∼
iid
SN(ξ, σ2, λ). Então, X tem uma função densidade de
probabilidades dada por:
1Azzalini (1985) chegou a este resultado, somando-se uma variável Normal Padrão, N(0, 12), com
uma variável Half -Normal, N+(0, 12).
66
3.2. PROPOSTA DE PARAMETRIZAÇÕES PARA O SFA 67
fX(x) =
2
σ
φ
(
x− ξ
σ
)
Φ
(
λ
x− ξ
σ
)
, ξ ∈ IR, σ > 0, (3.3)
conhecida como modelo Skew-Normal de três parâmentros. Observa-se que essa expressão
é exatamente igual à expressão que foi obtida na equação (2.43), isto é,
f() =
∫ ∞
0
f(u, )du (3.4)
= 2
σ
φ
(

σ
)
Φ
(
λ

σ
)
,
uma vez que  = ν + u = X − ξ.
O modelo SFA de custo assume que λ ∈ <+ e ξ(y) é a função de custo paramétrica,
isto é, uma função Cobb-Douglas ou uma função Translog. Esse modelo assume que:
Xi = ξ(yi) + νi + ui ou Xi = ξ(yi) + σzi, (3.5)
onde σzi = νi+ui, νi ∼
iid
N(0, σ2ν), ui ∼
iid
N+(0, σ2u) and σ2 = σ2ν +σ2u. Com essa abordagem
para o modelo de SFA de custo, deduz-se que Xi ∼
iid
SN(ξ(yi), σ2, λ), σ2 = σ2ν + σ2u, e
λ = σu
σν
, segundo a parametrização proposta por Battese e Corra (1977). Vale lembrar
que ξ(yi) é o parâmetro de localização (função de custo Translog ou Cobb-Douglas), σ é
o parâmetro de escala e, λ é o parâmetro de assimetria.
Conforme já foi discutido no capítulo 2, inferências sobre os parâmetros baseadas no
método de máxima verossimilhança apresentam alguns problemas. Por exemplo, λ pode
se tornar infinito com probabilidade positiva. Para resolver essa problemática, Bayes e
Branco (2007), baseando-se em Henze (1986), propuseram uma nova reparametrização
para uma variável aleatória Skew-Normal padrão:
Z =
√
(1− δ2)V + δU, (3.6)
onde V ∼
iid
N(0, 12), U ∼
iid
N+(0, 12) e δ = λ√1+λ2 . Além disso, se λ > 0 para o modelo
SFA de custo, δ ∈ ]0,1[. Também pode ser mostrado que:
λ = δ√
1− δ2 . (3.7)
Vale ressaltar aqui que, esse é um diferencial desse trabalho, uma vez que pelo princípio
de Bayes-Laplace, uma escolha natural de priori não-informativa para δ seria uma
67
3.2. PROPOSTA DE PARAMETRIZAÇÕES PARA O SFA 68
distribuição uniforme, isto é, δ ∼ U(−1, 1). Como no SFA de custo, ui ≥ 0 implica em
λ > 0, então δ = λ√1+λ2 ∈ ]0,1[, levando a δ ∼ U(0, 1).
Também, observa-se que:
E(Xi) = ξ(yi) + σδ
√
2
pi
, e
V (Xi) = σ2(1− 2
pi
δ2), (3.8)
ou seja, σ2 não é a variância de Xi, mas sim um parâmetro de escala que compõe a
variância de Xi.
Além disso, como νi + ui = σzi, pode-se escrever que νi + ui = σ
(√
1− δ2Vi + δUi
)
ou νi = σ
√
1− δ2Vi e ui = σδUi. Observa-se que ui ∼
iid
N+(0, σ2u) mede a ineficiência
econômica da i-ésima DSO e Ui ∼
iid
N+(0,12) descreve uma Half -Normal padrão, não tendo
interpretação prática, servindo apenas para manipulação. O termo νi ∼
iid
N(0, σ2ν) captura
a aleatoriedade sobre essa DSO e Vi ∼
iid
N(0, 12) descreve uma Normal padrão, também
não tendo interpretação prática. Essas manipulações oferecem maneiras alternativas de
se escrever ui e νi. Agora, tem-se:
Xi = ξ(yi) + σ
√
1− δ2Vi + σδUi, (3.9)
com Ui ∼
iid
N+(0,12), Vi ∼
iid
N(0, 12), σ =
√
σ2ν + σ2u e δ = λ√1+λ2 .
Utilizando a estrutura Bayesiana e a representação estocástica para a distribuição
Skew-Normal proposta por Henze (1986), o modelo SFA de custo proposto, pode ser
escrito como2:
Xi|Ui, ξ(yi), σ, δ(λ) ∼
iid
N
[
ξ(yi) + σδUi; σ2(1− δ2)
]
,
Ui ∼
iid
N+
(
0, 12
)
, i = 1,...,n.
(3.10)
Seguindo Gil et al. (2017) e Bayes e Branco (2007), as seguintes especificações a
priori fracamente informativas foram escolhidas para os parâmetros do SFA:
2Observe que Xi está condicionado ao conhecimento prévio de Ui, ξ(yi), σ e δ(λ). Logo esses valores
passam a ser considerados como constantes e somente Vi é variável.
68
3.3. BASE DE DADOS 69
1
σ2
∼ Γ(0,01; 0,01), (3.11)
δ ∼ U(0, 1), (3.12)
βj ∼
iid
N(0; 1002), (3.13)
onde o segundo argumento na expressão (3.13) representa a variância de βj , o que implica
em uma precisão de 0,0001.
O modelo descrito na equação (3.10) pode ser implementado usando softwares que
utilizam Markov Chain Monte Carlo (MCMC), como por exemplo, o WinBUGS (Albert,
2009; Cowles, 2004; Spiegelhalter et al., 2003) ou o JAGS (Plummer, 2017), como descrito
em Bayes e Branco (2007). Esses softwares retornam os valores de ui, σ e λ, utilizando
estimação pelo contexto Bayesiano, sem precisar recorrer a métodos de verossimilhança,
escapando assim das problemáticas de estimação.
3.3 Base de Dados
Um resumo das variáveis de entrada e saída disponíveis para as 61 DSOs brasileiras
é apresentado na Tabela 3.1 e na Figura 3.1. As variáveis compreendem os valores
médios dos anos de 2014 a 2016. A variável de entrada é o custo operacional (OPEX
ou PMSO ajustado), ajustado pela inflação, e as variáveis de saída são os seguintes
cost drivers: (a) número de consumidores como proxy para a quantidade de serviços
prestados; (b) o mercado ponderado (energia distribuída - MWh) como proxy da produção
total; (c) rede aérea; (d) rede de alta tensão; e, (e) rede subterrânea como medidas de
dispersão de consumidores dentro da área de concessão (Souza et al., 2010a). Além disso,
o consumidor-hora de energia interrompida é a variável de qualidade e a e.variable é
a variável ambiental. Correlações positivas são representadas por elipses com declives
positivos. As correlações negativas são representadas por elipses com declives negativos.
Quanto maior a correlação, mais estreita é a elipse. A Figura 3.1 mostra que o número de
consumidores apresenta a maior correlação com os custos operacionais (PMSO ajustado),
seguido por mercado ponderado e rede aérea. Além disso, o número de consumidores
e o mercado ponderado estão fortemente correlacionados. Aparentemente, a variável
ambiental está fracamente correlacionada aos custos operacionais.
69
3.3. BASE DE DADOS 70
Tabela 3.1: Variáveis de entrada e saída disponíveis para as 61 DSOs brasileiras.
Variável Sigla Notação Espécie Unidade Proxy
PMSO ajustado (OPEX) PMSOa x Input R$ Pessoal, material,serviços e outros
Número de consumidores Cons y1
Outputs
ordinários
un Quantidade de ser-viços prestados
Mercado ponderado Wmkt y2 MWh Produção total
Rede aérea Over y3
Km
Disseminação dos
consumidores
dentro da área de
concessão
Rede de alta tensão High y4
Rede subterrânea Under y5
Consumidor-hora de
energia interrompida CHI y6 Outputs
indesejados
h Qualidade dos
serviços prestados
Perdas não-técnicas NTL y7 MWh
Variável ambiental e.variable z Variável
exógena
∗ Informações ambi-entais
Figura 3.1: Gráfico de correlação de Spearman para as variáveis de entrada, saída,
qualidade e ambientais.
Vale ressaltar que a decisão quanto ao modelo recai sobre o regulador. Portanto,
com base no atual modelo DEA-NDRS, este trabalho propõe modelos de benchmarking
SFA utilizando as mesmas entradas e saídas. Imita-se o uso de outputs negativos no SFA,
utilizando distribuições a priori Half -Normal negativas para os coeficientes das variáveis
70
3.4. PROPOSTA DE MODELOS PARA O SFA 71
de qualidade. No entanto, propõe-se a agregação das perdas não-técnicas (variável de
qualidade) ao mercado ponderado. As perdas não-técnicas são estimadas apenas para
o mercado de baixa tensão, ou seja, principalmente para consumidores residenciais.
Portanto, essas perdas podem ser deduzidas do mercado de baixa tensão antes de se
calcular o mercado ponderado. Assim, apenas uma variável de qualidade, consumidor-hora
de energia interrompida, é avaliada. Além disso, Gil et al. (2017) e Veronese et al. (2018)
investigaram variáveis ambientais usando o DEA de segundo estágio e concluíram que o
índice ambiental (e.variable) é uma proxy razoável para informações ambientais. Portanto,
são propostos sete modelos SFA de custo, que utilizam ou não e.variable como a variável
ambiental, conforme descrito a seguir.
3.4 Proposta de Modelos para o SFA
3.4.1 Modelo 1
Esse modelo de SFA utiliza uma função de custo translog, sendo o custo operacional
a variável de entrada e número de consumidores, mercado ponderado (variável original),
rede aérea, rede de alta tensão e rede subterrânea são as variáveis de saída. Esse modelo
não inclui variáveis de qualidade ou ambientais. Sua estrutura é dada por:
ln xi = ln β0 +
5∑
j=1
βj ln yij +
5∑
j=1
5∑
k=1
βjk ln yij ln yik + i
= β0 + β1 ln yi1 + β2 ln yi2 + β3 ln yi3 + β4 ln yi4 + β5 ln yi5 +
+ β11(ln yi1)2 + β22(ln yi2)2 + β33(ln yi3)2 + β44(ln yi4)2 + β55(ln yi5)2 +
+ β12(ln yi1 · ln yi2) + β13(ln yi1 · ln yi3) + β14(ln yi1 · ln yi4) + β15(ln yi1 · ln yi5) +
+ β23(ln yi2 · ln yi3) + β24(ln yi2 · ln yi4) + β25(ln yi2 · ln yi5) +
+ β34(ln yi3 · ln yi4) + β35(ln yi3 · ln yi5) +
+ β45(ln yi4 · ln yi5) + νi + ui ∀ i = 1, 2, . . . , 61. (3.14)
71
3.4. PROPOSTA DE MODELOS PARA O SFA 72
3.4.2 Modelo 2
Esse modelo de SFA utiliza uma função de custo translog, com as mesmas variáveis
do Modelo 1. No entanto, o mercado ponderado é recalculado deduzindo-se as perdas
técnicas. Além disso, o consumidor-hora de energia interrompida é utilizado como a
variável de qualidade e, a e.variable é utilizada como a variável ambiental. A seguinte
estrutura de função de custo é usada:
ln xi = lnC(yi;β) + g(zi; δ) + νi + ui (3.15)
onde lnC(yi;β) é a função de custo Translog e g(zi; δ) = δ0 + δ1zi é a componente
contextual ou ambiental. Logo, a estrutura do modelo fica assim:
ln xi = ln β0 +
6∑
j=1
βj ln yij +
5∑
j=1
5∑
k=1
βjk ln yij ln yik + (δ0 + δ1zi) + i
= β0 + β1 ln yi1 + β2 ln yi2 + β3 ln yi3 + β4 ln yi4 + β5 ln yi5 + β6 ln yi6 +
+ β11(ln yi1)2 + β22(ln yi2)2 + β33(ln yi3)2 + β44(ln yi4)2 + β55(ln yi5)2 +
+ β12(ln yi1 · ln yi2) + β13(ln yi1 · ln yi3) + β14(ln yi1 · ln yi4) + β15(ln yi1 · ln yi5) +
+ β23(ln yi2 · ln yi3) + β24(ln yi2 · ln yi4) + β25(ln yi2 · ln yi5) +
+ β34(ln yi3 · ln yi4) + β35(ln yi3 · ln yi5) +
+ β45(ln yi4 · ln yi5) + (δ0 + δ1zi) + νi + ui ∀ i = 1, 2, . . . , 61. (3.16)
3.4.3 Modelo 3
Esse é um modelo de SFA híbrido que utiliza uma estrutura de custo translog para
número de consumidores e mercado ponderado, juntamente com uma estrutura de custo
Cobb-Douglas para rede aérea, rede de alta tensão e rede subterrânea. Além disso, o
consumidor-hora de energia interrompida é utilizado como variável de qualidade e a
e.variable é utilizada como variável ambiental. Sua estrutura é dada por:
72
3.4. PROPOSTA DE MODELOS PARA O SFA 73
ln xi = ln β0 +
6∑
j=1
βj ln yij +
2∑
j=1
2∑
k=1
βjk ln yij ln yik + (δ0 + δ1zi) + i
= β0 + β1 ln yi1 + β2 ln yi2 + β3 ln yi3 + β4 ln yi4 + β5 ln yi5 + β6 ln yi6 +
+ β11(ln yi1)2 + β22(ln yi2)2 +
+ β12(ln yi1 · ln yi2) + (δ0 + δ1zi) + νi + ui ∀ i = 1, 2, . . . , 61.
(3.17)
3.4.4 Modelo 4
Trata-se de um modelo SFA híbrido que utiliza uma estrutura de custo translog
para número de consumidores, mercado ponderado e rede aérea, juntamente com uma
estrutura de custo Cobb-Douglas para rede de alta tensão e rede subterrânea. Além disso,
o consumidor-hora de energia interrompida é utilizado como variável de qualidade e a
e.variable é utilizada como variável ambiental. Sua estrutura é dada por:
ln xi = ln β0 +
6∑
j=1
βj ln yij +
3∑
j=1
3∑
k=1
βjk ln yij ln yik + (δ0 + δ1zi) + i
= β0 + β1 ln yi1 + β2 ln yi2 + β3 ln yi3 + β4 ln yi4 + β5 ln yi5 + β6 ln yi6 +
+ β11(ln yi1)2 + β22(ln yi2)2 + β33(ln yi3)2 +
+ β12(ln yi1 · ln yi2) + β13(ln yi1 · ln yi3) +
+ β23(ln yi2 · ln yi3) + (δ0 + δ1zi) + νi + ui ∀ i = 1, 2, . . . , 61.
(3.18)
3.4.5 Modelo 5
Esse é um modelo de SFA, semelhante ao Modelo 2, porém utiliza uma distribuição
de probabilidades t-Student para o componente de ruído. Como indicado por Juárez e
73
3.5. IMPLEMENTAÇÃO COMPUTACIONAL 74
Steel (2010), é utilizada a seguinte distribuição a priori Gama para o parâmetro grau de
liberdade a da distribuição t-Student: a ∼ Γ(2; 0,1).
3.4.6 Modelo 6
Trata-se de um modelo híbrido de SFA, similar ao Modelo 3, porém utiliza uma
distribuição de probabilidades t-Student para o componente de ruído e a distribuição a
priori Gama para o parâmetro grau de liberdade proposta no modelo 5.
3.4.7 Modelo 7
Esse é um modelo híbrido de SFA, similar ao Modelo 4, porém utiliza uma distri-
buição de probabilidades t-Student para o componente de ruído e a distribuição a priori
Gama para o parâmetro grau de liberdade proposta no modelo 5.
3.5 Implementação Computacional
As parametrizações e as modelagens propostas foram implementadas a partir do
software livre JAGS (Just Another Gibbs Sampler) (Plumer, 2003), em conjunto com os
pacotes computacionais rjags (Plummer, 2016) e mcmc (Geyer e Johnson, 2017), que são
interfaces do R para a biblioteca JAGS MCMC.
Em todos os modelos BSFA propostos, inicialmente foram realizadas 40 milhões
de iterações (burn-in). Em seguida, executaram-se outras 40 milhões de iterações, com
uma defasagem (lag) de 20 mil iterações entre as sucessivas amostras geradas para os
parâmetros do modelo. A monitoração empregada para a convergência do Amostrador
de Gibbs foi a indicada por Cowles e Carlin (1996), isto é, a utilização de gráficos de
Autocorrelation Function (ACF), construídos a partir das amostras a posteriori.
3.6 Critérios de Seleção de Modelos
Os modelos BSFA propostos foram comparados utilizando-se as estatísticasWatanabe-
Akaike Information Criterion (WAIC), Deviance Information Criterion (DIC) e Log-
Pseudo Marginal Likelihood (LPML). Os modelos com menor valor de DIC e maiores
valores de WAIC e LPML alcançam melhor ajuste aos dados. No Apêndice C, é apresen-
74
3.6. CRITÉRIOS DE SELEÇÃO DE MODELOS 75
tada uma síntese destes critérios. Entretanto, para maiores detalhes, são indicadas as
obras de Gelman et al. (2014) e Gamerman e Lopes (2006).
Os resultados computacionais encontrados para as parametrizações e modelagens
aqui descritas, são apresentados no próximo capítulo.
75

C
a
p
ít
u
l
o 4
Resultados e Discussões
Nesse quarto capítulo, são apresentados os resultados e as discussões a respeitodas parametrizações e modelagens propostas no capítulo anterior.
4.1 Verificação Inicial da Assimetria de i
Antes que os modelos BSFA propostos no capítulo anterior fossem implementados,
foi pertinente verificar se o contexto do SBDEE suportava a presença de ineficiência
econômica (ui > 0). Caso não suportasse, seria desnecessário investir em técnicas mais
caras de estimação. Logo, foram testadas as seguintes hipóteses sobre i = νi + ui:
H0 :  é simétrico,
H1 :  é assimétrico. (4.1)
Em seguida, utilizou-se a estatística de teste M3T de Coelli (1995):
M3T = m3√
6m32
n
∼
sobH0
N(0, 12), (4.2)
onde mi e n representam respectivamente, o i-ésimo momento dos resíduos e o tamanho
amostral. Com esse propósito, implementou-se os modelos OLS para as variáveis de
77
4.2. PARÂMETROS ESTIMADOS 78
todos os sete modelos propostos, obtendo-se níveis descritivos p-values = 0,000 em todos
os sete casos. Assim, rejeitou-se a hipótese de simetria dada em (4.1), a um nível de
5% de significância, isto é, os dados em questão suportavam a presença de ineficiência
econômica, e os modelos de BSFA de custos puderam ser ajustados a partir disso.
4.2 Parâmetros Estimados
Além dos modelos selecionados, descritos no capítulo 3, os coeficientes estimados
usando o modelo OLS Cobb-Douglas com variáveis de produção, qualidade e ambientais
são apresentados na Tabela 4.1. O modelo OLS ilustra como essas variáveis afetam os
custos operacionais médios. A partir desses resultados, pode-se observar que, utilizando
todas as variáveis de produção, qualidade e ambientais, apenas o número de consumi-
dores, o mercado ponderado e as variáveis ambientais são estatisticamente significantes.
Provavelmente, isso se deve ao pequeno tamanho da amostra de 61 DSOs. Os resultados
também corroboram com as conclusões de Veronese et al. (2018) e Gil et al. (2017), que
alegam que o ambiente afeta as eficiências de custo das DSOs brasileiras. Além disso,
todos os coeficientes de produção e ambientais são positivos, como esperado. Curiosa-
mente, o modelo OLS apresenta um coeficiente negativo de qualidade (coeficiente de y6,
isto é, do consumidor-hora de energia interrompida), embora nenhuma restrição tenha
sido imposta. Este resultado indica o efeito da multicolinearidade e fornece evidências de
que um coeficiente de qualidade negativo melhora a estimativa do custo médio.
A Tabela 4.1 também mostra os coeficientes estimados para os modelos 1 a 7. Vale
ressaltar que o modelo 1 possui 21 coeficientes, os modelos 2 e 5 possuem 23 coeficientes,
os modelos 3 e 6 possuem 11 coeficientes e os modelos 4 e 7 tem 14 coeficientes. Vale a
pena observar que, embora a propriedade de convexidade seja obtida usando a Translog,
ela aumenta o número de coeficientes e compromete a análise estatística. Em conclusão,
há um trade-off entre propriedade de convexidade e significância estatística usando SFA.
78
4.2.
PA
R
Â
M
E
T
R
O
S
E
ST
IM
A
D
O
S
79
Tabela 4.1: Estimativas dos parâmetros médios a posteriori.
Estimativas dos parâmetros médios a posteriori.
Normal - Half-Normal SFA t-Student - Half-Normal SFA
OLS Cobb-Douglas* Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6 Modelo 7
Variáveis Parâmetros Estimativas SD Média SD Média SD Média SD Média SD Média SD Média SD Média SD
Constante β0 -0,1472 0,5738 5,5200 7,4887 -4,8662 6,5478 -3,5543 2,6209 -3,0444 3,4081 -5,3726 7,4029 -2,7410 2,7074 -1,8267 3,2774
lnCons β1 0,5223 0,1439 4,3133 2,5213 0,6031 2,0994 -1,4997 0,8683 -1,2721 1,3672 -2,1378 1,8600 -1,2172 0,7318 -0,8151 1,2540
lnWmkt β2 0,3288 0,1464 -3,5861 2,3781 1,6581 1,9922 2,7101 1,0580 2,1682 1,5471 3,9641 2,4197 2,3239 0,9316 1,5418 1,3449
lnOver β3 0,0225 0,0540 -1,1629 1,1865 -1,2917 1,2105 0,0143 0,0596 0,3838 0,6003 -0,8886 1,1089 0,0198 0,0595 0,4234 0,5527
lnHigh β4 0,0303 0,0226 0,8602 0,7632 0,5449 0,7300 0,0242 0,0230 0,0187 0,0257 0,7057 0,6182 0,0225 0,0231 0,0152 0,0249
lnUnder β5 0,0240 0,0215 0,4135 0,4491 -0,1691 0,4568 0,0461 0,0256 0,0448 0,0253 -0,3026 0,4913 0,0445 0,0255 0,0427 0,0243
(lnCons * lnCons) β11 0,0770 0,6107 0,3634 0,3177 -0,0525 0,1215 0,4233 0,3496 0,4835 0,2363 0,0063 0,0777 0,4521 0,2482
(lnWmkt * lnWmkt) β22 0,1860 0,3151 -0,0270 0,1682 -0,2150 0,1320 0,0592 0,2695 -0,2591 0,2702 -0,1408 0,0795 0,1395 0,1325
(lnOver * lnOver) β33 0,0379 0,0593 0,0404 0,0507 0,0774 0,0462 0,0639 0,0499 0,0788 0,0434
(lnHigh * lnHigh) β44 -0,0124 0,0194 -0,0140 0,0164 -0,0133 0,0163
(lnUnder * lnUnder) β55 0,0301 0,0144 0,0152 0,0132 0,0091 0,0128
lnCons * lnWmkt β12 -0,2604 0,9049 -0,3793 0,4258 0,2597 0,2433 -0,4176 0,5654 -0,1986 0,4565 0,1300 0,1439 -0,5220 0,3065
lnCons * lnOver β13 -0,5217 0,2983 -0,5793 0,2778 -0,3248 0,2462 -0,8295 0,2331 -0,3014 0,2591
lnCons * lnHigh β14 0,4377 0,2428 0,2553 0,1694 0,2084 0,1070
lnCons * lnUnder β15 0,1347 0,1165 0,0552 0,0984 -0,0194 0,1000
lnWmkt * lnOver β23 0,5271 0,2762 0,5875 0,2936 0,1717 0,2132 0,7467 0,2401 0,1463 0,2173
lnWmkt * lnHigh β24 -0,4594 0,2538 -0,2672 0,1838 -0,2578 0,1204
lnWmkt * lnUnder β25 -0,1649 0,1113 -0,0294 0,0990 0,0509 0,1114
lnOver * lnHigh β34 -0,0007 0,0712 -0,0003 0,0606 0,0303 0,0583
lnOver * lnUnder β35 -0,0116 0,0492 -0,0213 0,0504 -0,0248 0,0455
lnHigh * lnUnder β45 0,0153 0,0394 0,0036 0,0372 0,0116 0,0330
lnCHI β6 -0,0103 0,0088 -0,0124 0,0074 -0,0120 0,0069 -0,0098 0,0066 -0,0108 0,0067 -0,0109 0,0070 -0,0089 0,0062
e,variable δ1 0,0214 0,0049 0,0226 0,0053 0,0249 0,0050 0,0225 0,0052 0,0226 0,0053 0,0246 0,0050 0,0221 0,0049
a 18,9171 13,5916 21,7003 14,2939 19,7428 14,0988
σ 0,3224 0,0615 0,3226 0,0671 0,3113 0,0601 0,3277 0,0647 0,3058 0,0759 0,2928 0,0600 0,2953 0,0661
λ 0,9746 2,6313 1,8544 6,4711 1,0190 1,7999 1,4571 2,4012 1,9301 3,2776 0,9535 1,1257 1,2302 1,6212
WAIC -17,87839 -14,48895 -9,145846 -9,679834 -15,00923 -8,838742 -9,716204
DIC 44,75155 43,79012 22,22629 27,7508 44,69681 21,61173 25,06897
LPML -17,79408 -13,53134 -10,07233 -10,48291 -12,48827 -9,318436 -10,92601
Nota: os parâmetros estatísticos significativos a 5% estão em negrito.
*R2aj = 0,9795
79
4.3. EFICIÊNCIAS ESTIMADAS 80
Os Modelos 3, 4, 6 e 7 aplicam a estrutura híbrida da Translog Cobb-Douglas para
reduzir o número de parâmetros. Os resultados WAIC, DIC e LPML indicam os modelos
3 e 6 como os melhores modelos, ou seja, com o melhor ajuste aos dados. Os resultados
também mostram que os coeficientes de produção utilizando uma estrutura de Cobb-
Douglas apresentam estimativas positivas, como esperado. Além disso, os coeficientes
estimados nos Modelos 3 e 6 são muito semelhantes, e resultados semelhantes para o
parâmetro λ são encontrados. O parâmetro λ representa a proporção entre componentes
de ineficiência e ruído. Valores estimados para λ utilizando os Modelos 3 e 6 estão
próximos de um. O Modelo 6 alcança resultados um pouco melhores de WAIC, DIC e
LPML quando comparado ao Modelo 3. Isso é esperado, já que o Modelo 6 usa uma
distribuição t-Student para o componente de erro. De acordo com Stead et al. (2017), a
distribuição t-Student leva em conta a presença outliers na base de dados.
4.3 Eficiências Estimadas
A Figura 4.1 compara as eficiências estimadas pelo DEA e pelo SFA proposto. Os
resultados mostram que as eficiências estimadas do SFA são muito maiores do que as
eficiências do DEA. As eficiências do DEA têm média de 70,87% e valor mínimo de
27,90%, enquanto as eficiências de SFA têm média de 86,87% e valor mínimo de 66,34%.
Como descrito anteriormente, menores eficiências de DEA foram fortemente criticadas.
Além disso, no último CRTP, o regulador adotou uma redução máxima de custo de 5%
ao ano, o que indica uma eficiência de custo mínima de 20% em cada CRTP. Portanto, os
resultados do SFA estimados apoiam a decisão do regulador brasileiro no último CRTP.
A Figura 4.2 mostra a correlação linear das eficiências estimadas. O modelo SFA
1, daqui em diante denominado SFA 1, apresenta a maior correlação com as eficiências
originais do DEA (ρ = 0,6531). Vale ressaltar que o SFA 1 não inclui variáveis de qualidade
ou ambientais. Espera-se também que os modelos de SFA alcancem diferentes eficiências,
pois entre outras questões técnicas, dependem de diferentes fronteiras paramétricas e
as estimativas de eficiência são baseadas em máxima verossimilhança. No entanto, as
eficiências do SFA estão positivamente correlacionadas com as eficiências do DEA, como
esperado. Além disso, a Figura 4.2 mostra que as eficiências estimadas pelos Modelos 4 e
7 são altamente correlacionadas (ρ = 0.9974), assim como nos Modelos 3 e 6 (ρ = 0.9957).
As eficiências estimadas para cada modelo são apresentadas na Tabela 4.2.
80
4.3. EFICIÊNCIAS ESTIMADAS 81
Figura 4.1: Boxplots comparando eficiências originais de DEA e eficiências propostas de
SFA.
Figura 4.2: Matriz de correlação comparando eficiências originais de DEA e eficiências
propostas de SFA.
81
4.3. EFICIÊNCIAS ESTIMADAS 82
Tabela 4.2: Escores de eficiência estimados utilizando os modelos de SFA propostos.
DSO Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6 Modelo 7
DMED 0,7657 0,6789 0,7474 0,6634 0,6971 0,7737 0,7241
BOA VISTA 0,7643 0,7213 0,7800 0,7019 0,7193 0,7943 0,7498
JOAO CESA 0,8344 0,7142 0,7886 0,7005 0,7113 0,8156 0,7578
CERON 0,8521 0,8015 0,8186 0,7801 0,8029 0,8285 0,8097
ETO 0,8505 0,8141 0,8219 0,8198 0,8300 0,8289 0,8432
CEPISA 0,8511 0,7824 0,8207 0,7900 0,7865 0,8364 0,8203
LIGHT 0,8843 0,8586 0,8262 0,7915 0,8616 0,8419 0,8192
AMPLA 0,8718 0,7668 0,8303 0,8018 0,7957 0,8428 0,8235
EMT 0,8918 0,8439 0,8306 0,8379 0,8425 0,8430 0,8605
ENF 0,8563 0,8092 0,8363 0,7960 0,8246 0,8439 0,8187
CEB 0,8390 0,8089 0,8363 0,7922 0,7995 0,8492 0,8187
CEEE 0,8207 0,8123 0,8478 0,7906 0,8073 0,8500 0,8169
CEAL 0,8519 0,8275 0,8391 0,8227 0,8416 0,8508 0,8465
COPEL 0,8521 0,8085 0,8465 0,8061 0,8097 0,8539 0,8350
CHESP 0,8694 0,7981 0,8435 0,8163 0,8210 0,8553 0,8427
FORCEL 0,8873 0,8690 0,8455 0,8725 0,8805 0,8555 0,8872
IGUAÇU 0,8700 0,8256 0,8468 0,8079 0,8243 0,8564 0,8392
URUSSANGA 0,8722 0,8758 0,8422 0,8173 0,8916 0,8584 0,8455
COCEL 0,8145 0,7706 0,8538 0,8011 0,7682 0,8585 0,8289
BRAGANTINA 0,9046 0,8449 0,8527 0,8173 0,8463 0,8608 0,8368
CEMIG 0,8821 0,8460 0,8547 0,8119 0,8471 0,8663 0,8343
ELETROPAULO 0,8923 0,8720 0,8559 0,8429 0,8869 0,8694 0,8656
CELG 0,8630 0,8489 0,8603 0,8305 0,8469 0,8723 0,8542
CELESC 0,8658 0,8378 0,8692 0,8349 0,8436 0,8761 0,8587
CELPE 0,8475 0,8118 0,8695 0,8429 0,8266 0,8804 0,8602
EMS 0,9097 0,8749 0,8816 0,8779 0,8905 0,8834 0,8869
EMG 0,8949 0,8786 0,8807 0,8525 0,8777 0,8835 0,8698
DEMEI 0,8551 0,8140 0,8806 0,8377 0,8276 0,8872 0,8608
SULGIPE 0,8911 0,8967 0,8755 0,8756 0,8797 0,8907 0,8988
AMAZONAS 0,8542 0,8271 0,8853 0,8629 0,8374 0,8910 0,8817
COOPERALIANÇA 0,8726 0,8518 0,8872 0,8415 0,8514 0,8936 0,8689
RGE SUL 0,9016 0,8484 0,8858 0,8694 0,8495 0,8937 0,8860
ELETROACRE 0,8371 0,8806 0,8886 0,8589 0,8876 0,8954 0,8789
ELETROCAR 0,8771 0,8697 0,8855 0,8554 0,8913 0,8955 0,8718
CAIUÁ 0,9181 0,8887 0,8927 0,8661 0,8886 0,8962 0,8819
ESCELSA 0,8982 0,8400 0,8887 0,8653 0,8446 0,8976 0,8822
CPEE 0,9322 0,9101 0,8938 0,8806 0,9141 0,9011 0,8980
VALE PARANAPANEMA 0,9254 0,9150 0,9029 0,8842 0,9187 0,9048 0,8968
COELBA 0,9011 0,8978 0,8980 0,8772 0,8956 0,9063 0,8900
ESE 0,8880 0,8754 0,8992 0,8819 0,8813 0,9071 0,8933
SANTA MARIA 0,8935 0,8871 0,9121 0,9029 0,9020 0,9099 0,9104
BANDEIRANTE 0,8894 0,8464 0,9059 0,8945 0,8548 0,9128 0,9034
NACIONAL 0,9172 0,8995 0,9084 0,8814 0,8986 0,9132 0,8939
EPB 0,8885 0,8740 0,9021 0,8951 0,8814 0,9142 0,9069
SANTA CRUZ 0,9242 0,9164 0,9127 0,8971 0,9185 0,9168 0,9088
CSPE 0,9270 0,9112 0,9107 0,8979 0,9161 0,9172 0,9084
HIDROPAN 0,8922 0,9069 0,9143 0,8697 0,9081 0,9196 0,8901
EBO 0,8877 0,9135 0,9105 0,9069 0,9202 0,9207 0,9195
JAGUARI 0,8967 0,8574 0,9156 0,9062 0,8388 0,9215 0,9194
COSERN 0,9089 0,8950 0,9141 0,9049 0,9050 0,9218 0,9140
ELEKTRO 0,8889 0,8560 0,9166 0,9049 0,8679 0,9230 0,9175
CPFL PAULISTA 0,9101 0,8895 0,9198 0,9027 0,8976 0,9242 0,9162
MOCOCA 0,9069 0,8867 0,9224 0,9104 0,8871 0,9247 0,9176
COELCE 0,9279 0,9073 0,9225 0,9121 0,9087 0,9281 0,9229
NOVA PALMA 0,8545 0,8650 0,9223 0,9212 0,8716 0,9289 0,9271
CELPA 0,8672 0,9153 0,9293 0,9151 0,9186 0,9324 0,9221
CFLO 0,8566 0,8892 0,9294 0,9112 0,8925 0,9325 0,9195
RGE 0,9179 0,9291 0,9314 0,9304 0,9337 0,9337 0,9330
CEMAR 0,8991 0,9231 0,9296 0,9263 0,9269 0,9354 0,9306
PIRATININGA 0,9164 0,9136 0,9306 0,9250 0,9181 0,9357 0,9293
MUXFELDT 0,9382 0,9322 0,9457 0,9363 0,9312 0,9439 0,9382
Nota: os escores de eficiência foram classificados em ordem crescente do Modelo 6.
82
4.3. EFICIÊNCIAS ESTIMADAS 83
A Figura 4.3 mostra a distribuição das eficiências DEA e SFA (Modelo 6) em todo o
território brasileiro. Esquemas de cores foram ajustados para a faixa de eficiência DEA e
SFA para minimizar as diferenças de escala. Os resultados mostram padrões semelhantes
entre as eficiências DEA e SFA nas regiões sul e sudeste. Além disso, as eficiências de
SFA são maiores no norte, ao contrário das eficiências de DEA que são extremamente
mais baixas nessa região. Isso ocorre porque o modelo SFA inclui ajustes ambientais.
Veronese et al. (2018) e Gil et al. (2017) também concluíram que a região norte do Brasil
enfrenta condições ambientais adversas que exigem atualizações de eficiência de custos.
Diferenças significativas entre DEA e SFA são encontradas nos estados de Mato Grosso
e Tocantins (centro-oeste/norte). Ao contrário do DEA, as eficiências de SFA para as
DSOs localizadas nesses estados foram menores em comparação com as eficiências de
SFA em todo o território brasileiro. Em geral, apesar das diferenças de escala mostradas
na Figura 4.3, tanto o DEA quanto o SFA proposto apresentaram padrões similares
de maior e menor eficiência na maioria das DSOs brasileiros. Mudanças específicas são
principalmente devidas a ajustes ambientais.
Figura 4.3: Eficiências estimadas DEA e SFA em todo o território brasileiro.
A Figura 4.4 também ilustra semelhanças e diferenças entre eficiências de DEA e SFA
após ajustes de escala. As DSOs foram classificados em ordem crescente de dissimilaridade.
Dois eixos y diferentes são mostrados. Os valores de eficiência de SFA estão localizados
no eixo y esquerdo, enquanto os valores de eficiência DEA estão localizados no eixo y
direito. Pode-se concluir que, após o escalonamento, tanto a eficiência DEA quanto a SFA
83
4.3. EFICIÊNCIAS ESTIMADAS 84
são similares a um grande grupo de DSOs. Como mencionado anteriormente, grandes
dissimilaridades estão associadas a algumas DSOs localizadas na região norte.
Figura 4.4: Similaridades e dissimilaridades entre DEA e SFA após ajustes de escala.
A Tabela 4.3 mostra as eficiências DEA e SFA para todos as DSOs e seus respectivos
custos eficientes. Os resultados são classificados em ordem crescente das eficiências de
DEA. Como as eficiências de SFA são, em média, maiores que as eficiências de DEA, a
maioria dos custos eficientes de SFA são maiores do que os custos eficientes de DEA.
No entanto, as maiores eficiências de SFA estão abaixo de 100%. Isso ocorre porque as
eficiências de SFA são estimadas usando a média a posteriori. Como consequência, as
DSOs que alcançaram 100% utilizando DEA apresentarão eficiências mais baixas usando
SFA. Isso é mostrado na parte inferior da Tabela 4.3. Uma alternativa para superar essa
limitação é usar o valor máximo de eficiências de DEA e SFA como a eficiência final,
como sugerido em Agrell e Bogetoft (2017).
Os resultados mostram uma grande diferença de escala entre as eficiências DEA e
SFA. A eficiência média do DEA é de 70,5%, enquanto a eficiência média do SFA é de
88,5%. Essa diferença representa uma receita total de R$ 3.175.509.926,81 ou U$ 971,1
milhões (considerando uma taxa de câmbio média de R$ 3,27 por U$ 1,00 no ano de 2016),
que atualmente é contabilizada como ineficiência. Como mencionado anteriormente, isso
ocorre porque o SFA decompõe a distância da fronteira de custo em duas componentes,
ruído e ineficiência econômica, enquanto a DEA assume apenas a ineficiência econômica.
84
4.3. EFICIÊNCIAS ESTIMADAS 85
Tabela 4.3: Eficiências estimadas e custos eficientes utilizando DEA e SFA (Modelo 6), e
diferenças entre custos eficientes utilizando DEA e o SFA proposto.
DSO DEA SFA 6 OPEX Eficiente OPEX Eficiente SFA
DEA (R$) SFA 6 (R$) Mudança (R$)
BOA VISTA 0,2788 0,7943 25 556 579,36 72 799 267,22 47 242 687,86 N
DMED 0,2925 0,7737 13 701 384,11 36 245 575,96 22 544 191,84 N
AMAZONAS 0,3385 0,8910 158 480 620,50 417 078 259,35 258 597 638,85 N
CEEE 0,4402 0,8500 283 298 377,35 546 996 095,14 263 697 717,78 N
URUSSANGA 0,4706 0,8584 2 919 625,37 5 325 596,45 2 405 971,08 N
CERON 0,4723 0,8285 150 896 328,24 264 709 589,97 113 813 261,73 N
ENF 0,4773 0,8439 17 060 734,43 30 163 298,44 13 102 564,01 N
ELETROACRE 0,4822 0,8954 55 397 088,80 102 870 328,87 47 473 240,07 N
CEAL 0,5111 0,8508 165 651 311,27 275 729 011,15 110 077 699,87 N
COCEL 0,5194 0,8585 10 667 825,64 17 631 314,62 6 963 488,97 N
IGUAÇU 0,5282 0,8564 9 299 509,27 15 078 296,51 5 778 787,23 N
DEMEI 0,5294 0,8872 6 029 224,84 10 104 630,19 4 075 405,36 N
FORCEL 0,5374 0,8555 2 302 945,15 3 666 038,41 1 363 093,26 N
HIDROPAN 0,5405 0,9196 4 091 106,17 6 960 079,05 2 868 972,88 N
ELETROCAR 0,5475 0,8955 8 875 619,78 14 517 352,05 5 641 732,27 N
CEB 0,5490 0,8492 209 422 109,05 323 972 674,46 114 550 565,41 N
COOPERALIANÇA 0,5615 0,8936 7 401 912,74 11 779 949,76 4 378 037,02 N
SULGIPE 0,5638 0,8907 24 258 769,21 38 326 417,50 14 067 648,28 N
AMPLA 0,5918 0,8428 389 547 727,90 554 762 283,73 165 214 555,83 N
CELPA 0,5963 0,9324 404 356 427,10 632 251 584,55 227 895 157,46 N
BRAGANTINA 0,6334 0,8608 30 400 514,76 41 312 652,39 10 912 137,63 N
ESE 0,6413 0,9071 119 207 414,10 168 621 656,90 49 414 242,80 N
CELPE 0,6593 0,8804 567 757 907,55 758 101 234,45 190 343 326,90 N
CEPISA 0,6686 0,8364 262 940 893,06 328 930 688,56 65 989 795,50 N
CELG 0,6716 0,8723 636 942 966,74 827 262 789,91 190 319 823,18 N
CHESP 0,6842 0,8553 10 684 709,04 13 357 742,40 2 673 033,36 N
CEMIG 0,6898 0,8663 1 559 382 615,03 1 958 305 749,20 398 923 134,17 N
COPEL 0,6944 0,8539 921 299 620,68 1 132 916 200,47 211 616 579,79 N
CAIUÁ 0,6996 0,8962 46 718 956,27 59 847 115,45 13 128 159,19 N
CFLO 0,6998 0,9325 11 053 894,68 14 730 208,08 3 676 313,40 N
NACIONAL 0,7024 0,9132 22 979 857,74 29 877 638,54 6 897 780,80 N
EMG 0,7071 0,8835 89 328 273,51 111 606 719,88 22 278 446,37 N
COELBA 0,7086 0,9063 950 382 640,99 1 215 600 160,69 265 217 519,70 N
CELESC 0,7283 0,8761 610 036 189,83 733 803 079,84 123 766 890,01 N
LIGHT 0,7289 0,8419 672 705 722,42 776 933 929,47 104 228 207,04 N
EBO 0,7380 0,9207 33 049 261,01 41 228 536,01 8 179 275,00 N
COSERN 0,7546 0,9218 222 182 274,39 271 427 489,22 49 245 214,84 N
VALE PARANAPANEMA 0,7683 0,9048 36 862 519,27 43 413 501,52 6 550 982,25 N
SANTA CRUZ 0,7697 0,9168 40 051 305,05 47 706 033,02 7 654 727,97 N
EPB 0,7762 0,9142 236 460 129,38 278 509 035,37 42 048 905,99 N
ESCELSA 0,7986 0,8976 268 519 911,39 301 804 022,53 33 284 111,15 N
SANTA MARIA 0,8002 0,9098 27 837 424,60 31 653 267,84 3 815 843,24 N
CEMAR 0,8102 0,9354 402 967 994,29 465 223 348,83 62 255 354,54 N
ELETROPAULO 0,8269 0,8694 1 205 490 658,03 1 267 417 389,74 61 926 731,71 N
CSPE 0,8300 0,9172 17 652 782,24 19 509 075,30 1 856 293,06 N
CPEE 0,8332 0,9011 14 468 400,13 15 646 143,08 1 177 742,95 N
RGE SUL 0,8373 0,8937 272 950 518,08 291 329 041,91 18 378 523,83 N
MOCOCA 0,8406 0,9247 10 061 842,95 11 068 833,69 1 006 990,73 N
EMS 0,8494 0,8834 293 097 953,73 304 825 180,45 11 727 226,72 N
BANDEIRANTE 0,8852 0,9128 311 776 392,00 321 493 834,80 9 717 442,80 N
EMT 0,9145 0,8430 486 714 829,63 448 667 715,08 -38 047 114,55 H
JOAO CESA 0,9302 0,8156 2 134 654,07 1 871 801,38 -262 852,69 H
CPFL PAULISTA 0,9786 0,9242 776 723 186,65 733 518 498,73 -43 204 687,92 H
ETO 0,9833 0,8289 246 388 940,33 207 698 637,64 -38 690 302,69 H
ELEKTRO 0,9844 0,9230 514 851 312,42 482 743 777,86 -32 107 534,56 H
JAGUARI 1,0000 0,9215 12 324 819,00 11 356 950,96 -967 868,04 H
COELCE 1,0000 0,9281 571 992 828,00 530 849 383,88 -41 143 444,12 H
PIRATININGA 1,0000 0,9357 300 814 765,00 281 468 525,18 -19 346 239,82 H
MUXFELDT 1,0000 0,9439 2 304 748,00 2 175 443,57 -129 304,43 H
RGE 1,0000 0,9337 304 029 938,00 283 885 491,97 -20 144 446,03 H
NOVA PALMA 1,0000 0,9289 5 762 588,00 5 353 135,95 -409 452,05 H
85
4.4. CRITÉRIO DE CONVERGÊNCIA 86
4.4 Critério de Convergência
Segundo Cowles e Carlin (1996), um método eficiente e relativamente simples para
monitorar a convergência do Amostrador de Gibbs , é o gráfico de Autocorrelation Function
(ACF) construído a partir das amostras geradas para λ. A função de autocorrelação é uma
medida da correlação entre as observações de uma série temporal que estão separadas por
k unidades de tempo (lag), isto é, entre λt e λt−k. Quanto mais rápido for o decaimento
dos valores dessa função de autocorrelação em relação ao aumento do lag, melhor é o
mixing (mistura) das cadeias geradas. A Figura 4.5 a seguir, apresenta os gráficos para
os modelos propostos.
Nota: com limites de significância de 5% para autocorrelações.
Figura 4.5: Gráficos de ACF para os parâmetros λ dos modelos propostos.
Conforme pode ser observado na Figura 4.5, as correlações entre as amostras
geradas λt e λt−k decaem à medida que aumenta-se o valor de k (lag), isto é, essas
correlações vão diminuindo à medida que as amostras geradas vão se tornando mais
afastadas temporalmente uma da outra. Esse fato indica baixa autocorrelação da cadeia,
mixing apropriado e confiabilidade dos estimadores gerados, isto é, de λˆ para todos os
modelos propostos.
86
C
a
p
ít
u
l
o 5
Conclusão e Considerações de Prosseguimento
Nesse último capítulo, apresentam-se as conclusões obtidas a partir da concepçãoe execução desse estudo, perpassando pela validação das hipóteses associadasà questão-problema. Também são sugeridas algumas considerações para um
possível prosseguimento do trabalho.
5.1 Histórico Contextual
Como já mencionado anteriormente, para cumprir o compromisso de levar energia
elétrica aos seus consumidores, as DSOs brasileiras têm custos que devem ser cobertos
pela tarifa de energia. Por essa razão, a ANEEL atua para que esta seja composta
apenas pelos custos que efetivamente se relacionam com os serviços prestados, de forma a
torná-la justa, blindando os consumidores das voracidades do mercado e das ineficiências
na gestão da concessionária.
A partir de 2010, a ANEEL iniciou debates com a sociedade sobre as regras e
metodologias para definir as receitas das DSOs, através de audiências públicas. A partir
disso, a agência reguladora propôs uma revisão completa do modelo que calcula os custos
operacionais das concessionárias, convergindo para a prática de custos eficientes.
Partindo do pressuposto de que os escores de eficiência devem ser suficientemente
precisos e efetivos, a fim de balizar políticas gerenciais e tomadas de decisão mais acertadas,
tornam-se cruciais o desenvolvimento e o emprego, pelo regulador, de metodologias que se
87
5.2. VALIDAÇÃO DAS HIPÓTESES SOB ESTUDO 88
mostrem consistentes na definição de custos operacionais, como por exemplo, o emprego
dos denominados métodos de benchmarking (ou de fronteira), favorecendo assim, tanto
as DSOs quanto os próprios consumidores. Em muitos países, tem sido aplicado o state-
of-the-art benchmarking, que segundo Bogetoft e Otto (2011), já é responsável por um
considerável impacto econômico positivo em países europeus.
Estes métodos têm proporcionado aos analistas de diferentes setores da economia
moderna, em especial àqueles do setor de regulação de energia elétrica, a identificação do
nível máximo de produto ou dos níveis mínimos de custo, dada a quantidade de recursos
produtivos empregados, bem como a avaliação do desvio de um determinado grupo em
relação aos padrões de referência. Sendo assim, a ANEEL começou a utilizar modelos de
DEA (atual) e COLS Cobb-Douglas (não mais utilizado) para as DSOs brasileiras. Porém,
existem algumas lacunas e discrepâncias na metodologia empregada e, infelizmente, a
ANEEL ainda não possui uma metodologia livre de distorções, que possa apresentar
resultados capazes de incentivar uma análise mais verossímil da realidade.
Apesar das grandes melhorias do modelo de benchmarking de distribuição de
eletricidade no Brasil nos últimos ciclos periódicos de revisão tarifária, as eficiências
de custo estimadas apresentaram grande variabilidade de um ciclo de revisão anterior
para o seguinte. Infelizmente, mesmo com preciosas e fundadas sugestões ofertadas à
ANEEL, a problemática da ausência de implementação de uma metodologia acurada
ainda persiste. Com isso, a definição dos escores de eficiência das DSOs fica prejudicada,
e consequentemente, tomadas de decisão se mantêm deficientes. Logo, existe uma lacuna
a ser preenchida pela ANEEL: qual metodologia utilizar e/ou ser desenvolvida,
de maneira que se possa definir satisfatoriamente, uma fronteira de custos
eficientes para as DSOs brasileiras?
A busca por metodologias que pudessem suprir as deficiências dos métodos atuais,
como por exemplo, a utilização de modelos de fronteira estocática (SFA), motivaram
as pesquisas que foram desdobradas nesse trabalho de doutoramento. Além disso, a
associação entre a modelagem e o método de resolução pode resultar em uma valiosa
ferramenta para o processo de tomada de decisão.
5.2 Validação das Hipóteses sob Estudo
Ajustar um modelo de fronteira estocástica a um conjunto de dados limitado não é
uma tarefa trivial, como demonstrado nesse trabalho. Usando uma abordagem tradicional
88
5.3. RESULTADOS OBTIDOS 89
de máxima verossimilhança, o parâmetro de assimetria pode convergir para o infinito
com probabilidade positiva, comprometendo a estimativa da eficiência de custo. Como
alternativa, a abordagem Bayesiana fornece um mecanismo adequado para a estimativa
do parâmetro de assimetria e pode impor restrições nos coeficientes do modelo.
No entanto, a abordagem Bayesiana proposta tem limitações e mais investigações
ainda são necessárias. O processo de estimação Bayesiano aplicado foi o Markov Chain
Monte Carlo (MCMC). Para avaliar a convergência, são necessárias múltiplas execuções
e, portanto, os resultados finais podem apresentar pequenas diferenças. As estatísticas
WAIC, DIC e LPML foram utilizadas para avaliar o ajuste do modelo.
O objetivo desse estudo foi duplo: primeiro replicar o mais próximo possível, as
eficiências estimadas para as DSOs brasileiras, utilizando uma abordagem robusta de SFA,
ou seja, utilizando as mesmas entradas e saídas do modelo empregado atualmente pelo
regulador. Segundo, propor uma abordagem alternativa e robusta de SFA utilizando a
informação disponível, incluindo a componente ambiental. Uma correlação linear máxima
de ρ = 0,6531 foi obtida usando um modelo SFA com uma função de custo Translog.
No entanto, o modelo original de DEA inclui restrições adicionais de peso que ainda
exigem estudos adicionais para desenvolver uma proposta de SFA semelhante. Esse
trabalho estimou, com sucesso, um método de benchmarking de SFA para estimar os
custos eficientes das DSOs brasileiras, validando as duas hipóteses levantadas na seção
(1.9) desse texto.
5.3 Resultados Obtidos
Os resultados mostram uma grande diferença de escala entre as eficiências DEA e
SFA. A eficiência média do DEA é de 70,5%, enquanto a eficiência média do SFA é de
88,5%. Essa diferença representa uma receita total de R$ 3.175.509.926,81 ou U$ 971,1
milhões (considerando uma taxa de câmbio média de R$ 3,27 por U$ 1,00 no ano de 2016),
que atualmente é contabilizada como ineficiência. Como mencionado anteriormente, isso
ocorre porque o SFA decompõe a distância da fronteira de custo em duas componentes,
ruído e ineficiência econômica, enquanto a DEA assume apenas a ineficiência econômica.
Apesar da diferença de escala, tanto DEA e SFA apresentam semelhanças importantes e
algumas diferenças são encontradas em DSOs localizadas no norte do Brasil.
Vale ressaltar que, embora as pontuações originais do DEA variem de 28 a 100%, o
regulador aplicou ad-hoc restrições adicionais para forçar as eficiências no intervalo de 80
89
5.4. METODOLOGIAS COMPLEMENTARES 90
a 100% . A ANEEL aplicou um procedimento de padronização simples. Usando o SFA
ou o máximo de SFA e DEA como a nova estimativa de eficiência, as eficiências estarão
aproximadamente dentro do intervalo de 80 a 100%, como esperado pelo regulador.
Até onde se sabe, este é o primeiro trabalho que apresenta com sucesso um modelo
robusto de SFA, utilizando técnicas Bayesianas, para as DSOs brasileiras aplicando as
mesmas entradas, saídas e incluindo informações ambientais. Os resultados e discussões
aqui apresentados foram submetidos para apreciação e publicação no periódico Energy
Economics.1
5.4 Metodologias Complementares
Na literatura, duas metodologias principais concorrem entre si quanto à maneira
de se definir as fronteiras de eficiência. O DEA utiliza técnicas de programação linear
determinista, enquanto o SFA faz uso de técnicas econométricas.
O DEA é mais difundido e possui a vantagem de não impor formas funcionais aos
dados. Porém, a fronteira calculada pode ser influenciada negativamente caso os dados
sejam contaminados por erros aleatórios e/ou apresentem valores discrepantes (outliers).
Com isso, a mensuração das eficiências fica comprometida. O SFA tem uma natureza
estocástica e, ao permitir a acomodação de ruídos e outliers na base de dados, inferências
estatísticas sobre os parâmetros da função de fronteira podem ser realizadas. Todavia,
esse método requer considerações de formas funcionais e distribuições probabilísticas
sobre os parâmetros envolvidos na estimação, além de exigir especialização estatística
avançada em comparação com o DEA. Também, Lampe e Hilgers (2015) chamam a
atenção para o fato da atividade de pesquisa no DEA não ser tão rápida na adoção de
novos métodos como no SFA.
Apesar dessas significativas diferenças metodológicas entre os dois métodos, in-
dependentemente de qual será escolhido pelo regulador, é interessante avaliar os dois,
pois um complementa o outro e permite uma maior robustez dos resultados. Logo, como
resposta para a questão-problema apresentada nesse trabalho, pode-se dizer que DEA e
SFA devem ser vistas como metodologias não-excludentes e complementares, que podem
ser utilizadas e desenvolvidas pelo regulador brasileiro, visando definir satisfatoriamente,
uma fronteira de custos eficientes para as DSOs brasileiras.
1https://www.journals.elsevier.com/energy-economics
90
5.5. CONSIDERAÇÕES DE PROSSEGUIMENTO 91
5.5 Considerações de Prosseguimento
Para além do escopo desse trabalho, mas com desejo de prosseguimento nos estudos,
podem-se elencar as seguintes sugestões para trabalhos futuros:
• Investigar a metodologia do M-factor (Sartori, 2006) como possibilidade de estimar
o parâmetro λ, criando uma penalização (M-factor) para a verossimilhança e
permitindo assim, o emprego de técnicas frequentistas para a estimação desse
parâmetro;
• Investigar formas de estimar o modelo SFA a fim de aproximá-lo do atual modelo
DEA, caso assim seja proposto pelo regulador;
• Investigar modelos alternativos, como por exemplo, StoNED.
5.6 Considerações Finais
Ao se chegar nessa parte final, julga-se oportuno destacar a observação feita por
Haney e Pollit (2011), de que quanto mais fortes e maduras forem as instituições políticas,
mais provável é que um país tenha um alto índice de boas práticas de regulação, pois se
garante um regulador independente.
E por fim, ressalta-se que o presente trabalho consiste em uma pequena, porém
importante contribuição alternativa num cenário já tão amplamente pesquisado via DEA.
Não se pretende com ele, desmentir ou desqualificar os trabalhos e metodologias já
realizados, mas sim, criar uma sinergia entre as partes. E nesse sentido, vale parafrasear
Paradi (2015):
“Os métodos de engenharia para resolver problemas, melhorar sistemas e
até mesmo evitar desastres não permitem que simplesmente se rejeite o que
outros criaram, mas devem, em vez disso, apresentar alternativas viáveis e
suportáveis.”
91

A
p
ê
n
d
ic
e
Apêndice A
Nesse primeiro apêndice, serão apresentados os procedimentos metodológicosnecessários para a obtenção das expressões matemáticas que foram discutidasao longo desse trabalho.
A.1 Obtenção da Expressão para o Cálculo de f ()
Na seção 2.5.2.4 do capítulo 2, foi considerado o seguinte modelo de custo com
fronteira estocástica baseado em Aigner et al. (1977):
lnEi = lnC(wi, yi,β) + i, (A.1)
lnEi = C(wi, yi,β) + νi + ui, (A.2)
νi ∼
iid
N(0, σ2ν), (A.3)
ui ∼
iid
N+(0, σ2u), (A.4)
ui e νi são independentes entre si, (A.5)
ui e νi são independentes de xi. (A.6)
A função densidade de probabilidade marginal f() pode ser obtida, integrando-se
a função f(, u) dada em (2.42), isto é:
93
A.1. OBTENÇÃO DA EXPRESSÃO PARA O CÁLCULO DE F () 94
f() =
∫ ∞
0
f(, u)du
=
∫ ∞
0
2
2piσνσu
exp
[
−(− u)
2
2σ2ν
− u
2
2σ2u
]
du
=
∫ ∞
0
2
2piσνσu
exp
{
−12
[(
− u
σν
)2
+
(
u
σu
)2]}
du. (A.7)
Pode ser feita a seguinte simplificação:
(
− u
σν
)2
+
(
u
σu
)2
= 
2 − 2u+ u2
σ2ν
+ u
2
σ2u
= 
2
σ2ν
− 2u
σ2ν
+ u2
(
1
σ2ν
+ 1
σ2u
)
= 
2
σ2ν
+ σ
2
ν + σ2u
σ2νσ
2
u
(−2uσ2u
σ2ν + σ2u
+ u2
)
. (A.8)
Definindo µ∗ =  σ
2
u
σ2ν+σ2u
e σ2∗ =
σ2νσ
2
u
σ2ν+σ2u
, a equação (A.8) pode ser reescrita como:
(
− u
σν
)2
+
(
u
σu
)2
= 
2
σ2ν
+ σ
2
ν + σ2u
σ2νσ
2
u
(−2uσ2u
σ2ν + σ2u
+ u2
)
= 
2
σ2ν
+ 1
σ2∗
(
−2uµ∗ + u2
)
= 
2
σ2ν
+ 1
σ2∗
(
−2uµ∗ + u2
)
+ µ
2
∗
σ2∗
− µ
2
∗
σ2∗
= 
2
σ2ν
+ 1
σ2∗
(
−2uµ∗ + u2 + µ2∗
)
− µ
2
∗
σ2∗
= 
2
σ2ν
+
(
u− µ∗
σ∗
)2
− 
2σ2u
σ2ν (σ2ν + σ2u)
=
(
u− µ∗
σ∗
)2
+ 
2
σ2ν + σ2u
. (A.9)
Com isso, a expressão (A.7) é simplificada para:
94
A.1. OBTENÇÃO DA EXPRESSÃO PARA O CÁLCULO DE F () 95
f() =
∫ ∞
0
f(, u)du
=
∫ ∞
0
2
2piσνσu
exp
{
−12
[(
u− µ∗
σ∗
)2
+ 
2
σ2ν + σ2u
]}
du
=
∫ ∞
0
2
2piσνσu
exp
[
−12
(
u− µ∗
σ∗
)2]
· exp
[
−12
(
2
σ2ν + σ2u
)]
du
= 2√
2piσνσu
exp
[
−12
2
σ2ν + σ2u
] ∫ ∞
0
1√
2pi
exp
[
−12
(
u− µ∗
σ∗
)2]
du. (A.10)
Agora seja considerar u˜ = u−µ∗
σ∗ , o que implica em u˜ ∈ [−µ∗/σ∗,∞) e du˜du = 1σ∗ ∴
du = σ∗du˜.
Logo, a integral dada em (A.10) pode ser resolvida como:
∫ ∞
0
1√
2pi
exp
[
−12
(
u− µ∗
σ∗
)2]
du =
∫ ∞
−µ∗
σ∗
1√
2pi
exp
(
−12 u˜
2
)
σ∗du˜ = σ∗Φ
(
µ∗
σ∗
)
.(A.11)
Por fim,
f() = 2√
2piσνσu
exp
[
−12
(
2
σ2ν + σ2u
)] ∫ ∞
0
1√
2pi
exp
[
−12
[
(u− µ∗
σ∗
)2]
du
= 2√
2piσνσu
exp
[
−12
(
2
σ2ν + σ2u
)]
σ∗Φ
(
µ∗
σ∗
)
= 2√
2pi
√
σ2ν + σ2u
[
1
Φ(µ∗σ∗ )
]exp[−12
(
2
σ2ν + σ2u
)]
=
φ
(
√
σ2ν+σ2u
)
√
σ2ν + σ2u ·
[
1
Φ(µ∗σ∗ )
]
= 2
σ
φ
(

σ
)
Φ
(
λ

σ
)
, (A.12)
onde σ =
√
σ2u + σ2ν é conhecido como parâmetro de escala, λ = σuσν representa o parâmetro
de forma, φ(·) é a função densidade de probabilidades normal padrão e, Φ(·) é a função
de distribuição de probabilidades acumuladas normal padrão.
95
A.2. OBTENÇÃO DA EXPRESSÃO PARA O CÁLCULO DE E(U |) 96
A.2 Obtenção da Expressão para o Cálculo de
E(u|)
Na subseção 2.5.2.4 do capítulo 2, foi apresentada uma expressão, proposta por
Jondrow et al. (1982), para o cálculo da ineficiência econômica de um dado produtor,
conforme cálculos a seguir (o subscrito i foi omitido).
uˆ = E(u|)
=
∫ ∞
0
u · f(u|)du
=
∫ ∞
0
u√
2piσ∗ · Φ
(
µ∗
σ∗
) · exp[−12
(
u− µ∗
σ∗
)2]
du. (A.13)
Novamente, seja considerar
u˜ = u− µ∗
σ∗
,
o que implica em u˜ ∈ [−µ∗/σ∗,∞) e du˜du = 1σ∗ ∴ du = σ∗du˜.
Então,
uˆ = E(u|)
=
∫ ∞
−µ∗
σ∗
µ∗ + u˜σ∗√
2piΦ
(
µ∗
σ∗
)exp(−12 u˜2
)
du˜
= µ∗
Φ
(
µ∗
σ∗
) ∫ ∞
−µ∗
σ∗
1√
2pi
exp
(
−12 u˜
2
)
du˜+ σ∗
Φ
(
µ∗
σ∗
) ∫ ∞
−µ∗
σ∗
u˜√
2pi
exp
(
−12 u˜
2
)
du˜
= µ∗ +
σ∗
Φ
(
µ∗
σ∗
) · 1√
2pi
exp
[
−12
(
µ∗
σ∗
)2]
= µ∗i +
φ
(
µ∗i
σ∗
)
Φ
(
µ∗i
σ∗
)σ∗. (A.14)
96
A.3. OBTENÇÃO DA EXPRESSÃO PARA O CÁLCULO DE E(E−U |) 97
A.3 Obtenção da Expressão para o Cálculo de
E(e−u|)
Na subseção 2.5.2.4 do capítulo 2, foi apresentada uma expressão, proposta por
Battese e Coelli (1988), para o cálculo da eficiência econômica de um dado produtor,
conforme cálculos a seguir (o subscrito i foi omitido).
EE = E(e−u|)
=
∫ ∞
0
e−u · f(u|)du
=
∫ ∞
0
1√
2piσ∗ · Φ
(
µ∗
σ∗
) · exp[−12
(
u− µ∗
σ∗
)2
− u
]
du
= 1
σ∗Φ
(
µ∗
σ∗
) ∫ ∞
0
1√
2pi
· exp
[
−12
(
u− µ∗
σ∗
)2
− u
]
du. (A.15)
Considerando que,
−12
(
u− µ∗
σ∗
)2
− u = −12
(
u2 − 2uµ∗ + µ2∗
σ2∗
)
− u
= − [u− (µ∗ − σ
2
∗)]2
2σ2∗
− 12(2µ∗ − σ
2
∗), (A.16)
então, a equação (A.15) pode ser simplificada para:
EE = 1
σ∗Φ
(
µ∗
σ∗
) ∫ ∞
0
1√
2pi
exp
{
− [u− (µ∗ − σ
2
∗)]
2
2σ2∗
− 12
(
2µ∗ − σ2∗
)}
du
=
exp
[
−12 (2µ∗ − σ2∗)
]
σ∗Φ
(
µ∗
σ∗
) ∫ ∞
0
1√
2pi
exp
{
−12
[u− (µ∗ − σ2∗)]2
σ2∗
}
. (A.17)
Agora seja considerar u˜ = u−(µ∗−σ2∗)
σ∗ , o que implica em u˜ ∈ [(−µ∗/σ∗) + σ∗,∞) e
du˜
du
= 1
σ∗ ∴ du = σ∗du˜.
97
A.3. OBTENÇÃO DA EXPRESSÃO PARA O CÁLCULO DE E(E−U |) 98
Logo, a integral dada em (A.17) pode ser resolvida como:
EE = E(e−u|)
=
exp
[
−12 (2µ∗ − σ2∗)
]
σ∗Φ
(
µ∗
σ∗
) ∫ ∞
−µ∗
σ∗ +σ∗
1√
2pi
σ∗exp
{
−12 u˜
2
}
du˜
= exp
(
−µ∗ + 12σ
2
∗
)
· Φ
(
µ∗
σ∗ − σ∗
)
Φ
(
µ∗
σ∗
) . (A.18)
98
A
p
ê
n
d
ic
e B
Apêndice B
Nesse segundo apêndice, é apresentada uma síntese do procedimento de simulaçãocomputacional conhecido como Monte Carlo via Cadeias de Markov (MCMC),bem como um de seus algoritmos, conhecido como Amostrador de Gibbs.
B.1 Procedimento Monte Carlo via Cadeias de
Markov (MCMC)
Conforme foi apresentado na subseção 2.5.2.5, o estimador Bayesiano de um vetor
ψ de parâmetros a serem estimados é definido como o valor médio da distribuição a
posteriori, f(ψ|E), isto é,
ψˆ = E[ψ|E] =
∫
ψ
ψf(ψ|E)dψ. (B.1)
Infelizmente, na maioria das vezes o cálculo desta última integral é intratável
analiticamente. De acordo com Souza (2008), esse fato atrasou por muito tempo o
desenvolvimento de modelos Bayesianos. Somente nas últimas três décadas, com a evolução
da simulação computacional, é que este cenário se reverteu. Devido à complexidade, os
modelos Bayesianos necessitam na maioria das vezes, do suporte de métodos de simulação,
tais como aqueles que usam o procedimento conhecido como Monte Carlo1 via Cadeias
1Simulações de Monte Carlo referem-se àquelas simulações que utilizam números aleatórios.
99
B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 100
de Markov (MCMC). Dentre estes, destaca-se o Amostrador de Gibbs para a realização
de inferências sobre a distribuição a posteriori, sendo considerado uma técnica numérica
eficiente. Basicamente, a ideia desse método é poder gerar variáveis aleatórias de uma
distribuição marginal, sem ter de resolvê-la diretamente. Osiewalski e Steel (1998) trazem
um estudo com descrição detalhada sobre esses método numérico de simulação.
Uma maneira aparentemente plausível de se resolver a integral da equação (B.1)
consiste em gerar amostras aleatórias independentes e identicamente distribuídas {ψt, t =
1, 2, , . . . , T} da distribuição a posteriori f(ψ|E) e realizar a seguinte aproximação:
E[ψ|E] = 1
T
T∑
t=1
ψt, (B.2)
que converge para E[ψ|E] com probabilidade um, quando T →∞.
Entretanto, apesar de ser considerada uma ideia simples, o custo dessa simplicidade
é que além da variância ser alta, em diversos casos, é praticamente impossível amostrar
diretamente da distribuição a posteriori (Tierney, 1994). Porém, uma poderosa alternativa
é fazer uso do procedimento MCMC, descrito a seguir.
O MCMC (Metropolis et al., 1953) é um procedimento eficiente para gerar variáveis
aleatórias, baseando-se em processos estocásticos denominados Cadeias de Markov. Logo,
antes de se apresentar o método propriamente dito, vale a pena definir alguns conceitos
referentes a estes processos.
B.1.1 Cadeias de Markov
O conteúdo dessa subseção foi baseado nas obras de Anton e Busby (2006); Hines
et al. (2006); Taha (2008); Hillier e Lieberman (2010).
Um processo estocástico é definido como um conjunto indexado de variáveis aleató-
rias, {Xt}, em que o índice t percorre dado conjunto T . Normalmente, admite-se que T
seja o conjunto de inteiros não-negativos e Xt represente uma característica mensurável
de interesse no instante t. Por exemplo, Xt poderia representar o nível de estoque de
determinado produto no final da semana t (Hillier e Lieberman, 2010). Um processo
estocástico normalmente apresenta a seguinte estrutura:
O estado atual do sistema pode cair em qualquer uma das M + 1 categorias
mutuamente exclusivas denominadas estados. Para facilitar a notação, esses estados são
identificados como 0, 1, . . . ,M . A variável aleatória Xt representa o estado do sistema
100
B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 101
no instante t, de modo que seus únicos valores possíveis sejam 0, 1, 2, . . . ,M . Os sistema
é observado em pontos determinados do tempo, identificados por t = 0, 1, 2, . . . , T .
Portanto, o processo estocástico Xt = X0, X1, X2, . . . , XT fornece uma representação
matemática de como o estado do sistema físico evolui ao longo do tempo. Esse tipo de
processo é conhecido como um processo estocástico em tempo discreto com um espaço
de estado finito.
B.1.1.1 Propriedade Markoviana
Um processo estocástico Xt é dito ter propriedade markoviana se:
P (Xt+1 = j|X0 = k0, X1 = k1, . . . , Xt−1 = kt−1, Xt = i) = P (Xt+1 = j|Xt = i), (B.3)
para t = 0, 1, 2, . . . , T e toda sequência i, j, k0, k1, . . . , kt−1. Traduzindo isso em palavras,
essa propriedade markoviana diz que a probabilidade condicional de qualquer “evento”
futuro, dados “quaisquer” eventos passados e o estado presente Xt = i, é independente
dos eventos passados e depende apenas do estado atual. Um processo estocástico Xt(t =
0, 1, 2, . . . , T ) é uma Cadeia de Markov se possuir a propriedade markoviana.
B.1.1.2 Probabilidades de Transição
As probabilidades condicionais P (Xt+1 = j|Xt = i) para uma Cadeia de Markov
são chamadas probabilidades de transição ou Kernel de Transição em uma etapa. Se,
para cada i e j, P (Xt+1 = j|Xt = i) = P (X1 = j|X0 = i), para todo t = 1, 2, . . . , T ,
então as probabilidades de transição são ditas estacionárias.
Portanto, ter probabilidades de transição estacionárias implica que as probabilidades
de transição não mudam ao longo do tempo. A existência de probabilidades de transição
(em uma etapa) estacionárias também implica o mesmo, isto é, para cada i, j e n
(n = 0, 1, 2, . . . , N), P (Xt+n = j|Xt = i) = P (Xn = j|X0 = i) para todo t = 0, 1, 2, . . . , T .
Essas probabilidades condicionais são denominadas probabilidades de transição em n
etapas.
B.1.1.3 Notação
Para simplificar a notação com probabilidades de transição estacionárias, façamos
com que:
pij = P (Xt+1 = j|Xt = i)
p
(n)
ij = P (Xt+n = j|Xt = i). (B.4)
101
B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 102
Assim, a probabilidade de transição em n etapas p(n)ij é simplesmente a probabilidade
condicional de que o sistema estará no estado j após exatamente n etapas (unidades de
tempo), dado que ele inicia no estado i a qualquer instante t. Quando n = 1, note que
p
(1)
ij = pij. Para n = 0, p
(0)
ij é apenas P (X0 = j|X0 = i) e, consequentemente, é 1 quando
i = j e 0 quando i 6= j.
Como as p(n)ij são probabilidades condicionais, elas devem satisfazer as seguintes
propriedades:
p
(n)
ij ≥ 0 , ∀i, j, n,
M∑
j=0
p
(n)
ij = 1 , ∀i, n. (B.5)
Uma maneira conveniente de mostrar todas as probabilidades de transição em n
etapas é o formato de matriz a seguir:
Essa matriz é denominada de matriz de transição em n etapas. Note que a probabi-
lidade de transição em determinada linha e coluna é para a transição do estado de linha
para o estado de coluna.
B.1.1.4 Equações de Chapman-Kolmogorov
As equações de Chapman-Kolmogorov fornecem um método para calcular as proba-
bilidades de transição em n etapas:
p
(n)
ij =
M∑
k=0
p
(m)
ik p
(n−m)
kj , (B.6)
para todo i, j = 0, 1, 2, . . . ,M e quaisquer m = 1,2, . . . , n− 1 e n = m+ 1,m+ 2, . . . , n.
Na equação (B.6), p(m)ik p
(n−m)
kj indica que, dado um ponto de partida de estado i, o
processo vai ao estado k após m etapas e depois para o estado j em n−m etapas. Logo,
a soma das probabilidades sobre todos os possíveis k leva a p(n)ij . No entanto, pode-se
mostrar que P(n) = Pn. Assim, a matriz de probabilidades de transição em n etapas
P(n) pode ser obtida calculando-se a n-ésima potência da matriz de de transição em uma
etapa P .
102
B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 103
B.1.1.5 Classificação dos Estados em uma Cadeia de Markov
Em uma Cadeia de Markov, é usual dar a seguinte nomenclatura para os estados::
Estado Absorvente - um estado j é absorvente caso, após adentrar esse estado, o
processo jamais deixará este estado novamente. Portanto, pjj = 1;
Estado Transiente - um estado i é transiente se, após entrar nesse estado, existir a
possibilidade de se alcançar outro estado j, mas não será possível voltar ao estado
i em que se estava;
Estado Recorrente - o estado i é dito ser recorrente se, após entrar neste estado, o
processo com certeza for retornar a este estado novamente em outra etapa. Para
isso, este estado não pode ser transiente;
Estado Periódico - o período do estado i é definido como o inteiro t,(t > 1), tal que
p
(n)
ii = 0 para todos os valores de n diferentes de t, 2t, 3t, . . ., e t é o maior inteiro
com essa propriedade;
Estado Aperiódico - se existirem dois números consecutivos s e s + 1 tais que, o
processo possa se encontrar no estado i nos instantes s e s + 1, o estado é dito
como tendo período 1 e é dito aperiódico;
Estado Ergódico - em uma Cadeia de Markov de estados finitos, os estados recorrentes
que forem aperiódicos são denominados estados ergódigos;
Cadeia Ergódica - uma Cadeia de Markov é dita ergódiga se todos os seus estados
forem ergódigos, isto é, se todos os estados forem recorrentes e aperiódicos;
Cadeia Irredutível - uma Cadeia de Markov é dita irredutível se todos os seus estados
se comunicam entre si.
B.1.1.6 Probabilidade de Estado Estável
Para qualquer Cadeia de Markov ergódica e irredutível, tem-se que:
lim
n→+∞ p
(n)
ij = pij > 0, (B.7)
103
B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 104
e é independente de i. Os pij são chamados probabilidades de estado estável de uma
Cadeia de Markov e satisfazem às seguintes equações de estado estável:
pij =
M∑
i=0
piipij, ∀ j = 0, 1, . . . ,M,
M∑
j=0
pij = 1. (B.8)
Após essa síntese de alguns dos conceitos referentes às Cadeias de Markov, podem
ser apresentadas a ideias que estão por trás do MCMC.
B.1.2 Lógica do MCMC
Seja considerar uma sequência de variáveis aleatórias {ψt, t = 1, 2, . . . , T}, tal que
em cada momento t ≥ 0, o próximo estado ψt+1 é gerado da distribuição condicional
f(ψt+1|ψt), que representa a probabilidade de transição entre os estados, e não depende
de t se a cadeia for homogênea no tempo. Uma realização desta sequência de variáveis
aleatórias {ψt, t = 1, 2, . . . , T} constitui uma Cadeia de Markov, com ψ0 representando
uma condição inicial.
Se essa cadeia for ergódica e irredutível, então limn→+∞ p(n)ij = pij > 0, implicando
na existência de uma distribuição estacionária para pij. Assim, se ψt for gerado a partir
desta distribuição, então todos os valores seguintes também o serão (Roberts, 1996).
Considerando f(ψ|E) dada na equação (B.1) como sendo a distribuição estacionária,
isto é,
f(ψ|E) ≡ f(pi), (B.9)
pode ser observado que se t→∞, os pontos amostrados ψt se parecerão cada vez mais
com as amostras de f(ψ|E) (Gilks et al., 1996). Ignorando as primeiras tb iterações da
cadeia (período de burn-in2), pode-se utilizar a Cadeia de Markov para estimar E[ψ|E],
sendo ψ|E ∼ f(ψ|E), da seguinte maneira:
E[ψ|E] = 1
T − tb
T∑
t=tb+1
(ψt|E), (B.10)
2O período de burn-in representa as primeiras tb iterações da Cadeia de Markov que serão desprezadas,
porém necessárias para dar estabilidade e confiabilidade ao procedimento MCMC.
104
B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 105
com probabilidade de convergência tendendo a um (Roberts, 1996). Assim, torna-se
possível encontrar o estimador ψˆ descrito na equação (B.1).
Uma última questão a se tratar diz respeito à construção de uma Cadeia de Markov
tal que f(ψ|E) ≡ f(pi), isto é, a distribuição estacionária, f(pi), seja equivalente à
distribuição a posteriori, f(ψ|E). Uma possível solução para essa questão faz uso do
algoritmo conhecido como Amostrador de Gibbs, descrito a seguir.
B.1.3 Algoritmo Amostrador de Gibbs
De acordo com Gamerman e Lopes (2006), o Amostrador de Gibbs (Geman e
Geman, 1984) é um esquema iterativo de amostragem de uma Cadeia de Markov, cujas
probabilidades de transição são formadas pelas distribuições condicionais completas.
Casella e George (1992) descrevem o funcionamento deste algoritmo da seguinte maneira:
seja estudar o comportamento da distribuição marginal da variável aleatória ψ1 em um
contexto de mais variáveis (ψ2, ψ3, . . . , ψd). A marginal em questão é dada por:
f(ψ1) =
∫
ψd
∫
ψd−1
. . .
∫
ψ3
∫
ψ2
f(ψ1, ψ2, . . . , ψd)dψ2dψ3 . . . dψd. (B.11)
O cálculo dessas integrais pode ser impossível de ser realizado. Felizmente, o Amos-
trador de Gibbs permite contornar essa situação, estimando as distribuições marginais
através de simulação, conforme o algoritmo descrito na Figura B.1.
Conforme pode ser observado nesse algoritmo, cada iteração se completará após d
movimentos. Após um critério de convergência ser atendido, os valores resultantes para
ψ(t) = (ψ(t)1 , ψ
(t)
2 , . . . , ψ
(t)
d ) formam uma amostra para f(ψ). Se o mesmo raciocínio for
aplicado a f(ψ|E), a equação (B.1) pode ser resolvida diretamente.
B.1.4 Critério de Convergência
Segundo Cowles e Carlin (1996), um método eficiente e relativamente simples
para monitorar a convergência do Amostrador de Gibbs , é o gráfico de Autocorrelation
Function (ACF) construído a partir das amostras geradas para f(ψ|E). A função de
autocorrelação é uma medida da correlação entre as observações de uma série temporal
que estão separadas por k unidades de tempo (lag), isto é, entre f(ψt|E) e f(ψt−k|E).
Quanto mais rápido for o decaimento dos valores dessa função de autocorrelação em
105
B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 106
procedimento Amostrador de Gibbs
1 {Inicialização}
2 t← 1;
3 ψ(0) ← (ψ(0)1 , ψ(0)2 , . . . , ψ(0)d );
4 {Iterações}
5 para t = 1 até T (passo = t) faça
6 se Critério de Convergência Não Satisfeito
7 então
8 ψ(t) ← (ψ(t)1 , ψ(t)2 , . . . , ψ(t)d ), onde:
9 ψ(t)1 = f(ψ1|ψ(t−1)2 , ψ(t−1)3 , . . . , ψ(t−1)d );
10 ψ(t)2 = f(ψ2|ψ(t)1 , ψ(t−1)3 , . . . , ψ(t−1)d );
11
...
12 ψ(t)d = f(ψd|ψ(t)1 , ψ(t)2 , . . . , ψ(t)d−1);
13 senão
14 Pare;
15 f(ψ)← ψ(t) ← (ψ(t)1 , ψ(t)2 , . . . , ψ(t)d );
16 fim-se;
17 fim-para
fim Amostrador de Gibbs;
Figura B.1: Algoritmo Amostrador de Gibbs.
relação ao aumento do lag, melhor é o mixing (mistura) das cadeias geradas. A Figura
B.2 a seguir, ilustra esse tipo de gráfico.
Figura B.2: Exemplo de um gráfico ACF para ψt|E.
106
B.1. PROCEDIMENTO MONTE CARLO VIA CADEIAS DE MARKOV (MCMC) 107
Conforme pode ser observado na Figura B.2, as correlações entre as amostras
geradas f(ψt|E) e f(ψt−k|E) decaem à medida que aumenta-se o valor de k (lag), isto
é, essas correlações vão diminuindo à medida que as amostras geradas vão se tornando
mais afastadas temporalmente uma da outra. Esse fato indica baixa autocorrelação da
cadeia, mixing apropriado e confiabilidade dos estimadores gerados, isto é, de ψˆ.
107

A
p
ê
n
d
ic
e C
Apêndice C
Conforme foi discutido no capítulo 3, os modelos BSFA propostos foram com-parados utilizando-se as estatísticas Watanabe-Akaike Information Criterion(WAIC), Deviance Information Criterion (DIC) e Log-Pseudo Marginal Like-
lihood (LPML). Os modelos com menor valor de DIC e maiores valores de WAIC e LPML
alcançam melhor ajuste aos dados. Nesse terceiro apêndice, é apresentada uma síntese
destes critérios.
C.1 Critérios de Seleção de Modelos
C.1.1 Log-Pseudo Marginal Likelihood (LPML)
Esse critério funciona como uma validação cruzada do modelo, do tipo leave-one-out,
utilizando o logaritmo da função de verossimilhança como critério de comparação entre
os vários modelos de BSFA disponíveis, isto é, para cada modelo, calcula-se:
LPML =
n∑
i
ln f(xi|x(−i)), (C.1)
onde x(−i) é o conjunto de n dados sem a observação xi. Escolhe-se o modelo com maior
valor de LPML.
109
C.1. CRITÉRIOS DE SELEÇÃO DE MODELOS 110
C.1.2 Deviance Information Criterion (DIC)
Esse critério penaliza simultaneamente, a falta de ajuste e a complexidade do
modelo, conforme a seguinte equação:
DIC = E [D(x|Θ)] +
{
E [D(x|Θ)]−D(x|Θˆ)
}
, (C.2)
onde:
• Θ e Θˆ são os parâmetros e os estimadores de máxima verossimilhança do modelo;
• D(x|Θ) = −2 ln [f(x|Θ) é o deviance, isto é, a soma de quadrados dos resíduos
do ajuste obtido por máxima verossimilhança, ao invés de mínimos quadrados
ordinários (OLS);
• E [D(x|Θ)] é a média a posteriori para o deviance e penaliza a falta de ajuste;
• D(x|Θˆ) é o deviance avaliado na média ou na mediana a posteriori de Θˆ;
• E [D(x|Θ)]−D(x|Θˆ) é o tamanho efetivo do modelo e penaliza a complexidade.
Escolhe-se o modelo com menor valor de DIC.
C.1.3 Watanabe-Akaike Information Criterion (WAIC)
Esse critério também é composto por duas componentes: uma que penaliza a falta
de ajuste do modelo e outra que penaliza a complexidade do mesmo, da seguinte maneira:
WAIC = −2 · {
n∑
i=1
lnE[f(xi|Θ)] +
n∑
i=1
V [ln f(xi|Θ)]}. (C.3)
Escolhe-se o modelo com maior valor de WAIC.
110
Referências Bibliográficas
Agrell, P., Bogetoft, P., 2017. Regulatory benchmarking: models, analyses and applications.
Data Envelopment Analysis Journal 3, 49–91.
Aigner, D., Lovell, C., Schmidt, P., 1977. Formulation and estimation of stochastic frontier
production function models. Journal of Economics 6 (1), 21–37.
Albert, J., 2009. Bayesian Computation with R. New York: Springer.
Albuquerque, M., 1987. Uma análise translog sob mudança tecnológica e efeitos de escala:
um caso de modernização ineficiente. Pesquisa em Planejamento Econômico 17 (1),
191–220.
Altoé, A., Costa, N., Lopes, A., Veloso, T., Saurin, V., 2017. Technical efficiency and
financial performance in the brazilian distribution service operators. Socio-Economic
Planning Sciences 1 (1), 1–14.
Alvarez, A., Amsler, C., Orea, L., Schmidt, P., 2006. Interpreting and testing the scaling
property in models where inefficiency depends on firm characteristics. Journal of
Productivity Analysis 25 (1), 201–212.
Amsler, C., Prokorov, A., Schmidt, P., 2014. Using copulas to model time dependence in
stochastic frontier models. Econometric Reviews 33 (1), 497–522.
ANEEL, 2006. NT 262/2006: segundo cliclo de revisão tarifária periódica das
concessionárias de distribuição de energia elétrica do Brasil. Technical note,
SER/SFF/SRD/SFE/SRC/ANEEL.
ANEEL, 2015. NT 66/2015: metodologia de custos operacionais. Technical note, SRM-
SGT-ANEEL.
111
REFERÊNCIAS BIBLIOGRÁFICAS 112
ANEEL, 2017. NT 162/2017: abertura de audiência pública para atualização dos parâ-
metros relacionados à definição dos custos operacionais regulatórios (submódulos 2.2 e
2.2a dos procedimentos de regulação tarifária - proret). Technical note, SRM-ANEEL.
Anton, H., Busby, R., 2006. Álgebra Linear Contemporânea. Porto Alegre: Bookman.
Arcoverde, F., Tannuri-Pianto, M., Sousa, M., 2005. Mensuração das eficiências das
distribuidoras do setor energético brasileiro usando fronteiras estocásticas. Anais do
Encontro Nacional de Economia XXXIII (1), 1–18.
Atkinson, S., Dorfman, J., 2005. Bayesian measurement of productivity and efficiency in
the presence of undesirable outputs: crediting electric utilities for reducing air pollution.
Journal of Econometrics 126, 445–468.
Azzalini, A., 1985. A class of distributions which includes the normal ones. Scandinavian
Journal of Statistics 12 (1), 219–230.
Azzalini, A., 2013. The Skew-Normal and Related Families. New York: Cambridge
University Press.
Bandyopadhyay, D., Das, A., 2006. On measures of technical inefficiency and production
uncertainty in stochastic frontier production model with correlated error components.
Journal of Productivity Analysis 26 (1), 165–180.
Banker, R., 2011. Report on aneels proposal for electricity distribution tariff regulation.
Technical note, Technical Note, 101/2011.
Banker, R., Charnes, A., Cooper, W., 1984. Some models for estimating technical and scale
inefficiencies in data envelopment analysis. Management Science 30 (9), 1078–1092.
Banker, R., Forsund, F., Zhang, D., 2017. Use of data envelopment analysis for incentive
regulation of electric distribution firms. Data Envelopment Analysis Journal 3, 1–47.
Banker, R., Natarajan, R., 2008. Evaluating contextual variables affecting productivity
using data envelopment analysis. Operations Research 56 (1), 48–58.
Banker, R., Zhang, D., 2016. Improvement in efficiency under dea-based incentive regu-
lation of electric utilities in Brazil. Technical note based on Ph.D. Thesis of Daqun
Zhang, Temple University.
112
REFERÊNCIAS BIBLIOGRÁFICAS 113
Battese, G., Coelli, T., 1988. Prediction of firm level technical efficiencies with a ge-
neralized frontier production function and panel data. Journal of Econometrics 38,
387–399.
Battese, G., Coelli, T., 1992. Frontier production functions, technical efficiency and panel
data: with aplication to paddy farmers in India. Journal of Productivity Analysis 3 (1),
153–169.
Battese, G., Coelli, T., 1995. A model for technical inefficiency effects in a stochastic
frontier production function for panel data. Empirical Economics 20 (1), 325–332.
Battese, G., Corra, G., 1977. Estimation of a production frontier model: with aplication
to the pastoral zone of eastern Australia. Australian Journal of Agricultural Economics
21 (3), 169–179.
Bauer, P., 1990. Recent developments in the econometric estimation of frontiers. Journal
of Econometrics 46, 39–56.
Bayes, C. L., Branco, M. D., 2007. Bayesian inference for the skewness parameter of
the scalar skew-normal distribution. Brazilian Journal of Probability and Statistics,
141–163.
Behr, A., 2015. Production and Efficiency Analysis with R. New York: Springer.
Bogetoft, P., 2014. Comments on the brazilian benchmarking model for energy distribution
regulation. forth cycle of tariff review, NT 192 2014. Tech. rep.
Bogetoft, P., Lopes, A. L. M., 2015. Comments on the brazilian benchmarking model for
energy distribution regulation forth cycle tariff review technical note 407/2014. Tech.
rep.
Bogetoft, P., Otto, L., 2011. Benchmarking with DEA, SFA and R. International Series
in Operations Research and Management Science. New York: Springer.
Casella, G., George, E., 1992. Explaining the Gibbs Sampler. The American Statistician
46.
Caudill, S., Ford, J., 1993. Biases in frontier estimation due to heteroscedasticity. Econo-
mics Letters 41 (1), 17–20.
113
REFERÊNCIAS BIBLIOGRÁFICAS 114
CEPA, 2013. Assessing Efficiency for the 2005 Distribution Price Control Review. London:
OFGEM.
Chambers, R., 1988. Applied Production Analysis: a dual approach. New York: Cambridge
University Press.
Charnes, A., Cooper, W., Rhodes, E., 1978. Measuring the efficiency of decision making
units. European Journal of Operational Research 2 (6), 429–444.
Chen, Y., Schmidt, P., Wang, H., 2014. Consistent estimation of the fixed effects stochastic
frontier model. Journal of Econometrics 18 (2), 65–76.
Chen, Z., Barros, C., Borges, M., 2015. A Bayesian stochastic frontier analysis of chinese
fossil-fuel electricity generation companies. Energy Economics 48, 136–144.
Christensen, L., Jorgenson, R., Lau, L., 1971. Conjugate duality and transcendental
logarithmic function. Econometrica 39 (1), 255–256.
Cobb, C., Douglas, P., 1928. A theory of production. The American Economic Review
18 (1), 139–165.
Coelli, T., 1995. Estimators and hypothesis tests for a stochastic frontier function: A
monte carlo analysis. Journal of Productivity Analysis 6 (1), 247–268.
Colin, E., 2018. Pesquisa Operacional: 170 aplicações em estratégia, finanças, logística,
produção, marketing e vendas. Rio de Janeiro: LTC.
Cook, W., Zhu, J., 2013. Data Envelopment Analysis: balanced benchmarking. San
Bernardino: Cook and Zhu.
Cornwell, C., Schmidt, P., Sickles, R., 1990. Production frontiers with cross-sectional and
time-series variation in efficiency levels. Journal of Econometrics 46 (1), 185–200.
Costa, M., Lopes, A., Matos, G., 2015a. Statistical evaluation of data envelopment
analysis versus cols cobb-douglas benchmarking models for the 2011 brazilian tariff
revision. Socio-Economic Planning Sciences 49, 47–60.
Costa, M., Rodrigues, T., Costa, A., Natowics, R., Braga, A., 2015b. Sequential selection of
variables using short permutation procedures and multiple adjustments: an application
to genomic data. Statistical Methods in Medical Research, 1–24.
Cowles, K., 2004. Review of winbugs 1.4. The American Statistician 58, 330–336.
114
REFERÊNCIAS BIBLIOGRÁFICAS 115
Cowles, M., Carlin, B., 1996. Markov chain monte carlo convergence diagnostics: A
comparative review. Journal of the American Statistical Association 91 (434), 883–904.
Debreu, G., 1951. The coefficient of resource utilization. Econometrica 19 (3), 273–292.
Deprins, D., Simar, L., 1989a. Estimating technical inefficiencies with corrections for
environmental conditions with an application to railway companies. Annals of Public
and Cooperative Economics 60 (1), 81–102.
Deprins, D., Simar, L., 1989b. Estimation de frontières déterministes avec facteurs
exogènes d’inefficacité. Annales d’Economie et de Statistique 14 (1), 117–150.
Dey, D., Gelfand, A., Peng, F., 1997. Overdispersed generalized linear models. Journal of
Statistical Planning and Inference 64 (1), 93–107.
Dorfman, J., Koop, G., 2005. Current developments in productivity and efficiency
measurement. Journal of Econometrics 126, 233–240.
Douglas, P., 1976. The cobb-douglas production function once again: its history, its
testing, and some new empirical values. Journal of Political Economy 84 (5), 903–915.
Draper, N., Smith, H., Pownell, E., 1966. Applied regression analysis. New York: Wiley.
Edvardsen, P., 2006. Productivity and regulatory reform of norwegian electricity dis-
tribution utilities. Performance Measurement and Regulation of Network Utilities 1,
97–131.
Efron, B., 1979. Bootstrap methods: another look at the jackknife. The Annals of Statistics
7 (1), 1–26.
Emrouznejad, A., Yang, G., 2017. A survey and analysis of the first 40 years of scholarly
literature in dea: 1978 e 2016. Socio-Economic Planning Sciences 1 (1), 1–5.
Farrel, M., 1957. The measurement of productive efficiency. Journal of the Royal Statitical
Society 120 (3), 253–281.
Forsund, F., 2009. Good modelling of bad outputs: pollution and multiple-output pro-
duction. International Review of Environmental and Resource Economics 3, 1–38.
Forsund, F., Lovell, C., Schimidt, P., 1980. A survey of frontier production functions and
of their relationship to efficiency measurement. Journal of Econometrics 13 (1), 5–25.
115
REFERÊNCIAS BIBLIOGRÁFICAS 116
Franco, F., Fortuna, M., 2003. The stochastic frontier method in measuring the efficiency
of hospital services: a literature review. Portuguese Association of Economics and
Health 2, 4–33.
Färe, R., Grosskopf, S., Noh, D., Weber, W., 2005. Characteristics of a polluting techno-
logy: theory and practice. Journal of Econometrics 126, 469–492.
Gamerman, D., Lopes, H., 2006. Markov Chain Monte Carlo: stochastic simulation for
Bayesian inference. London: Chapman and Hall.
Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., Rubin, D. B., 2014.
Bayesian data analysis. Vol. 2. FL: CRC press Boca Raton.
Geman, S., Geman, D., 1984. Stochastic relaxation, gibbs distributions and bayesian
restoration of images. IEEE Transactions on Pattern Analysis and Machine Intelligence
PAMI-6.
Geyer, C. J., Johnson, L. T., 2017. Markov Chain Monte Carlo. R package version 0.9-5.
URL https://CRAN.R-project.org/package=mcmc
Gil, G., Costa, M., Lopes, A., Mayrink, V., 2017. Spatial statistical methods applied to
the 2015 brazilian energy distribution benchmarking model: accountig for unobserved
determinants of inneficieies. Energy Economics 64 (1), 373–383.
Gilks, W., Richardson, S., Spiegelhalter, D., 1996. Introducing Markov chain monte carlo.
In: Chapman, L., Hall (Eds.), Markov Chain Monte Carlo in Practice. Vol. 1. W. Gilks
and S. Richardson and D. Spiegelhalter.
Gilks, W., Roberts, G., 1996. Strategies for improving mcmc. In: Gilks, W., Richardson,
S., Spiegelhalter, D. (Eds.), Markov Chain Monte Carlo in Practice. Chapman and
Hall, pp. 89–114.
Greene, W., 1980a. Maximun likelihood estimation of econometric frontier functions.
Journal of Econometrics 13 (1), 27–56.
Greene, W., 1980b. On the estimation of a flexible frontier production model. Journal of
Econometrics 13 (1), 101–115.
Greene, W., 1990. A gamma-distributed stochastic frontier model. Journal of Econometrics
46 (1/2), 141–64.
116
REFERÊNCIAS BIBLIOGRÁFICAS 117
Greene, W., 2005. Fixed and random effects in stochastic frontier models. Journal of
Productivity Analysis 23 (1), 7–32.
Griffin, E., Steel, J., 2007. Bayesian stochastic frontier analysis using winbugs. Journal
of Productivity Analysis 27 (3), 163–176.
Hadri, K., 1999. Estimation of a doubly heteroscedastic stochastic frontier cost function.
Business and Economic Statistics 17 (1), 359–363.
Haney, A., Pollit, M., 2009. Efficiency analysis of energy networks: an international survey
of regulators. Energy Policy 37 (12), 5814–5830.
Haney, A., Pollit, M., 2011. Exploring the determinants of best practice benchmarking
in electricity network regulation. Energy Policy 39, 7739–7746.
Henze, N., 1986. A probabilistic representation of the skew-normal distribution. Scandi-
navian journal of statistics, 271–275.
Hillier, F., Lieberman, G., 2010. Introdução à Pesquisa Operacional. Porto Alegre:
McGraw Hill.
Hines, W., Montgomery, D., Goldsman, D., Borror, C., 2006. Probabilidade e Estatística
na Engenharia. Rio de Janeiro: LTC.
Hu, J., Wang, S., 2006. Total-factor energy efficiency of regions in china. Energy Policy
34 (17), 3206–3217.
Huang, C., Liu, J., 1994. Estimation of a non-neutral stochastic frontier production
function. Journal of Productivity Analysis 5 (2), 171–180.
Jamasb, T., Pollitt, M., 2001. Benchmarking and regulation: international electricity
experience. Utilities Policy 9, 107–130.
Jondrow, J., Lovell, C., Materov, I., Schmidt, P., 1982. On the estimation of techinical inef-
ficiency in the stochastic frontier production function model. Journal of Econometrics
19 (2), 233–238.
Juárez, M. A., Steel, M. F., 2010. Model-based clustering of non-Gaussian panel data
based on skew-t distributions. Journal of Business & Economic Statistics 28 (1), 52–66.
Koop, G., Osiewalski, J., Steel, M., 1995. Posterior analysis of stochastic frontier models
using gibbs sampling. Computational Statistics 10, 353–373.
117
REFERÊNCIAS BIBLIOGRÁFICAS 118
Koopmans, T., 1951. An an analysis of production as an efficient combination of activities.
In: Wiley, N. Y. (Ed.), Activity Analysis of Production and Allocatio. Vol. 13. Cowles
Comission for Research in Economics.
Kopp, R., Diewert, W., 1982. The decomposition of frontier cost function deviations
into measures of technical and allocative efficiency. Journal of Econometrics 19 (2),
319–331.
Kumbhakar, S., 1990. Production frontiers, panel data, and time-varyng technical ineffi-
ciency. Journal of Econometrics 46 (1), 201–212.
Kumbhakar, S., Glosh, S., McGuckin, J., 1991. A generalized production frontier approach
for estimating determinants of inefficiency in us dairy farms. Journal of Business and
Economic Statistics 9 (3), 279–286.
Kumbhakar, S., Lien, G., Hardarker, J., 2014. Technical efficiency in competing panel
data models: A study of norwegian grain farming. Journal of Productivity Analysis
41 (2), 321–337.
Kumbhakar, S., Lovell, C., 2003. Stochastic Frontier Analysis. New York: Cambridge
University Press.
Kumbhakar, S., Tsionas, E., 2013. The good, the bad and the ugly: a system approach
to good modeling of bad outputs. Working paper.
Kumbhakar, S., Wang, H., 2005. Estimation of growth convergence using a stochastic
production frontier approach. Economics Letters 88 (1), 300–305.
Kumbhakar, S., Wang, H., Horncastle, A., 2015. Stochastic Frontier Analysis Using Stata.
New York: Cambridge University Press.
Kuosmanen, T., 2012. Stochastic semi-nonparametric frontier estimation of electricity
distribution networks: application of the stoned method in the finnish regulatory model.
Energy Economics 34, 2189–2199.
Kuosmanen, T., Kortelainen, M., 2012. Stochastic non-smooth envelopment of data: semi-
parametric frontier estimation subject to shape constraints. Journal of Productivity
Analysis 38 (1), 11–28.
118
REFERÊNCIAS BIBLIOGRÁFICAS 119
Kuosmanen, T., Saastamonein, A., Sipilainen, T., 2013. What is the best practice for
benchmark regulation of electricity distribution? comparison of dea,sfa and stoned
methods. Energy Policy 61, 740–750.
Lai, H., Huang, C., 2013. Maximum likelihood estimation of seeminggly unrelated
stochastic frontier regressions. Journal of Productivity Analysis 40 (1), 1–14.
Lampe, H., Hilgers, D., 2015. Trajectories of efficiency measurement: a bibliometric
analysis of dea and sfa. European Journal of operational Research 240, 1–21.
Land, K., Lovell, C., Thore, S., 1993. Chance-constrained data envelopment analysis.
Managerial and Decision Economics 14 (1), 541–554.
Lee, L., 1983. A test for distributional assumptions for the stochastic frontier functions.
Journal of Econometrics 22 (3), 245–267.
Liseo, B., Loperfido, N., 2006. A note on reference priors for the scalar skew-normal
distribution. Journal of Statistical Planning and Inference 136 (2), 373–389.
Llorca, M., Orea, L., Pollit, M., 2014. Using the latent class approach to cluster firms in
benchmarking: an application to the us electricity transmission industry. Operations
Research Perspectives 1 (1), 6–17.
Llorca, M., Orea, L., Pollit, M., 2016. Efficiency and environmental factors in the us
electricity transmission industry. Energy Economics 55 (1), 234–246.
Lopes, A., 2015. Benchmarking Using Data Envelopment Analysis (DEA) in Regulating
Electricity: the brazilian case. NESP-FACE/UFMG, Belo Horizonte.
Lopes, A., Vilela, B., Costa, M., Lanzer, E., 2016. Critical evaluation of the efficient
costs assessment model used in the regulation of brazilian energy distribution service
operator. Revista Gestão e Tecnologia 16 (3), 5–30.
Meeusen, W., van den Broeck, J., 1977. Efficiency estimation from Cobb-Douglas produc-
tion functions with composed error. International Economic Review 18 (2), 435–444.
Mesquita, R., 2017. Regulação de custos de distribuição de energia elétrica: uma análise
comparativa das abordagens de benchmarking utilizadas em países europeus e latino-
americanos. Ph.D. thesis, UFMG.
119
REFERÊNCIAS BIBLIOGRÁFICAS 120
Metropolis, N., Rosenbluth, A., Rosenbluth, M., Teller, A., Teller, E., 1953. Equation
of state calculations by fast computing machines. The Journal of Chemical Physics
21 (6), 1087–1092.
Nieswand, M., Seifert, S., 2018. Environmental factors in frontier estimation: A monte
carlo analysis. European Journal of Operational Research 265, 133–148.
Nocedal, J., Wright, S., 2006. Numerical Optimization. New York: Springer.
Olesen, O., Petersen, N., 2016. Stochastic data envelopment analysis - a review. European
Journal of Operational Research 251 (1), 2–21.
Osiewalski, J., Steel, M., 1998. Numerical tools for the bayesian analysis of frontier
models. Journal of Productivity Analysis 10, 103–117.
Paradi, J., 2015. Comments on aneel’s models. In: Lopes, A. (Ed.), Benchmarking Using
Data Envelopment Analysis - DEA in Regulating Electricity: the Brazilian case. Vol. 1.
NESP-FACE/UFMG.
Pitt, M., Lee, L., 1981. The measurement and sources of techinical inefficiency in the
indonesian weaving industry. Journal of Development Economics 9 (1), 43–64.
Plumer, M., 2003. Jags: A program for analysis of bayesian graphical models using gibbs
sampling. In: K. Hornik, F. L., Zeileis, A. (Eds.), Proceedings of the 3rd International
Workshop on Distributed Statistical Computing. pp. 1–10.
Plummer, M., 2016. Bayesian Graphical Models using MCMC. R package version 4-6.
URL https://CRAN.R-project.org/package=rjags
Plummer, M., 2017. Just another gibbs sampler (JAGS) version 4.3.0. Software manual.
Ray, S., 2004. Data Envelopment Analysis: theory and techniques for Economics and
Operation Research. Cambridge: Cambridge University Press.
Ray, S., 2015. A critical review of aneel’s dea methodology. In: Lopes, A. (Ed.), Ben-
chmarking Using Data Envelopment Analysis - DEA in Regulating Electricity: the
Brazilian case. Vol. 1. NESP-FACE/UFMG.
Reifschneider, D., Stevenson, R., 1991. Systematic departures from the frontier: a fra-
mework for the analysis of firm inefficiency. International Economic Review 32 (3),
715–723.
120
REFERÊNCIAS BIBLIOGRÁFICAS 121
Roberts, G., 1996. Markov chains concepts related to sample algorithms monte carlo. In:
Chapman, L., Hall (Eds.), Markov Chain Monte Carlo in Practice. Vol. 3. W. Gilks
and S. Richardson and D. Spiegelhalter.
Saastamoinen, A., Kuosmanen, T., 2016. Quality frontier of electricity distribution:
supply security, best practices, and underground cabling in finland. Energy Economics
53, 281–292.
Sartori, N., 2006. Bias prevention of maximum likelihood estimates for scalar skew-
normal and skew-t distributions. Journal of Statistical Planning and Inference 136 (12),
4259–4275.
Schmidt, P., Lovell, C., 1979. Estimating technical and allocative inefficiency relative to
stochastic production and cost frontiers. Journal of Econometrics 9 (1), 343–366.
Schmidt, P., Sickles, R., 1984. Production frontiers and panel data. Journal of B. and E.
Statistics 2 (4), 367–374.
Seber, A., Lee, A., 2012. Linear regression analysis. New York: Wiley.
Semolini, R., 2014. Eficiência dos custos operacionais das empresas de distribuição de
energia elétrica no brasil. Ph.D. thesis, Unicamp.
Sherphard, R., 1953. Cost and Production Functions. New Jersey: Princeton University
Press.
Simar, L., Wilson, P., 2007. Estimation and inference in two-stage, semi-parametric
models of production processes. Journal of Econometrics 136 (1), 31–64.
Souza, M., 2008. Uma abordagem Bayesiana para o cálculo dos custos operacionais
eficientes das distribuidoras de energia elétrica. Ph.D. thesis, PUC-RJ.
Souza, M., Diallo, M., Souza, R., Baydia, T., 2010a. The cost efficiency of the brazi-
lian electricity distribution utilities: a comparassion of Bayesian sfa and dea models.
Mathematical Problems in Engineering 2010, 1–20.
Souza, M., Souza, R., Pessanha, J., 2007. Avaliação dos custos operacionais eficientes das
distribuidoras de energia elétrica: um exercício com modelos de fronteira estocástica
bayesiana. SPOLM 1, 1–14.
121
REFERÊNCIAS BIBLIOGRÁFICAS 122
Souza, M., Souza, R., Pessanha, J., 2010b. Custos operacionais eficientes das distribuidoras
de energia elétrica: um estudo comparativo dos modelos dea e sfa. Gestão e Produção
17, 653–667.
Spiegelhalter, D., Thomas, A., Best, N., Lunn, D., 2003. WinBUGS 1.4. Software manual.
Stead, A., Wheat, P., Greene, W., 2017. Robust stochastic frontier analysis: A student’s
t-half normal model with application to highways maintenance costs in England. Tech.
rep., Working Paper. University of Leeds, Insitute for Transport Studies.
Stevenson, R., 1980. Likelihood functions for generalized stochastic frontier estimation.
Journal of Econometrics 13 (1), 57–66.
Sueyoshi, T., Yuan, Y., Goto, M., 2017. A literature study for dea applied to energy and
environment. Energy Economics 62, 104–124.
Taha, H., 2008. Pesquisa Operacional. Porto Alegre: Pearson Prentice Hall.
Tannuri-Pianto, M., Sousa, M., Arcoverde, F., 2009. Fronteiras de eficiência estocásticas
para empresas de distribuição de energia elétrica no Brasil: uma análise de dados de
painel. Estudos Econômicos 39 (1), 221–247.
Tierney, L., 1994. Markov chains for exploring posterior distributions. The Annals of
Statistics 22 (4), 1701–1728.
Tobin, J., 1958. Estimation of relationships for limited dependent variables. Econometrica
26 (1), 24–36.
Train, E., 2009. Discrete Choice Methods with Simulation. Cambrigge: Cambridge
university press.
Tsionas, E. G., 2002. Stochastic frontier models with random coefficients. Journal of
Applied Econometrics 17 (2), 127–147.
van den Broeck, J., Koop, G., Osiewalski, J., Steel, M., 1994. Stochastic frontier models:
a baysesian perspective. Journal of Econometrics 61, 273–303.
Vaninsky, A., 2006. Efficiency of electric power generation in the united states: analysis
and forecast based on data envelopment analysis. Energy Economics 28 (3), 326–338.
122
REFERÊNCIAS BIBLIOGRÁFICAS 123
Veronese, A., 2015. Estimação paramétrica de escores de eficiência em 2 estágios: impacto
das variáveis ambientais no ajuste das eficiências regulatórias das empresas brasileiras
de distribuição de energia elétrica para o 4crtp. Ph.D. thesis, UFMG.
Veronese, A., Costa, M., Lopes, A., Carmo, G., 2018. A close look at second stage
data envelopment analysis using compound error models and the tobit model. Socio-
Economic Planning Sciences xx (xx), xx–xx, no prelo.
Wang, H., 2002. Heteroscedasticity and non-monotonic efficiency effects of a stochastic
frontier model. Journal of Productivity Analysis 18 (1), 241–253.
Wang, H., Ho, C., 2010. Estimating fixed-effect panel stochastic frontier models by
model transformation fixed and random effects in stochastic frontier models. Journal
of Econometrics 157 (1), 286–296.
Zaja, M., Banker, R., Fang, S., Hunjet, D., Neralic, L., Wendell, R., 2017. Efficiency
gains in Croatia’s electricity distribution centers following industry structure changes.
Data Envelopment Analysis Journal 3, 119–150.
Zanini, A., 2004. Regulação econômica no setor elétrico brasileiro: uma metodologia para
definição de fronteiras de eficiência e cálculo do fator x para empresas distribuidoras
de energia elétrica. Ph.D. thesis, PUC-RJ.
Zhou, P., Ang, B., Poh, K., 2008. A survey of data envelopment analysis in energy and
environmental studies. European Journal of Operational Research 189 (1), 1–18.
123

Índice Remissivo
A
Agências Reguladoras, 2
C
Cadeias de Markov, 98
classificação dos estados, 101
equações de Chapman-Kolmogorov,
100
matriz de transição, 100
probabilidade de estado estável, 101
probabilidade de transição, 99
propriedade markoviana, 99
Critérios de Seleção dos Modelos, 107
DIC, 72, 108
LPML, 72, 107
WAIC, 72, 108
Custos
custos gerenciáveis, 5
custos não-gerenciáveis, 5
D
Despesas
CAPEX, 15
OPEX, 15
TOTEX, 15
Deviance, 108
E
Empresas de Distribuição
autorizadas, 2
concessionárias, 2
cooperativas de eletrificação rural, 2
permissionárias, 2
Estatísticas
γ, 48
M3T, 39, 75
Estimador Bayesiano
ψˆ, 52, 97
Estimador Frequentista
λˆ, 47
Θˆ, 50
βˆ, 47
σˆ2u, 47
σˆ2ν , 47
σˆ, 47
uˆi, 49
Estimativas, 76, 78
Estimação
da fronteira estocática de custo, 35
paramétrica para e−ui , 37
enfoque Bayesiano, 50
enfoque frequentista, 45
F
Fronteira
de custo, 31
de produção, 25
125
ÍNDICE REMISSIVO 126
Função de Custo
Cobb-Douglas, 33
Reparametrizada
ξ(yi), 65
Translog, 34
Função de Produção, 29
Cobb-Douglas, 29
Translog, 30
Função de Verossimilhança
L(E,ψ), 52
função de log-verossimilhança, 47
Função Densidade de Probabilidades
f(i), 46, 91
f(E cond ψ), 52
f(ψ), 52, 103
f(ψ cond E), 52
f(νi), 45
f(u cond ), 48
f(u,), 48
f(ui), 45
fX(x), 65
fZ(z), 64
f(), 64
M
MCMC, 97
amostrador de Gibbs, 103
critério de convergência, 103
ACF, 84, 104
Modelo de Custo
com fronteira estocástica, 36
Modelos Propostos para o SFA de Custos
modelo 1, 69
modelo 2, 70
modelo 3, 70
modelo 4, 71
modelo 5, 71
modelo 6, 72
modelo 7, 72
Monópolio Natural, 1
Métodos de Benchmarking, 8
Goal Programming, 8
CMAD, 9
COLS, 12
DEA, 11
Empresa de referência, 14
MOLS, 9
OLS, 9
REA, 8
SDEA, 8
SFA, 13
StoNED, 13
TFA, 9
Métricas
eficiência, 5, 94, 95
alocativa, 30
econômica, 31
técnica, 25
eficácia, 5
escores de eficiência, 7
ineficência
técnica, 27
produtividade, 5
P
Parâmetro
δ, 65
δ1, 69
λ, 46, 65
Θ, 50
δ, 56
ψ, 52
126
ÍNDICE REMISSIVO 127
µ, 40
µ∗, 48
νi, 66
σ, 46, 65
σ2u, 40
σ2∗, 48
σ2ν , 40
ξ, 64
ζi, 56
a, 64
ui, 49, 66
R
Regulação, 2
price cap, 5
distribuição, 4
geração, 4
regulação por incentivo, 5
tarifária, 2
transmissão, 4
Revisões Tarifárias, 4
1o ciclo, 4
2o ciclo, 4
3o ciclo, 5
4o ciclo, 5
S
Setor
de distribuição de energia elétrica, 2
elétrico brasileiro, 1
V
Variáveis
de entrada
PMSOa (x), 68
de saída indesejada
CHI (y6), 68
NTL (y7), 68
de saída ordinária
Cons (y1), 68
High (y4), 68
Over (y3), 68
Under (y5), 68
Wmkt (y2), 68
exógenas, 54
zi, 68
e.variable, 68
127