Thursday, October 18th, 2007...12:48
Um mau modelo
Concluindo-se que, em média, a soma dos 100 lançamentos de cada amostra é 420. Suponhamos que uma qualquer pessoa tendo acesso à anterior informação, retira ao acaso um valor da última amostra e verifica que é “2″. Ou seja, num lançamento expecífico da última amostra o valor saído foi 2. Será aquela informação relevante para a constituição de expectativas futuras? Não. O valor esperado de futuras amostras continua a ser 420.
Nota: post corrigido.
Onde se refere, no excerto acima copiado deste post, o retirar ao acaso de um dado de uma amostra já recolhida, eu li a obtenção de um caso adicional às amostras já recolhidas. O post original está em baixo, com pouco mais que os tempos verbais retocados, dado este meu erro de leitura, pelo qual peço desculpa ao Carlos e aos leitores. Os comentários que fiz relativamente à confusão entre “valor esperado” e “média amostral” mantém-se, mas adquirem uma importância muito menor e praticamente académica face a esta nova informação (para mim, e dada a minha tresleitura inicial).
No caso realmente sugerido pelo Carlos - o de observarmos um valor já existente numa amostra - o modelo por ele proposto não aplica, ou aplica quando a mim de forma muito pouco satisfatória. É que a questão do BCP não se resume a saber se houve uma perda no montante de X - já incorporada - mas sim uma perda no montante de X de natureza Y. Importa pouco saber o montante de X, mas importa bastante saber o originou esse monante. A nova informação vem daquilo que rodeia uma dívida incobrável e não a dívida em si, que faz parte da actividade de um banco. É por isso, e apenas por isto, que considero que o modelo do Carlos é um mau modelo, porque exclui, à partida, a possibilidade de uma componente essencial do problema se manifestar nesse modelo, ao não permitir que seja relevante aquilo que está por trás de um ”número”. Pretender reforçar a ideia de que Y não interessa sem permitir que no modelo proposto Y possa ter algum papel significa que estamos perante um mau modelo.
O post original, retocado:
Valor Esperado e Média Amostral; Estimador e Estimativa; Frequências Observadas e Probabilidade
Se o Carlos Guimarães Pinto tivesse falado de uma observação adicional, esse post conteria um erro bastante grave, ao não incluir uma nova observação no cálculo da nova média amostral - a estimativa que temos para a média populacional ou valor esperado de uma variável aleatória.
O valor esperado de uma variável aleatória é a média populacional dessa variável aleatória, definida como a soma do produto entre os valores possíveis que essa variável aleatória pode tomar (por exemplo, no caso de um dado, 1, 2, 3, 4, 5 e 6) e a probabilidade de cada um desses valores acontecer (no caso de um dado não viciado, 1/6 para qualquer deles).
A média amostral é a aplicação desse mesmo conceito mas a uma amostra finita. A média amostral não é igual ao valor esperado de uma variável aleatória, é apenas um estimador (há outros) para esse valor esperado (mas ela tem propriedades especiais que a tornam preferível como escolha para esse efeito). E é um estimador que tem em conta toda a informação que se possui, pelo que se a amostra aumenta, a estimativa que resulta desse estimador - uma fórmula geral -, face aos novos dados obtidos, tem de ser recalculada.
As percentagens apresentadas no post são apenas frequências observadas em amostras finitas que se recolheram e não probabilidades de ocorrência dos acontecimentos descritos - que, por definição explícita no próprio post, desconhecemos, por estarmos perante um dado viciado. Se fossem probabilidades, aí sim poderíamos falar de valor esperado, porque estas se referem a qualidades da população e não da amostra. O Carlos utiliza, possivelmente por mera desatenção, o conceito de valor esperado de forma pouco correcta - o correcto seria falar em ”estimativa para esse valor esperado, via cálculo de uma média amostral”.*
Dá-se um exemplo de um dado viciado, em que não se conhecem as probabilidades de cada um dos acontecimentos possíveis - repito, uma propriedade da variável aleatória (da “população”) e não da concretização dessa variável aleatória (da “amostra”). Sugere-se que uma amostra de 100 lançamentos de um dado para aferir a média populacional dessa variável. Essa média amostral é um estimador da média populacional que se desconhece. Um estimador é uma fórmula. O número concreto que se obtém dessa fórmula, inserindo os dados observados nessa amostra é uma estimativa.
No exemplo dado no post, a média das 10 amostras passadas é 4.2. Esta é a estimativa para a média populacional que desconhecemos. Ela não é estanque nem é certa. Não tem propriedades “mágicas”. Existe uma coisa chamada variância da média amostral - que só é igual a zero quando o tamanho da amostra tende para infinito. O que se obtém do cálculo da média amostral só é uma estimativa absolutamente fiável da média populacional quando a amostra tende para infinito - para a própria população. Sempre que se obtém - se se obtém - novos dados, de novas amostras, tem-se em conta essa informação. No caso de adicionarmos - se adicionarmos (a tal leitura errada que, por desatenção, fiz) - uma observação igual a 2, a média amostral das 101 observações alterar-se-ia de 4.2 (igual a 420/100) para 4.178 (igual a 422/101).
*Segundo a teoria frequencista, a probabilidade pode ser entendida como a frequência observada numa amostra infinita, ou seja, o limite da frequência à medida que a amostra aumenta indefinidamente (é um conceito, não te de ser realizável). Entre outros defensores de uma concepção subjectivista de probabilidade, destaco John Maynard Keynes.

4 Comments
October 18th, 2007 at 16:17
“É que a questão do BCP não se resume a saber se houve uma perda no montante de X - já incorporada - mas sim uma perda no montante de X de natureza Y.”
Tomar conhecimento que houve uma perda do montante X de natureza Y, tambem nos diz que essa perda afinal nao foi de natureza Z.
Os investidores ficaram a saber que a administracao do banco era um pouco pior a evitar situacoes do tipo Y, mas melhor, na mesma proporcao, a evitar situacoes do tipo Z.
Mais concretamente, a administracao do BCP e’ agora vista como sendo um pouco mais eficiente a gerir o seu portfolio de creditos e um pouco menos idonea nessa mesma gestao. O efeito e’ nulo.
October 18th, 2007 at 16:24
Carlos,
O efeito é nulo por imposição tua (e do João Miranda). Não há razão para impor que os dois efeitos que referes tenham exactamente a mesma valorização-ponderação da parte do investidor. O problema está, repito, em apenas olhares para os números. É falso que haja uma revisão do investidor sobre a “qualidade” da gestão da créditos. As dívidas incobráveis são parte normal da vida do banco e, que eu saiba, não há qualquer acusação de “ocultação” de uma dívida incobrável. Ela estava lá. Apenas não se sabia aquilo que “os meandros que ela envolvia”. (E que ainda não estão esclarecidos, convém lembrar). Ou seja, a nova informação é apenas referente à “natureza” e “origem” de uma dívida incobrável cujo montante já se conhecia.
October 18th, 2007 at 17:15
Tiago, o efeito nao e’ nulo por imposicao minha. ‘E nulo porque o valor das dividas incobraveis nao aumentou pelo facto de se descobrir que uma parte desse montante se deveu a favores especiais. O valor manteve-se igual, apesar da origem se ter alterado.
“É falso que haja uma revisão do investidor sobre a “qualidade” da gestão da créditos. ”
Mas afinal, conclui-se ou nao que as dividas incobraveis resultantes da vida normal do banco foram afinal inferiores ao que se pensava? Se sim, e se o investidor tinha feito uma avaliacao anterior baseada numa capacidade de gestao de creditos X, so pode concluir que a capacidade de gestao de creditos do BCP e’ afinal melhor do que pensava.
Quando muito poderas argumentar que esta informacao e’ positiva para o BCP, porque se fica a saber que uma parte das suas dividas incobraveis passadas se deveu a factores mais directamente controlaveis e com menor probabilidade de se virem a repetir no futuro do que as tais dividas resultantes “da vida normal do banco”.
Retirando esta ultima possibilidade, a divulgacao da natureza das dividas incobraveis nao traz qualquer nova informacao ao investidor e nao tera qualquer efeito sobre consideracoes futuras(ver evolucao da cotacao das accoes do BCP desde que a informacao foi divulgada…)
October 19th, 2007 at 10:55
Muito interessante a formulação matemática. Mas isso deve ter aplicação apenas em robots.
A questão da “de natureza y” é não só subjectiva como indeterminável (ou seja, não modelizável…).
Afinal a nova informação nunca devia sequer ter sido “informada” .
“BCP avança com uma queixa-crime contra incertos por violação do sigilo bancário”
Será que a “nova” informação mesmo nova, não será apenas e tão sómente que existiu quebra de sigilo bancário?
Leave a Reply