quarta-feira, 24 de fevereiro de 2010

A Importância da Estatística no Mundo Contemporâneo

       Tendo cursado dois semestres de Estatística na faculdade, deixei a matemática aplicada e enveredei pela matemática pura até onde tive gás para continuar, gastando meu tempo em abstrações infrutíferas. Agora, estando a estudar Estatística, e tendo vivido o suficiente para entender um pouco da estrutura administrativa dos países e das empresas, e suas tendências de atuação,  começo a perceber a importância da Estatística.

       Pode-se considerar a Estatística como disciplina chave da Teoria de Informação. Segue algumas utilidades da Estatística:

      (1) Com amostras tratadas com métodos estatísticos, de tamanho diminuto, obtem-se informação sobre uma população (inferência estatística). Tem-se, assim, economia de recursos financeiros para estudo de populações.

      (2) Teste de hipóteses. Decidir se um pneu tem uma dada duração em quilometros.

      (3) Controle de qualidade em processos de fabricação. Colhe-se uma amostra, calcula-se média, desvio padrão, e testa-se a hipótese de  um produto estar dentro das especificações.

       (4) Escolha do melhor método de ensino.  Aplica-se dois métodos de ensino em duas classes, e avalia-se o rsultado. Aplica-se métodos estatístico para decidir se os métodos são equivalentes ou se um é melhor.

       (5) Tempo médio de duração de um aparelho eletrônico.

       (6) Decidir se uma dada substância faz bem para a saúde, se engorda, se emagrece, se prejudica a saúde, se prolonga a vida (teste de correlação).

       (7) Decisões administrativas requerem conhecimento de dados estatísticos sobre uma dada população. Quantos estudantes vão começar o primeiro ano letivo no próximo ano, quantos terminaram o ensino médio, quantos se formaram em um dado curso técnico,…(estatística descritiva).

       (8) Cálculos mais eficiêntes utilizando métodos Monte Carlo (gerador de números aleatórios).

       (9) Estudo do comportamento da cotação em bolsa de valores da ação de uma empresa (séries tremporais).

       (10) Estudo de modelos científicos. Colhem-se algumas amostras e compara-se com os valores esperados para se decidir se uma teoria é válida (teste de qui-quadrado).

       É difícil encontrar uma situação em que não se aplique a Estatística para solucionar problemas, para se obter produtos melhores, métodos mais eficazes, mais eficientes, diminuir riscos.

sexta-feira, 12 de fevereiro de 2010

Tipos de Estatísticas

Ao se estudar um fenômeno da Natureza, da sociedade humana, ou  científico, pode-se fazer experimentos para obter informações suficientes, ou razoavelmente suficientes,  para entendê-lo. Neste caso, utiliza-se certos tipos de Estatística, notadamente o que se pode chamar de Estatística experimentalista, baseada em teoria de probabilidade obtida de dados experimentais. Porém, em muitos casos, dos mais interessantes, ou não se tem a tecnologia para estudá-los,  ou a técnica existente  torna o seu estudo muito difícil, ou é muito caro estudá-lo, ou até mesmo impossível. Neste caso, utiliza-se outros tipos de Estatísitca, considerados nos itens seguintes.

Há dois tipos de Estatísticas:

   (1) Estatística obtida de dados experimentais (Estatísitca experimentalista, ou frequencista). As distribuições de probabilidade são obtidas de distribuições de frequências, obtidas por dados experimentais.

   (2) Estatística bayesiana, não obtida por dados experimentais. Neste tipo de Estatística, as distribuições de probabilidade são construídas sem dados experimentais. O motivo disto pode ser a impossibilidade de obtenção, o preço elevado, impossibilidade tecnológica ou técnica de obtenção de dados experimentais.

Por outra classificação de Estatística, mais didática, há quatro tipos de Estatística:

   (1) Estatística clássica, que abrange estatísticas dos jogos de azar. tais como lançamentos de moedas e  dados, com homogeneidade de distribuição de probabilidade. Por exemplo,

    para moedas, define-se  P(cara)=P(coroa)=0,5

    para dados, define-se P(1)=P(2)=P(3)=P(4)=P(5)=P(6)=1/6.

     (2) Estatística experimentalista, obtida de dados experimentais. Define-se as  distribuições de probabilidade a partir dos dados experimentais. Cada novo experimento aumenta a informação que se tem do sistema ou população em estudo.

   (3) Estatística subjetiva, em que as funções de probabilidade são definidas subjetivamente. É a única estatística utilizável ao se tentar decidir qualquer questão sobre um sistema muito complexo, que não pode ser estudado satisfatoriamente por meio de dados experimentais.

   (4) Estatística geométrica, em que as probabilidades são definidas por medidas: linear, de área, ou volumétrica.

   (5) Estatísitica axiomática,  definida por meio de um espaço de medida unitária (X,M,m), da Teoria de Medida e Integração da Análise Matemática, sendo X um espaço topológico, M uma classe de subconjuntos mensuráveis de X, e m uma medida tal que

m(X)=1.

domingo, 7 de fevereiro de 2010

O Paradoxo de Simpson

O paradoxo de Simpson (ver Wikipedia:  Simpson’s paradox) é um exemplo de como a leitura de tabelas pode ser enganosa.

Exemplo:  Considera-se dois tratamentos para pedra de rim, A e B. A tarefa é decidir qual deles é o melhor tratamento. São testados  os dois tratamentos em 400 pacientes, para cada um dos tratamentos. Considera-se a eficácia dos tratamentos para eliminar pedras pequenas, médias e grandes.  A tabela abaixo, criada por mim, embora imaginária (estatística bayesiana), serve para apresentar o paradoxo.

tipo de pedra tratamento A (porcentagem  de sucessos) tratamento B
(porcentagem de sucessos)
pequena 85% (255 de 300) 90% (9 de 10)
média 70% (56 de 80) 80% (72 de 90)
grande 5% (1 de 20) 69% (207 de 300)
total 78% (312 de 400) 72% (288 de 400)

 

Interpretação:  Segundo a última linha, o tratamento A parece melhor, pois tem 78% de sucessos contra 72% de sucessos do tratamento B. Porém B  é  melhor tratamento do que A  para todos os tipos de pedras (90% contra 85% para pedras pequenas, 80% contra 70% para pedras médias, 69% contra 5% para pedras grandes). Observe-se ainda que para pedras grandes, que são os casos mais críticos, o tratamento  B é muito melhor do que o tratamento A.

quarta-feira, 3 de fevereiro de 2010

Métodos Monte Carlo da Estatística

    Suponhamos que se tenha dois conjuntos A e B,  A contido em B, e que se queira calcular  a área de A, sabendo-se a área de B. 

    Método Monte Carlo de solução deste problema:  Com um algoritmo de geração aleatória homogênea de pontos em B, p.ex. com um gerador aleatório de números, define-se uma certa quantidade n de pontos em B.  Observar que esta distribuição de pontos tem de tender à uma distribuição homogênea de pontos para que o cálculo seja correto. Calcula-se a área de A facilmente, sabendo-se que a área de A dividido pela área de B (conhecida) é aproximadamente igual ao número de pontos incidentes em A dividido pelo número de ponto incidentes em B. A aproximação será tanto melhor quanto mais pontos forem definidos pelo algorítmo em consideração.

   Exemplo: Dá até para se calcular a constante universal pi  (encontrei na Wikipedia):

    Considere um disco de raio r dentro de uma quadrado de lado 2r. Fazendo-se o  desenho, percebe-se que o disco tange o quadrado perfeitamente nos quatro lados do quadrado. Procedendo-se à geração aleatória de pontos no quadrado, tem-se que a área do disco, pi vezes r ao quadrado, dividido pela área do quadrado, (2r) ao quadrado, é proporcional ao número de pontos do disco dividido pelo número de pontos do quadrado. Assim, pi é igual a 4 vezes o quociente definido pelo número de pontos incidentes no disco dividido pelo número de pontos incidentes no quadrado. 

  P.S.  Há muitas outras aplicações, à Matemática, à Estatística, à Física, à Engenharia, etc.