Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

214
2015 ESTATÍSTICA E INDICADORES AMBIENTAIS Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

Transcript of Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

Page 1: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

2015

Estatística E indicadorEs ambiEntais

Prof. Luis Augusto EbertProf.ª Rafaela Tamara Marquardt

Page 2: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

Copyright © UNIASSELVI 2015

Elaboração:Prof. Luis Augusto Ebert

Prof.ª Rafaela Tamara Marquardt

Revisão, Diagramação e Produção:Centro Universitário Leonardo da Vinci – UNIASSELVI

Ficha catalográfica elaborada na fonte pela Biblioteca Dante Alighieri UNIASSELVI – Indaial.

310.7

E16eSilva, Igor de Oliveira Insaurriaga Estatística e indicadores ambientais/ Luis Augusto Ebert, Rafaela Tamara Marquardt. Indaial : UNIASSELVI, 2015. 204 p. : il. ISBN 978-85-7830-907-7

1. Estatística. I. Centro Universitário Leonardo Da Vinci.

Impresso por:

Page 3: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

III

aprEsEntaçãoAo realizar e comparar uma pesquisa, nós necessitamos de parâmetros

para tal comparação. E a melhor forma de fazê-la é através da estatística, que aplicamos a ela. Através de coleta de dados, informações pertinentes à pesquisa, podemos aferir tais valores. E é isso sobre que a disciplina trata, contudo, não é algo complexo, pois realizamos o planejamento e a ordenação de todos os dados, e assim aplicamos vários modelos estatísticos.

A estatística pode ser adotada em vários campos de estudos, e nas áreas das ciências naturais sua denominação intitula-se bioestatística, em que são trabalhados dados biológicos. Então, caso você em algum artigo ou livro ler estatística voltada às ciências naturais, nada mais é que bioestatística.

Contudo, todo experimento começa com uma hipótese, uma pergunta. Ao analisarmos e trabalharmos os dados obtidos através desta análise, devemos como pesquisador ater-nos a estas informações obtidas, pois com os dados em mãos podemos reduzi-los ou agrupá-los, não esquecendo que a estatística é uma ciência exata, e devemos cuidar para que nossos dados não tenham incoerências.

Para tanto, na primeira unidade deste Caderno de Estudos, vamos ver as principais definições, nomenclaturas utilizadas pela estatística dentro do contexto das ciências naturais, bem como ter uma compreensão das teorias das probabilidades e da distribuição. Já na segunda unidade, iremos calcular os dados obtidos e analisá-los dentro do espectro da pesquisa, e averiguar estas informações se os dados são paramétricos ou não paramétricos. E na terceira unidade, veremos os indicadores ambientais e suas atribuições dentro da pesquisa voltada às ciências naturais.

Vamos aos estudos!

Page 4: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

IV

Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto para você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há novidades em nosso material.

Na Educação a Distância, o livro impresso, entregue a todos os acadêmicos desde 2005, é o material base da disciplina. A partir de 2017, nossos livros estão de visual novo, com um formato mais prático, que cabe na bolsa e facilita a leitura.

O conteúdo continua na íntegra, mas a estrutura interna foi aperfeiçoada com nova diagramação no texto, aproveitando ao máximo o espaço da página, o que também contribui para diminuir a extração de árvores para produção de folhas de papel, por exemplo.

Assim, a UNIASSELVI, preocupando-se com o impacto de nossas ações sobre o ambiente, apresenta também este livro no formato digital. Assim, você, acadêmico, tem a possibilidade de estudá-lo com versatilidade nas telas do celular, tablet ou computador. Eu mesmo, UNI, ganhei um novo layout, você me verá frequentemente e surgirei para apresentar dicas de vídeos e outras fontes de conhecimento que complementam o assunto em questão.

Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa continuar seus estudos com um material de qualidade.

Aproveito o momento para convidá-lo para um bate-papo sobre o Exame Nacional de Desempenho de Estudantes – ENADE. Bons estudos!

NOTA

Olá acadêmico! Para melhorar a qualidade dos materiais ofertados a você e dinamizar ainda mais os seus estudos, a Uniasselvi disponibiliza materiais que possuem o código QR Code, que é um código que permite que você acesse um conteúdo interativo relacionado ao tema que você está estudando. Para utilizar essa ferramenta, acesse as lojas de aplicativos e baixe um leitor de QR Code. Depois, é só aproveitar mais essa facilidade para aprimorar seus estudos!

UNI

Page 5: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

V

Page 6: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

VI

Page 7: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

VII

UNIDADE 1 – O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS ................................................................................................................ 1

TÓPICO 1 – CONCEITOS APLICADOS À ESTATÍSTICA ........................................................ 31 INTRODUÇÃO ................................................................................................................................. 32 DEFINIÇÃO DE ESTATÍSTICA E BIOESTATÍSTICA ............................................................. 33 CONCEITOS APLICADOS À ESTATÍSTICA ............................................................................ 5LEITURA COMPLEMENTAR ........................................................................................................... 7RESUMO DO TÓPICO 1 .................................................................................................................... 12AUTOATIVIDADE ............................................................................................................................. 13

TÓPICO 2 – MÉTODOS ESTATÍSTICOS ...................................................................................... 151 INTRODUÇÃO ................................................................................................................................. 152 MÉTODOS ......................................................................................................................................... 15

2.1 MÉTODO EXPERIMENTAL ...................................................................................................... 152.2. MÉTODO ESTATÍSTICO ........................................................................................................... 162.3 IMPORTÂNCIA DA ESCOLHA DO MÉTODO ..................................................................... 16

3 ETAPAS DO TRABALHO ESTATÍSTICO ................................................................................... 163.1 PLANEJAMENTO – DEFINIÇÃO DO PROBLEMA .............................................................. 163.2 COLETA DE DADOS .................................................................................................................. 163.3 TAMANHO AMOSTRAL ........................................................................................................... 17

3.3.1 Estudos analíticos ............................................................................................................... 183.3.2 Estudos descritivos ............................................................................................................. 19

RESUMO DO TÓPICO 2 .................................................................................................................... 21AUTOATIVIDADE ............................................................................................................................. 22

TÓPICO 3 – APRESENTAÇÃO DE DADOS ................................................................................. 231 INTRODUÇÃO ................................................................................................................................. 232 TABELAS ESTATÍSTICAS .............................................................................................................. 233 DISTRIBUIÇÃO POR FREQUÊNCIA .......................................................................................... 26

3.1 DISTRIBUIÇÃO DE FREQUÊNCIA POR PONTOS ............................................................... 263.2. DISTRIBUIÇÃO DE FREQUÊNCIA POR INTERVALOS ...................................................... 27

4 GRÁFICOS .......................................................................................................................................... 314.1 TIPOS DE GRÁFICOS .................................................................................................................. 31

4.1.1 Gráfico em linha ou curva .................................................................................................. 314.1.2 Gráfico em coluna ou em barras ........................................................................................ 324.1.3 Gráfico em barras ................................................................................................................. 324.1.4 Gráfico em coluna ou em barras múltiplas ...................................................................... 334.1.5 Gráfico em setores ............................................................................................................... 34

4.2 GRÁFICOS ESPECIAIS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA POR INTERVALOS ................................................................................................................................ 35

4.2.1 Histograma ........................................................................................................................... 354.2.2 Polígono de frequências ...................................................................................................... 364.2.3 Ogiva ...................................................................................................................................... 37

sumário

Page 8: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

VIII

RESUMO DO TÓPICO 3 .................................................................................................................... 38AUTOATIVIDADE ............................................................................................................................. 39

TÓPICO 4 – MÉTODOS DE AMOSTRAGEM .............................................................................. 411 INTRODUÇÃO ................................................................................................................................. 412 MÉTODOS DE AMOSTRAGEM .................................................................................................. 41

2.1 AMOSTRA DE CONVENIÊNCIAS .......................................................................................... 422.2 AMOSTRAGEM ALEATÓRIA SIMPLES ................................................................................. 422.3 AMOSTRAGEM SISTEMÁTICA ............................................................................................... 432.4 AMOSTRAGEM ALEATÓRIA ESTRATIFICADA .................................................................. 442.5 AMOSTRAGEM POR CONGLOMERADOS .......................................................................... 442.6 AMOSTRAGEM POR ESTÁGIOS MÚLTIPLOS ..................................................................... 44

RESUMO DO TÓPICO 4 .................................................................................................................... 45AUTOATIVIDADE ............................................................................................................................. 46

TÓPICO 5 – DISTRIBUIÇÃO DE PROBABILIDADES .............................................................. 471 INTRODUÇÃO ................................................................................................................................. 472 DISTRIBUIÇÃO DE PROBABILIDADES ................................................................................... 47

2.1 DISTRIBUIÇÃO BINOMINAL .................................................................................................. 482.2 DISTRIBUIÇÃO DE POISSON .................................................................................................. 502.3 DISTRIBUIÇÃO EXPONENCIAL ............................................................................................. 512.4 DISTRIBUIÇÃO NORMAL ........................................................................................................ 512.5 DISTRIBUIÇÃO DE T DE STUDENT ....................................................................................... 55

LEITURA COMPLEMENTAR ........................................................................................................... 55RESUMO DO TÓPICO 5 .................................................................................................................... 58AUTOATIVIDADE ............................................................................................................................. 59

TÓPICO 6 – INFERÊNCIAS ESTATÍSTICAS ................................................................................ 611 INTRODUÇÃO ................................................................................................................................. 612 DISTRIBUIÇÃO DE PROBABILIDADES ................................................................................... 61

2.1 VARIÁVEIS QUANTITATIVAS ................................................................................................. 612.2 VARIÁVEIS QUALITATIVAS .................................................................................................... 62

3 ESCALAS ESTATÍSTICAS ............................................................................................................. 634 ERROS DE OBSERVAÇÃO ............................................................................................................ 645 ARREDONDAMENTO DE NÚMEROS ...................................................................................... 64RESUMO DO TÓPICO 6 .................................................................................................................... 66AUTOATIVIDADE ............................................................................................................................. 67

UNIDADE 2 – MEDIDAS ESTATÍSTICAS .................................................................................... 69

TÓPICO 1 – MEDIDAS DE POSIÇÃO E VARIAÇÃO ................................................................ 711 INTRODUÇÃO ................................................................................................................................. 712 MEDIDAS DE POSIÇÃO ................................................................................................................ 71

2.1 MÉDIA ARITMÉTICA SIMPLES ( X ) ....................................................................................... 712.2 MÉDIA ARITMÉTICA PONDERADA ..................................................................................... 722.3 MÉDIA ARITMÉTICA DE DADOS AGRUPADOS EM INTERVALOS .............................. 742.4 MEDIANA (ME) .......................................................................................................................... 752.5 MODA (MO) ................................................................................................................................. 78

3 MEDIDAS DE VARIAÇÃO ............................................................................................................ 793.1 DESVIO-MÉDIO (D.M.) .............................................................................................................. 793.2 DESVIO-PADRÃO ....................................................................................................................... 80

Page 9: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

IX

3.3 VARIÂNCIA OU QUADRADO MÉDIO .................................................................................. 833.4 COEFICIENTE DE VARIAÇÃO (C.V.) ..................................................................................... 843.5 ERRO-PADRÃO DA MÉDIA – s X� � ........................................................................................ 843.6 ERRO-PADRÃO DE PERCENTAGEN – S (P) ......................................................................... 853.7 SEPARATRIZES ........................................................................................................................... 86

3.7.1 Quartis .................................................................................................................................. 863.7.2 Decis ...................................................................................................................................... 893.7.3 Centis .................................................................................................................................... 90

3.8 BOX PLOT (QUANTIL) .............................................................................................................. 92RESUMO DO TÓPICO 1 .................................................................................................................... 94AUTOATIVIDADE ............................................................................................................................. 95

TÓPICO 2 – TESTES DE NORMALIDADE, TESTES PARAMÉTRICOS ............................... 971 INTRODUÇÃO ................................................................................................................................. 972 DIFERENÇAS ENTRE DADOS PARAMÉTRICOS E NÃO PARAMÉTRICOS .................. 973 TESTES DE NORMALIDADE ....................................................................................................... 98

3.1. TESTE SHAPIRO-WILK ............................................................................................................. 983.2 TESTE KOLMOGOROV-SMIRNOV ......................................................................................... 99

4 TESTES PARAMÉTRICOS ............................................................................................................. 99RESUMO DO TÓPICO 2 .................................................................................................................... 102AUTOATIVIDADE ............................................................................................................................. 103ANEXOS ................................................................................................................................................ 104

TÓPICO 3 – TESTES DE HIPÓTESE ............................................................................................... 1071 INTRODUÇÃO ................................................................................................................................. 1072 HIPÓTESE ESTATÍSTICA .............................................................................................................. 1073 QUI-QUADRADO (TESTE DE ADERÊNCIA) ........................................................................... 1084 TESTE T – (STUDENT) .................................................................................................................... 110

4.1 DADOS DEPENDENTES ........................................................................................................... 1134.2 DIFERENÇA ENTRA A MÉDIA AMOSTRAL E O PARÂMETRO POPULACIONAL ........................................................................................................................ 115

5 COMPARAÇÃO DE DUAS PROPORÇÕES ............................................................................... 116RESUMO DO TÓPICO 3 .................................................................................................................... 118AUTOATIVIDADE ............................................................................................................................. 119ANEXOS ................................................................................................................................................ 120

TÓPICO 4 – TESTES NÃO PARAMÉTRICOS .............................................................................. 1251 INTRODUÇÃO ................................................................................................................................. 1252 TESTE U MANN-WHITEY ............................................................................................................. 1253 TESTE T DE WILCOXON ............................................................................................................... 128

3.1 PEQUENAS AMOSTRAS ........................................................................................................... 1293.2 GRANDES AMOSTRAS ............................................................................................................. 130

4 TESTE DE KRUSKAL-WALLIS ..................................................................................................... 1325 TESTE EXATO DE FISHER ............................................................................................................ 1346 TESTE DE FRIEDMAN ................................................................................................................... 1367 TESTE DE MCNEMAR .................................................................................................................... 1388 COEFICIENTE DE CORRELAÇÃO DE SPEARMAN (Rs) ...................................................... 140RESUMO DO TÓPICO 4 .................................................................................................................... 143AUTOATIVIDADE ............................................................................................................................. 144ANEXOS ................................................................................................................................................ 146

Page 10: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

X

UNIDADE 3 – ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL ................................................................................... 149

TÓPICO 1 – AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS ............................................................................................................... 1511 INTRODUÇÃO ................................................................................................................................. 1512 POR QUE UTILIZAR ÍNDICES DE QUALIDADE AMBIENTAL? ....................................... 1513 OS ÍNDICES ECOLÓGICOS SÃO CONFIÁVEIS? ................................................................... 1614 ESPÉCIES R E K ESTRATEGISTAS .............................................................................................. 1625 CONSERVAÇÃO AMBIENTAL X DIVERSIDADE BIOLÓGICA ......................................... 165RESUMO DO TÓPICO 1 .................................................................................................................... 168AUTOATIVIDADE ............................................................................................................................. 169

TÓPICO 2 – ÍNDICES ECOLÓGICOS ............................................................................................ 1711 INTRODUÇÃO ................................................................................................................................. 1712 ÍNDICES DE DIVERSIDADE ........................................................................................................ 171

2.1 ÍNDICES DE RIQUEZA .............................................................................................................. 1792.2 ÍNDICES DE DOMINÂNCIA .................................................................................................... 1812.3 ÍNDICES DE EQUITATIVIDADE .............................................................................................. 1842.4 A UTILIZAÇÃO DO SOFTWARE PAST PARA CÁLCULO DOS ÍNDICES ECOLÓGICOS .............................................................................................................................. 185

LEITURA COMPLEMENTAR ........................................................................................................... 188RESUMO DO TÓPICO 2 .................................................................................................................... 198AUTOATIVIDADE ............................................................................................................................. 199

REFERÊNCIAS ..................................................................................................................................... 201

Page 11: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

1

UNIDADE 1

O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE

DADOS

OBJETIVOS DE APRENDIZAGEM

PLANO DE ESTUDOS

A partir dessa unidade, você estará apto(a) a:

• reconhecer terminologias, símbolos e conceitos básicos encontrados na literatura da estatística;

• reconhecer, em seus experimentos, a forma como organizar seus dados, de forma concisa, e interpretando suas informações;

• ter maior compreensão em relação às teorias da probabilidade e da distribuição

Essa primeira unidade de estudo está dividida em seis tópicos. Você encontrará, ao final de cada um deles, uma leitura complementar e atividades que contribuirão para a compreensão dos conteúdos abordados

TÓPICO 1 – CONCEITOS APLICADOS À ESTATÍSTICA

TÓPICO 2 – OS MÉTODOS ESTATÍSTICOS

TÓPICO 3 – APRESENTAÇÃO DE DADOS

TÓPICO 4 – MÉTODOS DE AMOSTRAGEM

TÓPICO 5 – DISTRIBUIÇÃO DE PROBABILIDADE

TÓPICO 6 – INFERÊNCIAS ESTATÍSTICAS

Page 12: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

2

Page 13: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

3

TÓPICO 1UNIDADE 1

CONCEITOS APLICADOS À

ESTATÍSTICA

1 INTRODUÇÃOComo acadêmico(a), você precisa conhecer alguns conceitos, de onde

derivam, quais são suas aplicações, e na estatística não é diferente, pois, como dizem, “todo prédio deve ter um bom fundamento”.

Portanto, nesta unidade, você terá uma noção de alguns conceitos básicos aplicados à estatística, bem como um breve histórico na leitura complementar.

A estatística possui uma importância relevante nas pesquisas, pois acrescenta credibilidade aos dados analisados, tendo um grau elevado das conclusões que o pesquisador tem de seus dados coletados e observados.

2 DEFINIÇÃO DE ESTATÍSTICA E BIOESTATÍSTICAAo olharmos para um experimento, ou mesmo montá-lo, queremos

sempre ter uma resposta ou equipará-lo a outras pesquisas parecidas. Para isso precisamos de valores, de indicadores, para que possamos compará-los, atestá-los, e, então, precisaremos da estatística.

Afinal, o que é essa tal de estatística?

Etimologicamente, a palavra estatística vem de “status” (estado), expressão latina que define “sensu lato” como o estudo do estado (DORIA FILHO, 1999; SOUNIS, 1971).

Segundo Padovani (2012, p. 16), a estatística constitui-se em uma ciência destinada a:

I. Decidir o melhor plano (experimental ou observacional) para a execução de uma pesquisa metodologia científica.II. Organizar e resumir dados de contagem, mensuração e classificação raciocínio dedutivo.III. Inferir sobre populações de unidades (indivíduos, animais, objetos) quando uma parte (amostra) é considerada raciocínio indutivo.

Page 14: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

4

Padovani (2012, p. 16) menciona ainda que “[...] os métodos da estatística matemática são universais (ubíquos), e o estatístico, assim como o especialista em modelagem matemática, é capaz de colaborar em, praticamente, qualquer área de conhecimento e atividade profissional [...]”.

Portanto, você poderá aplicar a estatística em qualquer experimento que irá realizar, independentemente de sua área de atuação, pois é uma ciência que se preocupa com a análise e interpretação e, assim, você terá dados concretos para a tomada de possíveis decisões, baseado(a) nos valores obtidos de sua estatística.

De acordo com Motta e Wagner (2003, p. 15), a estatística se apresenta em duas partes:

• Estatística descritiva: é aquela que você como o próprio nome diz, aquela que se preocupa com a coleta, que organiza, que descreve, expõe os dados nas tabelas, gráficos, além do cálculo de estimativas de parâmetros representativos desses dados.• Estatística inferencial: a partir das conclusões sobre a população estatística, estabelece-se hipóteses sobre a população de origem.

FIGURA 1 - VISUALIZAÇÃO DA INTERAÇÃO DA ESTATÍSTICA DESCRITIVA E A INFERÊNCIA ESTATÍSTICA

FONTE: Adaptado de Battisti e Battisti (2008)

Na estatística, há várias formas de se obter o resultado da análise de um experimento, nos diversos ramos, como matemática, engenharia mecânica, contabilidade, entre outros, porém, quando se trabalha com dados obtidos nas áreas das ciências naturais, usa-se a estatística voltada para este campo, denominada de bioestatística.

Page 15: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | CONCEITOS APLICADOS À ESTATÍSTICA

5

Já a Bioestatística, de acordo com Padovani (2012, p. 15), “[...] é a metodologia estatística aplicada às ciências biológicas, com a finalidade planejar, coletar, organizar, resumir, analisar e interpretar os dados, permitindo tirar conclusões biológicas sobre populações a partir do estudo de amostras [...]”.

A bioestatística pode ser aplicada, também, à medicina e às ciências agrárias, porque ela está voltada às ciências ambientais, pois, muitas vezes, vocês irão utilizar os fatores climáticos, ou dados de população, com diversos fatores que influenciam de forma direta o resultado final.

Portanto, a estatística tem como objetivo principal tirar conclusões com base nos resultados observados, levando em consideração todos os fatores envolvidos no estudo.

“[...] As aplicações na área de biometria (medicina, biologia, agronomia, psicologia etc.), bem como nas ciências humanas, que tiveram enorme importância no desenvolvimento dos métodos estatísticos. Recentemente, até mesmo áreas que tradicionalmente não faziam análises baseadas em métodos quantitativos estão empregando modelos estatísticos extremamente sofisticados na pesquisa científica. Como exemplo, pode-se citar o uso de modelos logísticos em estudos de variação linguística, na sociolinguística [...]” (INSTITUTO DE MATEMÁTICA DA UFRGS).

NOTA

3 CONCEITOS APLICADOS À ESTATÍSTICAAlguns conceitos são importantes, para que você saiba, como proceder, ou

levantar seus dados em campo, ou fazer comparações de dados ou entre dados.

Vamos a eles:

• População: é qualquer conjunto de informações que tenham entre si uma característica comum (DORIA FILHO, 1999). Ex.: Num bairro, o conjunto das estaturas de todos os moradores constitui uma “população de estaturas”, e o tamanho de uma população é expressa pela letra N (maiúscula).

• Amostras: são subconjuntos representativos de uma dada população (DORIA FILHO, 1999). Esta amostra deve representar de forma significativa seus valores quantitativos e qualitativos, e ela é expressa pela letra n (minúscula).

Page 16: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

6

• Hipótese: Segundo Kato (2015, p. 01), “em estatística, é uma suposição formulada a respeito dos parâmetros de uma distribuição de probabilidade de uma ou mais populações. Esta hipótese será testada com base em resultados amostrais, sendo aceita ou rejeitada. Ela somente será rejeitada se o resultado da amostra for claramente improvável de ocorrer quando a hipótese for verdadeira. Consideremos Ho a hipótese nula, e H1 a hipótese alternativa a ser testada (complementar de Ho). O teste pode levar à aceitação ou rejeição de Ho, que corresponde, respectivamente, à negação ou afirmação de H1”.

• Nível de significância de um teste (α): é a probabilidade máxima de rejeitar Ho. Se, por exemplo, utilizarmos o nível de significância de 5%, a hipótese nula (Ho) será rejeitada somente se o resultado da amostra for tão diferente do valor suposto que uma diferença igual ou maior ocorreria com uma probabilidade máxima de 0,05. Na prática, o valor de α é fixo (geralmente, α = 0,01 ou 0,05 ou 0,10) (KATO, 2015).

• Variável aleatória: De acordo com Battisti e Battisti (2008), são as características de uma população ou uma amostra. Para o exemplo dado, as variáveis aleatórias são as questões que o instrumento de coleta de dados (também chamado de questionário) contempla, por exemplo: idade, estado civil, escolaridade, número de filhos, qual atividade exerce, tempo que exerce a atividade, quantas horas trabalha por semana, se é autônomo ou empregado, e muitas outras. Classificamos as variáveis aleatórias em qualitativas e quantitativas:

- As variáveis qualitativas têm seus valores (respostas para cada questão do questionário) não numéricos, como sexo, estado civil, nível de escolaridade, bairro, profissão, nível de satisfação. As variáveis quantitativas têm seus valores numéricos, tais como: idade, peso, salário, tempo de serviço, número de filhos. As variáveis qualitativas são subdivididas em nominais e ordinais. Quando as diferentes categorias (respostas) não têm relação entre si, ou seja, são independentes, classificamos a variável como qualitativa nominal, por exemplo, sexo, estado civil, curso de graduação e bairro. Por outro lado, quando as categorias têm uma relação entre si, geralmente atribuindo níveis, como o nível de escolaridade e o grau de satisfação do cliente, são denominadas qualitativas ordinais.

- As variáveis quantitativas são subdivididas em discretas e contínuas. Motta e Wagner (2003) descrevem que as variáveis quantitativas discretas assumem somente valores numéricos inteiros, como: número de filhos, número de alunos, número de computadores. Já as variáveis quantitativas contínuas podem assumir qualquer valor numérico, resultado de uma medida dentro de um certo intervalo de variação possível, como: peso, idade e salário.

Page 17: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | CONCEITOS APLICADOS À ESTATÍSTICA

7

FIGURA 2 - RESUMO DAS VARIÁVEIS ALEATÓRIAS

FONTE: Adaptado de Battisti e Battisti (2008)

• Dados primários e dados secundários: De acordo com Battisti e Battisti (2008), os dados primários estão disponíveis na sociedade (idade, sexo, estado civil) e os secundários estão organizados de alguma forma, geralmente, nos meios de comunicação e publicações científicas (tabelas, gráficos).

O texto a seguir foi retirado, na íntegra, do site do Instituto de Matemática da Universidade Federal do Rio Grande do Sul. Nele você conhecerá o começo da história da estatística, e seus principais percursores.

HISTÓRIA DA ESTATÍSTICA

A origem da palavra Estatística está associada à palavra latina STATUS (Estado). Há indícios de que há 3.000 anos a.C. já se faziam censos na Babilônia, China e Egito; até mesmo o 4º livro do Velho Testamento faz referência a uma instrução dada a Moisés para que fizesse um levantamento dos homens de Israel que estivessem aptos para guerrear. Usualmente, estas informações eram utilizadas para a taxação de impostos ou para o alistamento militar. O Imperador César Augusto, por exemplo, ordenou que se fizesse o censo de todo o Império Romano.

A palavra CENSO é derivada da palavra CENSERE, que em latim significa TAXAR. Em 1085, Guilherme, o Conquistador, solicitou um levantamento estatístico da Inglaterra, que deveria conter informações sobre terras, proprietários, uso da terra, empregados e animais. Os resultados deste censo foram publicados em 1086, no livro intitulado “Domesday Book”, e serviram de base para o cálculo de impostos.

LEITURA COMPLEMENTAR

Variável Aleatória

QualitativaOrdinal

Nominal

QuantitativaDiscreta

Contínua

Page 18: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

8

Contudo, mesmo que a prática de coletar dados sobre colheitas, composição da população humana ou de animais, impostos etc. fosse conhecida pelos egípcios, hebreus, caldeus e gregos, e se atribua a Aristóteles cento e oitenta descrições de estados, apenas no século XVII a Estatística passou a ser considerada disciplina autônoma, tendo como objetivo básico a descrição dos BENS do Estado.

A palavra Estatística foi cunhada pelo acadêmico alemão Gottfried Achenwall (1719-1772), que foi um notável continuador dos estudos de Hermann Conrig (1606-1681). A escola alemã atingiu sua maturidade com A. L. von Schlozer (1735-1809), mas sempre com ideias diferentes daquelas que fundamentaram a Estatística Moderna. Com algum exagero, pode-se dizer que o seu principal legado foi o termo “STAATENKUNDE”, que deu origem à designação atual. Na Enciclopédia Britânica, o verbete “STATISTICS” apareceu em 1797.

Em contraposição à natureza eminentemente qualitativa da escola alemã, na Inglaterra do século XVII surgiram os aritméticos políticos, dentre os quais destacaram-se John Graunt (1620-1674) e William Petty (1623-1687). Eles preocuparam-se com o estudo numérico dos fenômenos sociais e políticos, na busca de leis quantitativas que pudessem explicá-los. O estudo consistia essencialmente de exaustivas análises de nascimentos e mortes, realizadas através das Tábuas de Mortalidade, que deram origem às atuais Tábuas de Mortalidade usadas pelas companhias de seguros. Um dos resultados mais importantes foi a constatação de que o percentual de nascimento de crianças do sexo masculino (51%) é levemente superior ao do sexo feminino (49%). Dessa forma, a escola dos aritméticos políticos pode ser considerada o berço da Demografia. Um de seus mais notáveis adeptos foi o pastor alemão Sussmilch (1707-1767), com o qual pode-se dizer que a Estatística aparece pela primeira vez como meio indutivo de investigação.

Na última metade do século XIX, os alemães Helmert (1843-1917) e Wilhelm Lexis (1837-1914), o dinamarquês Thorvald Nicolai Thiele (1838-1910) e o inglês Francis Ysidro Edgeworth (1845-1926) obtiveram resultados extremamente valiosos para o desenvolvimento da Inferência Estatística, muitos dos quais só foram completamente compreendidos mais tarde. Contudo, o impulso decisivo deve-se a Karl Pearson (1857-1936), William S. Gosset (1876-1937) e, em especial, a Ronald A. Fisher (1890-1962).

Karl Pearson (1857-1936) formou-se em 1879 pela Cambridge University e, inicialmente, dedicou-se ao estudo da evolução de Darwin, aplicando os métodos estatísticos aos problemas biológicos relacionados com a evolução e hereditariedade. Em 1896, Pearson foi eleito membro da Royal Society of London.

Entre 1893 e 1912 escreveu um conjunto de 18 artigos denominado Mathematical Contribution to the Theory Evolution, com contribuições extremamente importantes para o desenvolvimento da teoria da Análise de Regressão e do Coeficiente de Correlação, bem como do teste de hipóteses de qui-quadrado. Em sua maioria, seus trabalhos foram publicados na revista Biometrika, que fundou

Page 19: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | CONCEITOS APLICADOS À ESTATÍSTICA

9

em parceria com Walter Frank Raphael Weldon (1860-1906) e Francis Galton (1822-1911). Além da valiosa contribuição que deu para a teoria da regressão e da correlação, Pearson fez com que a Estatística fosse reconhecida como uma disciplina autônoma. Uma coleção de seus artigos foi publicada em “Karl Pearson Early Statistical Papers” (Ed. por E. S. Pearson, Cambridge University Press, 1948). Para ver uma relação de alguns trabalhos publicados por Karl Pearson

William Sealey Gosset (1876-1937) estudou Química e Matemática na New College Oxford. Em 1899, foi contratado como Químico da Cervejaria Guiness em Dublin, desenvolvendo um trabalho extremamente importante na área de Estatística. Devido à necessidade de manipular dados provenientes de pequenas amostras, extraídas para melhorar a qualidade da cerveja, Gosset derivou o teste t de Student baseado na distribuição de probabilidades.

Esses resultados foram publicados em 1908 na revista Biometrika, sob o pseudônimo de Student, dando origem a uma nova e importante fase dos estudos estatísticos. Gosset usava o pseudônimo de Student, pois a Cervejaria Guiness não desejava revelar aos concorrentes os métodos estatísticos que estava empregando no controle de qualidade da cerveja. Os estudos de Gosset podem ser encontrados em “Student Collected Papers” (Ed. por E.S.Pearson e J. Wishart, University College, Londres, 1942).

A contribuição de Ronald Aylmer Fisher (1890-1962) para a Estatística Moderna é, sem dúvidas, a mais importante e decisiva de todas. Formado em astronomia pela Universidade de Cambridge, em 1912, foi o fundador do célebre Statistical Laboratory da prestigiosa Estação Agronômica de Rothamsted, contribuindo enormemente tanto para o desenvolvimento da Estatística quanto da Genética. Ele apresentou os princípios de planejamento de experimentos, introduzindo os conceitos de aleatorização e da Análise da Variância, procedimentos muito usados atualmente.

No princípio dos anos 20, estabeleceu o que a maioria aceita como a estrutura da moderna Estatística Analítica, através do conceito da verossimilhança (likelihood, em inglês). O seu livro intitulado “Statistical Methods for Research Workers”, publicado pela primeira vez em 1925, foi extremamente importante para familiarizar os investigadores com as aplicações práticas dos métodos estatísticos e, também, para criar a mentalidade estatística entre a nova geração de cientistas. Os trabalhos de Fisher encontram-se dispersos em numerosas revistas, mas suas contribuições mais importantes foram reunidas em “Contributions to Mathematical Statistics” (J. Wiley & Sons, Inc., Nova Iorque, 1950).

Fisher foi eleito membro da Royal Society em 1929 e condecorado com as medalhas Royal Medal of the Society e Darwin Medal of the Society em 1938 e em 1948, respectivamente. Em 1955, foi novamente condecorado, desta vez com a medalha Copley Medal of the Royal Society.

Page 20: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

10

Outra área de investigação extremamente importante para o desenvolvimento da Estatística é a Teoria das Probabilidades. Usualmente, costuma-se atribuir a origem do Cálculo de Probabilidades às questões relacionadas aos jogos de azar que o célebre cavaleiro Méré (1607-1684) encaminhou à Blaise Pascal (1623-1662).

No entanto, outros autores sustentam que o Cálculo de Probabilidades teve a sua origem na Itália, com especial referência para Luca Pacioli (1445-1517), Girolamo Cardano (1501-1576), Nicolo Fontana Tartaglia (1500-1557) e Galileo Galilei (1564-1642).

Três anos depois de Pascal ter previsto que a “aliança do rigor geométrico” com a “incerteza do azar” daria lugar a uma nova ciência, Christiaan Huygens (1629-1695) publicou o trabalho denominado “De Raciociciis in Ludo Aleae”, que é considerado o primeiro livro sobre o Cálculo de Probabilidades. Além disso, ainda teve a notável particularidade de introduzir o conceito de esperança matemática.

Gottfried Wilhelm von Leibniz (1646-1716) também dedicou-se ao estudo do Cálculo de Probabilidades, publicando um trabalho sobre a “arte combinatória” e outro sobre aplicações às questões financeiras. Leibniz também estimulou Jacques Bernoulli (1654-1705) ao estudo do Cálculo de Probabilidades, cuja grande obra, denominada “Ars Conjectandi”, foi publicada oito anos após a sua morte.

Em Ars Conjectandi, de Jacques Bernoulli, foi publicada e rigorosamente provada a Lei dos Grandes Números de Bernoulli, considerado o primeiro teorema limite. Pode-se dizer que, graças às contribuições de Bernoulli, o Cálculo de Probabilidades adquiriu o status de ciência.

Além da obra póstuma de Bernoulli, o início do século XVII foi marcado pelos livros de Pierre Rémond de Montmort (1678-1719), denominado Essai d’Analyse sur les Jeux de Hazard, e de Abraham De Moivre (1667-1754), intitulado The Doctrine of Chances.

De Moivre era francês de nascimento, mas desde a sua infância refugiou-se na Inglaterra devido às guerras religiosas, fazendo aplicações ao cálculo de anuidades e estabelecendo uma equação simples para a lei da mortalidade entre 22 anos e o limite da longevidade que fixou em 86 anos. Mais tarde, na “Miscellanea Analytica”, apresentou resultados aos quais Laplace deu uma forma mais geral e que constituem o segundo teorema limite.

É extremamente importante falar, também, do reverendo Thomas Bayes (1702-1761), a quem se deve o conceito de probabilidade inversa, relacionado com situações em que se caminha do particular para o geral. No seu livro denominado “Essay towards solving a problem of the doctrine of chances” (Philosophical Transactions of the Royal Society of London, 1764-65, póstumo), Bayes formula,

Page 21: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | CONCEITOS APLICADOS À ESTATÍSTICA

11

através do teorema que leva seu nome e do postulado que tantas vezes se lhe associa, a primeira tentativa de matematização da inferência Estatística. Mesmo sem ter publicado nenhum trabalho com seu nome, em 1742 Thomas Bayes foi eleito membro da Royal Society of London.

Os estudos dos astrônomos Pierre-Simon Laplace (1749-1827), Johann Carl Friedrich Gauss (1777-1855) e Lambert Adolphe Jacques Quetelet (1796-1874) foram fundamentais para o desenvolvimento do Cálculo de Probabilidades. Devido aos novos métodos e ideias, o trabalho de Laplace de 1812, intitulado “Théorie Analytique des Probabilités”, até o presente é considerado um dos mais importantes trabalhos sobre a matéria.

Johann Carl Friedrich Gauss, professor de astronomia e diretor do Observatório de Gottingen, em 1809, apresentou o estudo intitulado “Theoria combinationis Observatorium Erroribus Minimis Obnoxia”, explanando uma teoria sobre a análise de observações aplicável a qualquer ramo da ciência, alargando o campo de aplicação do Cálculo de Probabilidades.

Com Lambert Adolphe Jacques Quetelet, por sua vez, inicia-se a aplicação aos fenômenos sociais. O seu escrito “Sur l’homme et le développement de ses facultés” foi publicado em segunda edição com o título “Physique sociale ou Essai sur le développement des facultés de l’homme”, que incluía pormenorizada análise da teoria da probabilidade. Quetelet introduziu também o conceito de “homem médio” e chamou particular atenção para a notável consistência dos fenômenos sociais. Por exemplo, mostrou que fatores como a criminalidade apresentam permanências em relação a diferentes países e classes sociais.

Antoine Augustin Cournot (1801-1877) percebeu a importância da Teoria das probabilidades na análise estatística, tendo sido o pioneiro no tratamento matemático dos fenômenos econômicos. Suas ideias foram publicadas em “Exposition de la théorie des chances et des probabilités”.

Na segunda metade do século XIX, a Teoria das Probabilidades atingiu um dos pontos mais altos com os trabalhos da escola russa fundada por Pafnuty Lvovich Chebyshev (1821-1894), que contou com representantes como Andrei Andreyevich Markov (1856-1922) e Aleksandr Mikhailovich Lyapunov (1857-1918).

Contudo, o seu maior expoente foi Andrey Nikolayevich Kolmogorov (1903-1987), a quem se deve um estudo indispensável sobre os fundamentos da Teoria das Probabilidades, denominado “Grundbegrife der Warscheinlichkeitrechnung”, publicado em 1933. Em 1950, foi traduzido para o Inglês sob o título “Foundations of Probability”.

FONTE: Disponível em: <http://www.ufrgs.br/mat/graduacao/estatistica/historia-da-estatistica>. Acesso em: 19 abr. 2015.

Page 22: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

12

Neste tópico você viu que:

• A estatística tem como definição: a ciência de coletar, organizar, apresentar, analisar e interpretar dados numéricos com o objetivo de tomar melhores decisões.

• Estatística Descritiva como sendo: os procedimentos usados para organizar, resumir e apresentar dados numéricos.

• Estatística Indutiva ou Inferencial como a coleção de métodos e técnicas utilizados para se estudar uma população baseados em amostras probabilísticas desta mesma população.

• Bioestatística é voltada ao planejamento, à avaliação e interpretação de dados biológicos.

RESUMO DO TÓPICO 1

Page 23: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

13

AUTOATIVIDADE

1 Qual é a definição de bioestatística? E de que forma ela pode se apresentar?

2 Com relação à leitura complementar, faça um resumo cronoló-gico sobre a estatística.

Page 24: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

14

Page 25: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

15

TÓPICO 2

MÉTODOS ESTATÍSTICOS

UNIDADE 1

1 INTRODUÇÃONeste tópico, você irá perceber que estatística não é um cálculo fixo,

dependendo do que você realizará, ou a forma que conduzirá seu experimento, irá também alterar o curso de seus cálculos.

Você irá ver que os dados possuem denominações dentro da estatística, e conforme você conduz seu experimento, irá ver que o tamanho amostral pode ser verificado em formas diferentes para ter o valor.

2 MÉTODOSQuando você se prepara para viajar, você se organiza, coloca a roupa na

mala e, sem querer, está seguindo um método para que não se esqueça de nada.

A estatística funciona assim também, isto é, você possui um conjunto de dados pertinentes para chegar a um determinado resultado, os quais podem ser experimentais e estatísticos.

2.1 MÉTODO EXPERIMENTAL

O próprio nome já diz: é um método que consiste, através da experimentação, manter constante todas as causas (fatores), menos uma, variando-a de modo que se possa descobrir seus efeitos, caso existam. Esse método passa por várias etapas: observação, hipótese, experimentação e teoria. A pesquisa experimental procura entender de que modo ou por quais causas o fenômeno é produzido, sendo utilizada nos diversos campos da atividade humana, bem como nas disciplinas de física, química, biologia, entre outras.

Vantagens e desvantagens: possibilita conhecimento mediante procedimentos experimentais, porém, por exigir previsão e controle, torna-se, às vezes, inviável para objetos sociais. A pesquisa experimental exige um plano ou protocolo do experimento com passos bem definidos.

Page 26: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

16

2.2. MÉTODO ESTATÍSTICO

Com certa frequência, torna-se impossível fazer uso do método experimental, isso se deve porque não é possível manter constantes todos os fatores que envolvem um determinado fenômeno de estudo, pois cada variação que ocorrer você deve registrar e procurar determinar, no resultado final, que influências cabem a cada uma delas, ou seja, é muito importante controlar as variáveis que podem interferir em seu experimento.

2.3 IMPORTÂNCIA DA ESCOLHA DO MÉTODO

Quando você realizar um experimento, deve se ater ao que você deseja como resultado final, ou seja, o que você pretende com esta pesquisa, que tipo de conclusões quer tirar do estudo que se propôs a fazer, por isso é importante a escolha do método, lembrando que, na estatística descritiva, a coleta, a organização, a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem a este método, enquanto que a análise e a interpretação dos dados, associadas a uma margem de incerteza, ficam a cargo do método estatístico.

3.1 PLANEJAMENTO – DEFINIÇÃO DO PROBLEMA

3 ETAPAS DO TRABALHO ESTATÍSTICO

Uma vez definido o problema que se deseja resolver, você irá trazer as observações (informações) colhidas de uma determinada população.

Exemplo: numa determinada região, há o crescimento excessivo de uma alga que está prejudicando o ambiente local. E isto chamou sua atenção. Você, em campo, observa como o ambiente se apresenta; tenta verificar qual a origem dessa explosão populacional; verifica se há apenas uma espécie ou mais nesta área, estuda as condições ambientais (temperatura, umidade, pluviosidade, entre outras) etc.

Você faz todo o estudo, verificando quais informações são as mais relevantes para o caso.

Eles podem ser:

• Direta: quando feita sobre elementos informativos de registro obrigatório ou coletados pelo próprio pesquisador. Essa coleta pode ser contínua, periódica ou ocasional.

3.2 COLETA DE DADOS

Page 27: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | MÉTODOS ESTATÍSTICOS

17

• Indireta: quando é feita com base em elementos já pesquisados (revista, jornal, livros etc.)

Na coleta de dados, podemos ter:

• Dados discretos - resultam de contagens de eventos. Exemplo: número de filhos, número de batimentos cardíacos por minuto.

• Dados contínuos - estes dados são obtidos de algum tipo de medição: altura, peso, pressão arterial, temperatura corporal.

• Rankings ou postos – ocasionalmente, os dados representam a posição relativa dos membros de um grupo com relação a algum ranking. A posição de um indivíduo neste ranking é chamada de posto.

• Porcentagens - é necessário ter cuidado quando os dados com os quais se trabalha são porcentagens observadas.

• Escores - são usados quando não é possível fazer medições diretas. Em sua forma mais simples, estes sistemas numéricos classificam uma característica em diversas categorias segundo a opinião de um indivíduo. Por exemplo, a dor de um ferimento pode ser classificada como leve, moderada ou severa, podendo ser designado um valor numérico a cada categoria. Deve ser notado que estas escalas são subjetivas.

• Dados censurados - uma observação é chamada censurada se não pode ser medida de forma precisa, mas sabe-se que está além, ou aquém, de um limite. Por exemplo, em alguns experimentos existe um período fixo de acompanhamento, sendo a variável de interesse o tempo para aparecer um sintoma ou desaparecer alguma condição específica.

3.3 TAMANHO AMOSTRAL

Essa é sempre a maior dúvida dos pesquisadores: qual deve ser o tamanho de minha amostra? Esse é um ponto importante na pesquisa e, para realizar o cálculo do tamanho da amostra, segundo Motta e Wagner (2003), deve-se entender que o procedimento é totalmente baseado em pressuposições que o pesquisador faz em relação aos dados que irá encontrar. Nesse contexto, há dois tipos de estimativas para o tamanho amostral: cálculo para estudos analíticos e cálculo para estudos descritivos.

Page 28: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

18

3.3.1 Estudos analíticos

Segundo Motta e Wagner (2003, p. 171), “[...] o primeiro passo é estabelecer a sua hipótese de pesquisa, para que possam identificar o tipo de variável envolvida e o tipo de teste estatístico para a qual há fórmula disponível, fixando os níveis máximos de erro do tipo I (α) e do tipo II (β) o tamanho amostral é facilmente calculado [...]”.

Ainda segundo os autores, dentro do estudo analítico temos a variável quantitativa e a variável qualitativa.

Na variável quantitativa, você deve comparar dois grupos, devendo-se estimar:

Média esperada no grupo 1.Média esperada no grupo 2.Dispersão da variável nos dois grupos (usar desvio-padrão).

Com a diferença das médias, pode-se saber qual o efeito mínimo a ser detectado pelo estudo.

Eis a fórmula:

Sendo:Zα: valor de Z na curva normal segundo α (geralmente bicaudal).Zβ: valor de Z na curva normal segundo β (sempre unicaudal).Sa: desvio-padrão no grupo a.Sb: desvio-padrão no grupo b.

X Xa b− : diferença mínima a ser detectada no estudo.

Esta fórmula apresenta o tamanho amostral mínimo necessário por grupo, supondo grupos de tamanhos iguais e que corriqueiramente são utilizados α (0,05) e β (0,10) (MOTTA; WAGNER, 2003).

A variável qualitativa, de acordo com Motta e Wagner (2003), relata que, no caso de proporções, tudo que se precisa são os valores das proporções a serem testados. Eis a fórmula a seguir:

nZ p q p q Z p q

p p

a a b b

a b�

� �

�� �� � 2 0 0

2

Page 29: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | MÉTODOS ESTATÍSTICOS

19

Onde:

Zα: valor de Z na curva normal segundo α (geralmente bicaudal).Zβ: valor de Z na curva normal segundo β (sempre unicaudal).pa: proporção no grupo a.qa: complemento do pa, ou seja, (1-pa).pb: proporção no grupo b.qb: complemento do pb, ou seja, (1-pb).p0: proporção ponderada; p0=(xa+xb)/(na+nb), onde x é o nº de eventos

observados.qb= complemento de p0, ou seja, (1-p0).pa-pb= diferença mínima a ser detectada no estudo.

Assim, como na fórmula anterior, a fórmula apresenta n mínimo por grupo para testagem de um efeito; em proporções, os valores mais corriqueiramente utilizados para α é 0,05 e para β é 0,20 (MOTTA; WAGNER, 2003).

3.3.2 Estudos descritivos

De acordo com Motta e Wagner (2003),

em estudos descritivos, ou seja, estimativa de parâmetros quantitativos (μ) ou qualitativos (π) a estimativa do tamanho amostral baseia-se essencialmente na margem do erro que será aceita no intervalo de confiança do parâmetro, usando-se o α, mas sem necessidade de fixar β e efeito mínimo a testar.

Ainda segundo os autores, dentro do estudo descritivos temos a variável quantitativa e a variável qualitativa.

A variável quantitativa, após fixar o α, determina o valor esperado para o desvio padrão da variável e qual sua margem de erro máxima tolerável, ou seja, qual a diferença máxima (para cima ou para baixo) que será aceitável pelo pesquisador errar em relação ao parâmetro.

Eis a fórmula: nZ S

ME�� ��

�4

2

2 2

2�Z

Onde:Zα: valor de Z na curva normal segundo α (geralmente bicaudal).S: desvio-padrão da variável.ME: margem de erro máximo tolerável em relação ao parâmetro.

Page 30: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

20

Já com a variável qualitativa, estima-se em que faixa de valor se espera que seja o parâmetro (p. e 0,10; 0,50 ou 0,80) e, em seguida, qual a margem de erro máxima tolerável.

Segue a fórmula: nZ pq

ME�� �4

2

2

2� �p

Onde:Zα: valor de Z na curva normal segundo α (geralmente bicaudal).p: estimativa inicial da proporção.q: complemento de p, ou seja, (1-p).ME: margem de erro máximo tolerável em relação ao parâmetro.

Page 31: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

21

Neste tópico você viu que:

• Método experimental é um método que, através da experimentação, mantém constante todas as causas (fatores), menos uma, variando-a de modo que se possa descobrir seus efeitos, caso existam. Esse método passa por várias etapas: observação, hipótese, experimentação e teoria.

• No método estatístico é muito importante controlar as variáveis que podem interferir em seu experimento.

• A coleta de dados pode ser direta, ou seja, quando feita sobre elementos informativos de registro obrigatório ou coletados pelo próprio pesquisador, podendo ser contínua, periódica ou ocasional; e indireta, ou seja, quando é feita com base em elementos já pesquisados (revista, jornal, livros etc.).

• Dependendo da estatística que você irá aplicar, o tamanho amostral vai variar

entre o analítico e o descritivo.

RESUMO DO TÓPICO 2

Page 32: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

22

1 Descreva as diferenças entre o método estatístico e o experi-mental.

AUTOATIVIDADE

2 A coleta de dados pode ser:

3 Os dados podem se apresentar de que forma?

4 Em relação ao tamanho amostral, descreva as diferenças do cálculo para estudos analíticos e do cálculo para estudos descritivos.

Page 33: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

23

TÓPICO 3

APRESENTAÇÃO DE DADOS

UNIDADE 1

1 INTRODUÇÃOGráficos, como equações e tabelas, mostram como se relacionam duas ou

mais grandezas físicas. Como investigar quais são as relações existentes entre as grandezas constitui grande parte do trabalho, tanto experimental como teórico, em física; equações, tabelas e gráficos são importantes ferramentas.

Assim, uma boa forma de analisar um conjunto de dados experimentais e resumir os resultados é colocá-los em um gráfico. É importante fornecer, no gráfico, toda a informação necessária que permita sua leitura correta e simples.

Neste tópico, você irá ver como se monta uma tabela de dados, bem como as diversas formas que se apresentam os gráficos.

2 TABELAS ESTATÍSTICASDe acordo com Almeida, Araújo e Ramos (2009), a apresentação tabular é

uma apresentação numérica dos dados. Consiste em dispor os dados em linhas e colunas distribuídos de modo ordenado, segundo algumas regras práticas adotadas pelos diversos sistemas estatísticos. As regras que prevalecem no Brasil foram fixadas pelo Conselho Nacional de Estatística.

Tabela: é uma maneira de apresentar de forma resumida um conjunto de observações (dados). As tabelas têm a vantagem de conseguir expor organizadamente, em um só local, os resultados sobre determinado assunto, de modo a se obter uma visão global mais rápida daquilo que se pretende analisar (ALMEIDA; ARAÚJO; RAMOS, 2009).

Uma tabela compõe-se de: título, corpo (cabeçalho, colunas (indicadoras e numéricas)) e rodapé.

Page 34: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

24

FIGURA 3 - PRINCIPAIS ELEMENTOS DA TABELA

FONTE: Almeida, Araújo e Ramos (2009)

Principais elementos da tabela, de acordo dom Almeida, Araújo e Ramos (2009):

• Título da tabela: localizado no topo, deve conter as informações mais completas possíveis, além de conter a palavra “TABELA” e com sua respectiva numeração.

• Corpo da tabela: é o conjunto de linhas e colunas que contém informações sobre a variável de estudo; observando que:

- Na parte superior da tabela há o cabeçalho da coluna, que especifica o conteúdo da coluna.

- Verticalmente, tem-se as colunas (indicadora e numérica), onde a coluna indicadora é aquela que especifica o conteúdo das linhas e, na coluna numérica, os valores numéricos destas linhas.

• Rodapé: localizado na parte inferior da tabela, e contém informações sobre o responsável (fonte). Algum texto esclarecedor do conteúdo da tabela (nota) e algum símbolo remissível atribuído a algum elemento que necessite de uma nota (chamada).

Não se delimita, ou seja, fechar as laterais da tabela. Usa-se um traço horizontal (-) quando o dado for nulo; usa-se [...] quando não se dispuser de dados, embora ele possa ser quantificado; e usa-se zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada; também usa-se (?) quando temos dúvidas na unidade.Adotar as configurações de tamanho do título, bem como o tamanho da fonte e demais informações conforme as configuração das normas brasileiras - NBR 14724/2011.

IMPORTANTE

Corpoda

tabela

Título: o que? Quando? Onde?

Rodapé: fontes, notas, observações

cabeçalho

Coluna indicadora Coluna numérica O cruzamento de linha com coluna chama-se casa ou célula

Page 35: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | APRESENTAÇÃO DE DADOS

25

Séries estatísticas: é um conjunto de dados estatísticos referenciados a seguintes fatores: tempo, local e fenômeno.

A seguir, alguns exemplos fictícios:

1º) Série temporal ou cronológica: nesta série, o elemento de variação é o tempo (dia, mês, ano etc.)

TABELA 1- QUANTIDADE DE SCHINUS TEREBINTHIFOLIUS (AROEIRA), ENCONTRADA NA ÁREA DE PRESERVAÇÃO PERMANENTE DA LOCALIDADE DE TIJUCA, NUM PERÍODO DE 2012 A 2014.

FONTE: O autor

2º) Série geográfica: o elemento de variação é o lugar (município, bairro, país, escola etc).

TABELA 2 - A ESPÉCIE PASSER DOMESTICUS (PARDAL), CATALOGADOS PARA COLETA DE SANGUE E MAPEAMENTO GENÉTICO EM TRÊS ESTADOS BRASILEIROS

3º) Série especificativa: o elemento de variação é a espécie (material escolar, remédios, fauna, flora, produto de uma fábrica etc.).

FONTE: O autor

TABELA 3 - QUANTIDADE DE CADA ESPÉCIE ENCONTRADA NO ESTADO DE SANTA CATARINA NO ANO DE 2013

FONTE: O autor

Espécies Quantidade

Cedrela fissilis 2.458

Ocotea porosa 3.587

Nectandra lanceolata 7.598

Estados Quantidade

Pará 2.458

São Paulo 3.587

Minas Gerais 7.598

Anos Quantidade

2012 14

2013 20

2014 05

Page 36: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

26

4º) Série mista: é a junção de duas ou mais séries simples (geográfica, especificativa ou temporal)

TABELA 4 - CASOS DE DENGUE REGISTRADOS NUM PERÍODO DE 4 ANOS, EM 4 MUNICÍPIOS ESCOLHIDOS ALEATORIAMENTE

FONTE: O autor (2015)

3 DISTRIBUIÇÃO POR FREQUÊNCIAPor constituir-se um tipo de tabela importante para a Estatística Descritiva,

faremos um estudo com toda distribuição de frequências. Uma distribuição de frequências condensa um grande número de dados numa tabela, de modo que 100, 200, 500 ou um número qualquer de valores pode ser representado em poucas linhas. É uma série estatística específica em que os dados encontram-se dispostos em classes ou categorias junto às suas frequências correspondentes. Neste caso, todos os elementos são fixos (época, local, fenômeno). A distribuição de frequência pode ser por intervalo ou por pontos, sendo que isto depende muito da quantidade de informações que você tiver ou do tipo da variável.

MunicípiosAnos

2011 2012 2012 2014

Florianópolis 4 - 14 5

Blumenau 8 14 11 -

Tijucas 7 13 8 4

Lajes - 5 12 3

3.1 DISTRIBUIÇÃO DE FREQUÊNCIA POR PONTOS

É uma série estatística na qual a variável observada está dividida em subintervalos do intervalo total observado, e o tempo, a espécie e a região permanecem fixos.

Usada para variáveis qualitativas ou quantitativas discretas com poucos valores diferentes. As observações são representadas em uma tabela de frequências, não agrupadas em classes. Exemplos: número de acidentes de trabalho na Empresa X; quantidade de livros de estatística na biblioteca da UNIASSELVI. Eis um exemplo de distribuição de frequências para variável discreta:

Page 37: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | APRESENTAÇÃO DE DADOS

27

TABELA 5 - NÚMERO DE ACIDENTES DE TRABALHO EM PEQUENAS EMPRESAS DA CIDADE DE PORTO ALEGRE (2013)

FONTE: O autor (2015)

Xi = identifica as categorias em que o fato se subdivide. fi = corresponde à frequência absoluta, isto é, o número de vezes que cada

uma das categorias ocorre. N = soma dos fi = total de elementos observados na população. n = soma dos fi

Nº de acidentes (Xi)Número de Empresas

(fi)

0 35

1 20

2 14

3 18

4 06

5 ou mais 38

Total 131

3.2. DISTRIBUIÇÃO DE FREQUÊNCIA POR INTERVALOS

Usada para variáveis quantitativas contínuas ou discretas com muitos valores diferentes, sendo as variáveis observadas representadas sob a forma de intervalos. Geralmente, esta variável provém de medições.

Vamos ao exemplo:

X = Notas finais de 50 estudantes da disciplina de estatística22 46 9 40 57 22 22 13 50 4235 2 15 41 34 52 32 75 69 4426 42 60 56 30 3 17 79 45 370 12 62 50 45 41 59 11 66 3943 33 70 50 47 20 36 40 67 29

Então, a distribuição de frequência será expressa pela tabela:

Page 38: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

28

TABELA 6 – NOTAS FINAIS DOS ESTUDANTES DA DISCIPLINA DE ESTATÍSTICA –2009/1

FONTE: Fioreze e Marques (2015)

Notas fi

0 I--- 10 4

10 I--- 20 5

20 I--- 30 6

30 I--- 40 8

40 I--- 50 12

50 I--- 60 7

60 I--- 70 5

70 I--- 80 3

Total 50

fi é a frequência absoluta das classes, ou seja, quantas vezes ele aparece dentro dessa classe.

NOTA

A seguir, o passo a passo para a tabela de frequências (FIOREZE; MARQUES, 2015).

1. Dados Brutos: são os dados originais conforme eles foram coletados, não estando, portanto, numericamente organizados ou tabelados. Como exemplo tem-se as 50 notas dos alunos.

2. Rol : é uma lista, onde os valores são dispostos em ordem crescente ou decrescente. No exemplo das notas, o rol é:

0 2 3 9 11 12 13 15 17 2022 22 22 26 29 30 32 33 34 3536 37 39 40 40 41 41 42 42 4344 45 45 46 47 50 50 50 52 5657 9 60 62 66 67 69 70 75 79

3. Amplitude Total (H): é a diferença entre o maior valor e o menor valor observado da variável em estudo.

Page 39: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | APRESENTAÇÃO DE DADOS

29

H = Xmáx -Xmín

No nosso caso, a nota maior é 79 é a menor é 0; logo, nossa amplitude total é H = 79 -0 = 79.

Cumpre observar que, quando não dispusermos dos dados, o cálculo da amplitude se fará levando-se em consideração a diferença entre o limite superior da última classe e o limite inferior da primeira classe.

4. Limites de Classe: são os números extremos de cada intervalo: sendo assim, temos um limite inferior e um superior. Se a primeira classe tiver um intervalo de notas de 0 até 10, o 0 será o limite inferior enquanto que o 10 será o limite superior desta classe.

5. Classe: é cada um dos intervalos em que os dados são agrupados. Existem várias maneiras de apresentarmos o intervalo de classes: iguais ou diferentes entre si. Porém, sempre que possível, deveremos optar por intervalos iguais, o que facilitará os cálculos posteriores. Mesmo com intervalos iguais, as distribuições poderão apresentar-se da seguinte forma:

I--- inclui à esquerda e exclui à direita---I exclui à esquerda e inclui à direita--- exclui ambosI---I inclui ambos

Como optaremos por este último tipo (0 - 10), poderemos definir como intervalo de classe a diferença entre o limite superior e o limite inferior da classe. Portanto, no exemplo, 10 – 0 = 10 é o intervalo ou amplitude da classe que será representado pela letra h.

6. Ponto médio das classes (Xi): É a média aritmética entre o limite superior e o limite inferior da classe. Assim, se a classe for 0 - 10, teremos 0 + 10 / 2 = 5, que será o ponto médio da classe.

7. Número de Classes: Quantas classes serão necessárias para representar o fato? Existem vários critérios que podem ser utilizados a fim de determinar o número de classes, porém tais critérios servirão apenas como indicação e nunca como regra fixa, pois caberá sempre ao pesquisador estabelecer o melhor número, levando-se em conta o intervalo de classe e a facilidade para os posteriores cálculos numéricos. Neste estudo, destacaremos a Fórmula de Sturges, que estabelece que o número de classes K é calculado por:

Page 40: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

30

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

K = 1 + 3,3 log n

Onde n = número de elementos observados.Para o nosso exemplo teríamos:K = 1 + 3,3 log nK = 1 + 3,3 log 50K = 1 + 3,3(1,69897)K = 1 + 5,6 = 6,6ou arredondando: 7 classes.

8. Amplitude das Classes (h)h = H/ kNo exemplo anterior, a amplitude de cada classe será:h = amplitude total/ número de classesh = 79/7 = 11, 29 = 12

Obs. 1: Na amplitude das classes (h), observe que aumentamos uma unidade, não seguindo, portanto, as regras de arredondamento. Esta é uma regra que deve ser sempre seguida no cálculo da amplitude da classe.

Obs. 2: Deve-se conservar o número de casas decimais dos dados observados. Por exemplo, se os dados se referem à massa de indivíduos em kg e forem expressos com uma casa após a vírgula (por exemplo, 60,5 kg), então a amplitude deverá ter uma casa após a vírgula.

Obs. 3: Usando o bom senso e a experiência, poderá ser conveniente,

quando possível, a utilização da amplitude de um intervalo de classe igual a 10 ou 5, facilitando as operações posteriores.

9. Frequência acumulada (Fi): Corresponde à soma das frequências de determinada classe com as anteriores.

No exemplo, quero saber a frequência acumulada da 4a classe será: f1 + f2 + f3 + f4 = 4 + 5 + 6 + 8 = 23. Então, na quarta classe, a frequência acumulada é 23.

10. Frequência relativa (fri): Corresponde ao quociente entre a frequência absoluta da classe e o total de elementos.

No exemplo, a frequência relativa da 7a classe é:

fri fr n= = =/ ,550

0 1

Observação: cada f é o valor de uma classe.

Page 41: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | APRESENTAÇÃO DE DADOS

31

4 GRÁFICOSO gráfico estatístico é uma forma de apresentação, cujo objetivo é

reproduzir, no pesquisador, ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que, visualmente, os gráficos tendem a ser mais rápidos na compreensão do que as tabelas.

Para que os seus dados tenham uma representação gráfica, eles deverão ter alguns requisitos fundamentais, sendo eles:

• Simplicidade: como o próprio nome diz, deve ser simples, os detalhes de importância secundária devem ser retirados, assim como os traços desnecessários que possam levar o observador a uma análise morosa ou com erros.

• Clareza: o gráfico deve mostrar um correta interpretação dos valores representativos do fenômeno em estudo.

• Veracidade: deve expressar a verdade sobre o fenômeno em estudo.

4.1 TIPOS DE GRÁFICOS

4.1.1 Gráfico em linha ou curva

Este tipo de gráfico utiliza a linha poligonal para representar a série estatística. É muito utilizado para representar uma série temporal. O gráfico em linha constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. Neste sistema faz-se uso de duas retas perpendiculares; as retas são os eixos coordenados e o ponto de intersecção, a origem. O eixo horizontal é denominado eixo das abscissas (ou eixo dos x) e o vertical, eixo das ordenadas (ou eixo dos y) ( ALMEIDA; ARAÚJO; RAMOS, 2009).

FIGURA 4 - GRÁFICO EM LINHA

FONTE: Almeida, Araújo e Ramos (2009)

anos

0

10

20

30

40

2006 2007

quan

tidad

e

2008

Page 42: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

32

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

4.1.2 Gráfico em coluna ou em barras

É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. E quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados (ALMEIDA; ARAÚJO; RAMOS, 2009).

FIGURA 5 - GRÁFICO EM BARRAS – CASOS DE RAIVA REGISTRADOS NO PERÍODO DE 2006 A 2008

FONTE: Almeida, Araújo e Ramos (2009)

4.1.3 Gráfico em barras

Geralmente utilizado para representar uma série geográfica ou especificativa, sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferência ao gráfico em barra (séries geográficas e específicas). Se ainda assim preferir o gráfico em coluna, os dizeres deverão ser dispostos de baixo para cima, nunca ao contrário. A ordem a ser observada é a cronológica, se a série for temporal, e a decrescente, se for geográfica ou categórica (especificativa). A distância entre as colunas (ou barras), por questões estéticas, não deverá ser menor que a metade nem maior que os dois terços da largura (ou da altura) dos retângulos (ALMEIDA; ARAÚJO; RAMOS, 2009).

0

10

20

30

40

2006 2007

quan

tidad

e

2008

Page 43: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | APRESENTAÇÃO DE DADOS

33

FIGURA 6 - GRÁFICO EM BARRAS – CASOS REGISTRADOS DE RAIVA POR BAIRRO EM BELÉM NO ANO DE 2008

FONTE: Almeida, Araújo e Ramos (2009)

4.1.4 Gráfico em coluna ou em barras múltiplas

Este tipo de gráfico é, geralmente, empregado quando se deseja representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação (ALMEIDA; ARAÚJO; RAMOS, 2009).

FIGURA 7 - GRÁFICO EM BARRAS MÚLTIPLAS – CASOS DE MALÁRIA POR MUNICÍPIO NO PERÍODO DE 2005 A 2008

FONTE: Almeida, Araújo e Ramos (2009)

0

Marco

Guamá

Pedreira

Jurunas

Quantidade

Bair

ro

2 4 6 8

0

Abaetetuba

BarcarenaMun

icíp

io Belém

Quantidade

Gráfico em Barras Multiplas

Cameta

1 2 3 4

2008200720062005

Page 44: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

34

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

FIGURA 8 - GRÁFICO EM COLUNAS MÚLTIPLAS – CASOS DE MALÁRIA POR MUNICÍPIO NO PERÍODO DE 2005 A 2008

FONTE: Almeida, Araújo e Ramos (2009)

4.1.5 Gráfico em setores

Este gráfico é construído com base em um círculo, e é empregado sempre que se deseja ressaltar a participação do dado no total (ALMEIDA; ARAÚJO; RAMOS, 2009); é utilizado na ilustração de dados qualitativos, não devendo ser utilizado quando a variável descrita apresentar mais de seis categorias (MOTTA; WAGNER, 2003).

Veja o exemplo a seguir:

TABELA 7 - CASOS REGISTRADOS DE RAIVA POR BAIRRO EM BELÉM NO ANO DE 2008

FONTE: Adaptado de Almeida, Araújo e Ramos (2009)

Bairro Quantidade %

Guamá 6 30

Pedreira 4 20

Marco 7 35

Juruna 3 15

Total 20 100

2005

Anos

Gráfico em colunas Multiplas

Qua

ntid

ade

0

1

2

3

4

2006 2007 2008

MunicípioAbaetetubaBarcarenaBelémCameta

Page 45: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | APRESENTAÇÃO DE DADOS

35

Para fazermos de modo manual o gráfico, calcularemos a percentagem, fazendo uma simples regra de 3:

Assim, temos: 20 36006

6 201

� � � � � �� � � � �

���

��� � �

� = x 360 180°/

X₁

Dessa forma você deverá fazer com todos os dados. Posteriormente, marca-se com um transferidor os arcos correspondentes, obtendo o gráfico, ou usando o Excel, utilizando a coluna de %.

FIGURA 9 - GRÁFICO EM SETORES – PERCENTUAL DE REGISTROS DE RAIVA POR BAIRRO EM BELÉM NO ANO DE 2008

FONTE: Almeida, Araújo e Ramos (2009)

4.2 GRÁFICOS ESPECIAIS DE UMA DISTRIBUIÇÃO DEFREQUÊNCIA POR INTERVALOS

4.2.1 Histograma

É a representação gráfica de uma distribuição de frequência por meio de retângulos justapostos, cujas alturas são proporcionais às frequências absolutas e cujas bases correspondem ao intervalo de classe da distribuição (FIOREZE; MARQUES, 2015).

Page 46: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

36

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

4.2.2 Polígono de frequências

É um gráfico em linhas formado por segmentos de retas; os pontos extremos dos segmentos correspondem ao par ordenado formado pelo ponto médio de cada classe da distribuição (eixo x) e pela frequência absoluta (eixo y) (FIOREZE; MARQUES, 2015)

FIGURA 11 - POLÍGONO DE FREQUÊNCIAS

FONTE: Fioreze e Marques (2015)

FIGURA 10 - HISTOGRAMA

FONTE: Fioreze e Marques (2015)

Page 47: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | APRESENTAÇÃO DE DADOS

37

4.2.3 Ogiva

É um gráfico em linhas formado por segmentos de retas; os pontos extremos dos segmentos correspondem ao par ordenado formado pelo limite inferior de cada classe (eixo x) e pela frequência acumulada (eixo y) (FIOREZE; MARQUES, 2015).

FIGURA 12 - OGIVA

FONTE: Fioreze e Marques (2015)

Page 48: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

38

Nesse tópico você viu que:

• Tabela é uma maneira de apresentar de forma resumida um conjunto de observações (os dados compõem-se de: título, corpo e rodapé).

• Séries estatísticas: é um conjunto de dados estatísticos referenciados e são classificados em: série temporal; geográfico; específico e mista.

• Distribuição por frequência é uma série estatística específica em que os dados encontram-se dispostos em classes ou categorias junto às suas frequências correspondentes.

• O gráfico estatístico é uma forma de apresentação, cujo objetivo é o de reproduzir, no pesquisador, ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, e sempre deve conter simplicidade, clareza e veracidade, e que, em geral, usam-se 5 gráficos – em linha ou curva, coluna, barra, em coluna ou barras múltiplas e em setores, conhecido também como gráfico pizza).

• Dentro da série de gráficos, há os considerados espécies, que seriam: histograma,

polígono de frequências e ogiva.

RESUMO DO TÓPICO 3

Page 49: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

39

As atividades a seguir são necessárias para que você fixe bem o conteúdo estudado neste tópico:

AUTOATIVIDADE

1 De que maneira deve-se apresentar uma tabela e quais são seus elementos?

2 Baseado em seus estudos neste tópico, monte a seguinte tabela e calcule a distribuição de frequência:

- X = Análise de 16 peixes de uma mesma espécie, levando em consideraçãoseu comprimento em cm.

10 12 15 4

12 14 9 18

20 6 23 14

17 18 25 7

Calcule: o rol de valores; Amplitude Total (H); Ponto médio das classes (Xi); Número de Classes; Amplitude das Classes (h); Frequência acumulada (Fi) de todas as classes; Frequência relativa (fri) também de todas as classes.

3 Com base na frequência relativa (fi), monte um gráfico que melhor represente os seus dados.

Page 50: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

40

Page 51: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

41

TÓPICO 4

MÉTODOS DE AMOSTRAGEM

UNIDADE 1

1 INTRODUÇÃONesse tópico você irá ter uma noção em relação à amostragem. Para serem

conhecidas algumas características de uma população, é comum observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter estimativas para as características de interesse da população.

Neste caso, a seleção dos elementos que irão compor a amostra deve ser feita por uma metodologia adequada, de tal forma que ela seja representativa, de modo que os resultados sejam confiáveis para avaliar as características da população.

Segundo Motta e Wagner (2003, p. 27), ”[...] em virtude de se estudar as populações em sua totalidade, geralmente trabalha-se com amostras, sendo que está, deve ser representativa da população extraída, e sendo o mais parecido possível [...]”.

Vamos aos estudos?

2 MÉTODOS DE AMOSTRAGEMAmostragem é a técnica especial de escolher amostras que garantam

o acaso na escolha. Assim, cada elemento da população tem a mesma chance de ser escolhido, o que garante à amostra um caráter de representatividade da população.Além disso, as amostras devem ser:

• Seleção da Amostra – as amostras devem ser escolhidas de modo a poder aplicar a elas os cálculos de probabilidades.

• Amostra Representativa – é aquela que tem as mesmas características da população de onde foi retirada.

• Amostra Probabilística – é aquela cujo processo de amostragem permite atribuir a cada elemento da amostra uma probabilidade semelhante à da população.

• Amostragem Aleatória – é aquela em que cada um dos elementos da população tem a mesma chance de ser selecionado no levantamento dos dados.

A seguir são apresentados os tipos de amostragem.

Page 52: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

42

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

2.1 AMOSTRA DE CONVENIÊNCIASSegundo Motta e Wagner (2003), a amostragem por conveniência é

um procedimento não probabilístico, ou seja, é formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. Esta amostragem é adequada e frequentemente utilizada para geração de ideias em pesquisas exploratórias.

Franchi (2015, p. 8) ressalva que “os estatísticos têm muitas restrições ao uso de amostras de conveniência, [...] o pesquisador que utiliza amostras de conveniência precisa de muito senso crítico, e os dados podem ser tendenciosos”.

Alguns exemplos:

• Solicitar a pessoas que, voluntariamente, testem um produto e que, em seguida, respondam a uma entrevista.

• Parar pessoas no supermercado e colher suas opiniões.

• Colocar linhas de telefone adaptadas para que durante um programa de televisão os telespectadores possam dar suas opiniões.

2.2 AMOSTRAGEM ALEATÓRIA SIMPLES

Uma amostra escolhida de tal forma que cada item ou pessoa na população tem a mesma probabilidade de ser incluída. Se a população tem um tamanho N, cada pessoa desta população tem a mesma probabilidade igual a 1/N de entrar na amostra. Utilizamos uma tabela de números aleatórios para sortear (com a mesma probabilidade) os elementos da amostra. Também pode ser utilizada uma função randômica. Ou seja:

pn

=�1

Onde: n = número de elementos que irão compor a amostra.p= probabilidade de um elemento da população ser selecionado para

compor a amostra.

Exemplo 1: Vamos obter uma amostra de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola:

1º - Numeramos os alunos de 1 a 90.

2º - Escrevemos os números dos alunos de 1 a 90, em pedaços iguais de papel, colocamos na urna, misturamos e retiramos, um a um, nove números que formarão a amostra.

Page 53: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 4 | MÉTODOS DE AMOSTRAGEM

43

Exemplo 2: Suponha uma população com 300 elementos, que numeramos de 000 a 299 para selecionar uma amostra aleatória de n=15 elementos. O processo termina quando for sorteado o elemento 15. A probabilidade de cada elemento ser selecionado é p=1/15.

2.3 AMOSTRAGEM SISTEMÁTICA

Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.

Eis a fórmula: K Nn

=

Onde: N: números de elementos da população n: número de elementos da amostra

Depois determinar o ponto de partida (a1): sorteio aleatório simples.

Em seguida, determinar os elementos da amostra através de uma progressão aritmética (PA)

a a Kn � ��1

Exemplo: Num viveiro florestal, produz-se, em média, 100 espécies diferentes de plantas arbóreas por dia. Chega-se à conclusão de que é necessário avaliar no controle de qualidade 20 dessas espécies. Determine quais espécies poderiam compor a amostra de modo que esta seja representativa da produção diária.

Vamos à solução:

1. Define-se K → �= =10020

5K

2. Ponto de partida: dentre 1 a 5, sorteia-se aleatoriamente um número. Sorteio a1= 2

3. Determinam-se os elementos da amostra (A) através da PA:

a a Kn � � � � �1 2 5 7

Resultado: A= {2; 7; 14; 21; 28; 35; 42; 49; 56; 63; 70; 77; 84; 91;98}

Page 54: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

44

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

2.4 AMOSTRAGEM ALEATÓRIA ESTRATIFICADA

Quando a população se divide em estratos (subpopulações), convém que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos, como sexo, idade ou condição econômica (MOTTA; WAGNER, 2003).

Suponhamos que a população é subdividida em k estratos. Sejam:N = o número de indivíduos na populaçãon = o número de indivíduos na amostraNi = o número de indivíduos contidos no i-ésimo estrato da populaçãoni = o número de indivíduos contidos no i-ésimo estrato na amostra

n nNNii= x i = 1,2,...k.

Os estratos devem ser os mais homogêneos possíveis com relação às

características relevantes da pesquisa (variáveis que se correlacionam fortemente com a variável estudada). Para um mesmo tamanho amostral, a amostragem aleatória estratificada com repartição proporcional é mais precisa (menor variância do estimador) do que a amostragem aleatória simples.

2.5 AMOSTRAGEM POR CONGLOMERADOS

Motta e Wagner (2003) descrevem que é feita uma amostragem aleatória entre agrupamentos (conglomerados) que ocorrem naturalmente na população. Em seguida, os indivíduos que compõem o conglomerado podem ser selecionados por outro sorteio para incluir na amostra final. Um exemplo típico, o emprego de escolas como conglomerados para o estudo de populações infantis.

2.6 AMOSTRAGEM POR ESTÁGIOS MÚLTIPLOS

Motta e Wagner (2003) descrevem que esta amostragem é uma modificação da amostragem por conglomerados. É bastante usada para reduzir os custos de grandes pesquisas. Envolve o estabelecimento de um conglomerado chamado unidade primária de amostragem, que pode ser uma escola, um bairro etc. Numa segunda etapa são extraídas por sorteio as unidades secundárias, que vão constituir a amostra propriamente dita.

Page 55: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

45

Neste tópico você viu que:

• Amostragem é a técnica especial de escolher amostras que garantam o acaso na escolha, sendo que as amostras devem ser: representativas, probabilísticas e aleatória.

• Amostragem por conveniência é a quantidade de elementos que o pesquisador reuniu simplesmente porque dispunha deles.

• Amostragem aleatória simples, quando uma amostra é escolhida de tal forma que cada item ou pessoa na população tem a mesma probabilidade de ser incluída.

• Amostragem sistemática, quando os elementos da população já se acham ordenados, não havendo necessidade de um sistema.

• Amostragem aleatória estratificada, quando a população se divide em estratos (subpopulações).

• Amostragem por conglomerados, quando é realizada uma amostragem aleatória entre agrupamentos (conglomerados) que ocorrem naturalmente na população.

• Amostragem por estágios múltiplos envolve o estabelecimento de um

conglomerado chamado unidade primária de amostragem, e numa segunda etapa são extraídas por sorteio as unidades secundárias que vão constituir a amostra propriamente dita.

RESUMO DO TÓPICO 4

Page 56: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

46

AUTOATIVIDADE

1 Descreva as diferenças entre os métodos de amostragem.

Page 57: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

47

TÓPICO 5

DISTRIBUIÇÃO DE PROBABILIDADES

UNIDADE 1

1 INTRODUÇÃONesta unidade, vocês irão verificar que, dependendo do tamanho de suas

amostras e de seus dados, a estatística da probabilidade leva em consideração valores diferentes, como média e desvio-padrão.

A distribuição de probabilidades lida com um grande volume de dados, os quais estão sujeitos a variações.

Neste capítulo iremos ver as seguintes distribuições: distribuição binomial; de Poisson; exponencial; norma; e de Student.

2 DISTRIBUIÇÃO DE PROBABILIDADESReboita (2005) transcreve que a distribuição de probabilidade pode ser

útil quando os dados apresentam:

• Compacidade: representação de um grande volume de dados.

• Alisamento e interpolação: os dados reais estão sujeitos a variações na amostragem, que podem levar à falha de dados ou a dados errôneos nas distribuições empíricas. Logo, pode-se verificar se um dado é real e se pode ocorrer ou não, para tanto, podemos calcular a probabilidade de ocorrência.

• Extrapolação: estimar a probabilidade de eventos extremos à variação de um conjunto de dados particular exige a suposição de eventos ainda não observados. Isso pode ser realizado com a imposição de um modelo de probabilidade (isto é, uma distribuição teórica) ajustado à série de dados.

Ainda segundo Reboita (2005), a distribuição de probabilidades apresenta-se da seguinte forma:

• Distribuição discreta descreve quantidades aleatórias (dados de interesse) que podem assumir valores particulares e os valores são finitos. Por exemplo, a ocorrência de tempestades com granizo.

Page 58: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

48

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

• A distribuição contínua representa quantidades aleatórias contínuas que podem tomar um número infinito de valores. Por exemplo: temperatura, pressão, precipitação, ou qualquer elemento medido numa escala contínua, é uma variável aleatória contínua.

2.1 DISTRIBUIÇÃO BINOMINAL

Uma das distribuições mais comuns em estatística. Deriva de um processo conhecido como teste de Bernoulli, em que cada tentativa tem duas possibilidades excludentes de ocorrência chamada de sucesso e falha.

Um experimento aleatório é chamado binomial se em n repetições os ensaios são independentes; cada resultado do ensaio pode assumir somente uma de duas possibilidades: sucesso ou fracasso; a probabilidade de sucesso em cada ensaio, denotado por ( p ), permanece constante, e a probabilidade de fracasso,1-p, é designada por (q) (MOTTA; WAGNER, 2003).

Ainda segundo Motta e Wagner (2003), na distribuição binomial, a média é igual ao número de eventos estudados vezes a probabilidade de ocorrência do evento, ou seja, μ=np, e que o desvio padrão é igual à raiz quadrada do produto: n x p x q; sendo expresso pela fórmula σ npq .

Eis a fórmula da distribuição binomial:

!

! !

Onde:n: é o número de tentativas ou repetições do experimento.r: é o número/proporção/frequência desejada de sucesso.n-r: é o número/proporção/frequência desejada de fracassos.P: é a probabilidade/proporção/frequência de sucessos.q = 1-p: é a probabilidade/proporção/frequência de fracassos.

O símbolo ! indica o fatorial de um número inteiro; o “fatorial de n” é definido como n!=n x (n-1) x (n-2) x ...x 1. Por definição, 0!=1. Outro exemplo: 4!=4x3x2x1=24 (MOTTA; WAGNER, 2003).

NOTA

Page 59: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 5 | DISTRIBUIÇÃO DE PROBABILIDADES

49

Ainda segundo Motta e Wagner (2003), a fórmula dada acima é determinada pelo número n de tentativas, e a probabilidade p de sucesso numa tentativa isolada, os símbolos n e p são denominados parâmetros da distribuição.

Vamos aos exemplos, de acordo com Motta e Wagner (2003).

Exemplo: Admite-se que a probabilidade de nascimento de um menino, como também de uma menina, é igual a ½. Quais são as probabilidades em uma família de 6 filhos de ter: 0,1,2,3,4,5,6 crianças do sexo masculino? (M=masculino; F=feminino).

!

! !

P r ou pa� � ��� �

��

���

��

�� � ��6

0 6 012

12

164

0 0156 1 560 6 0!

! !, � �, %� rra M e F� ��6 00,0156 ou 1,56% para 6M e 0F

P r ou� � ��� �

��

���

��

�� � ��6

1 6 112

12

164

0 0937 9 371 6 1!

! !, � �, % parra 5M e 1F0,0937 ou 9,37% para 5M e 1F

P r� � ��� �

��

���

��

�� � ��6

2 6 212

12

1564

2 6 2!! !

0,2343�ou�23,43%�ppara�4M�e�2F0,2343 ou 23,43% para 4M e 2F

P r� � ��� �

��

���

��

�� � ��6

3 6 312

12

2064

3 6 3!! !

0,3125 ou 31,25% para 3M e 3F

0,2343 ou 23,43% para 2M e 4FP r� � ��� �

��

���

��

�� � ��6

4 6 412

12

1564

4 6 4!! !

P r� � ��� �

��

���

��

�� � ��6

5 6 512

12

664

5 6 5!! !

0,0937 ou 9,37% para 1M e 5F

P r� � ��� �

��

���

��

�� � ��6

6 6 612

12

164

6 6 6!! !

0,0156 ou 1,56% para 0M e 6F

Page 60: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

50

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

A probabilidade de que, numa família de 6 filhos, 5 ou mais sejam do sexo masculino é a soma das probabilidades de 5 e 6 filhos do sexo masculino, isto é, 0,0937+0,0156=0,1093, então, cerca de 10% das famílias de 6 filhos têm 5 ou mais meninos.

Parâmetros Binomiais: de acordo com Motta e Wagner (2003), a distribuição binomial tem dois parâmetros: n e p. A média e a variância da distribuição binomial são: μ=np e σ2=np(1-p), respetivamente.

Para o exemplo acima, tais dados ficam:

2.2 DISTRIBUIÇÃO DE POISSON

Segundo Motta e Wagner (2003), é uma distribuição discreta de probabilidade, ela descreve a probabilidade dos números de ocorrências, num campo ou intervalo contínuo (normalmente tempo e espaço), de eventos bem raros. Eis a fórmula:

P err

r

� �

�� �

�!

Onde:

r: frequência relativa ou probabilidade de um sucesso que pode tomar os valores 0,1,2,3...

e: base dos logaritmos neperianos, o número irracional 2,7183.λ: é o número médio de sucessos por amostra (λ=np) em um determinado

intervalo de tempo e espaço. A média λ é o único parâmetro dessa distribuição. A variância é idêntica ao valor médio λ (letra grega lambda). A média e a variância, geralmente, são menores que 5 (MOTTA; WAGNER, 2003).

Exemplo: Uma determinada espécie possui um erro inato no metabolismo com uma incidência de 0,6 por mil espécies. Qual a probabilidade de encontrar 3 casos dessa anomalia numa amostra de mil espécies durante o ano de 2015?

� ��

��

�� �6 1

23

� 2 6 12

12

1 5 1 5 1 22��

��

���

��

�� � � �, � � , ,desvio padrãodesvio padrão √1,5

p x our�� �

�� �� �

� �3

3 0 60 06 2 7183

30 216 0 548812

60 0197 1

, ,

!, ��, , � �

,

,, %97x 0, ou 1,97%

Page 61: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 5 | DISTRIBUIÇÃO DE PROBABILIDADES

51

Então, há uma probabilidade de 1,97% de se encontrar 3 casos com a anomalia.

2.3 DISTRIBUIÇÃO EXPONENCIAL

A distribuição exponencial é aplicada nos casos que queremos analisar o espaço ou intervalo de acontecimentos de um evento.

A variável X, que é igual à distância entre contagens sucessivas de um processo de Poisson, com média λ > 0, tem uma distribuição exponencial com parâmetro λ. A função densidade de probabilidade de X (pdf) é:

F x e x� � � �� . .� �λ

Para 0 ≤ x ≤ ∞

Onde:

λ: é a taxa de ocorrência por intervalo

Exemplo: Em uma grande rede corporativa de computadores, as conexões dos usuários ao sistema podem ser modeladas como um processo de Poisson, com média de 25 conexões por hora. Qual a probabilidade de não haver conexões em um intervalo de 6 minutos?

F x e x� � � �� . .� �λ

P X e dx e e ex�� � � � � � �� � � ��

� � � � ��0 1 25 00 1

25 25 25 0 1 25 0 1, � . .,

. . . , . , ,,082

2.4 DISTRIBUIÇÃO NORMAL

Motta e Wagner (2003) descrevem que a curva normal tem forma de sino, ou seja, é unimodal e simétrica, e o seu valor de máxima frequência, a moda, coincide com o valor da média e da mediana. A média (μ) é o centro da curva e σ é o desvio-padrão da população, os valores da variável X são representados no eixo horizontal; a média de X é a projeção sobre o eixo do ponto de frequência máxima da curva.

Page 62: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

52

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

FIGURA 13 - CURVA NORMAL TÍPICA, EM FORMATO DE SINO

FONTE: Conti (2009)

A distribuição normal padronizada é aquela na qual a média é (μ)=0 e o desvio padrão é (σ)=1, dessa forma, qualquer distribuição normal com média diferente de zero e desvio-padrão diferente de 1,0, pode ser transformada na normal padronizada (MOTTA; WAGNER, 2003). Ainda segundo os autores, o resultado da transformação aplicada a cada valor de X é a obtenção de uma nova variável – denominada z –, que mede o afastamento do valor x em relação à média.

O cálculo de Z é: zX

��� ���

Onde:

z: afastamento dos valores de X em relação à média em número de desvios-padrão.

x: valor qualquer da variável aleatória.μ: média da distribuição.σ: desvio-padrão da distribuição.

Com os valores que você obteve com a fórmula Z, você irá na tabela (em anexo) verificar em qual ela se encaixa. Ex.: intervalo Z:0 e o Z: 1,7, então, na tabela, você irá verificar a coluna Z e encontrará o valor de 0,4641.

IMPORTANTE

f(X)

médiadesvio padrão

Page 63: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 5 | DISTRIBUIÇÃO DE PROBABILIDADES

53

Vamos ao exemplo, segundo Motta e Wagner (2003):

Exemplo 1: Em uma distribuição de valores de glicose plasmática em jejum em homens normais entre 30 e 39 anos de idade, apresenta a média de μ=100 mg/dL e desvio-padrão σ=15 mg/dL. Qual a proporção de pessoas com glicose plasmática entre 100 e 120 mg/dL?

1º Passo:

zX

z��� �

��

� ��

� = 120 100

152015

1 33,

2º Passo:

Na tabela você irá cruzar o intervalo de z=0 e z=1,33, e o valor que você irá obter é 0,4082, ou 40,82%. Então, a proporção de pessoas com concentração de glicose plasmática entre 100 e 200 mg/dL é de 0,4082, ou em torno de 41%.

FONTE: Motta e Wagner (2003)

FIGURA 14 - GRÁFICO EM RELAÇÃO AO EXEMPLO 1

Exemplo 2: Com os mesmos dados do exemplo anterior, qual a proporção de pessoas com teor de glicose plasmática acima de 120 mg/dL?

1. A fórmula para o cálculo de z é a mesma do exercício anterior z=1,33.2. A área à esquerda de z=0 é 0,50.3. A área entre z=0 e z=1,33 é 0,4082.

Levando todos estes dados em consideração, obtemos além de z=1,33, temos:0,500 – 0,4082 = 0,0918

Assim, a resposta que temos é que 9% de pessoas têm glicose plasmática acima de 120 mg/dL.

ValoresZ

1000

0,5000

B

A0,4082

1201.33

Page 64: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

54

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

FIGURA 15 - GRÁFICO EM RELAÇÃO AO EXEMPLO 2

FONTE: Motta e Wagner (2003)

Exemplo 3: Com os mesmos dados do exemplo 1, pergunta-se: qual a proporção de pessoas com teor de glicose plasmática entre 80 e 120 mg/dL?

1. Como a curva é simétrica, ou seja, z=-1,33 e z=1,33.2. Então, para o cálculo, usando a simetria, simplesmente duplicamos a área entre

o z=0 e 1,33. 3. Ficando desta forma: 2(0,4082) = 0,8164 ou 82%.

Em resposta ao exercício, temos 82% das pessoas que possuem níveis de glicose entre 80 e 120mg/dL.

FIGURA 16 - GRÁFICO EM RELAÇÃO AO EXEMPLO 3

FONTE: Motta e Wagner (2003)

0,40820,4082

0,0918 =

ValoresZ

1000

1201.33

A

0,50000,5000 -

B

A0,4082

A0,4082

B BValores

Z80

-1.331000

1201.33

Page 65: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 5 | DISTRIBUIÇÃO DE PROBABILIDADES

55

2.5 DISTRIBUIÇÃO DE T DE STUDENT

O valor de t é a medida do desvio padrão (σ) entre a média ( �X ), estimada a partir de uma amostra aleatória de tamanho n, e a média (μ) da população, usando o erro-padrão da média (EP) como unidade de medida (MOTTA; WAGNER, 2003).

Temos a seguinte fórmula: t xs n

�� �

�/Ainda segundo Motta e Wagner (2003), as propriedades da distribuição t

de Student são:

A média é igual a zero.

As curvas t são simétricas em torno da média, tem forma de sino, porém mais achatadas.

O intervalo da variável t é: (-∞ ) a (+∞).

A distribuição de t não é descrita por uma única distribuição, mas por uma família de distribuições. Há uma curva t diferente para cada número de graus de liberdade da amostra (n-1).

A variação de t é maior com amostras pequenas do que com as amostras grandes, quando n tende para o infinito (∞), o desvio-padrão (s) tenderá para o σ.

A distribuição t tem como principais aplicações: a comparação de duas médias

pelo teste t e estimação dos intervalos de confiança para média populacional.

A seguir, um exemplo de como aplicar essas distribuições.

POLUIÇÃO ATMOSFÉRICA E ATENDIMENTOS POR PNEUMONIA E GRIPE EM SÃO PAULO

Objetivo: Investigar os efeitos causados pela poluição atmosférica na morbidade por pneumonia e por gripe em idosos entre 1996 e 1998.

Métodos: Foram obtidos dados diários de atendimentos por pneumonia e gripe para idosos em pronto-socorro médico de um hospital-escola de referência no município de São Paulo, SP, Brasil. Os níveis diários de CO, O3, SO2, NO2 e PM10 foram obtidos na Companhia de Tecnologia de Saneamento Ambiental, e os dados diários de temperatura e umidade relativa do ar foram obtidos no Instituto Astronômico e Geofísico da USP. Para verificar a relação existente entre pneumonia e gripe e poluição atmosférica, utilizou-se o modelo aditivo

LEITURA COMPLEMENTAR

Page 66: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

56

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

generalizado de regressão de Poisson, tendo como variável dependente o número diário de atendimentos por pneumonia e gripe e como variáveis independentes as concentrações médias diárias dos poluentes atmosféricos. A análise foi ajustada para sazonalidade de longa duração (número de dias transcorridos), sazonalidade de curta duração (dias da semana), temperatura mínima, umidade média, períodos de rodízio e os atendimentos por doenças não respiratórias em idosos. Resultados O3 e SO2 estão diretamente associados à pneumonia e à gripe, independentemente das variáveis de controle. Porém, na análise conjunta, eles perdem sua significância estatística. Pôde-se observar que um aumento interquartil (25%-75%) para o O3 (38,80 μg/m3) e SO2 (15,05 μg/m3) levou a um acréscimo de 8,07% e 14,51%, respectivamente, no número de atendimentos por pneumonia e gripe em idosos.

Conclusões: Os resultados sugerem que a poluição atmosférica promove efeitos adversos para a saúde de idosos.

ANEXO

Anexo A. Áreas sob curva normal padronizada. Para valores negativos de z, as áreas são obtidas por simetria

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

Page 67: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 5 | DISTRIBUIÇÃO DE PROBABILIDADES

57

1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857

2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890

2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964

2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974

2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986

3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993

3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995

3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997

3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998

3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998

3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

FONTE: MARTINS, Lourdes Conceição et al. Poluição atmosférica e atendimentos por pneumonia e gripe em São Paulo, Brasil. Rev. Saúde Pública, 2002, v. 36, n.1, p. 88-94.

Page 68: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

58

RESUMO DO TÓPICO 5

Neste tópico você viu que:

• A distribuição de probabilidade pode ser útil quando dados apresentarem: compacidade, interpolação e extrapolação.

• Na distribuição binomial, ela deriva de um processo conhecido como teste de Bernoulli, em que cada tentativa tem duas possibilidades excludentes de ocorrência chamada de sucesso e falha.

• A distribuição de Poisson descreve a probabilidade dos números de ocorrências, num campo ou intervalo contínuo.

• A exponencial é aplicada nos casos que queremos analisar o espaço ou intervalo de acontecimentos de um evento.

• Na distribuição normal mede-se o afastamento do valor x em relação à média. • A distribuição de Student tem como principais aplicações: a comparação de

duas médias pelo teste t e estimação dos intervalos de confiança para média populacional.

Page 69: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

59

AUTOATIVIDADE

1 Qual é a diferença entre as distribuições de Poisson e Binomial?

2 Sob que condições pode a distribuição de Poisson ser usada como uma aproximação da distribuição Binmial? Por que isto pode ser útil?

Page 70: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

60

Page 71: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

61

TÓPICO 6

INFERÊNCIAS ESTATÍSTICAS

UNIDADE 1

1 INTRODUÇÃOMuitas são as interferências que um pesquisador sofre no decorrer de seu

estudo. Há variáveis que você, por exemplo, deve levar em consideração quando for a campo para levantar uma determinada espécie.

Nesses dados devem ser observados se não há vícios que o responsável da pesquisa pode ter, bem como aparelhos utilizados nos levantamentos de dados.

Há detalhes que você deve levar em consideração quando for começar seus estudos. A seguir, você, acadêmico(a), irá compreender que pequenos detalhes fazem a grande diferença no final de sua análise estatística.

2 DISTRIBUIÇÃO DE PROBABILIDADESVariável é a característica de interesse que é medida em cada elemento da

amostra ou população. Como o nome diz, seus valores variam de elemento para elemento. As variáveis podem ter valores quantitativos ou qualitativos. (Fonte: Disponível em: <http://avale.iat.educacao.ba.gov.br/index.php?option=com_content&view=article&id=76&Itemid=110>).

2.1 VARIÁVEIS QUANTITATIVAS

As variáveis quantitativas são características que podem ser descritas por números, sendo classificadas entre contínuas e discretas (MOTTA; WAGNER, 2003).

• Variáveis discretas: a variável é avaliada em números que são resultados de contagens e, por isso, somente fazem sentido números inteiros. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia.

• Variáveis contínuas: a variável é avaliada em números que são resultados de medições e, por isso, podem assumir valores com casas decimais e devem ser medidas por meio de algum instrumento. Exemplos: massa (balança), altura (régua), tempo (relógio), pressão arterial, idade.

Page 72: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

62

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

2.2 VARIÁVEIS QUALITATIVAS

As variáveis qualitativas (ou categóricas) são as características que não possuem valores quantitativos, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais, de acordo com Motta e Wagner (2003).

• Variáveis nominais: não existe ordenação entre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio.

• Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1º, 2º, 3º graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro, …, dezembro).

Entretanto, as distinções são menos rígidas do que essa descrição insinua. Uma variável originalmente quantitativa pode ser coletada de forma qualitativa.

Por exemplo, a variável idade, medida em anos completos, é quantitativa (contínua); mas, se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos etc.), é qualitativa (ordinal). Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua) se trabalharmos com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado etc.).

FIGURA 17 - CLASSIFICAÇÃO DAS VARIÁVEIS ESTATÍSTICAS DE ACORDO COM SUA NATUREZA

FONTE: Disponível em: <http://avale.iat.educacao.ba.gov.br/index.php?option=com_content&view=article&id=76&Itemid=110>. Acesso em: 22 mar. 2015.

Variáveis

Qualitativa(categorias)

Quantitativa(números)

Nominal (não existe ordem nas

categorias)

Ordinal (existe ordem nas categorias)

Discreta (resultado de contagem)

Contínua (resultado de meensuração)

Page 73: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 6 | INFERÊNCIAS ESTATÍSTICAS

63

3 ESCALAS ESTATÍSTICASOs valores associados a cada variável podem ser classificados em escalas

de medida, expressando a qualidade ou quantidade dos dados.

• A escala nominal atribui números às categorias apenas para identificá-las, e eles não têm significado quantitativo, por exemplo: 1 para “Feminino” e 2 para “Masculino”.

• A escala ordinal atribui números às categorias indicando apenas a ordem, com o sentido de “mais que, maior que”; ou “menos que, menor que”, por exemplo: 1 para “Criança”; 2 para “Adolescente”, e 3 para “Adulto”.

• A escala intervalar tem as características de uma escala ordinal, e as distâncias ou diferenças entre quaisquer dois números na escala têm significado. Podemos afirmar que uma medida é igual, maior ou menor e quantificar o valor dessa diferença. Nesse tipo de escala, a unidade de medida e a origem são arbitrárias. Um exemplo é quando a temperatura de um indivíduo é medida na escala Fahrenheit. A origem é 0ºF e a unidade é 1ºF, que são arbitrárias, uma vez que se a temperatura for medida em centígrados teríamos que usar a transformação y = 5/(9 (x-32)) (BUSSAB; MORETTIN, 2008, p. 14).

• A escala de razão tem todas as características da escala intervalar e tem

ponto zero verdadeiro. Neste tipo de escala, a razão entre quaisquer dois pontos independe da unidade de medida. As grandezas, tais como massa, comprimento, altura podem ser medidas com a escala de razão. No caso da altura, por exemplo, se ela for medida em centímetros (cm), 0cm é a origem e 1cm é a unidade de medida. Um indivíduo com 90cm é duas vezes mais alto do que um indivíduo com 95cm, e esta relação contínua vale se usarmos 1m como unidade (BUSSAB; MORETTIN, 2008, p. 14).

FIGURA 18 - CLASSIFICAÇÃO DE ACORDO COM AS ESCALAS DE MEDIDAS

FONTE: Disponível em: <http://avale.iat.educacao.ba.gov.br/index.php?option=com_content&vieew=article&id=76&Itemid=110>. Acesso em: 22 mar. 2015.

Escala de medidas

Nominal ou categorica

Ordinal ou por pontos Intervalar De razão

Page 74: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

64

UNIDADE 1 | O MÉTODO ESTATÍSTICO E SUA UTILIZAÇÃO NA ANÁLISE DE DADOS

4 ERROS DE OBSERVAÇÃOQuando esses erros estão ligados à aleatoriedade ou à incerteza

modelada pela teoria da probabilidade, eles são "erros" no sentido estatístico (RODRIGUES, 1993).

Toda vez que repetimos uma medição com um instrumento sensível, obtemos resultados ligeiramente diferentes. O modelo estatístico que normalmente usamos é que o erro tem duas partes:

• Erro sistemático: aquele que sempre ocorre com o mesmo valor quando se usa o instrumento da mesma maneira e no mesmo processo; pode ser causado por falhas do aparelho de medida, calibração incorreta etc.

• Erro aleatório: pode variar de uma observação para outra.

O erro sistemático é, às vezes, chamado de viés estatístico. Muitas vezes pode ser reduzido por meio de processos cuidadosamente padronizados. O uso dos instrumentos padrão da disciplina faz parte do ensino de toda ciência.

O erro aleatório, ou variação aleatória, é devido a fatores que não controlamos, seja porque esse controle seria muito caro, seja porque ignoramos esses fatores. Pode até ser que tudo o que estamos tentando medir esteja mudando com o tempo, ou seja, fundamentalmente probabilístico (como é o caso da mecânica quântica). O erro aleatório muitas vezes ocorre quando os instrumentos são empurrados para seus limites. Por exemplo, é comum as balanças digitais apresentarem um erro aleatório dos seus dígitos menos significativos.

Os erros dependentes do observador podem ser diminuídos por uma preparação; já os métodos caudados pela observação podem ser reduzidos selecionando-se as melhores técnicas, padronizando os métodos e controlando o funcionamento dos aparelhos (RODRIGUES, 2003).

5 ARREDONDAMENTO DE NÚMEROSNoé (2015) descreve que, nos trabalhos relacionados à Estatística,

Matemática Financeira, entre outras situações cotidianas relacionadas ao uso de números, usamos algumas técnicas de arredondamento. Para efetuarmos o arredondamento de um número podemos utilizar as seguintes regras:

• Se o algarismo a ser eliminado for maior ou igual a cinco, acrescentamos uma unidade ao primeiro algarismo que está situado à sua esquerda.

• Se o algarismo a ser eliminado for menor que cinco, devemos manter inalterado o algarismo da esquerda.

Page 75: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 6 | INFERÊNCIAS ESTATÍSTICAS

65

Nos casos de arredondamentos sucessivos, as regras continuam valendo, por exemplo, escrever o número decimal 2,36935 das seguintes maneiras:

• Quatro casas decimais: eliminaremos o algarismo 5 e acrescentaremos uma unidade à casa da esquerda: 2,3694.

• Três casas decimais: eliminaremos o algarismo 4 e não modificaremos o número da esquerda: 2,369.

• Duas casas decimais: eliminaremos o algarismo 9 e acrescentaremos uma unidade à casa da esquerda: 2,37.

Em algumas áreas de conhecimento, como a Metrologia, ciência que provê a utilização de técnicas que permitem que grandezas físicas e químicas sejam quantificadas, os arredondamentos seguem uma normativa do IBGE, pois nessa ciência qualquer valor, por menor que seja, pode provocar alterações consideráveis (NOÉ, 2015). Veja a tabela de arredondamento de valores:

TABELA 8 – ARREDONDAMENTO DE ACORDO COM A RESOLUÇÃO Nº 886/66 DA FUNDAÇÃO IBGE

Condições Procedimentos Exemplos

< 5 O último algarismo a permanecer fica inalterado. 53,24

> 5 Aumenta-se de uma unidade o algarismo a permanecer.

42,87 passa a 42,9 25,08 passa a 25,1 53,99 passa a 54,0

= 5Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade no

algarismo a permanecer.

2,352 passa a 2,4 25,6501 passa a

25,7 76,250002 passa a

76,3

= 5

Se o 5 for o último algarismo ou se ao 5 só seguirem zeros, o último algarismo a ser

conservado só será aumentado de uma unidade se for ímpar.

24,75 passa a 24,8 24,65 passa a 24,6 24,7500 passa a

24,8 24,6500 passa a

24,6

FONTE: Disponível em: <http://www.brasilescola.com/matematica/arredondando-numeros.htm>. Acesso em: 18 maio 2015.

Page 76: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

66

RESUMO DO TÓPICO 6

Neste tópico você viu que:

• As variáveis quantitativas são características que podem ser descritas por números, sendo classificadas entre contínuas e discretas.

• As variáveis qualitativas (ou categóricas) são as características que não possuem valores quantitativos, representam uma classificação dos indivíduos. E podem ser nominais ou ordinais.

• A escalas estatísticas expressam a qualidade ou quantidade dos dados, e podem ser: nominal, ordinal e intercalar.

• Os erros ocasionados nos experimentos podem vir das observações ou dos aparelhos.

Page 77: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

67

1 Classifique o tipo de variável para os itens abaixo.

AUTOATIVIDADE

a) Marca de perfume preferida.b) Grau de satisfação com um produto alimentício.c) Peso de sementes advindas do Chile.d) Renda familiar.e) Grau de periculosidade de um reagente químico.f) Número de cadeiras em uma sala de reunião.

2 Descreva quais são as escalas estatísticas.

3 Em relação ao arredondamento de números, faça-os com os números abaixo:

16,89 14,32 10,7 126,892356 0,95 12,53 11,01 7,58 1.314,22 3,41568

Page 78: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

68

Page 79: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

69

UNIDADE 2

MEDIDAS ESTATÍSTICAS

OBJETIVOS DE APRENDIZAGEM

PLANO DE ESTUDOS

Nessa unidade vamos:

• reconhecer terminologias, os símbolos e conceitos básicos, encontrados na literatura da estatística;

• reconhecer em seus experimentos, a forma como organizar seus dados, de forma concisa, e interpretando suas informações;

• ter uma maior compreenção em relação as teorias da probabilidade, e da distribuição.

Essa segunda unidade de estudo está dividida em quatro tópicos. Você encontrará no final de cada um deles atividades que contribuirão para a compreensão dos conteúdos abordados. Lembramos que as unidades 1 e 2 estão correlacionadas.

TÓPICO 1 – MEDIDAS DE POSIÇÃO E VARIAÇÃO

TÓPICO 2 – TESTES DE NORMALIDADE, TESTES PARAMÉTRICOS

TÓPICO 3 – TESTES DE HIPÓTESES

TÓPICO 4 – TESTES NÃO PARAMÉTRICOS

Page 80: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

70

Page 81: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

71

TÓPICO 1

MEDIDAS DE POSIÇÃO E VARIAÇÃO

UNIDADE 2

1 INTRODUÇÃOQuando estudados, estatisticamente, os fenômenos, Rodrigues (2002)

cita que tais estudos são traduzidos por um conjunto de dados numéricos, e essa descrição dos conjuntos de dados torna-se mais clara quando se obtém medidas que resumem as informações necessárias.

Ainda segundo Rodrigues (2002), as medidas representam ou resumem todos os valores obtidos pelo grupo e, como tal, fornecem uma descrição precisa da execução do grupo como um todo, permitindo assim o confronto de dois ou mais grupos.

Neste capítulo iremos ver uma análise de conjunto de dados, com as medidas de posição e as medidas de variação.

2 MEDIDAS DE POSIÇÃOSegundo Rodrigues (2002), usam-se, em geral, três medidas de posição:

média aritmética (simples, ponderada, de dados agrupados em intervalos), mediana e moda.

2.1 MÉDIA ARITMÉTICA SIMPLES ( X )

A média aritmética simples é a soma dos valores ou medidas divididas pela quantidade destes, trata-se, portanto, de uma medida de posição em que as variáveis de um conjunto são tomadas isoladamente e representadas por um valor calculado (RODRIGUES, 2002).

Eis a fórmula: X xn

Onde:X : é a média∑x: é a soma das variáveisn: número de indivíduosExemplo: Se o peso em kg de 8 caprinos ao nascer é 23, 27, 20, 30, 14, 17,

29, 31, qual é o peso médio desse conjunto de caprinos?

Page 82: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

72

X xn

X �� � � � � � �23 27 20 30 14 17 29 31

8

X kg= =191

823 87, �kg

Portanto, o peso médio ou a média dos pesos dos caprinos é igual a 23,87 kg.

Quando utilizamos dados de uma amostra de uma determinada população, a média aritmética calculada será uma estimativa, pois empregamos apenas uma fração do conjunto total (RODRIGUES, 2002).

UNI

2.2 MÉDIA ARITMÉTICA PONDERADA

Quando você tiver uma série de valores sucessivos com a respectiva distribuição de frequência, pode-se calcular a média aritmética ponderada (RODRIGUES, 2002).

A forma que seus dados se apresentam na distribuição de frequência:

Variáveis Frequências

X1 f1

X2 f2

X3 f3

. .

. .

. .

. .

Xn fn

Page 83: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

73

A fórmula adotada para o cálculo, se apresenta da seguinte forma:

X xfn

x f x f x ff f f

n n

n

� �� ���� ���

£1 1 2 2

1 2

Vamos ao exemplo (RODRIGUES, 2002):

Idade (anos) Frequência

2 10

3 8

4 6

5 5

6 5

7 5

8 7

9 4

Sendo a fórmula:

X xfn

x f x f x ff f f

n n

n

� �� ���� ���

£1 1 2 2

1 2

Aplicando a fórmula:

X

x x x x x xx x

� � � � � � � � � � � � � � � � � �� � � � �

� � �

2 10 3 8 4 6 5 5 6 5 7 5

8 7 9 4

10 8 6 5�� � � �� �

5 5 7 4

250

505�

Logo, a idade média das crianças dessa escola é de cinco anos.

Page 84: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

74

2.3. MÉDIA ARITMÉTICA DE DADOS AGRUPADOS EMINTERVALOS

Segundo Rodrigues (2002, p. 61),

... há vezes em que os dados não se apresentam com seu verdadeiro valor individual, mas são representados por uma classe que pode ter um determinado intervalo, neste caso, operamos da mesma maneira do caso anterior, considerando que o intervalo não tem valor definido e sim um conjunto de valores, utilizamos como representante o ponto médio de cada intervalo...

Vamos ao exemplo (RODRIGUES, 2002), se tivéssemos a distribuição de frequência a seguir, procederíamos da seguinte forma:

Idade (anos) Frequência

0 I--- 5 4

5 I--- 10 2

10 I--- 15 3

15 I--- 20 1

Usaríamos a base de cálculos do exemplo anterior, ficando desta forma:

Idade (anos) Valor posição (X) Frequência X.f

0 5 2,5 4 10

5 10 7,5 2 15

10 15 12,5 3 37,5

15 20 17,5 1 17,5

Total --- 10 80

Então para calcularmos a coluna de valor de posição adotamos a seguinte fórmula:

5/2 = 2,5 ; 5+10/2= 7,5 e assim por diante.

Para calcularmos a coluna de X.f, adotamos os seguintes:2,5 x 4 = 10; 7,5 x 2= 15 e assim por diante.

Adotando a fórmula anterior, ficando:

Page 85: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

75

X xfn

anos= = =£

� �80

108anos

Logo, a idade média é de 8 anos.

Ainda segundo Rodrigues (2002), quando os dados apresentam certa homogeneidade, é possível o uso da média aritmética, que tem como:

• Vantagens: ser fácil de calcular e entender; unir em um valor todas as observações do conjunto.

• Desvantagens: não servir para séries variáveis assimétricas; não expressar variações dentro da distribuição de dados.

2.4 MEDIANA (ME)

A mediana é um valor situado no centro da distribuição de frequências e tem como objetivo encontrar um valor que permita conter 50% dos dados acima deste valor e 50% abaixo, sua utilidade é especialmente útil quando se trata de séries assimétricas, isto é, quando alguns valores são exageradamente baixos ou altos (RODRIGUES, 2002).

Ainda segundo Rodrigues (2002), a mediana não é influenciada pela magnitude de cada uma dessas séries. Para o cálculo da mediana:

1. Ordenamos todos os valores.2. Determinamos o total de valores (n).3. Localizamos o valor central mediante a fórmula:

n +12�

, quando o número de observações é ímpar;

n2� e n

2� + 1, quando o número de observações é par, o que corresponde à

média de valores centrais.

Vamos ao exemplo (RODRIGUES, 2002, p. 52):

A) No município de Cordeiro foram selecionados oito estabelecimentos de ensino que apresentaram quanto ao número de alunos:

Page 86: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

76

Estabelecimentos Nº de alunos

A 150

B 180

C 230

D 2.500

E 200

F 160

G 250

H 170

Primeiro passo: ordenar os valores:

150, 160,170,180,200, 230, 250 e 2.500.Então os valores centrais são: 180 e 200, portanto, levando em consideração as observações pares ou ímpares, temos o valor médio igual a 190, que corresponde à mediana. Me=190.

B) Um tipo de operação cirúrgica foi realizado por cinco médicos, cada um nos seguintes tempos:

Médicos Minutos

A 48

B 42

C 52

D 95

E 46

Primeiro passo: ordenar as variáveis:42, 46, 48, 52, 95

Então o valor central correspondente a 48, valor da mediana. Me = 48 minutos.

Segundo Rodrigues (2002), quando os dados se apresentam agrupados através de uma distribuição de frequência, podemos calcular a mediana pela seguinte fórmula:

Page 87: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

77

Me Li

n Fa

Fh

MeMe� �

�� .22

Onde:Li: limite inferior da classe que contém a mediana;n: número de observações do conjunto;Fa: soma das frequências das classes anteriores à classe da mediana;hMe: amplitude da classe que contém a mediana;fMe: frequência simples da classe da mediana.

Exemplo: Distribuição de frequências (RODRIGUES, 2002, p. 64).

ClassesFrequência

Simples Acumulada

10 I--- 20 10 10

20 I--- 30 15 25

30 I---40 20 45

40 I--- 50 15 60

50 I--- 60 8 68

60 I--- 70 2 70

Total 70 ---

Classe mediana: 30 -40 Limite inferior: 30Número de observações: 70Frequência acumulada anterior à classe mediana: 25Frequência simples da classe mediana: 20Amplitude da classe: 10Desta forma ficaria:

Page 88: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

78

2.5 MODA (MO)

Segundo Rodrigues (2002), quando temos uma pequena amostra, a moda corresponde ao valor mais frequente no conjunto de variáveis, já para dados agrupados, em que se utiliza uma distribuição de frequências é calculada através da seguinte fórmula:

Mo Li dd d

h� ��

� .1

1 2

Onde:Li: limite inferior da classe modald1: diferença entre a frequência da classe da moda e da classe inferiord2: diferença entre a frequência da classe da moda e da classe posteriorh: amplitude das classes

Exemplo (RODRIGUES, 2002, p. 65):Distribuição de frequências.

Me Li

n Fa

Fh

MeMe� �

�� .22

Me � ��

� ��

� �30

70

225

2010 30

35 25

2010 30

10

2010� . . .

2

Me � � �30100

2035

ClassesFrequência

Simples Acumulada

10 I--- 20 10 10

20 I--- 30 15 25

30 I---40 20 45

40 I--- 50 15 60

50 I--- 60 8 68

60 I--- 70 2 70

Total 70 ---

Page 89: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

79

Classe da moda: 30 - 40Limite inferior da classe modal: 30d1: 20 – 15 = 5d2: 20-15 = 5h = 10

Temos:

Mo Li dd d

h� ��

� .1

1 2

Mo � ��

� � � �305

5 510 30

5

1010 30

50

10� . .

Mo � � �30 5 35

3 MEDIDAS DE VARIAÇÃOSegundo Rodrigues (2002), usa-se em geral: desvio médio, devio-padrão,

variância ou quadrado médio, coeficiente de variação, erro padrão da média, erro padrão de percentagem e separatrizes.

3.1 DESVIO-MÉDIO (D.M.)

Considerando que num conjunto de dados, cada valor apresenta em relação à média aritmética um afastamento, o desvio-médio será a média aritmética dos afastamentos da média, levando em conta os valores absolutos desses desvios (RODRIGUES, 2002).

Exemplo:Para um conjunto de dados: 2,8,10,15,17,20.

Primeiro passo: X �� � � � �

� �2 8 10 15 17 20

6

72

612�

Page 90: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

80

O desvio-padrão é o afastamento médio em relação à média aritmética de um conjunto de valores (RODRIGUES, 2002).

Em série simples, eis a fórmula:

SX

Xn

n�

��� �

� ��

²²

Onde:X: valor do conjunto∑: somatórion: número de observaçõesExemplo (RODRIGUES, 2002), calcular o desvio-padrão de: 2,5,9,11,14 e 25.Primeiramente:∑X= 2+5+9+11+14+25 = 66∑X2=22+52+92+112+142+252=4+25+81+121+196+625=1.052n=6Inserindo dados na fórmula:

3.2 DESVIO-PADRÃO

Cálculo:

DM. . � ��

� � � � � � � � � � �2 12 8 12 10 12 15 12 17 12 20 12

6

DM. . �� � � � �10 4 2 3 5 8

6

DM. . � ,= =32

65 3

O desvio-médio deste conjunto é 5,3.

SX X

nn

�� �

��

��

��

�2

2 2

1

1 052 666

6 1

1 052 4 3566

51 052 726

5

. . ..

�= = =326

565 20 8 07, ,S

Page 91: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

81

Observa-se que no cálculo do desvio-padrão utilizamos o denominador (n-1), ou seja, 6 -1. Devemos considerar para casos em que n for menor que 30, este será o procedimento, por causa do pequeno número de observações, já para os casos onde o n é maior que 30, usa-se apenas o n no denominador (RODRIGUES, 2002).

No segundo exemplo, trata-se de uma série de dados agrupados, isto é, uma série de valores que se repetem, e por conseguinte são representados pela sua frequência (RODRIGUES, 2002).

X F FX

2 2 4

3 2 6

4 4 16

5 4 20

6 2 12

Total 14 58

Temos, portanto, um total de 14 valores agrupados em cinco categorias.

X F fX fX2

2 2 4 8

3 2 6 18

4 4 16 64

5 4 20 100

6 2 12 72

Total 14 58 262

Observando que para o cálculo da coluna fX, utilizamos (2x2=4 e assim por diante), e bem como para a coluna de fx2 utilizamos o seguinte procedimento (42=8, e assim por diante).

Seguindo o raciocínio, temos o cálculo para o desvio-padrão desta distribuição, utilizamos a seguinte expressão:

s fXn

fXn

� ����

���

£ £2 2

Page 92: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

82

�� ��

��

�� � � � � � �

26214

5814

18 71 4 1 18 71 16 81 1 90 1 42

2, , , , , ,S

Logo, o desvio-padrão desse conjunto de dados é 1,4, ou seja, esse é o valor que os números se afastam da média aritmética.

O terceiro exemplo são dados de uma série grupada onde apresentam as classes em intervalos, este problema é solucionado representando-se cada um dos intervalos pelo valor médio (RODRIGUES, 2002, p. 68).

INTERVALO (X) F VALOR MÉDIO DO INTERVALO (X)

1I--- 5 4 3

6 I--- 10 15 8

10 I--- 15 81 13

16 I--- 20 90 18

Total 190 ---

Para este procedimento restante é igual ao verificado no exemplo anterior, ficando desta forma:

Primeiro passo: calcular a coluna fX (4x3 = 12)

Segundo passo: calcular a coluna fX2 (122=144), ficando desta forma:

Intervalo (X) fValor médio do intervalo

(X)fX fx2

1I--- 5 4 3 12 144

6 I--- 10 15 8 120 14.400

10 I--- 15 81 13 1.053 1.108.809

16 I--- 20 90 18 1.620 2.624.400

Total 190 --- 2.805 3.747.753

Page 93: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

83

Seguindo a fórmula:

s fXn

fXn

� ����

���

£ £2 2

�� ��

��

�� � � � �

3 747 753190

2 805190

19 725 14 76 19 725 217 852

2. . . . , . ,S

�= =19 507 139 67. ,S

Desvio-padrão – POPULACIONAL, representada letra grega σ = σ 2

Desvio-padrão – AMOSTRAL, representada por s = s2

UNI

3.3 VARIÂNCIA OU QUADRADO MÉDIO

Quantitativamente, o seu valor corresponde ao desvio-padrão elevado ao quadrado, (RODRIGUES, 2002).

Segue a fórmula, seguindo o parâmetro do n.

N ≤ 30 N > 30

S �X

Xn

n2

2

2

1�

�� �

££

SX

Xn

n2

2

2

��� �

££

Page 94: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

84

3.4 COEFICIENTE DE VARIAÇÃO (C.V.)

Segundo Rodrigues (2002), em trabalhos experimentais, através deste parâmetro, comprovamos a precisão alcançada, seu coeficiente é expresso em %, sendo muito utilizado em trabalhos científicos.

Eis a fórmula:

CV SX

. . .= 100

Onde:S: desvio-padrãoX : média aritmética

Ainda segundo Rodrigues (2002), há uma relação existente entre desvio-padrão e a média aritmética, quanto maior for a dispersão no conjunto de observações, maior será o seu valor.

Até 10% - ótimo De 11% a 20% - bom De 21% a 30% - regular

3.5 ERRO-PADRÃO DA MÉDIA – s X� �Quando realizamos um experimento científico em que utilizamos dados

de uma fração representativa de uma população (amostra), a média aritmética determinada representará, em relação a média populacional, e as outras amostras fossem retiradas da população apresentariam médias aritméticas que teriam outros afastamentos em relação à média, e para determinar a média destes afastamentos utilizamos o erro-padrão da média (RODRIGUES, 2002).

Eis a fórmula:

S X Sn

� � �Onde:S: desvio-padrãon: nº de observações

Vamos a um exemplo:

Page 95: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

85

Em uma determinada amostra com 150 observações em que o desvio-padrão é igual a 5, o erro padrão da amostra será:

S X Sn

� � � � � �5

150

5

12 250 41

,,

Logo, 0,41 é o afastamento médio com que as médias amostrais se apresentam em relação a média aritmética da população.

3.6 ERRO-PADRÃO DE PERCENTAGEN – S (P)

De acordo com Rodrigues (2002), nos experimentos cuja população procuramos estudar a frequência com que certo fenômeno ocorre, utilizam-se comumente amostras para tal fim, e a percentagem de ocorrência do fenômeno na amostra deve apresentar diferença em relação à percentagem na população. Assim, o erro-padrão de percentagem seria o erro médio com que estaríamos afastados do percentual da população.

Eis a fórmula:

S p p qn

� � � .

Onde:p: percentual da amostraq: 100-pn: nº de observações

Vamos ao exemplo:

p= 20%

Valores: q= 100- p = 100-20=80%n= 400

S p p qn

x� � � � � �.

, %20 80

600

1600

6001 63

Logo, o erro-padrão da percentagem é de 1,63%

Page 96: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

86

3.7 SEPARATRIZES

Como já vimos, algumas medidas de posição, tal como a mediana, que divide a distribuição dos dados em duas partes com um número igual de observações. Agora vamos ver medidas semelhantes, mas que dividem a distribuição de dados de acordo com o número de elementos (RODRIGUES, 2002).

Estes elementos seriam:

• Quartis: quatro partes iguais

• Decis: dez partes iguais

• Centis: cem partes iguais

3.7.1 Quartis

Para dividirmos um conjunto de dados em quatro partes iguais necessitamos de separatrizes (quartis):

FONTE: Adaptado de Rodrigues (2002)

Ainda segundo Rodrigues (2002), segue a seguinte descrição:

• Primeiro quartil: em conjunto de dados, colocados em ordem crescente de valores, o 1º quartil (Q1) corresponderá ao valor que divide o conjunto em duas partes tais que 25% dos valores sejam menos e 75% dos valores sejam maiores do que o valor determinado.

• Segundo quartil: o Q2 corresponde ao valor mediano, dividindo o conjunto de dados em duas partes iguais, ou seja, 50% de cada lado.

• Terceiro quartil: é o valor da série em que teremos 75% dos valores abaixo e 25% acima do valor determinado (Q3).

x

n4 2 4

n 3n

Q₁ Q₂ Q₃ Z

Page 97: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

87

Há outras denominações para os quartis:

• Primeiro quartil ou quartil inferior (Qi);• O segundo quartil ou quartil do meio é a própria mediana (Md), • O terceiro quartil ou quartil superior (Qs)

Para o cálculo, como são medidas baseadas na ordenação dos dados, primeiro é preciso calcular a posição dos quartis.

Posição do quartil inferior = (n + 1)/4

Posição do quartil superior = [3x(n+1)]/4

Atentem que, se o valor da posição for fracionário deve-se fazer a média entre os dois valores que estão nas posições imediatamente anterior e imediatamente posterior à posição calculada. Se os dados estiverem dispostos em uma distribuição de frequências, utilizar o mesmo procedimento observando as frequências associadas a cada valor (variável discreta) ou ponto médio de classe.

Lembrando que, n é o número total de elementos da amostra, e que com o cálculo acima, desta forma Qj (quartil) será um elemento entre Xk e Xk+1, onde k é o maior inteiro menor que j(n+1)/4 e será calculado da seguinte forma.

Onde:Xj: número onde se encontra a posição quartilK: resultado da fórmula da posição quartil.Vamos ao exemplo:

Nome Idade

Beatriz 65

Guilherme 72

Monica 70

Altera em relação à posição do quartil

Page 98: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

88

Primeiro passo ordenar os números – atentem a essa ordem.60, 65, 67, 68, 69, 70, 72, 72.

Deste modo temos que (n+1)/4 = 9/4 = 2,25 e com isso k = 2, logo

Q X n k X Xj j k k� ��

����

��� �� ��

1

41

Q165

8 1

42 67 65� �

���

��

��� �� �

Q x165 2 25 2 67 65 65 0 25 2 65 0 5 65 5� � �� � �� � � � � � � � �, , , ,

Também temos que 2(n+1)/4 = 18/4 = 4,5, com isso k = 4, logo

Q Xn

k X Xk k2 4 1

2 1

4� �

�� ��

��

�� �� ��

Q x268

2 8 1

44 69 68 68

18

44 1 68 0 5 1� �

�� ��

��

�� �� � � � ��

��

���� � � � � � �, 668 5,

E, temos que 3(n+1)/4= 27/4 = 6,75, com isso k = 6, logo

Q Xn

k X Xk k3 6 1

3 1

4� �

�� ��

��

�� �� ��

Q k x370

3 8 1

472 70 70 6 75 6 2 70 0 75 2 71� �

�� ��

��

�� �� � � � �� �� � � � � � �, , ,,5

Adriana 72

Glauber 60

Verusca 67

Inês 69

Gabrielle 68

Page 99: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

89

Q1 65,5

Q2 68,5

Q3 71,5

Temos assim, o seguinte resultado dos quartis:

3.7.2 Decis

Para dividirmos um conjunto de dados em dez partes iguais são necessários nove separatrizes (decis):

FONTE: Rodrigues (2002)

Ainda segundo Rodrigues (2002), segue a seguinte descrição:

• O primeiro decil: o 1º decil (D1) de um conjunto de dados. Colocados em ordem crescente, corresponde ao valor que é procedido por 10% das observações e seguido de 90% restantes.

• De forma semelhante podemos definir outros decis, vale frisar que a mediana corresponde ao quinto decil.

Já Silva (2015) descreve que a definição dos decis obedece ao mesmo princípio dos quartis, com a modificação da porcentagem de valores que ficam aquém e além do decil que se pretende calcular. Deste modo precisamos de 9 decis para dividirmos uma série em 10 partes iguais.

Para fins de cálculos dos decis, utiliza-se a fórmula dos centis, veja a representação a seguir:

x

n10 10 10 10 10 10 10 10 10

2n 3n 4n 5n 6n 7n 8n 9n

D₁ D₂ D₃ D₄ D₅ D₆ D₇ D₈ D₉ Z

Page 100: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

90

FONTE: Disponível em: <http://www.eecis.udel.edu/~portnoi/classroom/prob_estatistica/2007_1/lecture_slides/aula02.pdf>. Acesso em: 10 maio 2015.

3.7.3 Centis

Segundo Rodrigues (2002), divide-se o conjunto de dados, em ordem crescente, em cem partes, para encontrar 99 separatrizes (centis).

• O primeiro centil: o 1º centil será o valor do conjunto ordenado que divide a série em duas partes, sendo que 1% dos valores está abaixo e 99% acima, por analogia, podemos considerar os outros centis.

FONTE: Rodrigues (2002)

Eis a fórmula:L= (k/100).nOnde:L: posição do percentil desejado no conjunto de dados ordenadok: percentil desejadon: número de valores

Vamos ao exemplo, levando em consideração todas as fórmulas acima citadas. Com base no exemplo do Instituto de Matemática da Universidade Federal da Bahia (2015), observe a tabela de distribuição de frequências a seguir e encontre:

x C1 C2 C3 C50 .......................................................... C99 Z

Page 101: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

91

a) Primeiro quartil; b) Septuagésimo quinto centil; c) Nono decil

Vamos a solução:

a) Q1

Encontrar a posição do primeiro quartil:

EQ n14

80

420�

�= = ==

n

O Q1 está localizado na 20a posição, logo se encontra na 3aclasse. Com base nesses dados, calcularemos

Q1 da seguinte forma:

�1 4520 20 10

1459 29� �

��� �� � ,Q

Interpretação: 25% dos usuários consomem até 59,59 kwh. De maneira análoga, 75% dos usuários consomem mais de 59,59 kwh.

b) C75

Encontrar a posição do centil 75:

Ec n75

75100

7580

10060= = =

Page 102: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

92

O C75 está localizado na 60ª posição, logo se encontra na 5ª classe. Com base nesses dados, calcularemos C75 da seguinte forma:

C75

8520 60 50

1499 29� �

�� �� ,

Interpretação: 75% dos usuários consomem até 99,29 kwh. De maneira análoga, 25% dos usuários consomem mais de 99,29 kwh.

c) D9Encontrar a posição do 9o decil:

ED n9910

980

1072� � �

��

��� �

O D9 está localizado na 72a posição, logo se encontra na 6aclasse. Com base nesses dados, calcularemos D9 da seguinte forma:

D9105

20 72 64

8125� �

�� ��

Interpretação: 90% dos usuários consomem até 125 kwh. De maneira análoga, 10% dos usuários consomem mais de 125 kwh.

3.8 BOX PLOT (QUANTIL)

Segundo Farias (2015), o boxplot é um gráfico construído com base no resumo dos cinco números, constituído por: • Valor mínimo • Primeiro quartil (Q1) • Mediana (segundo quartil Q2) • Terceiro quartil (Q3) • Valor máximo.

Ainda segundo Farias (2015), o gráfico é formado por uma caixa construída

paralelamente ao eixo da escala dos dados (pode ser horizontal ou vertical). Essa caixa vai desde o primeiro quartil até o terceiro quartil e nela se traça uma linha na posição da mediana. Essa caixa, que descreve os 50% centrais da distribuição, é comum a todas as variantes do boxplot.

Page 103: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | MEDIDAS DE POSIÇÃO E VARIAÇÃO

93

FIGURA 19 - GRÁFICO TIPO BOX-AND-WHISKER (BOX PLOT)

FONTE: Motta e Wagner (2003)

Valor máximo

Quartil 3

Quartil 2 (mediana)

Quartil 1

Valor mínimo

Page 104: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

94

Neste tópico vimos que:

• Para as medidas de posição, usa-se: média aritmética (simples, ponderada, de dados agrupados em intervalos), mediana e moda.

• Para as medidas de variação usa-se: Desvio médio, Devio-padrão, Variância ou quadrado médio, coeficiente de variação, erro padrão da média, erro padrão de percentagem e separatrizes.

• As separatrizes dividem a distribuição de dados de acordo com o número de elementos, sendo elas quartis, decis e centis.

RESUMO DO TÓPICO 1

Page 105: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

95

AUTOATIVIDADE

Numa determinada área, foram mensuradas 20 árvores, de diferentes espécies, todas catalogadas e identificadas. Conforme a tabela a seguir:

Árvore Diâmetro

1 30

2 14

3 25

4 48

5 77

6 36

7 57

8 14

9 10

10 6

11 12,5

12 58

13 66,45

14 17,3

15 25

16 61,89

17 47

18 12

19 11

20 10

1 Calcule: a somatória – a média – mediana – moda – desvio-padrão – variância da amostra – coeficiente de variação – erro-padrão da média.

Page 106: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

96

Árvore Diâmetro

1 30

2 14

3 25

4 48

5 77

6 36

7 57

8 13

9 10

10 6

2 Em relação a tabela a seguir, calcule:

A) QuartisB) DecisC) Centis 45 posição

Page 107: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

97

TÓPICO 2

TESTES DE NORMALIDADE, TESTES

PARAMÉTRICOS

UNIDADE 2

1 INTRODUÇÃOQuando vamos analisar estatísticamente os nossos dados, às vezes, eles

não são normais. Para tanto confirmamos esta situação usando alguns testes para averiguar: o teste D’Agostino-Pearson, o teste Pearson, teste Shapiro-Wilk e o teste Kolmogorov-Smirnov. Estes últimos são os mais usados.

Depois de realizada esta análise, para dar continuidade, há os testes estatísticos, tanto paramétricos quanto não paramétricos, ou seja, usamos os testes paramétricos para quando o teste que você utilizou deu como resultado a normalidade dos dados, e de forma oposta, você irá utilizar os testes paramétricos para quando o resultado de seu teste de normalidade resultou em não normalidade.

Suchmacher e Geller, 2005, citam: “Os testes bioestatísticos são as principais ferramentas que irão determinar o grau de probabilidade com o qual podemos afastar a hipótese de nulidade, e se dividem em dois tipos: paramétricos e não paramétricos”.

Neste tópico, você irá aprender os testes de normalidade, e posterior os testes paramétricos suas diferenças com os não paramétricos, e quais os testes paramétricos mais usados no meio científico.

2 DIFERENÇAS ENTRE DADOS PARAMÉTRICOS E NÃO PARAMÉTRICOSA. Testes paramétricos: de acordo com Suchmacher e Geller (2005), estes testes são

aqueles que permitem afastar H0 com maior grau de segurança e se baseiam nos parâmetros de distribuição gaussiana (média e desvio-padrão). E seus critérios para sua aplicabilidade são:

• A distribuição dos dados da amostra deve ser normal.

• As amostras devem ser independentes uma da outra.

• As medidas de dispersão entre as amostras comparadas devem ser homogêneas.

• As variáveis devem ser quantitativas.

Page 108: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

98

B. Testes não paramétricos: ainda de acordo com Suchmacher e Geller (2005), estes testes devem ser utilizados quando os testes paramétricos não puderem ser utilizados, tem um poder estatístico menor do que os paramétricos, e são aplicados nas seguintes situações:

• Dados de amostra sem distribuição normal.

• Os indivíduos da amostra estudada estão sob condições diferentes.

• Variáveis qualitativas (especialmente ordinais).

• Amostras com n pequeno.

• Amostras com medidas de dispersão diferentes.

Ainda segundo Suchmacher e Geller (2005, p. 43), “...quando os critérios para aplicabilidade de testes paramétricos forem preenchidos, ainda se poderá tentar transformar os dados do estudo, eis alguns dados de transformação: logarítmica, raiz cúbica dos dados e transformação angular...”.

3 TESTES DE NORMALIDADEEstes testes de normalidade são usados para definir a normalidade ou não

normalidade dos dados, para posteriormente, você utilizar os testes paramétricos ou não paramétricos.

Alguns dos testes de normalidade mais utilizados são: teste Shapiro-Wilk e o teste Kolmogorov-Smirnov.

3.1. TESTE SHAPIRO-WILK

Lucambio (2008) descreve que este teste foi proposto por Shapiro & Wilk (1965) e utilizada a seguinte fórmula:

Page 109: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | TESTES DE NORMALIDADE, TESTES PARAMÉTRICOS

99

Ainda segundo Lucambio (2008), “.... sendo m = (m1, m2, . . . , mn) > o vetor dos valores esperados das estatísticas de ´ordem da amostra e V a matriz de covariâncias dessas estatíticas. O p-valor deste teste é calculado exatamente para n = 3, em outras situações utilizam-se aproximações diferentes para 4 ≤ n ≤ 11 e para n ≥ 12”.

3.2 TESTE KOLMOGOROV-SMIRNOV

Este teste é usado para determinar se duas distribuições de probabilidade subjacentes diferem uma da outra ou se uma das distribuições de probabilidade subjacentes difere da distribuição em hipótese, em qualquer dos casos é com base em amostras finitas.

O teste pode ser utilizado para avaliar as hipóteses:

Ou seja, se P-Value (P-valor) for maior que o nível de significância (%), os dados apresentam distribuição normal.

A função distribuição acumulada Fn para n observações yi é definida por

H : Os dados seguem uma distribuição normalH :Os dados não

0

1 seguem uma distribuição normal.���

��

As duas estatísticas de teste Kolmogorov-Smirnov de apenas um lado são dadas por

D F x F xD F x F xn n

n n

� �

� �

max( ( ) ( ))max( ( ) ( ))

F if y caso contrário.n

i

n

xn

x( )

,�

����

���1 1

01

1

��

Onde:F(x) é a distribuição em hipótese ou outra distribuição empírica.

4 TESTES PARAMÉTRICOSApós verificarmos a normalidade dos dados, partimos, então para os

testes paramétricos, que possuem as seguintes características quanto ao cálculo de uma amostra ou comparando as duas amostras:

Page 110: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

100

FONTE: Disponível em: <http://www.pucrs.br/famat/viali/especializa/eae_fenge/material/laminaspi/THipoteses_Par.pdf>. Acesso em: 4 maio 2015.

Nos testes paramétricos iremos ver a análise de variância conhecida como ANOVA.

Nesta análise de 1 fator, também é conhecida como ANOVA “One Way” – ANOVA de um fator, sendo utilizada para comparar mais de dois grupos através de suas médias.

Ao conduzir uma ANOVA, queremos saber quanto da variabilidade dos nossos resultados é devido ao TRATAMENTO (variância ENTRE grupos) e quanto é devido a ERRO (variância DENTRO dos grupos).

Segundo Anjos (2015, 112), “A análise de variância baseia-se na decomposicão da variação total da variável resposta em partes que podem ser atribuídas aos tratamentos (variância entre) e ao erro experimental (variância dentro). Essa variação pode ser medida por meio das somas de quadrados definidas para cada um dos seguintes componentes:

FIGURA 20 - TESTES PARAMÉTRICOS PARA UMA E DUAS AMOSTRAS.

FONTE: Anjos (2015)

Umaamostra

Duasamostras

MédiaProporçãoVariância

Dependentes

Independetes

Diferença de médias

Diferença de médiasDiferença de proporçõesIgualdade de variâncias

Testes

Paramétricos

{ {{

{{

Page 111: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | TESTES DE NORMALIDADE, TESTES PARAMÉTRICOS

101

Ainda segundo Anjos (2015), a SQTrat também é chamada de variação Entre, que seria a variação existente entre os diferentes tratamentos e a SQRes é chamada de variação Dentro que tem como função analisar diferenças existentes entre as repetições de um mesmo tratamento.

Tais somas podem ser representadas da seguinte forma, para um resultado de uma análise:

FONTE: Anjos (2015)

Em que QMTrat=SQTrat/( I-1 ) e QMRes=SQRes/( I( J-1 ) ).

Anjos (2015, p. 113), descreve que

Pode-se mostrar que o quociente QMTrat/QMRes tem distribuição F com ( I − 1 ) e I ( J − 1) graus de liberdade, supondo que, yij são variáveis aleatórias independentes, todos os tratamentos tem variâncias iguais a σ2 e Yij ∼ N( μi, σ2 ). Por esses motivos, os pressupostos da ANOVA devem ser testados ou avaliados em qualquer análise S e Fcalculado> Ftabelado, rejeitamos a hipótese tese de nulidade H0, ou seja, existem evidências de diferença significativa entre pelo menos um par de médias de tratamentos, ao nível α de significância escolhido. Caso contrário, não rejeitamos a hipótese de nulidade H0 , ou seja, não há evidências de diferença significativa entre tratamentos, ao nível α de significância escolhido. Outra maneira de avaliar a significância da estatística F é utilizando o p-valor. S e o p-valor< α, rejeitamos a hipótese de nulidade H0. Caso contrário, se não rejeitamos a hipótese de nulidade H0, ou seja, não há evidências de diferenças significativas entre os tratamentos, ao nível α de significância escolhido.

FIGURA 21 - REPRESENTAÇÃO DA SQTrat.

Page 112: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

102

RESUMO DO TÓPICO 2Neste tópico vimos:

• Que os dados paramétricos possuem determinadas caraterísticas: a distribuição dos dados da amostra deve ser normal; as amostras devem ser independentes uma da outra; medidas de dispersão entre as amostras comparadas devem ser homogêneas; as variáveis devem ser quantitativas.

• E os dados não paramétricos: os dados da amostra não possuem distribuição normal; os indivíduos da amostra estudada estão sob condições diferentes e as variáveis qualitativas (especialmente ordinais).

• Que os testes de normalidade são usados para definir a normalidade ou não normalidade dos dados, para posteriormente, você utilizar os testes paramétricos ou não paramétricos.

Page 113: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

103

AUTOATIVIDADE

Quando devemos usar os dados para os testes paramétricos e para os testes não paramétricos?

Page 114: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

104

ANEXOS

TABELA 1 – TESTE DE SHAPIRO-WILK

FONTE: Disponível em: <http://docentes.esa.ipcb.pt/estatistica/apontamentos/Testes_Ajustamento.pdf>. Acesso em: 20 maio 2015.

Nível de significância α

0.01 0.02 0.05 0.10 0.50 0.90 0.95 0.98 0.99

Tam

anho

da

amos

ra, N

345

678910

1112131415

1617181920

2122232425

2627282930

0,7530,6870,686

0,7130,7300,7490,7640,781

0,7920,8050,8140,8250,835

0,8440,8510,8580,8630,868

0,8730,8780,8810,8840,888

0,8910,8940,8960,8980,900

0,7560,7070,715

0,7430,7600,7780,7910,805

0,8170,8280,8370,8460,855

0,8630,8690,8740,8790,884

0,8880,8920,8950,8980,901

0,9040,9060,9080,9100,912

0,7670,7480,762

0,7880,8030,8180,8290,842

0,8500,8590,8660,8740,881

0,8870,8920,8970,9010,905

0,9080,9110,9140,9160,918

0,9200,9230,9240,9260,927

0,7890,7920,806

0,8260,8380,8510,8590,869

0,8760,8830,8890,8950,901

0,9060,9100,9140,9170,920

0,9230,9260,9280,9300,931

0,9330,9350,9360,9370,939

0,9590,9350,927

0,9270,9280,9320,9350,938

0,9400,9430,9450,9470,950

0,9520,9540,9560,9570,959

0,9600,9610,9620,9630,964

0,9650,9650,9660,9660,967

0,9980,9870,979

0,9740,9720,9720,9720,972

0,9730,9730,9740,9750,975

0,9760,9770,9780,9780,979

0,9800,9800,9810,9810,981

0,9820,9820,9820,9820,983

0,9990,9920,985

0,9810,9790,9780,9780,978

0,9790,9790,9790,9800,980

0,9810,9810,9820,9820,983

0,9830,9840,9840,9840,985

0,9850,9850,9850,9850,985

1,0000,9960,991

0,9860,9850,9840,9840,983

0,9840,9840,9840,9840,984

0,9850,9850,9860,9860,985

0,9870,9870,9870,9870,988

0,9880,9880,9880,9880,988

1,0000,9970,993

0,9890,9880,9870,9860,986

0,9860,9860,9860,9860,987

0,9870,9870,9880,9880,988

0,9890,9890,9890,9890,989

0,9890,9900,9900,9900,990

Page 115: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

105

FONTE: Disponível em: < http://www.deg.ufla.br/site/_adm/upload/file/Hidrologia%20I/Tabelas_Hidrologia.pdf >. Acesso em: 20 maio 2015.

Tabela 2 do anexo: Smirnov --Kolmogorov

Tamanho da

Amostra (N)

Níve de Significância (α)

0,20 0,10 0,05 0,01

1 0,900 0,950 0,975 0,995

2 0,684 0,776 0,842 0,929

3 0,565 0,642 0,708 0,829

4 0,494 0,564 0,624 0,734

5 0,446 0,510 0,563 0,669

6 0,410 0,470 0,521 0,618

7 0,381 0,438 0,486 0,577

8 0,358 0,411 0,459 0,543

9 0,339 0,388 0,432 0,514

10 0,322 0,368 0,409 0,486

15 0,268 0,304 0,338 0,404

20 0,231 0,264 0,294 0,352

25 0,210 0,240 0,264 0,320

30 0,190 0,220 0,242 0,290

40 - - 0,210 0,250

50 - - 0,190 0,230

N>50 1,07 1,22 1,36 1,63√N √N √N √N

Page 116: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

106

Page 117: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

107

TÓPICO 3

TESTES DE HIPÓTESE

UNIDADE 2

1 INTRODUÇÃONeste tópico iremos ver alguns testes de hipótese que você irá utilizar em

seus cálculos estatísticos, atestando seus dados coletados em campo.

2 HIPÓTESE ESTATÍSTICAKato (2015) descreve que “Hipótese, em estatística, é uma suposição

formulada a respeito dos parâmetros de uma distribuição de probabilidade de uma ou mais populações”.

Ainda segundo Kato (2015),

o nível de significância de um teste é a probabilidade máxima de rejeitar Ho. Se, por exemplo, utilizarmos o nível de significância de 5%, a hipótese nula (Ho) será rejeitada somente se o resultado da amostra for tão diferente do valor suposto que uma diferença igual ou maior ocorreria com uma probabilidade máxima de 0,05. Na prática, o valor de α é fixo. (Geralmente α = 0,01 ou 0,05 ou 0,10.) No exemplo, fixado α = 0,05, levaria à rejeição de Ho, pois 0,0062 < 0,05. Uma outra maneira de tomar-se uma decisão é comparar o valor tabelado com a estatística do teste.

Kato (2015) ainda descreve:

A REGIÃO CRÍTICA de um teste é onde os valores da estatística do teste levam à rejeição da hipótese nula. A sua área é igual ao nível de significância, e sua direção é a mesma da hipótese alternativa.

Page 118: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

108

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

FONTE: Disponível em: <http://www.pucrs.br/famat/sergio/Estatistica_Basica_T126/Teste_de_hipotese.pdf>. Acesso em: 25 jun. 2015.

• REGRA DE DECISÃO: Se o valor da estatística do teste cair dentro da região crítica, rejeita-se H0. Ao rejeitar a hipótese nula (H0) existe uma forte evidência de sua falsidade. Ao contrário, quando aceitamos, dizemos que não houve evidência amostral significativa no sentido de permitir a rejeição de Ho.

• TIPOS DE ERROS: Pelo fato de usarmos resultados amostrais para fazer inferência sobre a população, estamos sujeitos a erros. Digamos que existe uma probabilidade α de que mesmo sendo Ho verdadeiro, �X assuma um valor que leva Zcalc à rejeição de Ho. As probabilidades desses erros são chamadas α e β respectivamente.

FONTE: Disponível em: <http://www.pucrs.br/famat/sergio/Estatistica_Basica_T126/Teste_de_hipotese.pdf>. Acesso em: 25 jun. 2015.

3 QUI-QUADRADO (TESTE DE ADERÊNCIA)

Rodrigues (1993) descreve que o teste não paramétrico de χ �2 (quiquadrado) foi desenvolvido por Pearson e ele designado pela letra minúscula grega χ � seguida do expoente 2, sendo muito aplicado nas pesquisas biológicas, este teste mede a variação quando temos amostras com frequências observadas, e baseadas na teoria, podemos calcular as frequências esperadas.

α

α

α/2 α/2

α = P(erro tipo I) = P(rejeitar H₀/H₀ é verdadeiro)β = P(erro tipo II) = O(aceitar H₀/H₀ é falso)

DECISÃOREALIDADEH₀ verdadeira H₀ falsa

Aceitar H₀ Decisão correta (1-α) Erro tipo II (β)Rejeitar H₀ Erro tipo I (α) Decisão correta (1-β)

Page 119: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | TESTES DE HIPÓTESE

109

A fórmula expressa é:

� 2 0

2

��� �£ f fe

efGL= nº de classes – 1Onde:f0: frequência observadafe: frequência esperada

Vamos ao exemplo:

Quando lançamos uma moeda, esperamos que ela seja de cara ou coroa, não é?!

Mas, se lançarmos esta mesma moeda 350 vezes, esperamos que a metade delas seja cara, e a outra metade consequentemente coroa. Portanto, a frequência esperada é 175, igual para cada uma.

Porém, quando realizamos o experimento, observamos que há uma discrepância entre os números de caras e os números de coroas. Tendo como o número de caras 160 e o número de coroas igual a 190. Os desvios são iguais a + 15 para caras e para coroa é -15.

Então o teste de quiquadrado será aplicado visando verificar a significância nos desvios que ocorrem (RODRIGUES, 1993, p. 80).

Usando a fórmula:

� 2 0

2

��� �£ f fe

ef

Lembrando que o desvio é elevado ao quadrado e dividido pela frequência esperada.

Com os dados anteriores:

Page 120: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

110

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

f0: 160 e 190fe: 175

�1

2

22

190 175

175

15

1751 28�

�� �� � ,

�2

2

2 2

160 175

175

15

1751 28�

�� ��

�� �� ,

Somando-se os valores de χ1

2

e χ22

, tem –se:

χ1

2

+ χ22

= 1,28+1,28 = 2,56 n.s.*

*n.s. = não significativo

Em seguida, confrontamos este valor com o valor tabela.

Valor da tabela= 2-1=1 --> São duas classes

Então verifica-se que o valor obtido, igual a 2,56, é menor do que encontrado na tabela, portanto, χ 2 é considerado não significativo, os desvios observados na amostra podem ser atribuídos ao acaso.

4 TESTE T – (STUDENT)Rodrigues (1993) descreve que se trata de um teste de larga aplicação

utilizado para a verificação de diferenças significativas entre médias, quando temos apenas dois tratamentos, ou seja, duas médias.

Ainda segundo Rodrigues (1993), há três formas distintas de sua aplicação:

• Amostras ou dados independentes – comparação das médias.

• Dados dependentes – comparação de médias, antes e após determinado tratamento.

• Estimativa de parâmetros – quando de uma população retiramos uma amostra e testamos se a média desta representa bem a média da população.

Page 121: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | TESTES DE HIPÓTESE

111

O teste t é indicado segundo Rodrigues (1993), para amostras que apresentam pequeno número de elementos (pequenas amostras), também podendo ser empregado para compararmos médias de amostras independentes quando o número de elementos nos dois grupos é diferente.

Vamos aos exemplos:

a. Amostras independentes – variâncias conhecidas (σ2)

Comparando o peso, aos 60 dias de vida, de 26 caprinos da raça A e 26 da raça B, segundo Rodrigues (1993) obtivemos os seguintes dados:

Raça A Raça B

X 1 = 38 Kg X 2 = 33,5 Kg

s1 = 5 Kg s2 = 6 Kg

n1 = 26 n2 = 26

Para a determinação do valor t, para a verificação das médias se apresentam diferenças significativas e aplica-se a seguinte fórmula:

t x xsn

sn

��

�1 2

1

2

1

2

2

2

Em que:

X 1 e X 2 : média das amostrass1 e s2 : desvios padrões das amostrasn1 e n2 : número de observações das amostras

t x xsn

sn

��

��

� �� �, ,

,,

1 2

1

2

1

2

2

2

2 2

38 33 5

5

26

6

26

4 50

1 862 94

Recorrendo a tabela t, e lembrando que:

Page 122: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

112

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

GL= n1+n2 -2, observando os valores t no nível de 5% e 1% de probabilidade na tabela; e que se o valor encontrado for menor que os 2 valores da tabela e correspondente àqueles graus de liberdade, o valor de t então, não será significativo, implicando, concluir que a diferença entre as médias não foi significativa (RODRIGUES, 1993).

Voltando ao nosso exemplo, temos como valor de t = 2,96, para 50 graus, pois 26 +26-2 = 50.

Conclusão: Consideramos significativo, no nível de 1% de probabilidade (P<0,01), por ter ultrapassado os valores da tabela; 2,01 a 5% e 2,68 a 1%. Dessa forma, concluímos que há 99% de probabilidade que os caprinos da raça A, aos 60 dias de vida, devam representar peso médio mais elevado do que os caprinos da raça B.

b. Amostras independentes – variâncias desconhecidas ( σ2)

O exemplo a seguir (RODRIGUES, 1993) possui duas amostras de indivíduos, que são submetidas a um determinado tratamento, obtendo-se de cada grupo os dados relativos à pressão arterial sistólica (PAS):

Grupo A Grupo B

X 1 = 175 X 2 = 169

s1 = 10 s2 = 11

n1= 20 n2= 32

Para a determinação do t, a fim de testar a diferença entre as médias aritméticas, temos:

t x x

sn n

A B

x xA B

A B

��

��

.1 1

Sendo que:xA e xB : médias aritméticas dos gruposn1 e n2 : número de observações Primeiramente vamos a estes cálculos:

Page 123: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | TESTES DE HIPÓTESE

113

Depois, iremos ao teste t:

Conclusão: t = 1,98 n.s. (P>0,05)

O valor de t foi considerado não significativo, portanto, a diferença entra as médias não foi significativa.

4.1 DADOS DEPENDENTES

Como já foi dito antes, a amostra é observada antes e após certo tratamento (RODRIGUES, 1993).

Vamos ao exemplo (RODRIGUES, 1993, p. 85).

Considerando uma amostra de 10 crianças, de 8 a 12 anos de idade, as quais teriam o seu índice CPOD determinado antes e após a aplicação de flúor.

sx xA B� � �113 02 10 63, ,

ss n s n

n nx xA A B B

A BA B� �

�� � � �� �� �

2

2 21 1

2�.A

ss n s n

n nx x

x xA A B B

A BA B� �

�� � � �� �� �

��

� ��2

2 21 1

2

19 100 31 121

20 32 2�.A

sx xA B� ��

� �2 1900 3751

50

5651

50113 02� ,

t x x

sn n

A B

x xA B

A B

��

��

.1 1

t � �

��

� �� ��

, ., . , ,

,175 169

10 631

20

1

32

6

10 63 0 285

6

3 031 98

Page 124: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

114

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

Nº de criançasAplicação de flúor

DiferençaAntes Após

1 5,7 4,7 1,0

2 5,2 4,8 0,4

3 6,4 6,0 0,4

4 5,9 5,3 0,6

5 5,8 5,2 0,6

6 7,0 5,0 2,0

7 6,4 5,6 0,8

8 6,0 5,2 0,8

9 5,8 5,0 0,8

10 5,2 4,6 0,9

Para se verificar a diferença entre as médias, e se estas são significativas, utiliza-se a seguinte fórmula:

tx x

sn

antes após��

�� �

GL = n -1

Onde:Numerador apresenta diferença entre as médias.No denominador, s, é o desvio-padrão da diferença entre os valores

antes e após.E n corresponde ao número de elementos da amostra.E n corresponde ao número de elementos da amostra.Dessa forma:

x antes= 5,94

xdepois = 5,14sdif = 0,46

n = 10

Page 125: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | TESTES DE HIPÓTESE

115

Usando a fórmula temos:

tx x

sn

antes após��

��

� ���

�, ,

,

,

,

,

,� 5 94 5 14

0 46

10

0 80

0 46

3 13

5 49– após

Conclusão:

Olhando na tabela GL = 10-1=9O t calculado é 5,49Então, olhando para a tabela para 9 graus de liberdade, temos 2,26 (5%) e

3,25 (1%).Conclui-se então que, t = 5,49 e considerado significativo no nível de 1%

de probabilidade (P<0,01), logo, a ação do flúor foi eficiente sobre a queda do índice de cárie.

4.2 DIFERENÇA ENTRA A MÉDIA AMOSTRAL E O PARÂMETROPOPULACIONAL

Segundo Rodrigues (1993), neste caso, é conhecida a média da característica ao estudar a população e, ao determinarmos a amostra, desejamos verificar se ela representa a população de onde foi retirada.

Eis a fórmula:

t Xsn

�� �

Onde:X = média amostralμ = parâmetro populacionals = desvio-padrão da amostran = número de elementos da amostraVamos ao exemplo Rodrigues (1993).

Verificamos que uma população bovina seja constituída de 10.000 animais, cuja média de peso seja igual a 420 kg. Retiramos dessa população uma amostra de 400 animais cujas observações sobre a média de peso apresentaram valor igual a 375 kg e desvio padrão de 23 kg. Observamos estes fatos, e neste experimento, queremos saber se a amostra representa bem a população, ou melhor, se haverá diferença significativa entre a média da amostra e da população.

Page 126: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

116

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

t Xsn

��

��

��

��

� ��� ,375 420

23

400

45

23

20

900

2339 13

t = -39,13 (P<0,01)

Este valor acima, confrontado com os valores da tabela, para n=1 grau de liberdade, com 1,96 (5%) e 2,58 (1%), possibilita concluirmos que o valor calculado é significativo no nível de 1%nde probabilidade (P<0,01), sendo assim, a amostra não representa bem a população, pois a média aritmética se diferencia da média populacional (RODRIGUES, 1993).

5 COMPARAÇÃO DE DUAS PROPORÇÕES“Quando desejamos comparar duas proporções, podemos testar uma

hipótese nula de diferença estatística não significativa contra uma hipótese alternativa de diferença estatística entre eles” (RODRIGUES, 1993, 1993).

Para isso, utilizamos o valor de Z, em que:

Z p pp qn

p qn

��

1 2

1 1

1

2 2

2

Onde:p1 e p2 = frequências relativas das duas amostras comparadas, e nestas

condições elas devem ser independentes.n1 e n2 = número de observações em cada amostraq1 = 1 – p1q2 = 1 – p2

Vamos ao exemplo (RODRIGUES, 1993):

Numa pesquisa de laboratório demonstrou que a droga A administrada a 50 animais provocou a morte de 26 deles, enquanto a droga B dada a 80 animais permitiu que 48 animais sobrevivessem.

Pergunto:Há diferença significativa entre as duas drogas?H0;p1 = p2; Ha:p1≠p2

Page 127: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 3 | TESTES DE HIPÓTESE

117

Então temos:

p1

26

500 52= = ,

q11 0 52 0 48� � �, ,

n1 = 50

p2

32

800 40= = ,

q11 0 40 0 60� � �, ,

n2= 80

E, portanto, com a fórmula de Z, temos:

Z p pp qn

p qn

��

��

� �� ��� �� �

1 2

1 1

1

2 2

2

0 52 0 40

0 52 0 48

50

0 40 0 60

8

, ,

, , , ,

00

0 12

0 00799

0 12

0 0891 34� � ��

,

,

,

,,

Z = 1,34

Com este resultado conclui-se que não houve diferença estatística significativa entre as duas drogas. Aceita-se H0, pois o valor de Z encontra-se na área de aceitação (RODRIGUES, 1993).

Page 128: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

118

Neste tópico vimos:

• Hipótese é uma suposição formulada a respeito dos parâmetros de uma distribuição de probabilidade de uma ou mais populações.

• Vimos os testes de quiquadrado, teste t e comparação de duas proporções, sendo estes os mais usados.

• O teste quiquadrado mede a variação quando temos amostras com frequências observadas, e baseadas na teoria, podemos calcular as frequências esperadas.

• O teste t, serve para a verificação de diferenças significativas entre médias, quando temos apenas dois tratamentos.

• Para verificar a comparação de duas proporções, podemos testar uma hipótese nula de diferença estatística não significativa contra uma hipótese alternativa de diferença estatística entre eles.

RESUMO DO TÓPICO 3

Page 129: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

119

AUTOATIVIDADE

1 Vamos reforçar os conhecimentos.

Nº de coletas AMOSTRA 01 (ml) AMOSTRA 02 (ml) AMOSTRA 03 (ml)

1 456 356 608

2 235 535 407

3 801 614 504

4 145 234 401

5 239 335 327

6 112 485 366

7 298 234 715

8 203 555 617

9 314 399 802

10 158 222 433

11 203 409 344

Como já vimos, a hipótese é uma suposição formulada a respeito dos parâmetros de uma distribuição de probabilidade de uma ou mais populações, certo, de acordo com as amostras coletadas abaixo, respondam se entre elas há diferenças estatísticas.

Page 130: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

120

ANEXOS

FONTE: Disponível em: <http://www.amendes.uac.pt/monograf/monograf01estatNparamt.pdf>. Acesso em: 10 maio 2015.

Nível do Significância para D – máx|F₀ (x) – Sn (x)|

0,20 0,15 0,10 0,05 0,0112345

678910

1112131415

1617181920

253035

Mais de 35

0,9000,6840,5650,4940,446

0,4100,3810,3580,3390,332

0,3070,2950,2840,2740,266

0,2580,2500,2440,2370,231

0,210,190,18

0,9250,7260,5970,5250,474

0,4360,4050,3810,3600,342

0,3260,3130,3020,3920,283

0,2740,2660,2590,2520,246

0,220,200,19

0,9500,7760,6420,5640,510

0,4700,4380,4110,3880,368

0,3520,3380,3250,3140,304

0,2950,2860,2780,2720,264

0,240,220,21

0,9750,8420,7080,6240,565

0,5210,4860,4570,4320,410

0,3910,3750,3610,3490,338

0,3280,3180,3090,3010,294

0,270,240,23

0,9950,9290,8280,7330,669

0,6180,5770,5430,5140,490

0,4680,4500,4330,4180,404

0,3920,3810,3710,3630,356

0,320,290,27

1,65N N N N N

1,14 1,22 1,36 0,63√ √ √ √ √

Page 131: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

121

Tabela Qui-quadrado

FONTE: Disponível em: <http://pt.slideshare.net/pcasquilho/tabela-qui-quadrado-2012>.Acesso em: 10 maio 2015.

n/F1 – α

0,005 0,010 0,025 0,050 0,100 0,250 0,500 0,750 0,900 0,950 0,975 0,990 0,995

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556

0,0000,0100,0720,2070,4120,6760,9891,3441,7352,1562,6033,0743,5554,0754,6015,1425,6976,2656,8447,4348,0348,6439,2609,88610,52011,16011,80812,45113,12113,78714,45815,13415,81516,50117,19217,88718,58619,28919,99620,70721,42122,13822,85923,58424,31125,04125,77526,51127,24927,99128,73529,48130,23030,98131,73532,490

0,0000,0200,1150,2970,5540,8721,2391,6452,0882,5583,0533,5714,1074,6605,2295,8126,4087,0157,6338,2608,8979,54210,19510,85511,52412,19812,87913,56514,25614,95315,65516,36217,07417,78918,50919,23319,96020,69121,42622,14622,90523,65024,39825,14825,90126,65727,41628,11728,94129,70730,47531,24532,01832,79333,57034,350

0,0010,0510,2160,4840,8311,2371,6902,1802,7003,2473,8164,4045,0095,6296,2626,9087,5548,2318,9079,59110,28310,98211,68912,40113,12013,84414,57315,30816,04716,79117,53918,29119,04719,80620,56921,33622,10622,87823,65424,43325,21525,99926,78527,57528,35629,16029,95630,75531,55532,35733,16233,95834,77635,58635,39837,212

0,0040,1030,3520,7111,1451,6352,1672,7333,3253,9404,5755,2265,8926,5717,2617,9628,6729,39010,11710,85111,95112,33813,09113,84814,61115,37916,15116,92817,70818,49319,28120,07220,86721,66422,45523,25924,07524,88425,69529,05127,32628,14428,95529,78730,61231,43932,26833,09833,93034,76435,60036,43737,27638,11638,95839,801

0,0160,2110,5841,0641,6102,2042,8333,4904,1684,8655,5786,3047,0427,7908,5479,31210,08510,86511,65112,44313,24014,04114,84815,65916,47317,29218,11418,93919,76820,59921,43422,27123,11023,95224,79725,64326,49227,34328,19529,05129,90730,76531,62532,48733,35034,21535,08135,94936,81837,68938,56039,43340,30841,18342,06042,937

0,1020,5751,2131,9232,5753,4554,2555,0715,8996,7377,5848,4389,29910,16511,03711,91212,79213,67514,56215,45216,34417,24018,13719,03719,93920,84321,74922,65723,56724,47825,39026,30427,21628,13629,05429,97330,89331,81532,73733,66034,58535,51036,43637,36338,29139,22040,14941,07942,01042,94243,87444,80845,74146,67647,61048,546

0,4551,3862,3663,3574,3515,3486,3467,3448,3439,34210,34111,34012,34013,33914,33915,33816,33817,33818,33819,33720,33721,33722,33723,33724,33725,33626,33627,33628,33629,33630,33631,33632,33633,33634,33635,33636,33637,33538,33539,33540,33541,33542,33543,33544,33545,33546,33547,33548,33549,33550,33551,33552,33553,33554,33555,335

1,3232,7734,1085,3856,6257,8419,03710,21911,38912,54913,70114,84515,98417,11718,24519,36920,48921,60522,71823,82824,93526,03927,14128,24129,33930,43531,52832,62033,71134,80035,88736,97338,05839,14140,22341,30442,38343,46244,53945,61646,69247,76648,84049,91350,98552,05653,12754,19655,26556,33457,40158,45859,53460,60061,66562,726

2,7054,6056,2517,7799,23510,64512,01713,36214,68415,98717,27518,54919,81221,06422,30723,54224,76925,98927,20428,41229,61530,81332,00733,19534,38235,56336,74137,91639,08740,25641,42242,58543,74544,90346,05947,21248,36349,51350,66051,80552,94954,09055,23056,36957,50558,64159,77460,90762,03863,16764,29565,42266,54867,67368,79569,919

3,8415,9917,8159,48811,07012,59214,06715,50716,91918,30719,67521,02622,35223,68524,99626,29627,58728,86930,14431,41032,67133,92435,17236,41537,65238,88540,11341,33742,55743,77344,98546,19447,40048,60249,80250,99852,19253,38454,57255,75856,94258,12459,30460,48161,65662,83064,00165,17166,33967,50568,66969,83270,99372,15373,31174,468

5,0247,3789,34811,14312,83314,44916,01317,53519,02320,48321,92023,33724,73626,11927,48828,84530,19131,52632,85234,17035,47936,78138,07639,36440,64641,92343,19544,46145,72246,97948,23249,48050,72551,95653,20354,43755,66856,89658,12059,34260,56161,77762,99064,20165,41066,61767,82169,02370,22271,42072,61673,81075,00276,19277,38078,567

6,6359,21011,34513,27715,08516,81218,47520,09021,66523,20927,72526,21727,66829,14130,57832,00033,40934,80535,19137,56539,93240,28941,63842,98044,31445,64246,96348,27849,58850,89252,19153,48554,77656,06157,34258,61959,89361,16262,48263,69164,95066,20567,54968,71069,95771,20172,44373,68374,91976,15477,38578,61679,84381,06982,29283,513

7,87910,59712,83814,85016,75018,54820,27821,95523,58925,18826,75728,30029,81931,31932,80134,26735,71837,15638,58239,99741,40142,79644,18145,55946,92848,29049,64550,99352,33653,67255,00356,32857,64858,96460,27561,58162,88364,18165,47666,76668,05369,33670,61671,89373,16674,43775,70476,95978,23179,49080,74782,00183,25384,50285,74986,994

Distribuição de Qui-QuadradoValores da Função de Distribuição

F(ϰ) = ∫n

( )2

(n-2)

n n

-12

2 2

2eSe X - ϰ² então P (X ≤ ϰ) = 1 - αSe X - ϰ² então P (X ≤ 11,07) = 0,95(5)

(5)ϰ²₀,₉₅ = 11,070

0,00

0,05

0,10

0,15

0,20

5 10 15 20 25

Page 132: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

122

Tabela T

FONTE: Disponível em: <http://paginapessoal.utfpr.edu.br/lcandido/tabelas-estatistica/t_student.pdf/at_download/file> Acesso em: 15 jun. 2015.

Page 133: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

123

Tabela Z

Áreas sob a curva normal padrão. Para os valores negativos de z as áreas são obtidas por simetrias.

z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0 0 0,004 0,008 0,012 0,016 0,0199 0,0239 0,0279 0,0319 0,0359

0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,2 0,0793 0,0832 0,0871 0,091 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,148 0,1517

0,4 0,1554 0,1591 0,1628 0,1664 0,17 0,1736 0,1772 0,1808 0,1844 0,1879

0,5 0,1915 0,195 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,219 0,2224

0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,7 0,258 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852

0,8 0,2881 0,291 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,334 0,3365 0,3389

1 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,377 0,379 0,381 0,383

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,398 0,3997 0,4015

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,5 0,4332 0,4345 0,4357 0,437 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,475 0,4756 0,4761 0,4767

2 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,1 0,4821 0,4826 0,483 0,4834 0,4838 0,4842 0,4846 0,485 0,4854 0,4857

2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,489

2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,4 0,4918 0,492 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

Page 134: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

124

2,5 0,4938 0,494 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,496 0,4961 0,4962 0,4963 0,4964

2,7 0,4965 0,4965 0,4967 0,4968 0,4969 0,497 0,4971 0,4972 0,4973 0,4974

2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,498 0,4981

2,9 0,4981 0,4982 0,4982 0,4983 0,4983 0,4984 0,4985 0,4985 0,4986 0,4986

3 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,499 0,499

3,1 0,499 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993

3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995

3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997

3,49 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998

3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,9 0,5

FONTE: Disponível em: <http://www.cultura.ufpa.br/dicas/biome/biotaz.htm>. Acesso em: 15 jun. 2015.

Page 135: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

125

TÓPICO 4

TESTES NÃO PARAMÉTRICOS

UNIDADE 2

1 INTRODUÇÃONeste tópico você irá ver alguns testes não paramétricos adotados no

meio científico. Tais testes são utilizados quando não há uma normalidade dos dados que foram levantados no experimento.

Viali (2008, p. 4) ainda cita que: “Em geral, as probabilidades das afirmativas obtidas na maioria dos testes não paramétricos são exatas, salvo quando se usam aproximações para grandes amostras. Independem da forma da população da qual a amostra foi obtida. São, em geral, de mais fácil aplicação, e exigem, quase sempre, menor volume de cálculos. Existem testes não paramétricos que nos permitem trabalhar com dados de diferentes populações, o que não é possível com os paramétricos. São úteis nos casos em que é difícil estabelecer uma escala de valores quantitativos para os dados. O pesquisador pode apenas dizer que um dado tem mais ou menos da característica que está sendo analisada, sem poder precisar ou quantificar as diferenças. Os dados se encontram numa certa ordem de classificação: mais ou menos; melhor ou pior; maior ou menor etc. São mais eficientes do que os paramétricos, quando os dados da população não têm uma distribuição normal. E quando a população é normalmente distribuída, sua eficiência, em alguns casos, é levemente inferior à dos concorrentes”.

2 TESTE U MANN-WHITEYEste teste corresponde a uma alternativa para a comparação de duas

amostras, os números naturais são classificados num conjunto de valores observados. Assim, o posto de um valor de um conjunto de n valores corresponde a um número natural que indicará a sua posição no conjunto anteriormente ordenado, quando ocorre a presença de valores iguais no conjunto, nós consideramos um ponto médio, não afetando assim o posto seguinte. Um exemplo, num conjunto de seis valores já ordenados 7 – 12 – 18 – 18 – 19 – 23, os postos serão 1 – 2 – 3,5 – 3,5 – 5 e 6, respectivamente (RODRIGUES, 2002).

Page 136: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

126

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

A aplicação do teste baseia-se na aplicação no cálculo de V1 eV2:

U n nn n

T1 1 2

1 1

1

1

2� �

�� ��.

E

U n nn n

T2 1 2

2 2

2

1

2� �

�� ��.

Onde:n1 e n2 = os tamanhos das duas amostras de T1 e T2T1 e T2 = correspondem às somas dos pontos atribuídos aos valores das

duas amostras.

Nas fórmulas, vocês irão observar que em algumas expressões; o sinal ponto (.), outras vezes o X (xis), e algumas não há nenhum sinal atribuído a multiplicação, atendem a isso.

ATENCAO

Para comparação de amostras com n1 e n2 maiores que sete, o teste pode ser aplicado por aproximação normal (RODRIGUES, 2002).

Tendo as seguintes fórmulas:

u u n n� � � 1 2

2

.

E

� un n n n� � � � �� �1 2 1 2

1

12

.

Neste caso, a expressão do teste será:

ZU u u

u�

� � �� �

1

Page 137: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 4 | TESTES NÃO PARAMÉTRICOS

127

Vamos ao exemplo Rodrigues (2002).

Num determinado experimento, vamos verificar se os dados das duas amostras apresentam diferenças significativas.

Amostra A Amostra B

Dados Postos Dados Postos

2,6 (9,5) 2,3 (5)

2,9 (13) 2,8 (12)

2,5 (8) 2,0 (2)

2,7 (11) 1,8 (1)

3,2 (14) 2,4 (7)

2,6 (9,5) 2,3 (5)

2,3 (5) 2,2 (3)

3,3 (15)

T1=85,0 T2=35,0

Primeiro Passo: ordenação dos valores para a obtenção dos seus postos e posterior somatório, já demostrado no quadro acima.

Temos então: n1 = 8n2= 7T1= 85T2= 35Após isso, primeiramente iremos calcular os seguintes valores:

u u n n� � � � �1 2

2

8 7

228

. �.�. 7

� un n n n� � � � �� �

� � � �1 2 1 21

12

8 7 16

12

896

1274 66 8 63

. �.�.��� , ,

. 7 . 16 89612

Page 138: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

128

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

O teste pode ser aplicado tanto para U1 ou U2, pois ambos são simétricos em relação à média 28 (RODRIGUES, 2002).

Então:

U n nn n

T1 1 2

1 1

1

1

28 7

8 9

285 7� �

�� �� � � � �. �.�

�.�. 7. 9

Sendo assim, o valor de Z será:

ZU u u

u�

� � �� �

��

� �1 7 28

8 632 43

��,

,

Como o valor de | Z | absoluto é maior do que Zα, quando α=0,05, ou seja, o valor de 1,96, rejeitamos H0. Como conclusão final, as amostras diferem entre si no nível de 5% de significância (RODRIGUES, 2002).

3 TESTE T DE WILCOXONEste teste avalia a grandeza das diferenças observadas quando comparados

postos de observação, quando isto ocorre, atribui-se maior valor para a maior diferença encontrada, diminuindo este valor de acordo com as menores diferenças existentes (RODRIGUES, 2002).

Ainda segundo Rodrigues (2002), como os demais testes não paramétricos, são utilizados os números naturais 1,2,3...n para representar os valores decorrentes das diferenças observadas, para este teste se tivermos um conjunto de diferenças do tipo: 7,4,2,9,13; estes receberão uma numeração de acordo com sua grandeza: 7(3),4(2),2(1),9(4),13(5). Observando que os números entre parênteses são os números naturais, e que esta é a forma ponderada comumente utilizada nos testes não paramétricos.

Por exemplo, se tivermos um experimento em que pares de indivíduos são comparados, vamos utilizar o seguinte procedimento (RODRIGUES, 2002):

Page 139: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 4 | TESTES NÃO PARAMÉTRICOS

129

Tratamento

A B Diferenças

12 9 3 (3,5)

8 4 4 (5)

7 5 2 (2)

6 6 0 (1)

9 6 3 (3,5)

10 5 5 (6)

9 3 6 (7)

Ainda, segundo Rodrigues (2002, p. 124), “na ordenação dos valores de diferenças observa-se o uso da ponderação, ou seja, menores valores com números mais baixos e, consequentemente, os valores mais altos com numeração mais alta. Percebe-se que há sete diferenças, sendo utilizados os primeiros sete números naturais. Em dois valores de diferenças, com igual grandeza, os mesmos receberam pontuação igual”.

3.1 PEQUENAS AMOSTRAS

Segundo Rodrigues (2002), a aplicação deste teste se dá quando as duas amostras sejam casualizadas e independentes, e que as variáveis em confronto sejam contínuas.

Ainda segundo Rodrigues 2002, sua metodologia consiste em proceder à ordenação dos valores das amostras, depois, atribuir aos mesmos a pontuação dos números naturais, em seguida, obter o somatório dos números naturais, atribuídos aos valores da amostra de menor tamanho, consultando a tabela do referido teste.

Vamos ao exemplo Rodrigues (2002, p. 125).

Em um laboratório foi realizado um ensaio clínico em que foram utilizadas duas drogas A e B. Com a droga A foram tratados oito pacientes e com a droga B, cinco. Os níveis de anticorpos correspondem a:

Page 140: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

130

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

Grupo A Grupo B

7,4 – 12,3 – 11,8 – 16,4 – 1,9 – 3,0 – 6,8 – 20,4 9,1 – 0,7 – 19,2 – 2,4 – 17,5

Levando em consideração a explicação acima, primeiramente vamos ordenar todos os valores para então proceder à classificação conjunta, atribuindo-se os valores naturais a cada um (RODRIGUES, 2002).

Temos assim:

Observa-se que alguns valores estão sublinhados, estes correspondem aos elementos da menor amostra. Se somarmos os valores naturais atribuídos a estes valores temos: 1+3+7+11+12=34. (RODRIGUES, 2002).

Quando consultamos a Tabela de Wilcoxon, e de acordo com o resultado obtido W=34, verifica-se que P(W=34)=0,473.

Podemos assim afirmar que aceitamos H0, que o valores referentes às drogas A e B, apresentam diferenças não significativas. Concluindo assim, que os níveis de anticorpos em relação aos dois tipos de drogas se comportaram de forma semelhante (RODRIGO, 2002).

0,7 1,9 2,4 3,0 6,8 7,4 9,1 11,8 12,3 16,4 17,5 19,2 20,4

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13)

3.2 GRANDES AMOSTRAS

Nesses casos, estas amostras apresentam valores com distribuição normal e portanto, a comparação das medidas será realizada através de determinação de um valor W (RODRIGUES, 2002).

Ainda, segundo Rodrigues (2002, p. 126), “são enunciadas naturalmente as hipóteses nula e alternativa. Será rejeitada a hipótese nula se o valor de Wx for maior ou igual a Zα, onde Zα é o limite superior da distribuição normal no nível de α de significância, sendo = 1,96% para 5% e Z= 2,58 para 1%...”.

A fórmula utilizada é:

WW

n m n

m n m n* �

�� �� �

� �� �

1

2

1

12

.

Page 141: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 4 | TESTES NÃO PARAMÉTRICOS

131

Em que: W= somatório de pontos atribuídos aos valores da menor amostran= número de elementos da menor amostram= número de elementos da maior amostraVamos ao exemplo (RODRIGUES, 2002).

Num experimento, uma dieta é aplicada a 23 atletas durante um período experimental. Posteriormente são formados dois grupos, sendo que um deles permanece com a mesma dieta. Verificando o ganho de peso ao final do ensaio, observam-se os seguintes dados:

Grupo Dieta Total (m=12) Grupo dieta Parcial (n=11)

6,0 (22) 0,2 (1)

0,8 (4) 0,9 (5)

5,4 (21) 2,3 (14)

5,3 (20) 2,9 (16)

4,9 (19) 3,0 (17)

0,4 (2) 1,9 (11)

7,3 (23) 1,7 (10)

2,4 (15) 1,0 (6)

3,7 (18) 1,2 (8)

1,4 (9) 2,0 (12)

1,1 (7) 2,2 (13) W=113

Primeiramente inicia-se uma análise fazendo-se a classificação conjunta dos 23 elementos, utilizando os números naturais, conforme exposto acima.

Segundo, obtém-se o somatório de pontos atribuídos aos valores da menor amostra (dieta parcial), o que corresponde a W=113.

n=11m=12Vamos ao cálculo:

Page 142: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

132

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

Considerando que o valor de W*=-1,17 é menor do que o valor de Z5%=1,96, aceitamos H0, concluindo assim, que os valores dos dois conjuntos apresentam diferença não significativa.

4 TESTE DE KRUSKAL-WALLISSegundo Rodrigues (2002), este teste é utilizado para que se verifique o

contraste entre k amostras independentes, os valores obtidos nas diversas amostras diferem entre si, e portanto, será uma maneira de verificar se estas diferenças são devidas ao acaso ou se amostras provêm de populações diferentes. Neste teste, todas as N observações recebem uma pontuação através dos números naturais 1,2,3...n, assim, ao menor valor se dará pelo número 1, e assim sucessivamente até o maior valor, que receberá a maior pontuação. Serão consideradas as hipóteses nula (H0) e alternativa (Ha).

Eis a fórmula adotada:

HN N n

Ni

Ki

i

��� �

� �� ���12

13 1

1

2

.R

Onde:Ri : é a soma das ordens atribuídas ao tratamento i.K: corresponde ao número de tratamentos a comparar.ni:o número de observações em cada tratamento K.N: o total de observações em todos os tratamentos K.

WW

n m n

m n m n* �

�� �� �

� �� ��

�� �� �

1

2

1

12

11311 12 11 1

2

11 12 24

12

. �.� �.�. 12 . 24

W * ��

��

��

� �113

11 24

2

264

113 132

16 2

19

16 21 17

�.�

, ,,

11 . 24

W* = -1,17

Page 143: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 4 | TESTES NÃO PARAMÉTRICOS

133

Ainda, segundo Rodrigues (2002), na ordenação global que se faz para atribuição dos pontos, considera-se que nos casos de empate entre duas ou mais observações será procedida à média das ordens que seriam atribuídas a elas se não houvesse o empate. Para a verificação de significância, quanto as diferenças observadas entre tratamentos K, Rodrigues (2002) cita que se considere que o teste tem uma distribuição aproximada de χ2(quiquadrado) com K-1 graus de liberdade.

Vamos ao exemplo Rodrigues (2002).

Num experimento, vamos analisar o tempo de sobrevida, em meses, de pacientes atendidos na clínica de abdômen do hospital X, na cidade de Cabrobó.

Radioterapia (n=7) Quimioterapia (n=8) Cirurgia (n=8)

17 (11)0 20 (12) 32 (17)

14 (9) 5 (3) 35 (20)

4 (2) 9 (6) 26 (15)

8 (5) 13 (8) 34 (18,5)

29 (16) 34 (18,5) 21 (13)

6 (4) 2 (1) 45 (21)

15 (10) 11 (7) 50 (23)

22 (14) 47 (22)

Vamos aos questionamentos.

Há diferença significativa entre os tempos de sobrevida? Qual é o tratamento recomendado baseado no tempo de sobrevida?

Primeiro passo: identificar os somatórios dos pontos em cada tratamento, dessa forma temos:

R1= 57,0R2= 69,5R3= 149,5

Então, com todos os dados em mãos, vamos à fórmula:

Page 144: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

134

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

O teste de Kruskal-Wallis segue a distribuição do teste de quiquadrado (RODRIGUES, 2002).

G.L= k-1=3-1=2

Os valores da tabela de X2 correspondem:

g.l. 5% 1%

2 5,99 9,21

Observando que o valor de H=11,95, e este é maior do que os valores da tabela, concluímos pela rejeição de H0 e, consequentemente, pela indicação de que o tratamento cirúrgico se destaca dos demais, pois apresenta maiores valores quanto ao tempo de sobrevida (RODRIGUES, 2002).

5 TESTE EXATO DE FISHERQuando seus dados no seu experimento apresentarem uma tabela

de contingência com formato 2x2, com pequeno número de observações, e consequentemente, com frequências observadas em cada casa muito baixa, a literatura apresenta a utilização do teste exato de Fisher, no qual estimamos a partir da menor frequência contida da tabela, a probabilidade de ocorrência desse

valor e de uma frequência menor ainda, fazendo-se a comparação p pii

n� �� 0

, em que n é a menor frequência verificada na tabela (RODRIGUES, 2002.)

De acordo com Rodrigues (2002, p. 123), “Numa tabela de contingência de 2x2, com totais marginais fixos, as frequências observadas têm distribuição hipergeométrica considerando a seguinte tabela:

Hx

x� � ����

����

12

23 24

3249

7

4830 25

8

22350 25

83 24.

. ,

H =11 95,

HN N n

Ni

Ki

i

��� �

� �� � ��� �

� ���12

13 1

12

23 23 1

57

7

69 5

8

149 5

1

2 2 2

. � ., ,R

22

83 23 1

��

�� � �� �

H x� � �� �� � � �� �12

46464 14 603 78 2793 78 3 24

1

463 861 70 72 83. , , , � . . , ,995 72�

Page 145: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 4 | TESTES NÃO PARAMÉTRICOS

135

Fator I II Total

A a b a+b

B c d c+d

Total a+c b+d N

A probabilidade de ocorrência de observações na classe (B,II), é dada por:

P x da b c d b d

N a b c d�� � � �� � �� � �� �! ! !

! ! ! ! !

Vamos ao exemplo de Rodrigues (2002).

Realizamos um experimento onde há dois tratamentos contra o vírus da AIDS versus a mortalidade.

Tipo de tratamento

MortalidadeTotal

Sim Não

A 7 5 12

B 1 9 10

Total 8 14 22

p pii

n� �� 0

, sendo que para o cálculo de p, com i variando de 0 a 1, temos:p=1.

Pa b c d b d

N a b c d1

12 10 8 14

22 7 5 1 90 0�

�� � �� � �� �� �

! ! !

! ! ! ! !

! ! ! !

! ! ! ! !, 224

Agora modificando o p=0, temos outra tabela:

Tipo de tratamento

MortalidadeTotal

Sim Não

A 8 4 12

B 0 10 10

Total 8 14 22

Page 146: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

136

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

Pa b c d b d

N a b c d0

12 10 8 14

22 0 10 8 40�

�� � �� � �� �� �

! ! !

! ! ! ! !

! ! ! !

! ! ! ! !,00015

Resolução:

O valor de p será 0,024 + 0,0015 = 0,0255

Como este p é menor que o nível de significância, para α=0,05 a decisão correta será rejeitar H0 e aceitar Ha. Conclui-se então que há diferença quanto à mortalidade em relação ao tipo de tratamento, sendo B mais eficaz (RODRIGUES, 2002).

6 TESTE DE FRIEDMANSegundo Motta e Wagner (2003, p. 180), (teste de Friedman, ou também

chamado de prova de Friedman), “... a dupla análise de variância por postos – o χ 2

de Friedman ( χ p2 ) – é a aproximação não paramétrica que permite a

comparação de dados resultantes numa mesma amostra, em dois momentos distintos (na forma antes e depois)”.

Eis a fórmula:

� p NK KR N K2

1

212

13 1�

�� � � � � �� �£ £

Onde:K= número de tratamentos (número de condições em que foram realizadas

as mensurações)N= tamanho da amostra∑R1= soma dos postos relativos a um particular tratamento

Ainda, segundo Motta e Wagner (2003), o emprego da dupla análise da variância dos postos, necessita que os seguintes requisitos sejam satisfeitos:

• Comparação de dados de uma mesma amostra mensurada sob duas ou mais condições (ou, então, que os membros de duas ou mais amostras tenham sido aglutinados em função de variáveis específicas);

• Dados ordinais - para que aos dados possam ser atribuídos postos;

• O tamanho da amostra não deve ser pequeno. O tamanho mínimo de N depende do número de tratamentos (K) aos quais a amostra é exposta. Por exemplo: N deve ser igual ou maior que 10 quando K=3; já com K=4, N≥5.

Page 147: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 4 | TESTES NÃO PARAMÉTRICOS

137

Vamos ao exemplo de Rodrigues (2002, p. 132):

Num experimento são prescritos quatro procedimentos técnicos para a determinação de certa variável. Foram formados cinco blocos e obtidos os seguintes valores:

TRATAMENTOS

A B C D

12,00 (2) 13,00 (3) 16,00 (4) 07,00 (1)

08,00 (2) 09,00 (3) 12,00 (4) 05,00 (1)

14,00 (2) 20,00 (3) 22,00 (4) 06,00 (1)

17,00 (3) 16,00 (2) 21,00 (4) 11,00 (1)

12,00 (2) 15,00 (3) 16,00 (4) 10,00 (1)

Primeiramente procede-se à ordenação dos valores, em cada bloco, para a obtenção dos valores de Ri:

R1= 11,00R2=14,00R3=20,00R4= 5

Colocando os valores na fórmula, fica:

� p NK KR N K2

1

212

13 1�

�� � � � � �� �£ £

� p2 2 2 2 212

5 4 4 111 14 20 5 3 5 4 1�

�� �� � ��� �� � �� �

..

� p2 12

100121 196 400 25 3 5 5

12

100742 75 89 04 75 14� � � �� �� � � �� � � �. . , ,004

Como o valor de graus de liberdade é igual a K-1 graus de liberdade e sendo K=4, tem-se três graus de liberdade> Para três graus de liberdade os valores do teste χ 2

correspondem a:

Page 148: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

138

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

Graus de liberdades 5% 1%

. . .

. . .

. . .

3 7,82 11,34

Concluindo: sendo o valor encontrado na análise igual a 14,04, maior do que os valores da tabela de χ 2

, verifica-se que há diferença significativa entre as medidas dos tratamentos, rejeitando H0 e optando-se pela hipótese alterantiva (Ha). Então, o tratamento C apresentou melhores resultados em relação aos demais grupos (RODRIGUES, 2002).

7 TESTE DE MCNEMARDe acordo com Motta e Wagner (2003), este teste é uma alternativa para

o teste quiquadrado para amostras dependentes (pareadas). Sendo empregado quando é realizado um pareamento indivíduo a indivíduo entre os membros de duas amostras ou quando o indivíduo é controle de si mesmo.

Eis a fórmula:

�c McNemarb cb c,�

�� �� ��

12

Mc Nemar

Vamos ao exemplo (VIALI, 2008, p. 13).

Um psicólogo infantil está interessado em observar a iniciação de contatos sociais em crianças. Ele observou que crianças que são novas em uma escola maternal estabelecem contatos interpessoais com adultos ao invés de com outras crianças. Ele prevê que à medida que se familiarizam com o ambiente as crianças estabelecem contatos interpessoais com outras crianças ao invés de com adultos. Para testar esta hipótese ele observa 25 crianças nos seus primeiros dias em uma escola maternal e então categoriza suas primeiras iniciações de contatos sociais em: se foi dirigido a um adulto ou se foi dirigido a outra criança. Ele, então, observa cada uma das 25 crianças depois de elas estarem na escola por um mês, fazendo a mesma classificação.

Page 149: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 4 | TESTES NÃO PARAMÉTRICOS

139

FONTE: VIALI (2008, p. 13).

Hipóteses:

• Ho: Para aquelas crianças que mudam, a probabilidade de que uma criança mude o seu objeto de iniciação de um adulto para criança (isto é, PA) é igual a probabilidade que ela mude seu objeto de iniciação de criança para adulto (isto é, PB) e é igual a 50%, ou seja: PA = PB = 1/2.

• H1: PA > PB Prova Estatística. Prova de McNemar para a significância de mudanças porque o estudo utiliza duas amostras relacionadas e utiliza mensuração nominal.

• Nível de significância. Sejam α = 0,05 e n = 25, o número de crianças observadas no primeiro e no trigésimo dia na escola maternal. Distribuição amostral.

• Quiquadrado com 1 grau de liberdade. Região de Rejeição. Consiste de todos os valores da distribuição χ2 obtidos dos dados tal que a probabilidade de ocorrência de um valor mais extremo é menor que 0,05. Decisão. Os dados hipotéticos do exemplo estão mostrados na tabela acima. De acordo com eles o valor de quiquadrado calculado é:

�c McNemarb cb c,�

�� �� ��

12

Mc Nemar

�c McNemar,�,�

� �� ��

�14 4 1

14 44 50

2

Mc Nemar

Uma consulta à tabela mostra que o valor da distribuição quiquadrado com “um” grau de liberdade e com probabilidade de 5% é 3,84. Como o valor calculado é maior do que o valor tabelado rejeita-se H0, isto é, pode-se afirmar que as crianças apresentam tendência significativa para mudar o objeto de seu interesse, de adulto para outra criança, após 30 dias de frequência à escola maternal. (VIALI, p. 13, 2008).

Page 150: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

140

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

8 COEFICIENTE DE CORRELAÇÃO DE SPEARMAN (Rs)Motta e Wagner (2003) descrevem que este teste é o substituto do

coeficiente de Pearson e é empregado sempre que as variáveis quantitativas não satisfizerem as exigências (distribuição bivariada normal e homocedascidade – igual (homo) dispersão (scedasticidade).

Eis a fórmula:

r dn ns � ��

16

2

3

£

Ainda segundo Motta e Wagner (2003, p. 179), “a magnitude do coeficiente de Spearman, indica correlação entre postos e não entre valores medidos e varia entre -1 (correlação perfeita negativa e +1 (correlação perfeita positiva), passando pelo valor 0 (ausência de correlação) sendo interpretada, portanto, do mesmo modo que o coeficiente de correlação de Pearson (r).

Vamos ao exemplo (VIALI, 2008):

Em um estudo sobre o efeito das pressões grupais sobre um indivíduo para uma atitude conformista em uma situação que envolva risco monetário, os pesquisadores aplicaram a 12 estudantes universitários a escala F (medida de autoritarismo) e uma escala destinada a medir as aspirações de status social. Desejava-se uma informação sobre a correlação entre os escores relativos ao autoritarismo e os escores referentes às aspirações de status social. (Tais aspirações foram definidas de acordo com os pontos de vista “O indivíduo não deve casar-se com pessoa de nível social inferior ao seu”, ou “Para um encontro, é melhor uma demonstração equestre do que um jogo de baseball”, ou ainda, “É interessante verificar sua genealogia”. A tabela 9 fornece os escores de cada um dos 12 estudantes nas duas escalas.

Page 151: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 4 | TESTES NÃO PARAMÉTRICOS

141

FONTE: VIALI (2008, p. 37)

Para calcular o coeficiente de correlação por postos, de Spearman, para estes dois conjuntos de valores é necessário colocá-los, inicialmente em duas séries de postos. Estes postos são apresentados na tabela 10, juntamente com as diferenças entre eles e as diferenças ao quadrado. Através destes dados então, pode-se calcular o coeficiente de correlação rs, através da expressão mostrada acima. Assim:

FONTE: VIALI (2008, p. 37)

Page 152: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

142

UNIDADE 2 | MEDIDAS ESTATÍSTICAS

Através destes dados, então, pode-se calcular o coeficiente de correlação rs, através da expressão mostrada acima. Assim:

r dn ns � ��

� ��

�16

16 52

12 120 82

2

3 3

£ .,

r dn ns � ��

16

2

3

£∑

Page 153: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

143

Neste tópico você viu que:

• O teste de U Mann-Whitey corresponde a uma alternativa para a comparação de duas amostras, os números naturais são classificados num conjunto de valores observados. Assim, o posto de um valor de um conjunto de n valores corresponde a um número natural que indicará a sua posição no conjunto anteriormente ordenado.

• Teste de T Wilcoxon, avalia a grandeza das diferenças observadas quando comparados postos de observação.

• Teste de Kruskal-Wallis, é utilizado para que se verifique o contraste entre k amostras independentes.

• Teste exato de Fisher, no qual estimamos a partir da menor frequência contida da tabela, a probabilidade de ocorrência desse valor e de uma frequência menor ainda, fazendo-se a comparação.

• Teste de Fridman, é a dupla análise de variância por postos, que permite a comparação de dados resultantes numa mesma amostra, em dois momentos distintos.

• Teste de McNemar, empregado quando é realizado um pareamento indivíduo a indivíduo entre os membros de duas amostras ou quando o indivíduo é controle de si mesmo.

• Coeficiente de correlação de Spermann é empregado sempre que as variáveis quantitativas não satisfizerem as exigências.

RESUMO DO TÓPICO 4

Page 154: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

144

AUTOATIVIDADE

Num experimento, com 4 tratamentos, obtivemos os seguintes dados:

Rep T1 T2 T3 T4

1 8 11 15 18

2 46 40 37 47

3 6 7 5 2

4 14 45 36 25

5 1 9 4 13

6 3 0 20 10

Calcule com estes dados:

a) O teste U Mann-whitey, reponda:

- Os dois primeiros tratamentos diferem entre sim?- O terceiro tratamento com primeiro?

b) Levando em consideração oTeste de Kruskal-Wallis, essas amostras provêm de uma mesma população?

0 1 2 3 4 5 6 7 8 9 10 11 13 14 15 18 20 25 36 37 40 45 46 47

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Levando os dados para a tabela

Rep T1 Postos T2 Postos T3 Postos T4 Postos

1 8 9 11 12 15 15 18 16

2 46 23 40 21 37 20 47 24

3 6 5 7 8 5 6 2 3

4 14 14 45 22 36 19 25 18

5 1 2 9 10 4 5 13 13

6 3 4 0 1 20 17 10 11

Total postos T1 57 T2 74 T3 82 T3 85

Page 155: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

145

a)

• Os primeiros tratamentos não são diferentes estatísticamente.H0: As amostras têm distribuições idênticas Ao nível de 5% de probabilidade U = 15 P(U) = 0.350 p-valor > 0.05 H0 não rejeitada As amostras não são diferentes Para o caso n2 < 9 com n2 >= n1 U' = 21

• Para a terceira e primeira amostrasH0: As amostras têm distribuições idênticas Ao nível de 5% de probabilidade U = 12 P(U) = 0.197 p-valor > 0.05 H0 não rejeitada As amostras não são diferentes Para o caso n2 < 9 com n2 >= n1 U' = 24

b) Testes de Kruskal-Wallis

Hipótese nula (H0): Os tratamentos provêm de uma mesma população

Ao nível de 5% de probabilidade H = 1.3533 H-crit = 7,8147 p-valor > 0.05 H0 não rejeitada

Ao nível de 1% de probabilidade H = 1.3533 H-crit = 11,3449 p-valor > 0.01 H0 não rejeitada

Page 156: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

146

ANEXOS

FONTE: Disponível em: <http://www.amendes.uac.pt/monograf/monograf01estatNparamt.pdf>. Acesso em: 15 jun. 2015.

Page 157: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

147

FONTE: Disponível em: <http://www.amendes.uac.pt/monograf/monograf01estatNparamt.pdf>. Acesso em: 15 jun. 2015.

Page 158: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

148

FONTE: Disponível em: <http://www.amendes.uac.pt/monograf/monograf01estatNparamt.pdf>. Acesso em: 15 jun. 2015.

Valores Críticos de rS, coeficiente de correlação de Spearman

NNível de significância

(unilateral)0,05 0,01

4567891012141618202224262830

1,0000,9000,8290,7140,6430,6000,5640,5060,4560,4250,3990,9770,3590,3430,3290,3170,306

1,0000,9430,8930,8330,7830,7460,7120,6450,6010,5640,5340,5080,4850,4650,4480,432

Page 159: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

149

UNIDADE 3

ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES

DE QUALIDADE AMBIENTAL

OBJETIVOS DE APRENDIZAGEM

PLANO DE ESTUDOS

A partir desta unidade você será capaz de:

• reconhecer os principais métodos e índices ecológicos para tomada de decisão no que tange a resolução de problemas ecológicos;

• estudar os principais ecólogos e cientistas responsáveis pela criação dos índices ecológicos e ambientais;

• identificar os principais problemas associados à exploração dos recursos naturais utilizando índices ecológicos;

• capacitar-se tecnicamente para estudos ecológicos e de impacto ambiental;

• compreender as definições básicas dos processos de avaliação e gestão dos recursos naturais;

• entender que a utilização de índices ecológicos possui alguma instabilidade, e reconhecer essa fragilidade para proposição da adequada recuperação ambiental;

• utilizar softwares que permitem o cálculo dos índices propostos;

• interpretar resultados de relatórios ambientais.

Esta unidade está dividida em dois tópicos, sendo que ao final de cada um deles, você encontrará atividades que lhe auxiliarão na apropriação dos conhecimentos.

TÓPICO 1 – AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS

TÓPICO 2 – ÍNDICES ECOLÓGICOS

Page 160: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

150

Page 161: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

151

TÓPICO 1

AS ORIGENS DOS INDICADORES

AMBIENTAIS E ÍNDICES ECOLÓGICOS

UNIDADE 3

1 INTRODUÇÃOAté o momento vimos diversas técnicas estatísticas para serem utilizadas

em estudos ambientais. Deve-se utilizar essas técnicas para tomar decisões sobre o futuro de uma determinada área. Toda a decisão amparada pelo “achismo” pode ter graves consequências ambientais, e você, como partícipe de um movimento que visa à sustentabilidade deve estar muito atento a isso. No caso dos indicadores ambientais, eles serão fundamentais para que você decida sobre a saúde de um determinado ecossistema, e assim, ajude a preservá-lo.

A seguir veremos alguns aspectos ecológicos que derivam dos problemas ambientais enfrentados atualmente, e que estão fora da linha que vai ao encontro do desenvolvimento sustentável, onde visamos a integração das partes social, econômica e ambiental. Desta forma, esperamos sensibilizar todos vocês da importância de utilizarmos as ferramentas estatísticas e os indicadores ambientais para gerenciamento dos nossos recursos.

2 POR QUE UTILIZAR ÍNDICES DE QUALIDADE AMBIENTAL?Ao nos depararmos com ambientes completamente degradados, colocamos

em questão qual ou quais ferramentas poderíamos dispor para gerenciar esses problemas. Não importa qual bioma (mata atlântica, cerrado, restinga ou caatinga), e ainda em qual ambiente, se no mar, na terra, ou florestas. As ferramentas que dispomos para reconhecer um ambiente degradado são amplas e bem robustas. Assim, podemos adequar nossas decisões naquilo que é mais pertinente, e também aqueles métodos que nos trazem mais confiabilidade dos resultados.

Você já ouviu falar em índices de diversidade? E índices de riqueza e equitatividade? Acha que diversidade biológica é a mesma coisa que riqueza de espécies? E a similaridade, ouviu falar? Quando por exemplo comparamos uma área de proteção integral com outra. Normalmente, os resultados gerados por todos esses índices nos mostram o quanto uma determinada área está degradada ou ainda se está saudável do ponto de vista biológico. Como exemplo, podemos

Page 162: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

152

pegar uma Reserva Particular do Patrimônio Natural (RPPN). Como o profissional responsável por essa área poderá tomar uma decisão com relação à ocupação dessa área e apresentar para os órgãos ambientais como IBAMA e ICMBio? Naturalmente se os gestores dessa área optarem por lidar com as ferramentas que serão apresentadas nessa disciplina, tudo fica mais claro, e as proposições das medidas a serem tomadas, melhor geridas.

Em um primeiro momento, toda a parte estatística apresentada nas Unidades I e II embasam o profissional no delineamento do seu esforço amostral, assim como no cálculo das estatísticas pertinentes. Assim, os relatórios poderão ser apresentados com robustez e principalmente confiabilidade.

E para os índices de qualidade ambiental? O que fazer? Bom, voltando as perguntas anteriores, sobre diversidade, riqueza e equitatividade de espécies, por exemplo, podemos imaginar que um ambiente degradado não apresenta um índice de diversidade elevado. Mas em relação à riqueza de espécies, quando esta estiver acentuada, será que haveria um indicativo de problemas ambientais associados? Normalmente, na mídia, muitos especialistas confundem-se ao abordar esses dois conceitos como sendo a mesma coisa. Mas não são!

Para lembrá-lo: Segundo o IBGE, Bioma é um conjunto de vida (vegetal e animal) constituído pelo agrupamento de tipos de vegetação contíguos e identificáveis em escala regional, com condições geoclimáticas similares e história compartilhada de mudanças, o que resulta em uma diversidade biológica própria. O Brasil abriga seis biomas continentais. São eles: Amazônia, Cerrado, Mata Atlântica, Caatinga, Pampa e o Pantanal. FONTE:<http://www.florestal.gov.br/snif/recursos-florestais/os-biomas-e-suas-florestas>. Acesso em: 25 abr. 2015.

UNI

Page 163: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS

153

FIGURA 22 – BIOMAS DO BRASIL

FONTE: IBGE e MMA (2004)

Quando falamos que um ambiente é diverso em número de espécies, ou ainda, que tem alta diversidade, queremos dizer que existem muitas espécies (vegetais e animais) coexistindo, e/ou residentes em um determinado ambiente. Uma característica muito importante aqui é que o número de exemplares ou indivíduos não difere muito entre cada uma das espécies observadas. Obviamente que temos espécies com populações maiores e menores, mas geralmente seu número apresenta certa homogeneidade. Mas a riqueza?

Quando falamos em um ecossistema rico em espécies, isso quer dizer que determinado bioma favorece a predominância de uma ou poucas espécies. Ou seja, de todas as espécies residentes em uma determinada área, por exemplo, duas delas podem ter suas populações com o número de indivíduos muito acentuado, muito acima da média das demais espécies. Ficou claro? Assim sendo, qual diagnóstico que você, como profissional, poderia ter desta área? Na sua opinião, qual ambiente, independente do bioma, do ponto de vista ecológico, poderia ser considerado o mais estável e/ou saudável, um ambiente rico ou um ambiente diverso?

Page 164: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

154

Se pegarmos por exemplo, fragmentos florestais de Mata Atlântica, podemos observar que esse ambiente é composto por uma enorme heterogeneidade de condições ambientais, que oscilam em função da latitude e ainda da maior ou menor proximidade com o mar, onde já pode ser denominada de restinga. Desta forma, fica fácil imaginarmos que em um local com oscilação de temperatura, umidade, vento, insolação, latitude e composição de solo, é esperada uma grande diversidade, tanto animal quanto vegetal. Fica evidente, que quanto mais diverso o ambiente em suas condições físicas e químicas, mais espécies esse local pode abrigar, ou seja, maior número de indivíduos se pode encontrar em seus respectivos nichos ecológicos. Olhando para a integridade deste ecossistema, esse estaria mais conservado do que um outro fragmento desta floresta onde o mesmo número de espécies não fosse observado.

Com a diversidade desse fragmento reduzida, o que falar sobre a riqueza de indivíduos, ou ainda, se somente uma ou duas espécies predominassem nesse ambiente. Certamente, que as condições de sobrevivência nesse ambiente seriam mais restritas, ou ainda, favoreceriam o crescimento de poucas espécies, e essas por sua vez, encontrariam nesse tipo de ambiente, condições para se reproduzirem em número muito acentuado. Assim, ficaria claro que esse ambiente não estaria em uma condição normal. Alguns ambientes, claro, são mais restritivos em relação ao número de espécies que suportam, mas de maneira geral, em ambientes degradados, é onde iremos verificar menor diversidade com algumas espécies predominando em número de indivíduos sobre outras. Essa característica também pode ser observada em baixas latitudes, onde as condições do ambiente favorecem o crescimento em número de organismos de algumas espécies, mas deve ficar claro que esse ambiente não necessariamente está degradado. Dependendo da situação, e dependendo do ambiente, caso esse naturalmente ofereça condições propícias para o desenvolvimento de apenas alguns organismos, que assim seja. Esses irão encontrar condições físico-químicas determinantes para o crescimento exponencial de suas populações. Já regiões tropicais e subtropicais possuem elevada diversidade animal e vegetal, em função da amplitude de condições ambientais observadas nesse ambiente. Nesses casos, naturalmente encontramos elevada diversidade, e qualquer diminuição nessa característica poderia indicar sérios problemas ambientais. Como exemplo disso temos a Mata Atlântica.

Page 165: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS

155

FIGURA 23 – PROCESSO DE REDUÇÃO DA MATA ATLÂNTICA NO BRASIL

FONTE: Disponível em: <http://www1.folha.uol.com.br/ambiente/2013/06/1289500-desmatamento-na-mata-atlantica-e-o-maior-desde-2008.shtml>. Acesso em: 20 abr. 2015.

Como observado na figura acima, a redução da Mata Atlântica tem causado inúmeros problemas ambientais em função da redução da sua cobertura vegetal, e também devido à fragmentação de hábitats. Esse processo torna os biomas particularmente sensíveis devido à limitação de conectividade entre os fragmentos. As espécies vegetais e animais que ali residem sofrem com o deslocamento, na busca de alimentos ou ainda por indivíduos a fim de completar o seu ciclo reprodutivo. Desta forma inúmeros problemas podem ser observados, como a redução de fluxo gênico entre indivíduos reprodutores o que acarreta na sobrevivência desses organismos devido à falta de resposta adaptativa, principalmente em função da geração de indivíduos consanguíneos. Outro problema grave que pode ser observado nesses fragmentos isolados é o chamado “Efeito de Borda”. Você sabe o que isso significa? Imagine uma área de floresta nativa do tamanho de um campo de futebol. Nas bordas desse campo, todas as condições físicas e químicas serão distintas daquelas observadas no interior desse campo imaginário. Por quê? Fica fácil entender quando observamos que todas as condições ecológicas como temperatura, umidade, insolação, vulnerabilidade as chuvas, escoamento superficial de água, erosão, minerais no solo entre muitas outras características alteram-se com facilidade por estarem mais expostas, certo?

Page 166: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

156

E a mesma coisa ocorre com a variação do número de espécies que se adaptam a essas novas condições. Diferente do centro do campo de futebol, onde as condições são mais homogêneas, percebe-se que a diversidade antes observada no fragmento intacto é maior e mais homogênea, diferente daquela comunidade animal ou vegetal da borda desse fragmento. Nesses locais mais vulneráveis vamos observar que poucas espécies conseguem se adaptar e normalmente suas populações apresentam grande número de indivíduos ocasionando em elevada riqueza.

FIGURA 24 – FRAGMENTAÇÃO DE HÁBITATS NAS REGIÕES DO CERRADO NO ESTADO DA BAHIA

FONTE: Google Earth (2015)

A figura circular no centro do fragmento (A) representa o ambiente com as condições mais homogêneas e alta diversidade vegetal e animal, enquanto que a figura retangular (B) a região de borda desse mesmo fragmento, onde maior riqueza será observada.

Voltando aos índices ecológicos, são justamente essas características que os especialistas em recuperação ambiental levam em consideração na tomada de decisão a medidas de manejo para um determinado local.

Na figura Processo de redução da mata atlântica no Brasil, fica claro que a cobertura vegetal do bioma Mata Atlântica ficou reduzida a uma área muito menor daquela observada há aproximadamente 30 anos. A supressão de vegetação que ocorreu em função da exploração de madeira e também para contrução civil foi implacável para acelerar o processo de degradação desse importante bioma no Brasil. Além do problema da fragmentação florestal, não foi dada a devida atenção para a importância dos corredores biológicos, que na prática permitiriam maior conectividade entre os fragmentos remanescentes.

Page 167: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS

157

Conceito técnico:

Para lembrá-lo: O efeito de borda ocorre porque a maioria dos fragmentos apresenta uma transição abrupta entre as bordas e as matrizes. Dessa forma, a borda do fragmento fica mais vulnerável às ações externas, como invasões biológicas, penetração de vento e radiações solares. Estes fatores propiciam uma diferenciação entre as condições físicas e bióticas na borda e no interior do fragmento, alterando a estrutura, a composição e/ou a abundância relativa de espécies na parte marginal de um fragmento. Além disso, quanto maior o contraste entre a estrutura dos fragmentos e da matriz, maior a intensidade destes efeitos na periferia do fragmento, tanto sobre a flora quanto fauna. O efeito de borda, como é chamada tal alteração, é mais intenso em fragmentos pequenos e isolados. Esta alteração da estrutura acarreta em uma mudança local, e, muitas vezes, pode atingir até 500 metros. Dessa forma, estudos sugerem que a relação perímetro X área deve ser considerada na escolha de fragmentos a serem protegidos.FONTE:<http://www.portaleducacao.com.br/biologia/artigos/25316/efeito-de-borda>. Acesso em: 25 abr. 2015.

UNI

Os sistemas naturais, devido à sua estrutura e complexidade, são ambientes vulneráveis, e que durante o processo de exploração podem ser profundamente afetados. Assim, sua recuperação torna-se lenta, podendo não sustentar os níveis de uso atual, contrastando com as metas de produção para a atual sociedade. Assim, planos de manejo adequado embasados por técnicas de gerenciamento corretas são imprescindíveis para a manutenção da biodiversidade. (RICKLEFS, 2003).

Uma alternativa para o processo de exploração dos biomas brasileiros, principalmente no que tange ao desmatamento e a fragmentação dos hábitats, seria a manutenção de corredores biológicos. Resumidamente esta estratégia de conservação permitiria que os maiores fragmentos de floresta ficassem conectados entre si através de menores parcelas, funcionando como um tipo de corredor de flora e fauna.

Page 168: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

158

Conceito técnico

Como instrumento de gestão territorial, os Corredores Ecológicos atuam com o objetivo específico de promover a conectividade entre fragmentos de áreas naturais. Eles são definidos no SNUC como porções de ecossistemas naturais ou seminaturais, ligando unidades de conservação, que possibilitam entre elas o fluxo de genes e o movimento da biota, facilitando a dispersão de espécies e a recolonização de áreas degradadas, bem como a manutenção de populações que demandam para sua sobrevivência áreas com extensão maior do que aquelas das unidades individuais.

Os Corredores Ecológicos visam mitigar os efeitos da fragmentação dos ecossistemas promovendo a ligação entre diferentes áreas, com o objetivo de proporcionar o deslocamento de animais, a dispersão de sementes, aumento da cobertura vegetal. São instituídos com base em informações como estudos sobre o deslocamento de espécies, sua área de vida (área necessária para o suprimento de suas necessidades vitais e reprodutivas) e a distribuição de suas populações. A partir destas informações são estabelecidas as regras de utilização destas áreas, com vistas a possibilitar a manutenção do fluxo de espécies entre fragmentos naturais e, com isso, a conservação dos recursos naturais e da biodiversidade. São, portanto, uma estratégia para amenizar os impactos das atividades humanas sob o meio ambiente e uma busca ao ordenamento da ocupação humana para a manutenção das funções ecológicas no mesmo território.

As regras de utilização e ocupação dos corredores e seu planejamento são determinadas no plano de manejo da Unidade de Conservação à qual estiver associado, incluindo medidas com o fim de promover sua integração à vida econômica e social das comunidades vizinhas.

Os Corredores Ecológicos são criados por ato do Ministério do Meio Ambiente. Até o momento foram reconhecidos dois corredores ecológicos:

Corredor Capivara-Confusões Corredor Caatinga Para saber mais sobre esses corredores acesse:

• Portaria nº 76 de 11 de março de 2005, reconhece o Corredor Capivara-Confusões. • Portaria nº131 de 4 de maio de 2006, reconhece o Corredor Ecológico da Caatinga.

FONTE: Disponívelem: <http://www.mma.gov.br/areas-protegidas/acoes-e-iniciativas/gestao-territorial-para-a-conservacao/corredores-ecologicos>. Acesso em: 25 abr. 2015.

UNI

Para compreendermos a importância dos ecossistemas e sua fragilidade, o ecólogo Odum (1988) destaca que o ambiente é composto de:

• Ecossistemas de início de sucessão • Ecossistemas maduros ou clímax• Sistemas aquáticos

Page 169: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS

159

Os ecossistemas em início de sucessão são aqueles que estão no início do seu desenvolvimento. E esse fenômeno ocorre por diferentes razões. Se usarmos como exemplo um bioma qualquer, por exemplo o cerrado, podemos imaginar duas situações. A primeira que este bioma ainda não ocupou determinada área, ou ainda não se desenvolveu ao longo deste novo espaço, e assim, gradualmente passa a ocupar um novo local e, portanto, dizemos que ele está em início do seu estágio sucessional. Na segunda situação, o cerrado encontra-se completamente desenvolvido. Na ecologia falamos em clímax, e, portanto, uma vegetação com maior maturidade. Aqui, para que esse ecossistema volte para a sua condição original, somente se alguma perturbação de ordem natural ou não degradar parte da mata. Pode-se imaginar aqui diversas situações. Uma queimada provocada por um raio. Ou ainda, um desmatamento, com posterior mobilização do solo preparando-o para a agricultura. Nos dois exemplos, levamos o ecossistema cerrado para uma fase inicial do seu desenvolvimento. Ou seja, não mais encontramos todas as espécies animais e vegetais que antes ali cresciam e viviam. Imagine agora que o solo está completamente descoberto, a céu aberto.

Se optarmos por recuperar essa área, devastada pelo fogo (ordem natural), ou mesmo pelo homem (supressão de vegetação de ordem antropogênica), devemos deixar essa área sem qualquer tipo de interferência pelos próximos anos. Algumas técnicas de revegetação e que aceleram esse processo de recuperação poderão ser utilizadas. Mas, de forma geral, esse bioma entrará gradualmente em processo de sucessão, onde a comunidade de fauna e flora sofrerão alteração ao longo dos anos. No início, muitas espécies pioneiras, que se adaptam facilmente às condições mais expostas – similar às condições de borda de floresta, e menor diversidade será observada, com maior número de indivíduos de uma mesma espécie, ou seja, grande riqueza. Posteriormente, conforme vamos avançando no tempo, essa condição vai alternando. A vegetação começa a crescer, árvores de maior porte começam a ser observadas, e, portanto, maior sombreamento incide sobre o solo. Dessa forma, uma nova condição se instala, e espécies rasteiras e de solo, não mais conseguem sobreviver a esta condição. Dizemos que a vegetação está em um processo secundário de desenvolvimento, indo em direção ao seu clímax, ou seja, seu estágio final de desenvolvimento, onde maior biodiversidade e equitabilidade de fauna e flora será encontrada.

Page 170: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

160

conceitos

Para você não ter dúvidas sobre a sucessão ecológica

Processo ordenado da instalação e desenvolvimento de uma comunidade de fauna ou flora. Ocorre com o tempo e termina quando se estabelece na área uma comunidade estável. Vamos tomar como exemplo uma região completamente desabitada, como uma rocha nua. O conjunto de condições para que plantas e animais sobrevivam ou se instalem nesse ambiente são muito desfavoráveis:

• Iluminação direta causa altas temperaturas.• A ausência de solo dificulta a fixação de vegetais.• A água das chuvas não se fixa e rapidamente evapora.

Os seres vivos capazes de se instalar em tal ambiente devem ser bem adaptados e pouco exigentes. Estes são os liquens (associação de cianobactérias com fungos), que conseguem sobreviver apenas com água, luz e pouca quantidade de sais minerais. Isso caracteriza a formação de uma comunidade pioneira. Os liquens, por serem os primeiros seres a se instalarem, são chamados de “organismos pioneiros”. A atividade metabólica dos liquens vai lentamente modificando as condições iniciais da região. Os liquens produzem ácidos orgânicos que corroem gradativamente a rocha, formando através da erosão as primeiras camadas de solo.

Camada sobre camada de líquen, vão formando um tapete orgânico, que enriquece o solo, deixando o mesmo úmido e rico em sais minerais. A partir de então as condições, já não tão desfavoráveis, permitem o aparecimento de plantas de pequeno porte, como briófitas (musgos), que necessitam de pequena quantidade de nutrientes para se desenvolverem e atingirem o estágio de reprodução. Novas e constantes modificações se sucedem permitindo o aparecimento de plantas de maior porte como samambaias e arbustos. Também começam a aparecer os pequenos animais como insetos e moluscos.

UNI

Dessa forma, etapa após etapa a comunidade pioneira evolui, até que a velocidade do processo começa a diminuir gradativamente, chegando a um ponto de equilíbrio, no qual a sucessão ecológica atinge seu desenvolvimento máximo compatível com as condições físicas do local (solo, clima etc.). Essa comunidade é a etapa final do processo de sucessão, conhecida como comunidade clímax. Cada etapa intermediária entre a comunidade pioneira e o clímax é chamada sere.FONTE: Disponível em: <http://www.sobiologia.com.br/conteudos/bio_ecologia/ecologia23.php>. Acesso em: 25 abr. 2015.

Page 171: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS

161

No ambiente, se formos medir índices de diversidade, riqueza, equitatividade ou similaridade, nos primeiros estágios do processo de sucessão ecológica provavelmente serão observadas muitas espécies pioneiras ou R estrategistas. Essas têm um ciclo de vida muito curto (nascem, se desenvolvem e morrem) em um período muito curto, adaptadas a locais com grande variação das condições ambientais. Para que a ocupação ocorra, apenas algumas espécies conseguem encontrar ali seu espaço para viver, adaptando-se à variabilidade do ambiente. Ao mesmo tempo em que somente alguns táxons conseguem, e por terem ciclo de vida muito curto, para compensar essas características, essas poucas espécies geram muitos descentes que ocupam gradativamente a área degradada ou intocada.

Espera-se, portanto, que o índice de riqueza observado para a área em início de processo de sucessão e/ou recuperação seja mais acentuada. Na contramão, menores índices de diversidade e equitatividade serão observados nesses mesmos locais no início do processo de sucessão ou recuperação. O processo inverso ocorre quando temos uma área cuja floresta se encontra em estágio de clímax ou totalmente desenvolvida. Nessas condições é esperada alta diversidade de flora e fauna, assim como elevada equitatividade. Então, quando a diversidade aumenta, podemos observar no ambiente muitos táxons e o número de indivíduos dentro das populações é equivalente. Desta forma, pode-se dizer que o ambiente está equilibrado, diverso e equitativo, sem a predominância de alguma espécie específica, que acarretaria aumento da riqueza.

3 OS ÍNDICES ECOLÓGICOS SÃO CONFIÁVEIS?

FIGURA 11: AS CARACTERÍSTICAS DE UMA COMUNIDADE CLÍMAX

ATRIBUTOS DO ECOSSISTEMA EM DESENVOLVIMENTO CLÍMAX

CONDIÇÕES AMBIENTAIS Variável e imprevisívelConstante ou

previsivelmente variável

POPULAÇÕES

Mecanismos de determinação de tamanho populacional

Abióticos, independentes de

densidade

Bióticos, dependentes de densidade

Tamanho do indivíduo Pequeno Grande

Ciclo de vida Curto/simples Longo/complexo

Crescimento Rápido, alta mortalidade

Lento, maior capacidade de sobrevivência competitiva

Produção Quantidade Qualidade

Flutuações Mais pronunciadas Menos pronunciadas

Page 172: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

162

ESTRUTURA DA COMUNIDADE

Estratificação (heterogeneidade espacial) Pouca Muita

Diversidade de espécies (riqueza) Baixa Alta

Diversidade de espécies (equitatividade) Baixa Alta

Diversidade bioquímica Baixa Alta

Matéria orgânica total Pouca Muita

ENERGÉTICA DA COMUNIDADE

PPB/R >1 = 1

PPB/B Alta Baixa

PPL Alta Baixa

Cadeia alimentar Linear (simples) Em rede (complexa)

NUTRIENTES

Ciclo de minerais Aberto Fechado

Nutrientes inorgânicos Extrabióticos Intrabióticos

Troca de nutrientes entre organismos e ambiente Rápida Lenta

Papel dos detritos na regeneração de nutrientes Não importante Importante

POSSIBILIDADE DE EXPLORAÇÃO PELO HOMEM

Produção potencial Alta Baixa

Capacidade de resistir à exploração Grande Pequena

FONTE: Disponível em: <http://www.sobiologia.com.br/conteudos/bio_ecologia/ecologia23.php>. Acesso em: 25 abr. 2015.

4 ESPÉCIES R E K ESTRATEGISTASEm 1837, o matemático Pierre F. Verhulst propôs um modelo que

define o limite máximo de crescimento de uma população, e que em seguida tende a se estabilizar. O seu modelo proposto foi definido por uma equação, a chamada Equação de Verhulst, e que determina uma condição onde a taxa de crescimento de uma população varia ao longo do tempo.

É um modelo que difere do modelo de crescimento exponencial, em que define que a taxa de crescimento é constante e não há limites para o tamanho da população. Para espécies animais de vida livre, por exemplo, a disponibilidade de alimento, abrigo e água é um fator limitante para o crescimento populacional. Esse limite máximo sustentável é denominado capacidade de suporte (K) em Ecologia.

Page 173: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS

163

FIGURA 25 – VERHULST / MATEMÁTICO QUE CRIOU A EQUAÇÃOLOGÍSTICA

FONTE: Disponível em: <http://www.euquerobiologia.com.br/2013/01/especies-k-e-r-estrategistas.html>. Acesso em: 25 abr. 2015.

Assim, para uma população de tamanho (N), com taxa de crescimento “r”, o modelo de crescimento logístico contínuo pode ser representado pela equação:

dNdt

rN NK

� ��

��

���1

Pode-se observar, na equação acima, que quando a população tende à capacidade de suporte, tem-se que dN/dt = 0, e o tamanho da população permanece estável. O que se espera que ocorra é que haja ou uma elevação da taxa de mortalidade devido à competição por alimento e abrigo ou uma redução da taxa de natalidade.

Com base nos parâmetros K e r da equação do modelo logístico, surgiram duas definições usadas em Ecologia: a de populações K e r estrategistas. Uma população K estrategista seria uma população para a qual a capacidade de suporte do meio é um fator restritivo. Por conseguinte, os indivíduos de uma população K estrategista tendem a preparar a prole para a competição por alimento, e a apresentar um tempo de vida mais longo em comparação a indivíduos de espécies r estrategistas. As espécies com estratégia demográfica de tipo seleção K são tipicamente competidoras com outras espécies, em nichos já bem preenchidos, investindo mais numa descendência menos prolífica, com cada descendente tendo uma maior probabilidade de sobreviver até à idade adulta.

Page 174: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

164

Apresentam comumente comportamentos de cuidados parentais, já que investem principalmente na sobrevivência e longevidade da prole. Podem também ser chamadas de espécies k estrategistas. Como exemplo de espécie K estrategista pode-se citar mamíferos de grande e médio porte como onças, antas, grandes aves, répteis em geral e qualquer animal que tenha que cumprir todo o seu ciclo de vida em pelo menos alguns anos.

Para as espécies r estrategistas, por outro lado, a capacidade de suporte não é um fator restritivo, com indivíduos com tempo de vida mais curto, e que tendem a não apresentar cuidado com a prole. Em termos gerais, as espécies com estratégia demográfica de tipo seleção (r) exploram nichos ecológicos vazios, e produzem um elevado número de descendentes a cada ciclo reprodutivo, ainda que cada um tenha poucas hipóteses individuais de sobreviver até à idade adulta. Podem apresentar picos populacionais. Podem também ser chamadas de espécies r estrategistas. Um exemplo seriam mosquitos que proliferam em áreas próximas a rios ou lagos, organismos planctônicos, micro-organismos de forma geral, algumas espécies de peixes como as sardinhas, assim como as lulas, moluscos que cumprem todo o seu ciclo de vida, ou seja, nascem, se reproduzem e morrem em apenas um ano.

FONTE: Disponível em: <http://www.euquerobiologia.com.br/2013/01/especies-k-e-r-estrategistas.html>. Acesso em: 25 abr. 2015.

Indicação de leitura

“Eu entendo que pode haver uma crise de biodiversidade, mas como isso me afeta?” Boa pergunta! Funciona assim...

A diversidade biológica é o recurso do qual dependem famílias, comunidades, nações e gerações futuras. É o elo entre todos os organismos existentes na terra, que liga cada um deles a um ecossistema interdependente, em que cada espécie desempenha sua função. É uma verdadeira teia da vida. O patrimônio natural da Terra é composto por plantas, animais, terra, água, atmosfera e os seres humanos! Juntos, fazemos parte dos ecossistemas do planeta, o que equivale a dizer que, se houver uma crise de biodiversidade, nossa saúde e meios de subsistência também entram em risco. Porém, atualmente estamos usando 25% mais recursos naturais do que o planeta é capaz de fornecer. O resultado é que espécies, habitats e comunidades locais estão sofrendo pressões ou ameaças diretas. Um exemplo de ameaça que já atinge seres humanos é a perda de acesso à água doce. A biodiversidade é a base da saúde do planeta e tem um impacto direto sobre a vida de todos nós. Indo direto ao ponto: a redução da biodiversidade significa que milhões de pessoas estão diante de um futuro em que os estoques de alimentos serão mais vulneráveis a pragas e doenças e a oferta de água doce será irregular ou escassa. Para os seres humanos, isso é preocupante. Muito preocupante mesmo!

FONTE: Disponível em: <http://www.wwf.org.br/natureza_brasileira/especiais/biodiversidade/consequencias_perda_biodiversidade/>. Acesso em: 25 abr. 2015.

UNI

Page 175: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS

165

5 CONSERVAÇÃO AMBIENTAL X DIVERSIDADE BIOLÓGICAAté que ponto a diversidade biológica é indicativo de qualidade dos

ecossistemas e poderia ser utilizada para o manejo de áreas degradadas? Essa é uma pergunta que muitos ecologistas atuais tentam responder, e estão cada vez mais convencidos de que existe correlação entre essas duas variáveis. Dada a vulnerabilidade dos ecossistemas naturais e dos organismos que o habitam, dois aspectos são de fundamental importância dentro do funcionamento no meio ambiente natural: o direcionamento da energia e a reciclagem contínua de materiais. Em outras palavras, em que prazo teremos a renovação de um recurso explorado, seja ele de fauna ou flora?

Nos sistemas naturais, a fonte primária de energia é a luz do Sol. A sua reciclagem é realizada por alguns processos regenerativos, seja de origem física, química ou biológica. Qualquer desequilíbrio que leve à acumulação ou à depressão de algum componente no ecossistema é normalmente corrigido por processos dinâmicos de automanutenção do ecossistema. Basta lembrarmos aqui dos processos sucessionais descritos anteriormente, que visam estabelecer as condições originais do ambiente perturbado.

Só para você entender melhor, vamos exemplificar: quando a matéria orgânica morta se acumula num sistema, o número de organismos detritívoros aumenta para consumir o excesso de detrito. Dos componentes da atmosfera até plantas, animais e micro-organismos modificam a condição dos ecossistemas terrestres e são responsáveis pela manutenção de sua qualidade. Quando os processos naturais são rompidos, os ecossistemas podem não ser mais capazes de manterem a si próprios. Podemos notar isso nas mudanças que ocorrem nos solos e nas correntes de água após o desmatamento de uma floresta.

Como ocorre com qualquer organismo dentro de um sistema, todas as atividades humanas trazem consequências para o ambiente. Porém, como fazemos parte da espécie que mais interfere e ameaça os processos ecológicos, a seguir, Ricklefs (2003) nos dá alguns exemplos de efeitos tanto diretos quanto indiretos da espécie humana nestes processos:

• Sobre-exploração – a pesca, a caça, a pastagem, a coleta de madeira para combustível, a retirada de madeira e afins são as interações clássicas consumidor-recurso. Na maioria dos sistemas naturais essas interações atingem estados estacionários porque à medida que um recurso se torna escasso, a eficiência da exploração e também de sobrevivência cai. Onde a fertilidade da terra for exaurida, a população humana pode perder a base dos recursos de que necessita para se sustentar. Ainda, nos casos em que a população não pode mais se mover para outras áreas, ou trocar suas fontes de alimentos, a perspectiva do controle populacional pela fome e doenças associadas, além do conflito social, pode ser uma realidade. Para resolvermos este problema, devemos limitar a exploração das populações e recursos às produtividades máximas sustentáveis,

Page 176: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

166

considerando usos sustentáveis alternativos da terra; aumentar a intensidade da agricultura em terras capazes de sustentá-la; e aprimorar a distribuição de alimentos entre as áreas de produção e as áreas de consumo.

• Introdução de espécies exóticas – intencionalmente ou não intencionalmente, os humanos têm levado outras espécies para toda parte que viajam. Estas incluem: plantas comestíveis, plantas para horticulturas e suas pragas, árvores de valor comercial, animais domésticos para trabalho ou alimento, aves, mamíferos para esporte de caça, organismos patogênicos e frequentadores de habitações humanas como baratas e aranhas. O resultado deste movimento de espécies entre os continentes é a distribuição global de espécies da flora e da fauna, podendo em alguns casos, resultar na eliminação ou expulsão das espécies locais (nativas) devido à desvantagem competitiva destas últimas.

• Conversão de habitat – alterar a natureza básica de um habitat como a estrutura física, muitas vezes, perturba os processos naturais de regeneração e controle. Exemplo: derrubada de florestas de manguezal, que controlam o regime de inundação, as migrações de peixes, o transporte de sedimentos, entre outros, para construções humanas.

• Eutrofização – os fertilizantes aplicados na agricultura para aumentar a produção acabam alcançando o subsolo e de lá os rios, lagos e, por fim, oceanos. Os nitratos, fosfatos e outros fertilizantes inorgânicos presentes nas águas têm o mesmo efeito que na produção em terras cultivadas: o aumento da produção biológica. A sobreprodução como uma consequência dessa fertilização artificial, frequentemente chamada eutrofização, pode originar águas turvas, acumular material orgânico, aumentar as taxas de decomposição bacteriana e provocar a desoxigenação da água, matando peixes e outros organismos. Problema ainda maior para a qualidade das águas é a entrada direta de resíduos orgânicos, como o esgoto e o escoamento diário de alimentos. Materiais orgânicos suspensos ou dissolvidos na água criam o que é conhecido como demanda biológica de oxigênio, significando que a decomposição desses materiais por bactérias consome o oxigênio presente na água. Uma das alternativas para o controle da eutrofização está em cortar as fontes externas de nutrientes orgânicos, seja desviando as entradas para corpos de água maiores, que possam absorvê-los, seja por tratamento de esgoto.

• Acumulação de toxinas – ocorre pela acidificação de solos e águas, principalmente pela mineração do carvão, composto por enxofre e nitrogênio. Estes, quando liberados na atmosfera, produzem a chuva ácida e trazem consequências como a diminuição do pH do solo, aumento da lixiviação dos nutrientes do solo e dificuldade de assimilação de nutrientes pelas raízes das plantas. A liberação de metais pesados e compostos orgânicos na queima de combustíveis e nos pesticidas de plantações, também são exemplos de outras toxinas derivadas das atividades humanas que podem se acumular em sistemas biológicos.

Page 177: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 1 | AS ORIGENS DOS INDICADORES AMBIENTAIS E ÍNDICES ECOLÓGICOS

167

• Destruição da camada de ozônio – vários poluentes aerossóis, especialmente os clorofluorcarbonados (CFCs), reduzem as concentrações de ozônio (O3) na atmosfera superior.

• Efeito estufa – o dióxido de carbono (CO2) ocorre naturalmente na atmosfera onde absorve a radiação infravermelha de comprimento longo de onda, evitando a perda de calor ao mesmo tempo em que permite a passagem da luz solar visível e da radiação ultravioleta (ondas curtas). Os níveis crescentes de dióxido de carbono na atmosfera, produzidos pela queima de combustíveis fósseis e pelo desmatamento e queima de florestas, ameaçam aumentar a temperatura média da Terra em torno de 2oC a 6oC, com consequências potencialmente adversas para os ecossistemas naturais e para a agricultura. Além disso, o derretimento das calotas polares de gelo e a expansão das águas oceânicas aquecidas ocasionarão a elevação do nível dos mares.

a. Conservação dos Recursos Naturais

Em um primeiro momento, a resolução da crise ambiental pela qual estamos passando parece fácil. Mas será que é mesmo assim? Uma coisa é certa: esta crise não pode ser totalmente resolvida até que o crescimento populacional humano seja interrompido, o consumo da energia decline e o desenvolvimento econômico leve os valores ecológicos em consideração.

Além da diminuição do consumo de recursos naturais, é de preocupação

imediata a preservação da biodiversidade (principalmente as espécies endêmicas), que abrange toda a variedade dos seres vivos na Terra e que responde pela manutenção do equilíbrio da natureza, que é de onde retiramos nossos produtos. O valor de cada espécie está baseado em considerações morais gerais, na estética, na economia e nos seus benefícios recreacionais que nós usufruímos, bem como, no seu papel como indicadora de qualidade ambiental (a presença ou a ausência de certas espécies pode dizer se determinado ambiente é mais degradado ou conservado). A diversidade de espécies em sistemas ecológicos pode ter um valor intrínseco de estabilizar a função do ecossistema. Um número crescente de estudos está mostrando que sistemas diversos são mais capazes de manter a alta produtividade em face de variações ambientais.

Com esse panorama evidenciado e sabendo que hoje a conservação ambiental é prioridade, temos que pensar em todas as metodologias possíveis para tentarmos visualizar nossos impactos no ambiente natural e claro, no que podemos fazer para diminuir esse impacto. A seguir vamos conhecer o conceito de Pegada Ecológica, e o que quantifica nosso impacto sobre o meio ambiente.

Page 178: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

168

RESUMO DO TÓPICO 1

Neste tópico, você viu:

• Os principais motivos que levam os gestores ambientais a utilizarem os indicadores ecológicos para proporem medidas de recuperação ambiental.

• Os problemas atuais da fragmentação de hábitat e a redução dos biomas.

• Diminuição da diversidade biológica como fator que compromete o equilíbrio dos ecossistemas.

• O efeito de borda e os problemas relacionados à conectividade entre os ambientes degradados.

• Principais problemas relacionados à degradação do meio ambiente.

Page 179: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

169

AUTOATIVIDADE

Para exercitar seus conhecimentos adquiridos, resolva as questões a seguir.

1 Relacione a segunda coluna com a primeira, de acordo com as definições:

a) Fragmentação de hábitat.b) Efeito de borda.c) Diversidade biológica.

( ) Diferente da riqueza de espécies, que aponta a quantidade de indivíduos por espécie, esse conceito nos informa a quantidade de espécies, seja ela de fauna ou flora.

( ) Está relacionada com a diminuição de diversidade biológica em função das alterações físicas e químicas do ambiente, quando este se torna exposto em função de supressão de vegetação.

( ) Compromete a rede de conexões entre diferentes biomas e/ou hábitats, afetando o fluxo gênico das espécies residentes e consequentemente diminuição da diversidade biológica.

Agora assinale a alternativa CORRETA:

( ) c – b – a.( ) c – a – b.( ) a – b – c.( ) b – a – a.

2 Atividade de Estudo: Para você refletir e pesquisar, explique a frase “A diminuição da diversidade biológica é fundamental para a manutenção do equilíbrio do planeta”.

Page 180: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

170

Page 181: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

171

TÓPICO 2

ÍNDICES ECOLÓGICOS

UNIDADE 3

1 INTRODUÇÃOPrezado acadêmico(a)! A partir desse tópico veremos os principais índices

ecológicos utilizados para medidas de diversidade, riqueza e equitatividade. Este tópico busca fazer o entendimento entre conceitos utilizados anteriormente para proteção dos recursos naturais e a aplicabilidade dos índices ecológicos para o gerenciamento do meio ambiente. Desta forma, o entendimento do que são, para que servem, e como podem ser estimados é o foco a partir de agora.

2 ÍNDICES DE DIVERSIDADEMedidas de diversidade são para ecologistas e gestores ambientais um

dos principais objetivos a serem alcançados. O número de espécies de um local, nicho ou assembleia significa, como já discutido anteriormente, uma maneira intuitiva de observar a estrutura de uma comunidade biológica, e muitas vezes pode representar o último indicativo na luta da conservação e restauração de ambientes degradados (MAGURRAN; McGILL, 2011).

Dos índices de diversidade mais comumente utilizados, encontramos o de Simpson e Shannon. Destes dois, o mais conhecido para o cálculo de diversidade biológica é o Índice de Shannon-Weaver (H´), ou comumente conhecido como Índice de Shannon. Todos esses índices possuem algumas limitações em relação ao seu uso, no entanto, não é o objetivo desse caderno aprofundarmos esses aspectos.

Para os acadêmicos que desejam aprofundar a compreensão da utilização dessas ferramentas ecológicas, assim como suas limitações, recomenda-se a leitura do livro “Biological Diversity: Frontiers in Measurement and Assessment” ou “Diversidade Biológica: Fronteiras para as Avalições e Cálculos”, dos autores Anne Magurran e Brian McGill, do ano de 2011. Este livro traz de forma muito aprofundada todos os assuntos relativos aos índices ecológicos.

UNI

Page 182: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

172

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

Voltando ao Índice de Shannon, uma de suas maiores limitações é atribuir em seus cálculos o mesmo peso para as espécies raras e abundantes. O que significa isso? Uma espécie rara é aquela que em um determinado ambiente, encontramos em abundância muito baixa. E normalmente esta tem um papel fundamental para a estrutura daquela comunidade. Desta forma, no Shannon, a premissa para seus cálculos é de que todas as espécies teriam um papel fundamental, ou que todas teriam o mesmo “peso” ou “valor” para o equilíbrio do ecossistema. Isso também é verdade, e por isso, essa fragilidade não desqualifica o índice. De qualquer forma, é sugerido que algum processo antrópico possa causar algum tipo de distúrbio quando espécies de flora e/ou fauna, são observadas em menores abundâncias no ambiente.

De acordo com a fórmula do Índice de Shannon, temos que:

Onde:

H´= Índice de Shannon.Ni = Número de indivíduos amostrados da i-ésima espécie.N = Número total de indivíduos amostrados.S = Número total de espécies amostradas.ln = Logaritmo de base neperiana.

Desta forma, quanto maior for o valor de H´, maior será a diversidade de espécies da comunidade. No entanto, é necessário que se façam mais réplicas para essa comunidade, como veremos adiante, e posteriormente, compararmos os valores encontrados, por exemplo, entre uma e outra comunidade, ou ainda, entre um ambiente preservado e outro degradado. Só assim, será possível entender os resultados.

De qualquer forma, o primeiro passo é fazer uma amostragem que de fato seja significativa (Obs.: ver na Unidade 1 deste caderno procedimentos para um “n” amostral adequado). Isso significa que devemos nos deslocar até o local, preservado ou não, e fazer o levantamento de espécies. Como não somos especialistas em classificação, esse tipo de trabalho faz mais sentido se tivermos o apoio de um profissional especialista em levantamento florístico, por exemplo, ou ainda um ornitólogo, para o registro das espécies de aves, e assim por diante. Caso tenhamos a nossa disposição guias para classificação de fauna ou flora, ou ainda as chaves de classificação, nada impede de nós mesmos fazermos o levantamento. É claro que o tempo empregado pode aumentar consideravelmente, mas é uma forma de nos tornarmos gestores ambientais mais completos.

Page 183: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

173

Uma vez que determinamos qual grupo iremos amostrar, é hora de partirmos para o levantamento. Vamos imaginar que iremos determinar a diversidade de vegetação de uma área recém-degradada, em início de processo de sucessão. Para que tenhamos êxito em nossa amostragem, precisamos definir alguns procedimentos metodológicos. O primeiro deles, é determinar o tamanho do meu amostrador dentro da área a ser amostrada. Esse amostrador pode ser compreendido por um “quadrado” de dimensões definidas, como por exemplo, de 2 por 2 metros. Por exemplo, podemos fazer isso com uma corda colorida, cercando dentro da mata, uma área de dois metros quadrados, amarrando suas extremidades com estacas. Feito isso, dentro desse “quadrado” ou “quadrat”, vamos registrar o número de espécies, e também, o número de indivíduos para cada uma destas. Vamos imaginar que nessa primeira área amostrada identificamos quatro espécies de árvores, A, B, C e D. Assim, para cada uma delas foi registrado o número de indivíduos (árvores) presentes nessa área de dois metros quadrados, conforme tabela a seguir, compreendida como réplica 1:

Réplica 1

Espécies N de indivíduos

A N = 10

B N = 11

C N = 22

D N = 15

Posteriormente, é recomendado que esse mesmo experimento seja repetido, caracterizando uma réplica. Podemos assim, caminhar aleatoriamente pela floresta, distanciando-se da área amostrada anteriormente. Novamente delimito a minha área a ser amostrada com o meu quadrat, com a utilização de cordas coloridas por exemplo, identificando as espécies e contando o número de exemplares dentro da área definida. Isso se faz necessário para diminuirmos o erro estatístico amostral, ou seja, depois que realizarmos os cálculos para a diversidade, a chance de encontrarmos algum erro é reduzido em função da repetição do experimento.

Desta forma, o número de réplicas que posso fazer depende do meu objetivo, do tamanho da área que estou analisando, do tempo e do dinheiro que tenho disponível dentro do projeto e assim por diante. Sugere-se no mínimo três réplicas para uma determinada área. Caso esta seja muito reduzida, uma ideia é diminuir o tamanho do quadrat. Se antes trabalhávamos com distanciamento de dois metros quadrados, podemos fazer com um metro, ou ainda 0,5 metros quadrados, caso estejamos trabalhando com espécies colonizadoras, como pequenas plantas ou gramíneas.

Page 184: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

174

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

Para ilustrar melhor o cálculo de diversidade, vamos trabalhar com uma situação real. Para isso, vamos pegar os registros feitos para espécies de aves marinhas que foram observadas em ilhas oceânicas. A identificação das espécies de aves foi feita com a utilização de guias de identificação específicos para esse tipo de trabalho, e a contagem das aves foi feita com a utilização de binóculos, por contagem direta, ou seja, quando o indivíduo era observado, seguia com o registro. Um pouco diferente do que fazer a contagem de plantas ou árvores, ao trabalharmos com aves, o nosso quadrat é referenciado por um ponto fixo, pois não temos como delimitar uma área na terra para contar as aves pousadas, assim como não é possível demarcar com fitas e cordas o céu, quando esses animais encontram-se voando. No entanto, o princípio é o mesmo, ou seja, dentro de uma área definida por um ponto fixo, contabilizar o número de espécies e respectivo número de indivíduos para toda a ilha, conforme tabela a seguir:

TABELA 1 – A TABELA REPRESENTA UM EXEMPLO PRÁTICO DA CONTAGEM DO NÚMERO DE INDIVÍDUOS POR ESPÉCIE DE AVES. AS RÉPLICAS REPRESENTAM O NÚMERO DE VEZES QUE FORAM FEITAS AS CONTAGENS DE INDIVÍDUOS, PARA CADA UMA DAS ESPÉCIES.

FONTE: Os autores

Como podemos observar, nessa ilha, denominada de Moleques do Sul, foram realizados quatro censos visuais, ou réplicas, onde foram registradas 15 espécies. Reparem a importância da repetição dos censos ou réplicas. Por exemplo, a espécie Thalassarche melannophris, foi observada apenas na primeira réplica, enquanto que o Sula sula somente na terceira réplica e assim por diante. Por isso, existe a necessidade de “replicarmos” o experimento como comentado anteriormente. Pois quando estamos em atividade de campo, muitas vezes nas primeiras observações, determinada espécie, seja ela de flora ou fauna, pode não aparecer, e se fôssemos confiar apenas nos resultados da primeira observação, certamente em nossos relatórios destacaríamos que determinada espécie não é encontrada naquela região, ou neste caso, para esta ilha, estaríamos negligenciando a existência de uma ave que poderia ser importante para o equilíbrio daquele ecossistema.

Page 185: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

175

Outras observações já podem ser feitas de acordo com os resultados da tabela, sem calcularmos o índice. Por exemplo, algumas espécies possuem o número de indivíduos mais elevado do que outras. Esses padrões podem influenciar diretamente sobre a riqueza de espécies neste ambiente. Ou ainda, aumentar a competição interespecífica, ou seja, entre espécies diferentes, onde aquelas que conseguem se destacar, ocupam maior extensão territorial e consomem mais recursos do que aquelas que estão em menor número. Mas isso faz parte dos processos ecológicos, inerentes a qualquer ecossistema, e é função do profissional da área compreendê-las e através de ferramentas como os índices ecológicos, propor soluções para mitigar os problemas.

De qualquer forma, mesmo que um resultado aparente, existe a necessidade de executar os cálculos. Desta forma, como proceder com o cálculo de diversidade para a amostragem de aves na ilha Moleques do Sul? O primeiro passo é realizarmos a soma do número de indivíduos por espécie, para cada uma das réplicas, conforme mostra a continuação da tabela, onde estão registrados os dados:

TABELA 13 – ESTA TABELA APRESENTA O NÚMERO DE AVES OBSERVADAS POR ESPÉCIE. O NÚMERO DE RÉPLICAS REPRESENTA A QUANTIDADE DE VEZES QUE CADA CONTAGEM FOI REALIZADA. A ÚLTIMA COLUNA DESTA TABELA APRESENTA A SOMA DOS INDIVÍDUOS DE UMA ESPÉCIE PARA AS QUATRO RÉPLICAS.

FONTE: Os autores

No software excel, do pacote office da Microsoft, através de um comando simples, essa tarefa pode ser executada. Pegamos a espécie Larus dominicanus, na mesma linha onde estão inseridos os dados de sua abundância, na célula de excel seguinte inserimos o comando “=soma (seleciona todos os valores da linha com o mouse)” + enter. Automaticamente o programa irá contabilizar 132 + 125 +178 + 132 + 567 = 567. Feito isso, é necessário para as demais espécies realizar a mesma somatória.

Page 186: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

176

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

O passo seguinte, é realizarmos uma soma dos valores totais de indivíduos por espécie, ou seja, a soma das “somas”. Assim, o valor obtido será:

Lembrem-se da fórmula de riqueza destacada anteriormente. Apenas estamos fazendo por partes, em uma planilha do excel, o que a fórmula de diversidade de Shannon preconiza, ok? O próximo passo é calcularmos o “pi” ou conforme a fórmula descrita, o “ni”. No excel, nomeamos uma nova coluna (G3 por exemplo), onde faremos a divisão do primeiro valor de soma do número de indivíduos de uma das espécies pelo número total calculado. Na prática, para Larus dominicanus, iremos dividir o valor 567 por 1431 = 0,396226415. No excel, supondo que os meus valores estejam respectivamente nas células F3 e F19, na célula G3 (célula de destino para cálculo do “pi”) basta inserimos o seguinte comando: “=F3 / F19” + Enter. Posteriormente, calcula-se para todas as demais espécies. Quando você for arrastar a célula para proceder com os demais cálculos, para todas as espécies, lembre-se que o valor total (1431), está em uma célula de excel qualquer, onde você procedeu com o cálculo, ok? No nosso caso, este valor está na célula F19. Assim, ao dar o comando para o cálculo das demais espécies, você precisa travar esse valor, ou seja, ele é fixo no cálculo para todas as espécies. Como travamos um valor no excel? É muito simples. Colocamos o símbolo de cifrão “$” na frente da letra da célula e também na frente da numeração desta mesma célula. Ou seja, se o nosso valor total (1431) estiver calculado na célula F19, precisamos clicar na célula, e em cima da tela do excel, onde aparece a barra de cálculos do programa, inserir o cifrão, conforme o exemplo a seguir.

Page 187: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

177

FIGURA 26 – A FIGURA APRESENTA DE FORMA AMPLIADA E CIRCULADA COMO PROCEDER NO SOFTWARE EXCEL PARA “TRAVARMOS” UM VALOR OU FÓRMULA, COM A APLICAÇÃO DO CIFRÃO “$”.

FONTE: Os autores

Feito isso, partimos para os próximos cálculos. Observando a fórmula descrita por Shannon, veremos que a próxima etapa consiste em calcularmos o logaritmo natural dos valores encontrados para o “pi” ou “ni”. Para isso, o destino desses valores será uma nova célula, por exemplo, a “H3”. Assim, na célula de destino, basta darmos o comando “=LN(G3) + enter”, e os valores serão calculados para esta célula, conforme a figura a seguir, coluna H3:

FIGURA 27 – A FIGURA APRESENTA COMO CALCULAR OS VALORES DE LOGARITMO NATURAL (LN) PARA OS VALORES DE PI. A FÓRMULA, A SER DIGITADA NO EXCEL ESTÁ CIRCULADA E EM DESTAQUE.

FONTE: Os autores

Page 188: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

178

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

Posteriormente, multiplicam-se os valores de “pi” por “LN de pi”, ou seja, um valor pelo outro, selecionando como célula de destino a “I3”. Assim, pelo comando “=G3 * H3 + Enter” encontramos esse valor, conforme mostra a planilha a seguir:

FIGURA 28 – A FIGURA APRESENTA COMO PROCEDER COM O CÁLCULO DA MULTIPLICAÇÃO DOS VALORES DE PI POR LN DE PI, PARA POSTERIORMENTE ENCONTRARMOS ATRAVÉS DA SOMA DESSES VALORES O ÍNDICE DE DIVERSIDADE. A FÓRMULA ESTÁ EM DESTAQUE E CIRCULADA.

FONTE: Os autores

Por fim, a soma de todos os valores observados nesta última coluna, será o valor para o índice de Shannon. Neste caso, não consideramos o sinal do valor observado, ou seja, se encontrarmos um valor negativo, desconsideramos o sinal de menos.

Assim, para o nosso estudo de caso, a soma de todos os valores da última coluna foi igual a ( – 1,6534), ou desconsiderando o sinal, igual a (1,6534). Na prática, quanto maior for o valor de diversidade calculado, maior será a diversidade para determinada área. Podemos aplicar a mesma metodologia para duas áreas distintas, por exemplo, uma área preservada, ou em estado de “clímax” ou estágio final da sua sucessão, com outro em início de sucessão, e veremos que naquele em estágio inicial irá apresentar um valor de diversidade menor se comparado aquele ambiente maduro, ou em estágio de sucessão avançado. Isso, se tratarmos de fragmentos florestais. No entanto, o mesmo cenário, se repete para comunidades de fauna. Tipicamente para ambientes degradados, iremos observar índices de diversidade menores daqueles ambientes protegidos.

Page 189: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

179

A princípio, não existe um valor para podermos estabelecer uma comparação. Por exemplo, em nosso estudo de caso, encontramos um valor de 1,6534. A dúvida que surge é o que esse valor significa. Normalmente, em condições normais, os valores de diversidade irão variar entre uma escala de 1,0 a 3,0. Então, para cada situação que realizarmos os cálculos, encontraremos diferentes valores, e a comparação deverá ser feita para períodos de tempo diferentes (variações sazonais dentro de uma mesma área). Jamais poderei comparar, para um mesmo intervalo de tempo, dois biomas distintos. Por exemplo, comparar os valores de diversidade de flora, para a mata atlântica e cerrado. Obviamente, que diferentes ecossistemas apresentarão índices de diversidade distintos, maiores ou menores, em função de suas características, e por isso, não podem ser comparados. Assim, aquele que apresentar o menor índice de diversidade não poderia ser eleito como um ambiente degradado. O mesmo diagnóstico deve ser observado para comunidades de fauna, onde ambientes distintos não podem ser comparados.

No entanto, se fizermos uma comparação entre valores observados para um mesmo bioma, uma diminuição do índice ao longo do tempo pode sim estar representando decréscimo da diversidade, provavelmente influenciado pela perda de qualidade ambiental.

Similar ao cálculo de diversidade de Shannon, temos os índices de riqueza. Os mais conhecidos são dois: o de Margalef e o de Menhinick. É o que iremos ver a seguir.

2.1 ÍNDICES DE RIQUEZA

Para Margalef (1974), a riqueza pode ser entendida como o número total de espécies (S) em uma unidade amostral. Consequentemente, esta variável fica muito dependente do tamanho amostral – quanto maior a amostra, maior o número de espécies que poderão ser amostradas. Assim, a riqueza de espécies diz pouco a respeito da organização da comunidade, aumentando em função da área, mesmo sem modificação do habitat.

Um índice muito utilizado para medir a riqueza de espécies é conhecido como Índice de Margalef. Ramón Margalef i López foi um ecólogo catalão que trabalhou durante muitos anos no Instituto Botânico da cidade de Barcelona, e já era conhecido pelos seus trabalhos sobre a investigação das algas de água doce e os processos de eutrofização.

Com relação ao seu indicador, utiliza-se a fórmula:

Page 190: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

180

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

onde, “S” é a riqueza de Margalef a ser encontrada, “n” é o número de espécies presentes em determinada amostragem, e “N” é o número total de indivíduos encontrados (pertencentes a todas as espécies). A notação “ln” denota o logaritmo neperiano do número. Assim, para os mesmos dados já registrados para o cálculo da diversidade, anteriormente demonstrados, os valores são: n = 15; N = 1431.

Colocando os valores na fórmula:

S n

S

S

S

��

��

1

15 11431

147 2661

1 9267

lnN

ln

,

,

Os mesmos cuidados e atenção devem ser dados na comparação de comunidades de fauna e flora. Portanto, não devemos comparar por exemplo, índices de biomas distintos. Para um mesmo ecossistema, esses valores irão variar em função da maior ou menor suceptibilidade a alterações antrópicas, ou ainda, de acordo com a maturidade e/ou estágio sucessional que se encontra determinado ambiente. Como já explicado, no início do processo de sucessão, menor diversidade deverá ser observada no início do processo sucessional, com a predominância de algumas espécies. Essas espécies também podem causar um efeito de dominância na comunidade, que veremos a seguir.

O índice de riqueza de Menhinick é muito semelhante ao de Margalef, e com relação a sua interpretação ecológica, enquadra-se dentro dos mesmos efeitos observados por outros índices de riqueza para uma comunidade, ou seja, estão associados a processos iniciais de sucessão ou ainda degradação ambiental. Para procedermos com os cálculos, devemos seguir a fórmula:

S nRaizdeN

SRaizde

S

=

=

=

� �

� �

,

151431

0 3965

Raiz de N

Raiz de 1431

Page 191: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

181

Observem que os valores encontrados para os dois índices foram distintos. De qualquer forma, a opção de escolha por um ou outro é do especialista ambiental. O que deve ser levado em consideração é a escolha de um índice e posteriormente fazermos a comparação entre diferentes áreas de um mesmo bioma ao longo do tempo (por exemplo um ano), e ficarmos atentos as suas oscilações.

Existem ainda outros métodos que podem ser pesquisados na literatura, para cálculo da riqueza de uma comunidade, como o Chao e o Jackknife, no entanto, não é objetivo deste caderno nos aprofundarmos no estudo desses indicadores.

Quando observamos que uma, duas ou três espécies apresentam número de indivíduos muito acima do restante das espécies registradas em uma determinada área, significa que o ambiente, em suas condições físicas, químicas, de espaço e oferta de alimentos está favorecendo a reprodução e o desenvolvimento de poucas espécies em relação às demais. Isso implica um desequilíbrio na composição da comunidade desse ambiente, ou ainda, que este se encontre no seu estado inicial de recuperação ou estágio sucessional, como já discutimos anteriormente. Alguns cálculos permitem observar a dominância, como por exemplo, na fórmula a seguir:

Da NaNa Nb Nc Nd Nn

�� � � ���..

Onde:Da = Dominância da espécie “a”Na = Número de indivíduos da espécie “a”Nb = Número de indivíduos da espécie “b”Nc = Número de indivíduos da espécie “c”Nd = Número de indivíduos da espécie “d”

Assim, teremos um indicativo se determinado ecossistema está em “equilíbrio”, ou ainda, sem a dominância de alguma espécie, favorecendo a competição interespecífica, ou seja, a disputa por espaço e alimentos na área entre espécies diferentes.

Obviamente que além de um estágio de degradação ou comprometimento ambiental, a dominância de uma determinada espécie em relação a outras pode indicar que este ambiente esteja em estágio inicial de sucessão ecológica, como já evidenciado anteriormente.

2.2 ÍNDICES DE DOMINÂNCIA

Page 192: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

182

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

Outros pesquisadores, também pensaram em outras formas de estimar a dominância de espécies. Um deles foi Simpson. O Índice de Dominância de Simpson (C) mede a probabilidade de 2 (dois) indivíduos, selecionados ao acaso na amostra, pertencer à mesma espécie. Assim, uma comunidade de espécies com maior diversidade terá uma menor dominância. O valor estimado de C varia de 0 (zero) a 1 (um), sendo que para valores próximos de um, a diversidade é considerada maior.

Dni niN N

� ��� ��� �

11

Em que:

D = índice de dominância de Simpsonni = número de indivíduos amostrados da i-ésima espécie N = número total de indivíduos amostrados.

Assim, observe os dados da tabela a seguir, para proceder com os cálculos de Dominância de Simpson, conforme a descrição da fórmula.

TABELA 29 – A FIGURA APRESENTA COMO PROCEDER NO EXCEL COM O CÁLCULO DO ÍNDICE DE DOMINÂNCIA. NESTE CASO ESPECÍFICO APONTA PARA O PRIMEIRO PROCEDIMENTO PARA O CÁLCULO DE DOMINÂNCIA DA COMUNIDADE “A”. AS FÓRMULAS A SEREM ESCRITAS ESTÃO CIRCULADAS.

FONTE: Os autores

Page 193: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

183

Assim, inicialmente calculamos o Pi (Pi – 1) para a comunidade A. Para isso, pega-se o valor do número de indivíduos observados para a espécie 1 (sp1), que foi igual a nove (9) e multiplicamos pelo próprio valor, decrescido de 1 conforme consta na fórmula. A operação está em destaque na planilha acima, circulada. Desta forma, você pode calcular no excel sem grandes dificuldades. Ao encontrar os resultados, somam-se os valores, que na fórmula estão descritos com o símbolo de somatório. O resultado é 92. Posteriormente é necessário calcularmos o N (N – 1) para a comunidade A, conforme podemos visualizar na tabela a seguir, destacado pelo círculo.

TABELA 30 – A FIGURA ILUSTRA COMO DAR SEQUÊNCIA AO CÁLCULO DE DOMINÂNCIA ENTRE COMUNIDADES DISTINTAS. O EXEMPLO REFERE-SE A DOMINÂNCIA DA COMUNIDADE “A”, ONDE ATRAVÉS DO SOMATÓRIO DO NÚMERO DE INDIVÍDUOS OBSERVADOS PARA CADA ESPÉCIE (VALOR = 23), CHEGA-SE AO VALOR DE 506, REFERENCIAL PARA A DOMINÂNCIA, INDICADO PELA SETA.

FONTE: Os autores

Observe aqui que o número 23 é a soma dos indivíduos observados para todas as 12 espécies, e que este varia de acordo com a comunidade ou bioma por exemplo. Na comunidade B, esse valor é de 13. Calculado este valor, basta dividirmos a soma de Pi para a comunidade A, ou seja, o valor de 92 por 506, e encontraremos a dominância de Simpson que é de 0,181818. Este valor também está descrito na planilha acima. Repare que exatamente os mesmos cálculos serão realizados para a comunidade B, onde encontramos um valor de 0,179487. Desta forma, podemos concluir que a comunidade B apresenta menor dominância se

Page 194: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

184

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

comparada à comunidade A. Como sabemos que a dominância é inversamente proporcional da diversidade, ou seja, quanto maior a dominância, menor a diversidade, teoricamente a comunidade B seria mais diversa, e, portanto, mais saudável, ou com menor pressão antrópica, se comparada com a comunidade A, de um mesmo bioma. Aparentemente, esta comunidade poderia sofrer algum tipo de pressão externa, limitando o seu desenvolvimento, ou ainda, estaria em início de estágio sucessional, conforme já evidenciamos anteriormente.

2.3 ÍNDICES DE EQUITATIVIDADE

Equitatividade ou equabilidade é o índice que mede o quanto as populações das diferentes espécies que habitam uma comunidade ou bioma estão em equilíbrio. Ou seja, se não há dominância de uma ou outra espécie. Desta forma, quanto mais equitativo for um ecossistema, maior será a sua diversidade e vice-versa. Geralmente varia de 0 a 1. Os valores mais próximos a 1 são aqueles mais diversos. Quanto mais equitativo e diverso for esse ambiente, dizemos que mais saudável o mesmo está. Como já vimos, esses índices poderiam ainda ser sugestivos de um ambiente próximo ao clímax, nos processos finais do estágio sucessional.

Percebam que um índice complementa o outro. Os dois indicadores que andam juntos, ou seja, quando um é elevado, o outro também tende a ser, são a diversidade e a equitatividade, assim como riqueza e dominância. Essas observações são importantes, pois na interpretação dos resultados numéricos, se não tivermos uma base teórica, podemos induzir ao erro de interpretação dentro de um processo de tomada de decisão para o gerenciamento ambiental de um ecossistema.

Em seu cálculo, compara-se o valor de diversidade calculado (Shannon) em relação ao valor máximo teórico. Quanto maior for a diferença entre o valor calculado e o teórico, menor será a equitatividade. O índice mais conhecido para cálculo da equitatividade é o de Pielou, que veremos a seguir.

Onde:

J = Equabilidade de Pielou;Hmáx= ln(S);S = número total de espécies amostradas;H' = índice de diversidade de Shannon-Weaver.

Para os resultados da ilha Moleques do Sul, já calculamos os valores de diversidade e sabemos o número de espécies, fica fácil encontrar os valores de equitabilidade. Desta forma, os valores que serão utilizados na fórmula serão:

Page 195: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

185

J = ? – quero descobrir!S = número total de espécies amostradas = 15;Hmáx= ln(S) = ln(15) = 2,7080;H' = índice de diversidade de Shannon-Weaver = 1,6534.

Desta forma, basta substituirmos os valores na fórmula e teremos o resultado:

Esse é o valor observado para equitabilidade de Pielou, e que expressa a homogeneidade em termos de abundância de indivíduos das espécies observadas dentro de um ecossistema. Como nossa equitabilidade ficou pouco acima de 50%, ou seja, com 0,61, pode-se afirmar que esse ambiente favorece a predominância de algumas espécies. Para o nosso estudo de caso, é fácil observarmos que a espécie Larus dominicanus ocupa o primeiro lugar em número de indivíduos registrados na ilha. Por ser uma ave muito oportunista em relação à ocupação de hábitats, consegue ocupar o espaço disponível para a construção de ninhos, por exemplo, com mais eficácia do que as demais espécies de aves, assim como consegue aproveitar melhor o alimento disponível. Essas características indicam para um ambiente comprometido em relação a sua diversidade e saúde ambiental, onde a tendência é de que as demais espécies deixem gradativamente a ilha para ocuparem outros locais, onde possam cumprir seu ciclo de vida, devido à elevada competição interespecífica.

2.4 A UTILIZAÇÃO DO SOFTWARE PAST PARA CÁLCULO DOS ÍNDICES ECOLÓGICOS

O programa PAST é um software muito utilizado atualmente pelos mais diversos profissionais da área de ecologia, biologia, oceanografia, engenharia ambiental, agronomia e gestão ambiental. Na prática, funciona como uma planilha de Excel, mas que faz todos os cálculos descritos anteriormente com apenas um clique no mouse, além de infinitos outros recursos.

Foi desenvolvido por pesquisadores como Oyvind Hammer do Museu de História Natural e também por pesquisadores da Universidade de Oslo. De acordo com o ecólogo Pavel Dodonov, PAST é originado do nome Palaeontological Statistics. É disponível on-line, e constantemente atualizado, e faz boa parte das análises mais comuns em ecologia, além de muitas outras de que nunca ouvimos falar.

Pode ser baixado em: <http://folk.uio.no/ohammer/past/>.

Page 196: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

186

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

Os autores pedem que ao utilizarmos o programa para procedermos com os cálculos, os devidos créditos sejam concedidos. Isso ocorre, pois, o download do programa é gratuito, ou seja, não pagamos nada para utilizá-lo. Apenas baixamos em nosso computador e os cálculos podem ser feitos. Há ainda na internet apostilas em português sobre a utilização do PAST. Para quem tiver interesse, é muito recomendado.

FIGURA 31 – A FIGURA APRESENTA O LAYOUT DO SOFTWARE PAST, PROGRAMA DE ECOLOGIA QUE NOS PERMITE CALCULAR DIVERSOS ÍNDICES ECOLÓGICOS

FONTE: Os autores

Apenas para ilustrar como a utilização deste software pode ser útil, vamos utilizar os dados da abundância de aves marinhas presentes na ilha Moleques do Sul. Neste caso, vamos inserir na planilha do PAST os dados da soma das quatro réplicas, conforme mostra a figura a seguir.

Page 197: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

187

FIGURA 32 – A FIGURA APRESENTA DE QUE FORMA NO PROGRAMA PAST PODEM SER CALCULADOS OS DIVERSOS ÍNDICES ECOLÓGICOS

FONTE: Os autores

Com os dados inseridos (567, 17, 42, 28, 299, 125...) em coluna, e selecionados, clicamos em Diversity, ou diversidade, do inglês, e em seguida, Diversity indices. Automaticamente todos os cálculos realizados anteriormente para diversidade, riqueza, equitatividade e dominância aparecem na tela, como visualizamos na figura a seguir. Repare que os dados estão muito próximos daqueles feitos por nós ao longo da explicação da origem dos cálculos. No entanto, por ser mais robusto, o PAST oferece maior certeza dos valores apresentados.

Page 198: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

188

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

FIGURA 33 – A FIGURA APRESENTA OS RESULTADOS DOS DIFERENTES ÍNDICES ECOLÓGICOS CALCULADOS PELO PROGRAMA PAST, COM A INSERÇÃO DE UMA COLUNA DE CONTAGEM DE INDIVÍDUOS DE DIFERENTES ESPÉCIES. NESTE CASO ESPECÍFICO FOI UTILIZADO A SOMA DOS VALORES DESCRITOS ANTERIORMENTE NA CONTAGEM DAS QUATRO RÉPLICAS PARA ESPÉCIES DE AVES.

FONTE: Os autores

Bom, finalizamos os nossos estudos com relação a utilização de índices ecológicos aqui. Desta forma, esperamos ter contribuído para que todos vocês tenham entendido na teoria e na prática o motivo de utilizarmos índices ecológicos para avaliar a qualidade ambiental. Certamente, todos esses cálculos serão muito úteis para suas vidas profissionais.

UTILIZAÇÃO DE ÍNDICES ECOLÓGICOS PARA ANÁLISE DO TRATAMENTO PAISAGÍSTICO ARBÓREO DOS PARQUES URBANOS DE

CURITIBA-PR

RESUMO

O objetivo deste trabalho foi avaliar a diversidade de espécies utilizadas no paisagismo arbóreo dos parques urbanos de Curitiba-PR por meio de índices ecológicos que traduzem a riqueza, dominância e equidade de espécies. Das 30 unidades de parques e bosques de Curitiba, foram sorteados aleatoriamente cinco parques: Passeio Público, Parque General Iberê de Mattos, Parque São Lourenço,

LEITURA COMPLEMENTAR

Page 199: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

189

Parque Municipal Barigui e Parque Municipal do Passaúna. As árvores foram identificadas quanto à taxonomia e origem. Para a análise da diversidade de espécies foram calculados os seguintes índices ecológicos relativos à riqueza, dominância e equidade de espécies: Margalef, Simpson, Pielou e Jaccard. Foram analisados 5525 indivíduos arbóreos, sendo identificados 95,9% até o nível de espécie. As maiores proporções de espécies exclusivas foram observadas no Passeio Público, seguido pelo Parque Passaúna, tanto para o total de espécies amostradas, quanto para a classe de espécies adultas. As menores proporções de espécies exclusivas foram observadas no Parque General Iberê de Mattos, tanto para o total amostrado, quanto para as classes jovem e adulto, sendo este o que apresentou a maior proporção de espécies na classe jovem. Dentre os cinco parques urbanos analisados, o Passeio Público foi o que apresentou maior riqueza de espécies e menor dominância e equidade de espécies.

PALAVRAS-CHAVE: Áreas verdes. Diversidade de espécies. Dominância de espécies. Equidade de espécies. Riqueza de espécies.

INTRODUÇÃO

Os parques urbanos, além de importantes espaços para recreação, esportes, lazer e cultura, promovem melhoria na qualidade de vida e apresentam potencial para contribuir com a biodiversidade regional (KABASHIMA et al., 2011). Neste sentido, Isernhagen et al. (2009) afirmam que a conservação da diversidade biológica é reconhecida como uma necessidade mundial, sendo preciso estender as estratégias de conservação para dentro do planejamento das áreas verdes das cidades. Biondi & Muller (2013) afirmam que atualmente, a conservação dos ecossistemas locais e/ou nacionais está diretamente associada com a qualidade da vegetação no tratamento paisagístico dos parques urbanos, independente da época de criação e estilo do projeto.

Com isto deve gerar maiores cuidados por parte dos paisagistas, pesquisadores e a municipalidade que é responsável pela gestão das áreas verdes urbanas. O conhecimento da flora urbana faz parte de um programa de estudos que toda cidade deveria se preocupar em desenvolver, visando a um plano de arborização que valorize os aspectos paisagísticos e ecológicos com a utilização, principalmente, de espécies nativas. Com isto, pode-se salvaguardar a identidade biológica da região, preservando ou cultivando as espécies vegetais que ocorrem em cada região específica (KRAMER & KRUPEK, 2012). Para Biondi & Leal (2008) a preocupação atual é grande com a biodiversidade nas áreas urbanas e isto se reflete na diversificação do número de espécies produzidas em viveiro; no entanto, esta preocupação com a diversificação de espécies é problemática, pois muitas vezes não há tempo suficiente para realizar pesquisas sobre as espécies introduzidas e desta forma ocorre a produção e a utilização de espécies indesejáveis para o ambiente e para o homem, tais como as plantas tóxicas e as plantas exóticas invasoras.

Page 200: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

190

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

Ainda é muito incipiente o número de pesquisas que avaliam os índices ecológicos da vegetação introduzida no paisagismo dos parques urbanos. Para o uso de tais índices é necessário a clara distinção entre os significados de “diversidade” e “diversidade de espécies”. Melo (2008) considera “diversidade” no sentido mais restrito de “diversidade de espécies”, expressão que ainda é ampla e pode ser interpretada de diversas formas. No contexto de índices de diversidade, o mesmo autor afirma que “diversidade de espécies” poderá englobar riqueza de espécies ou riqueza de espécies e equabilidade. Rodrigues (2014) conceitua os termos de maneira mais prática e direta, assim sendo: diversidade de espécies refere-se à variedade de espécies de organismos vivos de uma determinada comunidade, habitat ou região; riqueza de espécies - refere-se à abundância numérica de uma determinada área geográfica, região ou comunidade; equidade, equitabilidade, igualdade - padrão de distribuição de indivíduos entre as espécies, sendo proporcional a diversidade, exceto se houver codominância de espécie; e dominância como o próprio nome já diz, refere-se a dominância de uma ou mais espécies numa determinada comunidade, habitat ou região. E quanto à biodiversidade refere-se tanto ao número (riqueza) de diferentes categorias biológicas quanto à abundância relativa (equitabilidade) dessas categorias.

O conhecimento da diversidade de espécies em uma área é essencial para o gerenciamento desta, em relação às atividades impactantes, aos interesses e necessidades de conservação de recursos naturais ou à necessidade de recuperação de áreas degradadas (MELO, 2008). Os índices de riqueza e diversidade são indicadores da diversidade de espécies e podem ser usados como ferramenta do manejo e do plano diretor da arborização urbana (BOBROWSKI, 2011). Tanto no planejamento como na manutenção das áreas urbanas ainda não existe, por parte da municipalidade, o cuidado de se analisar a proporção de espécies que compõe o paisagismo arbóreo das áreas verdes que mais são próximas à população usuária. Isto provavelmente ajudaria não só a conservação de espécies como seria um instrumento de popularização e educação ambiental.

Para iniciar esse processo e contribuir para futuras comparações entre áreas verdes e/ou entre cidades, o objetivo deste trabalho foi avaliar a diversidade de espécies utilizadas no paisagismo arbóreo dos parques urbanos de Curitiba-PR por meio de índices ecológicos que traduzem a riqueza, dominância e equidade de espécies.

MATERIAL E MÉTODOS

No ano 2000 o município de Curitiba contava com 30 unidades de parques e bosques, 11 núcleos ambientais, 5 jardins ambientais, 54 largos, 15 eixos de animação, 330 jardinetes e 453 praças (SMMA, 2006; IPPUC, 2011). Das 30 unidades de parques e bosques de Curitiba, foram sorteados aleatoriamente cinco parques, representando 16,67% do total. São eles: Passeio Público, Parque

Page 201: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

191

General Iberê de Mattos (Bacacheri), Parque São Lourenço, Parque Barigui e Parque Municipal do Passaúna. O Passeio Público, inaugurado em 1886, foi o primeiro parque de Curitiba e apresentava cerca de 70 mil m² de vegetação nativa nas margens do rio Belém. Ainda naquele século foi, por algum tempo, utilizado como Jardim Botânico de Curitiba e depois como o primeiro zoológico, sendo que até hoje possui alguns animais em cativeiro, além de um aquário (PARQUES, 2012). O Parque General Iberê de Mattos, mais conhecido por Parque Bacacheri, foi inaugurado em 1988, com uma área de 152 mil m². Possui canchas de futebol e de vôlei de areia, churrasqueiras, playground, lago artificial (PARQUES, 2012) e bosque de vegetação nativa. O Parque São Lourenço foi inaugurado em 1972 e possui uma área total igual a 204 mil m², onde existem diversos equipamentos de lazer (PARQUES, 2012) e bosques nativos com araucárias.

O Parque Municipal Barigui, criado em 1972, possui uma área de 1,4 milhão m². É um dos maiores e o mais frequentado de Curitiba e possui diversos equipamentos de lazer, Museu do Automóvel, parque de exposições, heliporto, pista de bicicross e aeromodelismo (PARQUES, 2012) e remanescentes florestais. O Parque Municipal do Passaúna, inaugurado em 1991, possui uma área de 6,5 milhões m². Aproximadamente a metade dessa área foi recoberta pelo lago da represa da Estação de Abastecimento de Água do Passaúna, que abastece parte da cidade de Curitiba. Por isso, é considerada, por lei estadual e municipal, uma Área de Proteção Ambiental (APA). Possui uma trilha ecológica de 3,5 km beirando o lago, Estação Biológica, diversos equipamentos de lazer e um mirante de 60 m de altura (PARQUES, 2012).

A coleta foi realizada no período de agosto de 2009 a junho de 2010. Em cada área verde foi utilizada uma planilha para a coleta de campo com os seguintes dados: código da espécie; número de referência da espécie para identificação (exsicata); estágio de desenvolvimento (adulta ou jovem) e o número de indivíduos de cada espécie arbórea. Todas as áreas verdes analisadas nesta pesquisa possuem um ou mais fragmentos de vegetação remanescente de Floresta Ombrófila Mista, além das árvores introduzidas no tratamento paisagístico. Somente as árvores introduzidas no tratamento paisagístico foram contempladas no levantamento florístico, sendo adotados os seguintes critérios de inclusão: (a) árvore isolada ou em agrupamentos fora das áreas do remanescente florestal, fazendo parte de uma composição com outras plantas ou complementando áreas específicas do parque, tais como estacionamento, playground, áreas com churrasqueiras, bordas de caminhos e outros; (b) mudas arbóreas com tronco sem ramificação na base (padrão para arborização de ruas de mudas produzidas no Horto Municipal da Barreirinha, Curitiba); (c) mudas arbóreas com presença de tutor (material utilizado pela prefeitura para apoiar ou sustentar a muda ereta), sendo que, em caso de dúvida, buscaram-se informações sobre o seu plantio com os funcionários do local.

Page 202: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

192

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

Foi coletado, quando existente, material vegetal fértil (com flor e/ou fruto), para elaboração de exsicata e posterior identificação de espécies que não foram identificadas durante as coletas de campo. As exsicatas foram identificadas no Herbário do Curso de Engenharia Florestal da UFPR. Os nomes científicos e a autoria dos epítetos específicos foram conferidos pelo banco eletrônico do Jardim Botânico de Missouri (MISSOURI BOTANICAL GARDEN, 2012) e pela lista de espécies da flora do Brasil (MUSEU BOTÂNICO DO RIO DE JANEIRO, 2012). Para a análise da diversidade de espécies foram calculados, em cada parque selecionado, os seguintes índices ecológicos relativos à riqueza, dominância e equidade de espécies:

a) Índice de Margalef - expressa a riqueza de espécies, considerando o número de espécies (S-1) e o logaritmo (base 10 ou natural) do número total de indivíduos. É estimado por meio da seguinte equação (MAGURRAN, 2011): Dmg = (S – 1) / ln N; Onde: S = número de espécies amostradas; N = número total de indivíduos em todas as espécies.

b) Índice de Simpson – expressa a dominância de espécies e a probabilidade de dois indivíduos selecionados ao acaso serem da mesma espécie. Varia de 0 a 1 e quanto mais alto for, maior a probabilidade de os indivíduos serem da mesma espécie, ou seja, maior a dominância e menor a diversidade (URAMOTO et al., 2005). Possui uma vantagem em relação aos índices de Margalef, Gleason e Menhinick, pois não somente considera o número de espécies (s) e o total de números de indivíduos (N), mas também a proporção do total de ocorrência de cada espécie. A dominância de Simpson é estimada por meio da equação (MAGURRAN, 2011): λ = Σpi2; Onde: pi = proporção de cada espécie, para i variando de 1 a S.

c) Índice de Pielou – exprime a análise da equitabilidade, o qual refere-se ao padrão de distribuição dos indivíduos entre as espécies, com valores variando entre 0 e 1, para um mínimo e máximo de uniformidade (MOÇO et al., 2005; RODE et al., 2009). Segundo Kanieski et al. (2010) este índice mede a proporção da diversidade observada em relação à máxima diversidade esperada. De acordo com Magurran (2011) o índice de Pielou é obtido pela equação: J’= H’ / Hmax; Onde: H’ = índice de diversidade de Shannon-Wiener; Hmax = ln do número total de espécies (S).

d) Índice de Jaccard – utilizado para a análise da similaridade de espécies entre as parcelas (parques). Este coeficiente é utilizado para estudar a coexistência de espécies ou a similaridade entre unidades amostrais (REAL & VARGAS, 1996), sendo uma medida de correlação que varia entre 0 e 1 (RODE et al., 2009). Segundo Real & Vargas (1996) pode ser descrito pela equação: J = C / A+B+C; Onde: A = número de espécies presentes na parcela A e ausentes na parcela B; B = número de espécies presentes na parcela B e ausentes na parcela A; C = número de espécies comuns entre as parcelas A e B. A quantidade de espécies classificadas nas classes total, adulta e jovem foi comparada, aos pares, por meio do teste de quiquadrado ao nível de 1% de probabilidade.

Page 203: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

193

RESULTADOS E DISCUSSÃO

Do total de espécies arbóreas identificadas nos parques avaliados (149 espécies), metade das espécies (75 espécies) ocorre em apenas um parque e 12% delas (18 espécies) ocorrem simultaneamente em todos eles. O maior número de espécies foi encontrado no Passeio Público (81 espécies), seguido pelos parques São Lourenço (69 espécies) e Passaúna (57 espécies). O maior número de famílias foi encontrado no Parque São Lourenço (37 famílias), seguido do Passeio Público (32 famílias) e do Parque Municipal do Passaúna (30 famílias). O número total de indivíduos arbóreos amostrados foi igual a 5.525.

A partir dos dados apresentados na Tabela 1 constatou-se que houve diferença estatisticamente significativa (p < 0,01) entre a quantidade de espécies observadas nos grupos Total e Classe Jovem (χ² = 87,61; GL = 4) e entre os grupos Classe Jovem e Classe Adulto (χ² = 101,19; GL = 4). As maiores proporções de espécies exclusivas foram observadas no Passeio Público, seguido pelo Parque Municipal Passaúna, tanto para o total de espécies amostradas (15,44% e 12,08% respectivamente), quanto para a classe de espécies adultas (14,77% e 12,08% respectivamente). Para o Parque Municipal Passaúna foi observada a maior proporção de espécies como indivíduos da classe adulta (98,36%), bem como a maior proporção de espécimes com indivíduos da classe adulta (89,82%). Isso reflete duas situações relacionadas à composição do tratamento paisagístico arbóreo do parque: a implantação de espécies florestais se deu há algum tempo, não sendo verificados plantios expressivos dada a baixa quantidade de árvores jovens, e a composição observada se dá essencialmente com espécies provenientes da regeneração natural da área, já que este é o parque municipal mais naturalmente preservado.

Page 204: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

194

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

As menores proporções de espécies exclusivas foram observadas para o Parque Bacacheri, tanto para o total amostrado (2,01%) quanto para as classes jovem (2,44%) e adulto (1,34%), sendo este o parque que apresentou a maior proporção de espécies na classe jovem (91,11%). Por outro lado, o Parque São Lourenço, que apresentou a segunda maior proporção de espécies na classe jovem (84,0%), foi a área verde amostrada onde se observou a maior proporção de espécimes como indivíduos enquadrados na classe jovem (81,29%). As menores proporções de espécies classificadas na classe jovem foram observadas para os parques Passeio Público e Passaúna (37,80% e 19,67% respectivamente) e as menores proporções de espécimes enquadrados na classe jovem foram observadas nos parques Barigui e Passaúna (18,03% e 10,18% respectivamente).

Com relação aos índices de diversidade analisados constatou-se que a maior riqueza específica, expressa pelo índice de Margalef, foi observada para o Passeio Público, tanto para o total amostrado quanto para a classe de árvores adultas; ao passo que o menor valor deste índice ocorreu para o Parque Bacacheri, também para o total amostrado e para a classe de árvores adultas. Para a classe de árvores jovens a maior riqueza específica foi observada no Parque São Lourenço e a menor delas para o Parque Municipal Passaúna, sendo que para o primeiro parque foi constatada a maior quantidade de espécies exclusivas e para o segundo parque a menor delas. Em análise da composição arbórea de

Page 205: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

195

sete parques urbanos em Recife-PE, SILVA et al. (2007) encontraram valores de riqueza específica, expresso pelo índice de Margalef, variando entre 3,54 a 10,07. Os valores de riqueza específica encontrados no tratamento arbóreo paisagístico dos parques analisados em Curitiba, Paraná, em relação ao total de indivíduos, também apresentaram valores altos de diversidade, mas com menor amplitude.

A análise comparativa dos valores deste trabalho com os valores do trabalho de SILVA et al. (2007) não deve ser utilizada como parâmetro de qual situação apresenta a melhor diversidade de espécies na composição paisagística, pois de acordo com MAGURRAN (2011) a análise comparativa de índices de diversidade deve levar em consideração as respectivas áreas de amostragem e suas equivalências, caso contrário deve-se adotar a rarefação dos dados para poder realizar uma análise comparativa apropriada. RICHTER et al. (2012), em análise da arborização de vias públicas e dos parques urbanos na cidade de Mata-RS, consideraram como baixa diversidade os valores do índice de riqueza específica de Margalef menores que 2,0 e como alta diversidade os valores do índice maiores que 5,0. Se adotado esse critério na análise do levantamento florístico dos parques verifica-se que houve elevada diversidade para o total amostrado em cada parque, mas baixa diversidade de espécies na classe jovem, para o Parque Municipal Passaúna.

Deve-se observar que no Parque São Lourenço houve a maior introdução de novas espécies (39 espécies), representado pela maior quantidade da diferença entre os valores da classe adulto e os valores do total amostrado, e que no Parque Municipal Passaúna houve a menor introdução de novas espécies (apenas uma). Apesar de não existirem referências ou uma padronização técnica de composição do tratamento paisagístico arbóreo de parques urbanos, em termos de diversificação, ISERNHAGEN et al. (2009) afirmam que altos valores de índices de diversidade podem mascarar a presença de espécies exóticas e principalmente das exóticas invasoras, não indicando de forma confiável a boa qualidade ambiental da arborização implantada.

Neste sentido, Sjömana et al. (2012) atestam que ainda não há conhecimento apropriado sobre níveis de diversidade sustentáveis para uma população de árvores urbanas. Sendo assim, os resultados obtidos na análise de diversidade do Passeio Público é um exemplo de que o maior valor da diversidade pode não representar uma qualidade ambiental no momento. Segundo Biondi & Muller (2013) quando estudaram os mesmos parques urbanos desta pesquisa, constataram que o Passeio Público foi o parque que apresentou maior número de espécies exóticas (13 espécies) e exóticas invasoras (10 espécies). Por ser o primeiro parque de Curitiba, inaugurado em 1886, a utilização de espécies exóticas nas áreas verdes no século 19 tinha forte influência europeia. Além disso, a utilização de espécies exóticas pode também ser justificada pela função primitiva do parque. Segundo NOGUEIRA (2010), durante o século 19, essa área verde foi, por um tempo, o primeiro Jardim Botânico de Curitiba, e depois o primeiro zoológico de Curitiba, até 1982. Quando uma área verde funciona como Jardim Botânico ela necessita de uma grande variedade de espécies nativas e exóticas para compor

Page 206: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

196

UNIDADE 3 | ÍNDICES ECOLÓGICOS UTILIZADOS COMO INDICADORES DE QUALIDADE AMBIENTAL

uma coleção de espécies exsitu, que, de acordo com o PLANO DE AÇÃO PARA OS JARDINS BOTÂNICOS BRASILEIROS (2004), é requisito para a conservação da diversidade biológica dos jardins botânicos nacionais. A análise dos índices de diversidade utilizados demonstra que quanto maior a riqueza específica encontrada, menores tendem a ser os valores de dominância e de equidade na composição da diversidade de espécies do tratamento paisagístico arbóreo dos parques. O comportamento contraditório entre os índices de Margalef e Simpson é um fato esperado, tendo em vista que quanto maior a riqueza de espécies de uma comunidade vegetal menor tende a ser a dominância de uma espécie em específico (KANIESKI et al., 2010).

A reduzida equidade observada na amostragem da composição paisagística arbórea dos parques revela que as espécies não são plantadas de maneira uniforme, atendendo a uma mesma proporção de composição por espécie. A maior dominância constatada para a classe de indivíduos adultos no Parque Bacacheri se deve ao predomínio da espécie Handroanthus chrysotrichus (Mart. ex A.DC.) Mattos (ipê-amarelo-miúdo), da qual foram amostrados 64 indivíduos (35,75% do total). Para o Parque Municipal Passaúna, a maior dominância constatada na classe jovem se deve ao predomínio de plantio de indivíduos de Lafoensia pacari St.-Hil (dedaleiro), da qual foram amostrados 42 indivíduos (27,81% do total). Esse fato é reforçado pela constatação da menor variabilidade de indivíduos por espécie expressa pelo menor coeficiente de variação para o parque (Tabela 2), que apresentou a menor quantidade de espécies com indivíduos na classe jovem (Tabela 1).

A variabilidade dos resultados do índice de equidade de Pielou (Tabela 1) apresentou correspondências interessantes com os dados da estatística descritiva apresentados na Tabela 2. Para a classe jovem, o maior valor de equidade obtido com o Parque Municipal Passaúna (0,22) está relacionado ao menor coeficiente de variação da quantidade de indivíduos por espécie (107,24%), porém o menor valor observado para este índice, com o Parque São Lourenço (0,07), na classe jovem, não corresponde ao maior valor de coeficiente de variação.

Page 207: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

TÓPICO 2 | ÍNDICES ECOLÓGICOS

197

Para a classe adulta, o maior valor de equidade verificado no Parque Bacacheri (0,14) corresponde ao maior coeficiente de variação (225,70%); o menor valor de equidade verificado para o Passeio Público (0,05) corresponde ao menor valor do coeficiente de variação para a classe (136,43%). Com base nisso, constata-se que o uso de informações básicas da estatística descritiva não consegue explicar satisfatoriamente a equidade na composição da diversidade de espécies. Em termos de similaridade de composição, os dados foram analisados por meio do índice de Jaccard e estão apresentados na Tabela 3.

Verifica-se que a maior similaridade de composição paisagística arbórea para a classe jovem, referente ao plantio de novas mudas e espécies, ocorreu entre os parques Bacacheri e Passaúna (0,91), demonstrando que as espécies introduzidas são essencialmente as mesmas, porém com predomínios (dominância) diferentes. Para a classe adultos e para o total amostrado a maior similaridade de composição de espécies foi encontrada entre os parques Bacacheri e Barigui.

CONCLUSÕES

Com os resultados obtidos foi possível concluir que dentre os cinco parques urbanos analisados, o Passeio Público foi o que apresentou maior riqueza de espécies e menor dominância e equidade de espécies. O índice de Jaccard mostrou-se uma ferramenta útil para a análise comparativa da composição florística entre tratamentos paisagísticos nos parques urbanos. O uso dos índices ecológicos para descrição da diversidade de espécies em parques urbanos deve sempre ser feito mediante considerações acerca da origem das espécies florestais avaliadas, a fim de demonstrar a participação das espécies exóticas invasoras e de pautar ações de substituição, priorizando aquelas nativas do ecossistema local.

FONTE: Disponível em: < http://www.conhecer.org.br/enciclop/2014a/AGRARIAS/utilizacao%20de%20indices.pdf>. Acesso em: 30 jun. 2015.

Page 208: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

198

RESUMO DO TÓPICO 2

Neste tópico, você viu:

• O que são índices ecológicos.

• Para que utilizarmos indicadores ambientais visando prever o comportamento de um ecossistema.

• Os índices de diversidade e de equitatividade sempre possuem uma correlação positiva.

• Sempre que índices de riqueza forem elevados, os de dominância também serão.

• Elevados índices de diversidade biológica e equitabilidade sugerem que um ecossistema esteja com seu estágio de sucessão concluído, ou ainda, que este ambiente esteja saudável, sem a interferência de ações antrópicas.

• Utilização do software PAST para cálculo de índices ecológicos.

Page 209: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

199

AUTOATIVIDADE

Para exercitar seus conhecimentos adquiridos, resolva a questão a seguir.

Para esta atividade de estudo, sugerimos que com o apoio do tutor externo, vocês façam uma saída de campo, buscando por uma área com cobertura vegetal. Assim, podem proceder com os cálculos dos índices vistos anteriormente. Vocês podem, por exemplo, comparar o interior desta floresta, com sua região de borda, no que tange à diversidade vegetal. Não precisamos chegar a ponto de classificar as espécies. Apenas vamos classificá-las como A, B, C, D e assim por diante, e contar o número de indivíduos presentes dentro de um quadrat. Este pode ter por exemplo, 2 X 2, ou se estivermos trabalhando dentro de uma área com árvores de maior porte, pode-se ampliar o tamanho do quadrat. Podemos trabalhar com no mínimo três réplicas para cada área, ou seja, três quadrats no interior da mata, e três fora, na região de borda. Posteriormente anotamos todos os dados em planilhas de excel e procedemos com os cálculos, fazendo a comparação dos dados obtidos.

Page 210: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

200

Page 211: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

201

REFERÊNCIAS

MAGURRAN, A. E.; MCGILL, B. J. Biological Diversity: Frontiers in Measurement and Assessment. Estados Unidos: Oxford University Press, 2011.Margalef, R. Ecología. Barcelona: Editora Omega, 1974.

ODUM, E.P. Ecologia. Guanabara Koogan: Rio de Janeiro, 1988.

PARTIDÁRIO, M. do R.; JESUS, J. de. Avaliação do impacte ambiental: conceitos, procedimentos e aplicações. Portugal: CEPGA, 1999.

RICKLEFS, R.E. A economia da natureza. 5. ed. Guanabara Koogan: Rio de Janeiro, 2003.

Page 212: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

202

ANOTAÇÕES

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

Page 213: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

203

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

Page 214: Prof. Luis Augusto Ebert Prof.ª Rafaela Tamara Marquardt

204

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________

____________________________________________________________