O Teste de Hipótese é uma das regras e metodologias fundamentais da estatística. Ele envolve parâmetros que auxiliam o indivíduo a decidir entre uma ou mais opções para tomar a melhor decisão.
Também conhecido como teste estatístico, ou teste de significância, uma explicação também muito atrelada ao teste de hipótese mostra que o seu objetivo é averiguar se um determinado valor hipotético representa bem ou não uma determinada ocasião.
Mas como vamos saber qual valor hipotético utilizar como parâmetro? Como saber se esse valor representa bem ou não o caso estudado?
Além disso, você sabe como realizar o teste de hipótese e em quais situações ele se encaixa? Se a sua resposta para essas perguntas é “não”, está no lugar certo! Neste artigo, você aprenderá tudo o que é necessário para usar essa ferramenta. Confira os tópicos:
Vamos lá?
O teste de hipótese, também chamado de teste estatístico ou teste de significância, é uma ferramenta estatística baseada na utilização de uma amostra aleatória extraída de uma população de interesse, com o objetivo de testar uma afirmação sobre um parâmetro ou característica desta população.
Não se trata de uma simples comparação matemática entre dois ou mais valores, mas da necessidade de compreender se o valor obtido a partir de uma determinada amostra representa uma simples variação amostral da situação atual ou não.
O teste de hipótese é amplamente utilizado na área de Controle Estatístico de Processo (CEP) e funciona como um procedimento adotado pelos profissionais da estatística para aceitar ou eliminar hipóteses.
Existem inúmeras ferramentas estatísticas, não é mesmo? Então, como saberemos quando utilizar cada uma delas? A resposta é simples: a escolha se baseia no tipo de amostra que sua base de dados possui.
Na figura abaixo, está representado um mapa de análise estatística, ele indica qual ferramenta quantitativa é a mais indicada para cada par entrada-saída de dados que será estudado.
Esse mapa deve ser utilizado no início da fase de análise do método DMAICa fim de comprovar com fatos e dados a relação entre as causas raiz (X´s vitais) e as saídas de interesse do processo (variáveis Y´s).
Respondendo à pergunta principal deste tópico, utilizaremos os testes de hipóteses sempre que a variável de entrada X for discreta e a variável de saída Y contínua, ou seja, no quadrante superior direito deste mapa.
É importante ressaltar que devemos garantir que as amostras são provenientes de uma distribuição normal.
Curtindo o assunto do artigo? Fizemos essa pausa para oferecer a você um conteúdo gratuito que irá ajudá-lo na sua caminhada de aprendizados no universo profissional.
Entenda o que é e desvende os principais mitos sobre a metodologia Lean Seis Sigma com o nosso E-book Guia Definitivo Lean Seis Sigma!
Faça agora o download e se torne qualificado para concorrer às melhores vagas no mercado! Clique na imagem abaixo e garanta o seu acesso.
Para facilitar o entendimento de quando deve-se aplicar os testes de hipóteses, elaborei uma lista com alguns exemplos de situações com variável de entrada discreta e variável de saída contínua, veja:
Imagine que o dono de duas farmácias mediu, durante 15 dias, o tempo de espera do cliente na fila do caixa. Ao calcular o tempo médio, os valores obtidos foram 5 minutos na loja A e 3,5 minutos na loja B. Podemos afirmar que o tempo médio de espera na loja B é menor?
Para respondermos à pergunta, podemos construir duas hipóteses: uma hipótese nula (H0), em que o tempo médio de espera é significativamente igual nas duas lojas. E uma hipótese alternativa (Ha), em que existe diferença significativa entre o tempo médio da loja A e loja B.
A partir das hipóteses formuladas, temos a possibilidade de quatro ocorrências, aceitando ou rejeitando uma das hipóteses, como mostrado abaixo:
Ou seja, se a hipótese nula for verdadeira e a rejeitarmos, estaremos cometendo um equívoco, esse erro é chamado de erro tipo I. O correto seria aceitar essa hipótese.
Por outro lado, se a hipótese alternativa for verdadeira e rejeitarmos H0, estaremos tomando uma decisão correta, se não rejeitássemos, estaríamos cometendo o erro tipo II.
E como vamos tomar essa decisão? Para isso é importante definir a variável "p-valor". Também chamada de nível descritivo ou probabilidade de significância, é a probabilidade de se obter uma estatística de teste igual ou mais extrema que aquela observada em uma amostra.
Podemos dizer que quando o valor alvo está próximo do que seria a variação natural do processo, o "p-valor" é grande e aceita-se H0 e rejeita-se Ha.
A partir de qual valor pode-se dizer que “p-valor” é muito pequeno e, portanto, podemos rejeitar a hipótese nula e aceitar a hipótese alternativa?
Na área comercial, esse valor é chamado de α e é usual de 0,05, ou seja, 5%. Em outras palavras, é de no máximo 5% o risco de rejeitar H0 quando H0 é verdadeira.
É importante ressaltar que o teste de hipótese não garante total certeza de estarmos tomando a decisão correta, porém trabalhando com 95% de confiabilidade, a chance de estarmos cometendo um dos erros é muito baixa.
O intervalo de confiançaé um conceito que foi criado em 1937 por Jerzy Neyman, matemático russo, amplamente utilizado durante os testes de hipótese.
Na estatística, o intervalo de confiança é uma estimativa que possui um parâmetro populacional (como a média ou o desvio-padrão) visível em porcentagem e elencadas por nível de confiança, sendo 90%, 95% e 99% os mais utilizados. Contudo, é válido ressaltar que é possível utilizar vários níveis distintos a depender da necessidade de cada cenário.
O intervalo de confiança é retratado como um intervalo numérico que possui um parâmetro a ser avaliado e o nível de confiança indica a porcentagem citada acima.
A partir dos conceitos discutidos, podemos aplicar alguns tipos de testes de hipóteses para a combinação de uma variável x discreta com uma variável y contínua. Confira abaixo um exemplo prático no Minitab para algumas dessas aplicações.
Determina se a média de uma amostra difere de maneira significativa de um valor especificado como padrão.
O Green Belt responsável pelo projeto de consolidação de tubos na Voitto Labs, conseguiu adquirir informações de mercado e identificou que os concorrentes estão trabalhando, em média, com um índice de consolidação igual a 1,75.
Através do teste t para uma amostra, o Green Belt fará uma validação estatística para concluir se a Voitto Labs possui um resultado igual ou pior que dos concorrentes.
Neste exemplo podemos perceber claramente que se trata de um teste t para uma amostra, pois a comparação que se deseja fazer é entre uma única empresa com um valor de referência.
A primeira coisa que se deve fazer é definir qual vai ser a hipótese nula e qual vai ser a hipótese alternativa. Nesse exemplo vamos utilizar H0: índice de consolidação Voitto Labs = 1,75 e Ha: índice de consolidação Voitto Labs ≠ 1,75.
Após a coleta de dados, abra o Minitab e selecione stat > estatísticas básicas > teste t para 1 amostra.
Selecione Índice de consolidação como a variável > clique em realizar teste de hipóteses > digite 1,75 em média hipotética > clique em opções e Escolha o teste ≠ como Hipótese alternativa.
Dessa forma o Minitab nos retorna o valor do p-valor. Basta então analisá-lo. Se p-valor < α rejeita-se H0. Se p-valor ≥ α não rejeita-se H0. Onde α é o nível de significância, que estamos utilizando 5%.
Determina se a média de duas amostras independentes diferem significativamente entre si.
Um dos engenheiros da Voitto Labs identificou como causa potencial o fornecedor dos equipamentos utilizados nas análises. Segundo ele, o equipamento de cada fornecedor consolida ou fraciona o conteúdo dos tubos de maneira diferente, o que pode afetar o indicador do projeto.
Neste exemplo vamos comparar a média de duas amostras. Por isso iremos utilizar o teste t para duas amostras com o objetivo de avaliar o índice de consolidação estratificado por fornecedor/equipamento. Atualmente a Voitto Labs trabalha com dois fornecedores de equipamentos, a ProLab e a BrasMed.
Vamos considerar a hipótese H0 como desempenho ProLab = desempenho BrasMed, e a hipóteses Ha como desempenho ProLab ≠ desempenho BrasMed.
Após a coleta de dados, abra o Minitab e selecione stat > estatísticas básicas > teste t para 2 amostras.
Escolha ProLab como amostra 1 e BrasMed como amostra 2 > clique em opções e escolha a opção adequada para a hipótese alternativa (neste exemplo a opção testada é ≠).
Dessa forma o Minitab nos retorna o valor do p-valor, basta então analisá-lo. Se p-valor < α rejeita-se H0, se p-valor ≥ α não rejeita-se H0. Onde α é o nível de significância, que estamos utilizando 5%.
Também conhecida como Análise de Variância, a ANOVA compara a média de mais de duas amostras e determina se pelo menos uma difere significativamente.
Iremos usar do fato que uma possível causa de um determinado problema seja a diferença de desempenho das linhas de produção. Na Voitto Labs, o layout na área de produção é separado em quatro linhas: verde, azul, vermelha e amarela.
O Green Belt fará uma análise de variância para determinar se o desempenho médio das linhas é igual ou se pelo menos uma linha possui desempenho significativamente diferente das outras.
A hipótese nula nesse caso é de que H0: linha verde = linha azul = linha amarela = linha vermelha. Já a hipótese alternativa é Ha: pelo menos um desempenho médio é significativamente diferente.
Após fazer a análise no Minitab de forma similar aos exemplos anteriores basta analisar se p-valor < α e assim rejeitar H0 e se p-valor ≥ α não rejeitar H0.
Determina se a média de duas amostras pareadas, ou seja, dependentes, difere significativamente. Dois conjuntos de observações estão relacionados à mesma unidade amostral.
O RH da empresa Voitto Cars deseja verificar se duas faixas distintas de tempo de empresa (abaixo de 18 meses, acima de 18 meses) possuem resultados significativamente distintos para o índice de produtividade dos operadores do chão de fábrica.
Através do teste t pareado fará a comparação do índice de produtividade médio, resultante de 45 dias de medição por exemplo, para cada operador de um mesmo turno, com características similares e apenas o tempo de empresa visivelmente distinto.
Vamos adotar uma hipótese nula H0: abaixo de 18 meses = acima de 18 meses e um hipótese alternativa Ha: abaixo de 18 meses ≠ acima de 18 meses.
Após a coleta de dados, abra o Minitab e selecione stat > estatísticas básicas > teste t pareado.
Selecione abaixo de 18 meses como amostra 1 > selecione acima de 18 meses como amostra 2.
Confira se o nível de confiança está em 95% > escolha o teste ≠ como hipótese alternativa.
A regra de decisão do teste é a mesma que nos outros testes: se p-valor < α rejeitar H0. Se p-valor ≥ α não rejeitar H0. Onde nível de significância α = 0,05 (5%).
Determina a proporção que uma amostra difere de maneira significativa de uma valor especificado como padrão.
Além de monitorar a produtividade dos operadores, a empresa Voitto Cars também acompanha de perto o índice de refugo de peças produzidas. A empresa estabelece como meta um índice de refugo igual ou menor que 2%.
Um Black Belt deseja verificar se as melhorias que ele realizou no processo e nos equipamentos resultaram em um índice dentro da meta da empresa. Uma amostra aleatória de 480 peças foi coletada e avaliada. Na amostra, 11 peças foram consideradas defeituosas e, consequentemente, refugadas.
Através do teste para 1 proporção podemos comparar o resultado da amostra com o valor de referência do índice de refugo.
Vamos tomar H0: proporção de peças refugadas na amostra = 2% e Ha: proporção de peças refugadas na amostra ≠ 2%
Após a coleta de dados, abra o Minitab e selecione stat > estatísticas básicas > teste para 1 proporção.
Selecione dados sumarizados > digite 11 em número de eventos: > 480 em número de ensaios: > clique em realizar teste de hipóteses > digite 0,02 em proporção hipotética.
Confira se o nível de confiança está em 95% > escolha o teste ≠ como hipótese alternativa.
Iremos rejeitar H0 se p-valor < α e não rejeitar H0 se p-valor ≥ α. Para α = 0,05.
Compara se a proporção de duas amostras diferem significativamente.
Surpreso com o resultado da primeira amostra de 480 peças, o Black Belt estabeleceu a hipótese de que os dois turnos da empresa teriam resultados distintos. Portanto, um turno poderia estar fora da meta desejada pela empresa, mas outro turno estaria dentro da meta.
O Black Belt realizou nova coleta de amostras, sendo avaliadas 580 peças da primeiro turno, sendo 18 peças refugadas, e 560 peças do segundo turno, sendo 7 peças refugadas.
Através do teste de hipótese para 2 proporções podemos comparar o resultado das duas amostras e verificar se o resultado é significativamente distinto, além de observar se algum turno está dentro da meta definida para o índice de refugo.
Iremos tomar H0: proporção de peças refugadas no 1º turno = proporção de peças refugadas no 2º turno e Ha: proporção de peças refugadas no 1º turno ≠ proporção de peças refugadas no 2º turno.
Para realização do teste são coletadas amostras dos elementos das duas populações e observada a proporção de elementos que possuem alguma característica de interesse.
Após a coleta de dados, abra o Minitab e selecione stat > estatísticas básicas > teste para 2 proporções.
Selecione dados sumarizados > digite 18 em Número de eventos da amostra 1 > 7 em número de eventos da amostra 2 > digite 580 em número de ensaios da amostra 1 > 560 em número de ensaios da amostra 2 > clique em opções e confira se o nível de confiança está em 95% e escolha o teste ≠ como hipótese alternativa.
Se p-valor < α devemos rejeitar H0 e se p-valor ≥ α não se rejeita H0.
Você quer aprender a tomar melhores decisões a partir da realização de uma análise de risco? Temos aqui a sua solução!
Com a nossa planilha de Planilha de Análise de Risco e Matriz de Decisão, você terá acesso a uma estrutura prática e interativa que te permite categorizar as possibilidades por riscos e vantagens, facilitando assim sua análise de riscos e a sua tomada de decisão.
Não vai perder essa oportunidade não é mesmo? Então clique no botão abaixo e faça já o seu download!
Possui curso Técnico em Agroindústria pelo IFF (Instituto Federal Fluminense), onde foi o monitor principal da disciplina de matemática. Acumulou por 3 anos, menções honrosas por bom desempenho na OBMEP (Olimpíada Brasileira de Matemática das Escolas Públicas). É graduado em Engenharia Mecânica pela UFJF (Universidade Federal de Juiz de Fora), onde além de continuar lecionando através de monitoria das disciplinas de cálculo 3, resistência dos materiais (I e II), e fundamentos de combustão, participou do movimento empresa júnior. Também foi presidente da equipe universitária de eficiência energética da faculdade, nessa área teve um artigo acadêmico aceito e o apresentou no EMMEC (Encontro Mineiro de Engenharia Mecânica). Leonardo foi estagiário na empresa MRS Logística S.A. onde trabalhou com planilhas gerenciais e liderança de equipes de trabalho a partir da definição de metas. Tem formação complementar Master em MS Excel, Black Belt em Lean Seis Sigma, Análises Estatísticas, Marketing de Conteúdo e Produção de Conteúdo Web. Atualmente ê Mestrando do programa de pós-graduação em Modelagem Computacional da UFJF e colaborador do Grupo Voitto na área de Pesquisa e Desenvolvimento.
Entre para nossa lista e receba conteúdos exclusivos e com prioridade.
Respeitamos sua privacidade e nunca enviaremos spam!