A manipulação e interpretação da base de dados é de suma importância dentro de um programa Lean Seis Sigma para o sucesso do método DMAIC.
A fim de facilitar a visualização da distribuição dos dados, são desenvolvidas inúmeras ferramentas gráficas que migram os dados de uma tabela para um diagrama, como o histograma e o boxplot, por exemplo.
Provavelmente você já ouviu falar sobre histograma, tendência central, ou até mesmo do diagrama de séries temporais. Mas e sobre o boxplot? Você sabe o que é? Para que ele serve ou como analisá-lo? Se não, continue lendo este artigo para descobrir tudo sobre esse diagrama.
O Boxplot ou box plot é um diagrama de caixa construído utilizando as referências de valores mínimos e máximos, primeiro e terceiro quartil, mediana e outliers da base de dados.
O boxplot tem como objetivo estudar as medidas estatística do conjunto de dados, como propriedades de locação, variabilidade, média, e outliers. Você deve estar pensando que isso tudo pode-se calcular com o histograma, certo?
Realmente, essas duas ferramentas são bem similares, cada uma com suas particularidades, e quando estão juntas, uma complementa muito bem a informação da outra.
No histograma você consegue ver melhor a média e o desvio padrão. Já no boxplot se percebe um pouco melhor as medidas de quartis, mediana, amplitude, além de identificar muito bem os outliers.
No boxplot a parte central do gráfico contém os valores que estão entre o primeiro quartil e o terceiro quartil. As hastes inferiores e superiores se estendem, respectivamente, do primeiro quartil até o menor valor, limite inferior, e do terceiro quartil até o maior valor.
Esse artifício é muito utilizando por profissionais do Lean Seis Sigma, para desenvolver projetos voltados a otimizações de processos e impulsionar o faturamento de empresas. Se você está buscando impulsionar sua carreira, essa é a certificação certa para você.
Quer aprender a usar ferramentas que irão te ajudar a definir, mensurar, analisar e propor soluções aos problemas que interferem no desempenho dos processos organizacionais de sua empresa?
Então acesse o nosso eBook "As principais ferramentas do Lean Seis Sigma"!Com ele você entenderá o conceito de Seis Sigma, bem como um compilado com as principais ferramentas utilizadas por Belts na aplicação de cada etapa do método DMAIC.
Além de se obter a definição de cada uma dessas ferramentas, para que elas servem, e como utilizar, nesse Ebook você encontra, também, dicas de aplicação utilizando o software Minitab.
Então não perca tempo e baixe agora!
Para te ajudar a entender melhor esse diagrama, separei a imagem a seguir com dois exemplos de boxplot, contendo uma indicação de o que significa cada um de seus pontos notáveis.
O boxplot começa sempre no valor mínimo da base de dados e termina no valor máximo, assim como o histograma.
A caixa representa os valores centrais da base de dados, onde no histograma essa parte é representada pelas barras mais altas, ou seja, dados com maior frequência.
A linha que dá início a caixa representa o valor do primeiro quartil, já a linha que está contida dentro representa a mediana e, por fim, a caixa é finalizada no terceiro quartil.
É importante observar que de cada lado da caixa se tem uma linha que se estende do valor mínimo na parte inferior, até o valor máximo na parte superior.
Ou seja, todo o boxplot representa 100% da base de dados. E sua grande vantagem é que cada região desse gráfico representa uma parte dos dados, facilitando assim a tomada de decisão.
Do valor mínimo até o início da caixa, estão representados 25% dos dados, já dentro da caixa estão representados mais 50% dos dados, e por fim, a haste superior representa os outros 25% restantes.
No boxplot, quando se tem um outlier, valores atípicos, facilmente conseguimos visualizá-los através do asterisco apresentado no boxplot. Isso pode ser observado no boxplot a direita na figura.
Quando se tem um outlier, ele distorce um pouco mais a questão da simetria da figura quando comparada com a figura sem outlier. Isso acontece quando temos valores discrepantes na base de dados e é observado pela diferença do tamanho da haste inferior comparado com a haste superior na figura da direita.
Se fizermos o histograma com os dados que originaram a figura da direita, observaremos um comportamento de curva normal mais estendida para um lado do que para o outro, ou seja, uma curva normal assimétrica.
Beleza, agora já sabemos interpretar. Mas que tal construir um boxplot para depois analisarmos? Pensando nisso, separei um espaço neste artigo para esse exemplo. Confira!
Na empresa Voitto Tubes, o gestor construiu e coletou informações a respeito dos três principais motivos de desclassificados de sua empresa para fazer uma análise de dados.
Para isso, iremos utilizar o boxplot, pois com ele fica mais evidente a presença de outliers e a assimetria dos dados. Além disso, a comparação entre os três motivos analisados será mais efetiva já que a amplitude e a locação do Boxplot é visualmente mais simples de identificar do que em um histograma.
Para realizar essa análise, após a coleta de dados você deve ir ao software Minitab, selecionar a opção Gráficos e depois Boxplot como mostrado na figura a seguir.
De modo a facilitar a comparação entre as bases de dados, para esse caso, escolha a opção de múltiplos y's para que ambos os boxplots sejam plotados na mesma malha, como mostrado a seguir.
Feito isso, basta clicar em OK e o Minitab gera o gráfico que iremos comparar.
Pelo boxplot, conseguimos perceber que cada um dos três motivos tem um comportamento distinto. Isso não aconteceu por acaso, a ideia é realmente conseguir te explicar vários tipos de análises de modo que consiga absorver o máximo de conteúdo.
O boxplot da emenda é mais achatado, o que indica uma baixa variabilidade e desvio padrão. Porém ele está posicionado na parte superior da tela. Ou seja, a média e o valor mediano são valores bem altos.
Já no boxplot da solda fraca, o problema é um pouco diferente. Nesse caso temos um valor mediano mais baixo que a emenda, porém, altíssima variabilidade.
Isso traz uma certa imprevisibilidade, pois ora se tem valores muito baixos, ora se tem valores muito altos. É fácil de ver que quando essa variabilidade é muito grande, a previsibilidade é muito menor.
Já para ajuste de máquinas, temos dois outliers. Como esse boxplot tem um valor mediano mais baixo e esses dois valores de ajuste de máquinas estão mais distantes do valor mediano, acabamos por entender que são outlier.
Se fizéssemos o histograma dessa situação não ficaria tão fácil de enxergar essa condição do outlier para o ajuste de máquina, mas utilizando essa ferramenta, boxplot, isso fica muito evidente.
Já pensou em ter acesso a um Kit Completo sobre Lean Seis Sigma, a metodologia que revolucionou a indústria mundial?
Então adquira os conhecimentos necessários sobre a qualidade, as ferramentas Lean e a redução de desperdícios com 4 E-books totalmente gratuitos!
Incrível, né? Além disso, o kit também conta com 2 Webséries e 1 Workshop com 3 aulas sobre o método passo a passo!
Está esperando o que para começar a sua jornada de conquista dos melhores cargos no mercado de trabalho?
Clique na imagem e aproveite já!
Possui curso Técnico em Agroindústria pelo IFF (Instituto Federal Fluminense), onde foi o monitor principal da disciplina de matemática. Acumulou por 3 anos, menções honrosas por bom desempenho na OBMEP (Olimpíada Brasileira de Matemática das Escolas Públicas). É graduado em Engenharia Mecânica pela UFJF (Universidade Federal de Juiz de Fora), onde além de continuar lecionando através de monitoria das disciplinas de cálculo 3, resistência dos materiais (I e II), e fundamentos de combustão, participou do movimento empresa júnior. Também foi presidente da equipe universitária de eficiência energética da faculdade, nessa área teve um artigo acadêmico aceito e o apresentou no EMMEC (Encontro Mineiro de Engenharia Mecânica). Leonardo foi estagiário na empresa MRS Logística S.A. onde trabalhou com planilhas gerenciais e liderança de equipes de trabalho a partir da definição de metas. Tem formação complementar Master em MS Excel, Black Belt em Lean Seis Sigma, Análises Estatísticas, Marketing de Conteúdo e Produção de Conteúdo Web. Atualmente ê Mestrando do programa de pós-graduação em Modelagem Computacional da UFJF e colaborador do Grupo Voitto na área de Pesquisa e Desenvolvimento.
Entre para nossa lista e receba conteúdos exclusivos e com prioridade.
Respeitamos sua privacidade e nunca enviaremos spam!