descrição da imagem

A importância do valor p nas avaliações de palatabilidade

Na indústria de alimentos para animais de estimação, as decisões de negócios sobre o avanço do produto são baseadas em avaliações comparativas de palatabilidade usando dados. As preferências dos animais de estimação são geralmente determinadas por meio de testes de duas tigelas. Os dados destas ou de quaisquer comparações devem ser cuidadosamente analisados ​​para contar uma história precisa. O primeiro passo nesta análise é definir qual medida você usará de preferência. O próximo passo é determinar o valor p, uma estatística que indica se uma situação hipotética parece razoável após a coleta e análise dos dados.

MÉTODO

Na AFB, o método mais comum para preferências de produtos alimentares para animais de estimação é um teste de preferência emparelhado. Quantidades iguais dos dois alimentos a serem comparados são apresentadas simultaneamente a cada gato ou cão. Após um período de tempo ou quantidade ingerida predefinida, os alimentos são retirados e pesados ​​para determinar quanto resta. Os mesmos dois alimentos são apresentados no dia seguinte da mesma maneira, exceto que as posições dos alimentos são trocadas da esquerda para a direita. Essa mudança é importante para evitar o que é conhecido como “viés lateral”. O viés lateral ocorre quando um animal demonstra uma preferência por causa de sua posição esquerda/direita, e não por seu sabor. É vital, estatisticamente, que os dados dos dois dias sejam combinados e não tratados individualmente. Os dois dias devem ser considerados como uma tentativa na análise estatística.

COMO ESCOLHER UM TAMANHO DE AMOSTRA

O tamanho da amostra é o número de gatos ou cães que podem escolher no ensaio de preferência. Este grupo de amostra pretende ser representativo de um grupo maior. Neste exemplo, a amostra são os cães utilizados para testes de preferência e representa o grupo maior de cães em residências que podem estar interessados ​​neste produto. Com um tamanho de amostra maior, há maior confiança nos resultados. Existem várias maneiras de definir um tamanho de amostra:

Determinar o nível de confiança necessário: Com um tamanho de amostra maior, há maior confiança nos resultados. Isso depende de quão pequena é a diferença que você precisa encontrar. É mais fácil encontrar a diferença entre 2 gramas e 20 gramas de alimento ingerido do que entre 2 gramas e 4 gramas.

Através da experiência: No caso de testes de preferência alimentar para animais de estimação, o padrão da indústria é de 20 a 30 gatos ou cães.

Análise de poder: A análise de poder é um cálculo que pode ser feito em um experimento proposto que ajuda a minimizar as chances de chegar a conclusões erradas após testes estatísticos. A análise de potência requer algumas estimativas de parâmetros para começar e mudará dependendo dos métodos estatísticos.

A medida

A Taxa de Ingestão (RI) é a medida mais utilizada na AFB para tirar conclusões sobre preferências alimentares.

Um IR(A) de 0.5 indica nenhuma preferência, enquanto um IR(A) de 1 indica uma preferência total pela Ração A, e um IR(A) de 0 indica uma preferência total pela Ração B. A maioria dos testes
caem dentro da faixa de IR(A) = 0.3 a 0.7. A proporção de ingestão compensa diferentes tamanhos corporais e diferentes apetites entre os animais em um ensaio.

Outras medidas

AFB também inclui medidas como taxa de consumo e primeira escolha em nossos relatórios de palatabilidade. Essas medidas podem ajudar a fornecer mais informações sobre como o gato ou cachorro se comportou durante a refeição. Não fornecemos um teste estatístico para estes por vários motivos.

Cálculo da Taxa de Ingestão (IR)

(todas as medidas em gramas consumidas)

COMO INTERPRETAR UM VALOR P

Na pesquisa de alimentos para animais de estimação, ao comparar duas rações com um teste estatístico:

  • Um valor p grande significa que o experimento não forneceu evidências convincentes de que as duas rações eram diferentes na preferência da população de animais de estimação.
  • Um valor p pequeno significa que existem evidências suficientes para apoiar a ideia de que as duas rações são diferentes. Desta forma, um pequeno valor p demonstra que seria improvável observarmos uma diferença tão grande entre as duas rações se, de facto, elas fossem igualmente preferidas na população de animais de estimação.
  • O “ponto de corte” historicamente aceito de 0.05 significa que valores de p inferiores a 0.05 são considerados estatisticamente significativos. Esse limite é baseado na tradição e foi originalmente influenciado pela conveniência computacional antes que os computadores se tornassem amplamente disponíveis.

EXEMPLOS

Diferença Significativa – os resultados de um ensaio levam-nos a concluir que os dois alimentos testados são significativamente diferentes.

A Figura 1 é um exemplo do nosso relatório padrão para ensaios de preferência pareados.

A Figura 2 mostra os resultados por cão. O IR(A) é 0.62 (Figura 1) e é representado pelo quadrado laranja. As linhas que se estendem a partir do quadrado laranja são o Intervalo de Confiança de 95% (0.51-0.73), que é uma medida da nossa confiança nos resultados. O valor p é 0.039, o que indica que é improvável que vejamos esse padrão devido ao acaso.

Nenhuma diferença significativa – resultados de um ensaio que não nos permite concluir que os dois alimentos testados são significativamente diferentes.

O IR(A) é 0.50 (Figura 3) e é representado pelo quadrado laranja na Figura 4. As linhas que se estendem do quadrado laranja são o Intervalo de Confiança de 95% (0.35-0.65), que é uma medida da nossa confiança no resultados. O valor p para o teste t bilateral de uma amostra é 0.49, o que indica que esse padrão não é distinguível do acaso.

ENTENDENDO OS VALORES P

O valor p é complicado. A confusão – e até mesmo uma conclusão incorreta – pode surgir quando o valor p é simplificado demais.

Por exemplo, uma afirmação comum é que um valor p acima do limite de 0.05 indica que as duas rações tinham a mesma preferência. Na verdade, apenas indica que não havia provas suficientes nos dados para concluir que as rações eram diferentes. A situação é semelhante à de um grupo de biólogos que estuda um lago. Eles acham que o lago tem peixes, então lançam uma rede na água. Se pescarem, então provaram que há peixes no lago. Se não pescarem, seria incorreto concluir que não há peixes no lago. No entanto, um tamanho de amostra maior (lançamentos adicionais da rede) proporcionaria mais oportunidades de captura de peixes se estes existissem no lago.

Além disso, o valor p não conta toda a história. Considere o segundo exemplo (Figura 4): Os cães neste teste de ração para animais de estimação apresentam alta variação, com alguns mostrando alta preferência por uma ração e alguns preferindo a outra ração. Isto resultou em um grande valor de p, indicando nenhuma diferença significativa entre as rações.

No entanto, em vez de rejeitar os resultados, seria sensato investigar mais aprofundadamente se havia uma característica identificável potencialmente responsável pelas preferências – tais como cães mais velhos preferindo uma ração e cães mais jovens preferindo a outra. Encontrar essa característica poderia ajudar os fabricantes de alimentos para animais de estimação a desenvolver uma estratégia para atingir diferentes segmentos de consumidores para aquela ração específica, apesar de não haver diferença estatisticamente significativa entre as rações. O resultado poderia aproveitar ao máximo os dados da pesquisa e proporcionar novas oportunidades para servir os donos de animais de estimação de forma mais eficaz.

Voltar