A seguinte amostra foi obtida: 12, 8, 10, 9, 15, 6, 7, 9, 10, 6. A diferença entre os valores da média e da mediana dessa amostra é igual a
Uma amostra x1, x2,..., x20, de tamanho 20, foi observada e forneceu os seguintes valores: ∑ xi20i=1= 54,0 ∑ xi220i=1 =221,8. O coeficiente de variação é então aproximadamente igual a
Numa população, 10% das pessoas sofrem de uma certa doença W. Se uma amostra aleatória simples de tamanho 4 dessa população for observada, a probabilidade de que duas ou mais sofram da doença W é aproximadamente igual a
Considere uma variável aleatória contínua X com função de densidade de probabilidade dada por f(x) = Kx2, se 0 < x < 3, f(x) = 0, nos demais casos, sendo k constante. A média de X é igual a
Se Z1, Z2, ... Zn são n variáveis aleatórias independentes e identicamente distribuídas N(0, 1), então a variável ∑ Zi2ni=1 tem distribuição
Uma amostra aleatória simples x1, x2,..., x25, de tamanho 25 foi obtida de uma variável populacional normalmente distribuída com média μ desconhecida e variância σ2 = 100. A média amostral obtida foi x̅ = 60. Lembre-se de que, se Z tem distribuição normal padrão, então P [ Z < 1.96 ] = 0,975. Um intervalo de 95% de confiança para μ será então dado por
Uma amostra aleatória simples de tamanho 100 foi obtida para estimar uma proporção p populacional de indivíduos que apresentam uma característica A. Como resultado, 36 indivíduos amostrais apresentaram a característica A. Lembre-se que, se Z tem distribuição normal padrão, então P [ Z < 1.96 ] = 0,975. Usando a estimativa de p no lugar do valor desconhecido, um intervalo de 95% de confiança para p será dado aproximadamente por
Uma amostra aleatória simples X1, X2,..., Xn será obtida de uma densidade dada por f(x) = θe−θx, se x > 0, θ > 0, f(x) = 0, nos demais casos. O estimador de máxima verossimilhança de θ é dado por
O tamanho da amostra aleatória simples necessário para que possamos garantir, com 99% de confiança, que o valor da média amostral não se afaste do valor da média populacional por mais de 5% do valor do desvio padrão populacional será, no mínimo, aproximadamente igual a
Para testar a hipótese nula de que uma proporção populacional p de sucessos é menor ou igual a 0,5 contra a hipótese alternativa de que p é maior do que 0,5, uma amostra aleatória simples de tamanho 100 será observada e o critério que rejeita a hipótese nula se a proporção de sucessos amostral for maior do que 0,64 será usado. A probabilidade de erro tipo I máxima com esse critério é aproximadamente igual a
Para testar H0: μ≤30 versus H1: μ > 30, em que μ é a média de uma variável populacional suposta normalmente distribuída com variância 64, uma amostra aleatória simples de tamanho 100 será obtida. Lembre-se de que, se Z tem distribuição normal padrão, P[ Z > 1,64 ] ≈ 0,05. O teste uniformemente mais potente de tamanho α = 0,05 rejeitará H0 se o valor da média amostral observada for maior ou igual a
Avalie se as afirmativas a seguir, acerca das características de um bom estimador são falsas (F) ou verdadeiras (V). ( ) Um bom estimador de um parâmetro θ deve ser não tendencioso para θ. ( ) Um bom estimador de um parâmetro θ deve ter a maior variância possível. ( ) Um bom estimador de um parâmetro θ deve ter erro médio quadrático máximo. As afirmativas são, respectivamente,
Para testar a hipótese nula de igualdade entre 5 médias populacionais a seguinte tabela ANOVA foi obtida (alguns dados estão omitidos). Há um total de 100 observações. Fonte de variação Soma dos Quadrados g.l. Quadrados médios F Entre amostras 100.000 Dentro das amostras Total 119.950. Sob a hipótese nula, o valor da estatística F é então aproximadamente igual a
Para testar a hipótese nula de igualdade entre duas médias populacionais de variáveis aleatórias X e Y normalmente distribuídas com variâncias supostas iguais e desconhecidas, duas amostras independentes foram observadas, uma para a variável X, outra para a variável Y. Os dados obtidos estão resumidos na tabela a seguir. Amostra X Amostra Y Tamanho 10 10 Média x̅ = 22,5 y̅ = 26,5 Variância sX2 = 100 sY2 = 64. O valor da estatística T usual, nesse caso, é aproximadamente igual a
No cálculo do índice de preços de Laspeyres, se n é o número de itens, pt,i é o preço de um item qualquer no período "atual", p0,i é o preço de um item qualquer no período base, qt,i é a quantidade de um item qualquer no período atual, e q0,i é a quantidade de um item qualquer no período base, então o referido índice será dado pela fórmula
Os formatos de dados XML, JSON e CSV são amplamente usados para armazenamento e troca de informações, cada um com características distintas. Assinale a opção que descreve corretamente uma diferença entre os padrões XML, JSON e CSV.
O processo de ETL (Extract, Transform, and Load) é importante na integração de dados, especialmente em projetos de data warehousing e business intelligence. Ele envolve três etapas principais, que são fundamentais para garantir a integridade e a qualidade dos dados permitindo análises precisas e insights valiosos. No processo ETL, a etapa de transformação
No aprendizado de máquina, técnicas de classificação e agrupamento têm objetivos distintos. Assinale a opção que descreve corretamente uma diferença fundamental entre técnicas de agrupamento e técnicas de classificação.
Os classificadores Naive Bayes são amplamente utilizados em aprendizado de máquina devido à sua simplicidade e eficácia. Assim, é correto afirmar que os classificadores Naive Bayes
No processamento de linguagem natural (PLN), a redução de dimensionalidade é vital para simplificar dados textuais e melhorar o desempenho dos algoritmos de aprendizado de máquina. Diversos métodos são usados para esse fim, cada um com suas próprias características. Na redução de dimensionalidade em PLN, a técnica utilizada é chamada
A otimização de hiperparâmetros é crucial na construção de modelos de Machine Learning, pois pode afetar significativamente o desempenho do modelo. Diversas técnicas de busca são usadas para encontrar a melhor combinação de hiperparâmetros, e entender quais são eficazes para esse propósito é essencial para aprimorar a precisão do modelo. A técnica apropriada na otimização de hiperparâmetros para um modelo de aprendizado supervisionado, considerando tanto a eficiência quanto a eficácia é a


























