Provas para Download

Prova Tecnologista em Saúde Pública - Cientista de Dados em Saúde - FIOCRUZ
Visualizar os arquivos PDF
Ver tecnologista-em-saude-publica-cientista-de-dados-em-saude.pdf
PDF
tecnologista-em-saude-publica-cientista-de-dados-em-saude.pdf
Ver gabarito.pdf
PDF
gabarito.pdf
Download dos arquivos PDF
Baixar tecnologista-em-saude-publica-cientista-de-dados-em-saude.pdf
PDF
tecnologista-em-saude-publica-cientista-de-dados-em-saude.pdf
Baixar gabarito.pdf
PDF
gabarito.pdf
Compartilhar os arquivos PDF
Ver tecnologista-em-saude-publica-cientista-de-dados-em-saude.pdf
PDF
tecnologista-em-saude-publica-cientista-de-dados-em-saude.pdf
Ver gabarito.pdf
PDF
gabarito.pdf
Compartilhe:
Questões extraídas da Prova :: clique na alternativa correta
0
Acertos
0
Erros
40
Restantes
Questão 1 de 40 Q1 da prova
Entre as opções abaixo, a que apresenta corretamente uma consulta SQL para retornar o valor total de fi nanciamento de um projeto chamado “Inovação em Saúde” é:

Entre as opções abaixo, a que apresenta corretamente uma consulta SQL para retornar o valor total de fi nanciamento de um projeto chamado “Inovação em Saúde” é:

Questão 2 de 40 Q2 da prova
Com base no diagrama ER apresentado na questão anterior, a consulta SQL que lista os nomes de todos os projetos que estão associados a menos de 4 pesquisadores e que têm um fi nanciamento total maior que 20.000,00 é:

Com base no diagrama ER apresentado na questão anterior, a consulta SQL que lista os nomes de todos os projetos que estão associados a menos de 4 pesquisadores e que têm um fi nanciamento total maior que 20.000,00 é:

Questão 3 de 40 Q3 da prova
Observe as afi rmativas a seguir sobre a execução do código.

Sobre as afi rmativas acima, pode-se dizer que:

Questão 4 de 40 Q4 da prova
Sobre as afi rmativas acima, pode-se dizer que:

Sobre as afi rmativas acima, pode-se dizer que:

Questão 5 de 40 Q5 da prova
Das opções abaixo, a que apresenta corretamente o array extraído pela operação NumPy é:

Das opções abaixo, a que apresenta corretamente o array extraído pela operação NumPy é:

Questão 6 de 40 Q6 da prova
Com base nesta informação, a opção que contém uma observação INCORRETA é:

Com base nesta informação, a opção que contém uma observação INCORRETA é:

Questão 7 de 40 Q7 da prova
Considerando a base de dados contendo projetos, pesquisadores, publicações e fi nanciamentos, diversos modelos de aprendizado de máquina podem ser criados.

Entre as opções abaixo, a que apresenta uma relação INCORRETA entre objetivo, tipo de aprendizado e tipo de algoritmo de aprendizado de máquina é:

Questão 8 de 40 Q8 da prova
Entre as opções abaixo, a que apresenta corretamente a combinação de classes e funções do scikit-learn usadas para implementar regressão do tipo polinomial e classifi cação com árvores de decisão é:

Entre as opções abaixo, a que apresenta corretamente a combinação de classes e funções do scikit-learn usadas para implementar regressão do tipo polinomial e classifi cação com árvores de decisão é:

Questão 9 de 40 Q9 da prova
Após executar o código, foram obtidas as seguintes métricas de desempenho:

Sobre as afi rmativas acima, pode-se dizer que:

Questão 10 de 40 Q10 da prova
Acerca dessas técnicas, a opção que apresenta uma observação INCORRETA é:

Acerca dessas técnicas, a opção que apresenta uma observação INCORRETA é:

Questão 11 de 40 Q11 da prova
Sobre a técnica de Word Embeddings e sua importância em modelos de Processamento de Linguagem Natural (PLN), a que está correta é:

Sobre a técnica de Word Embeddings e sua importância em modelos de Processamento de Linguagem Natural (PLN), a que está correta é:

Questão 12 de 40 Q12 da prova
Observe o código Python abaixo, que utiliza a biblioteca NLTK para tarefas de Processamento de Linguagem Natural.

O valor da variável resultado, ao fi nal da execução do código, é:

Questão 13 de 40 Q13 da prova
Entre as observações abaixo sobre a técnica de Word Embeddings e sua importância em modelos de Processamento de Linguagem Natural (PLN), a que está correta é:

Entre as observações abaixo sobre a técnica de Word Embeddings e sua importância em modelos de Processamento de Linguagem Natural (PLN), a que está correta é:

Questão 14 de 40 Q14 da prova
Você é um cientista de dados trabalhando em um projeto de pesquisa em saúde que envolve a análise de relatórios médicos utilizando técnicas de Processamento de Linguagem Natural (PLN).

Seja o seguinte código Python, que utiliza a biblioteca gensim e um modelo hipotético de word embeddings denominado modelo_saude.bin especializado em termos médicos em português:

Questão 15 de 40 Q15 da prova
A evolução das tecnologias de Inteligência Artificial, especialmente no campo do Processamento de Linguagem Natural (PLN), tem sido marcada por inovações significativas que transformaram a maneira como as máquinas entendem e geram linguagem humana.

Sobre essa arquitetura, pode-se afirmar que:

Questão 16 de 40 Q16 da prova
O uso de Large Language Models (LLMs) na área da saúde, como GPT e BERT, oferece um vasto campo de possibilidades para inovação.

Entre as opções abaixo, aquela que apresenta uma iniciativa que NÃO pode ser baseada no uso de LLMs é:

Questão 17 de 40 Q17 da prova
Considerando o avanço recente dos modelos de Processamento de Linguagem Natural (PLN) e a necessidade crescente de processar e sumarizar grandes volumes de documentos de forma eficiente.

Sobre avaliação de sumários, a opção que NÃO apresenta um modelo adequado para esta tarefa é:

Questão 18 de 40 Q18 da prova
Ao integrar informações provenientes de fontes de dados externas, como documentos ou bancos de dados, com Large Language Models (LLMs), é possível empregar uma variedade de técnicas e estratégias para construir aplicações adaptadas às demandas específicas de cada projeto e aos recursos disponíveis.

Das opções abaixo, a que descreve corretamente uma dessas técnicas é:

Questão 19 de 40 Q19 da prova
Acerca dos frameworks LangChain e Llamaindex, amplamente utilizados atualmente para construir aplicação integradas a Large Language Models (LLMs), a opção que apresenta uma observação correta é:

Acerca dos frameworks LangChain e Llamaindex, amplamente utilizados atualmente para construir aplicação integradas a Large Language Models (LLMs), a opção que apresenta uma observação correta é:

Questão 20 de 40 Q20 da prova
Você é um cientista de dados incumbido de desenvolver uma aplicação de perguntas e respostas para facilitar a extração de informações de documentos PDF contendo artigos científicos na área da saúde.

Das estratégias acima:

Questão 21 de 40 Q21 da prova
Alguns atributos são preenchidos com informações da classificação estatística internacional de doenças e problemas relacionados com a Saúde (CID-10).

São disponibilizados pelo DATASUS arquivos que permitem a agregação das doenças em:

Questão 22 de 40 Q22 da prova
Dissiminados pelo DATASUS para download (ftp.data-sus.gov.br), os dados desagregados sobre a declaração de óbito do Sistema de Informação sobre Mortalidade (SIM) estão disponíveis com a extensão:

Dissiminados pelo DATASUS para download (ftp.data-sus.gov.br), os dados desagregados sobre a declaração de óbito do Sistema de Informação sobre Mortalidade (SIM) estão disponíveis com a extensão:

Questão 23 de 40 Q23 da prova
Considerando a definição, pilares e objetivos da Saúde Coletiva, avalie se são verdadeiras (V) ou falsas (F) as afirmativas a seguir:

As afirmativas I, II e III são, respectivamente:

Questão 24 de 40 Q24 da prova
Segundo a Lei Orgânica da Saúde (Lei nº 8080/1990), os serviços públicos de saúde e os serviços privados contratados ou conveniados que integram o Sistema Único de Saúde (SUS) devem obedecer aos princípios abaixo, EXCETO:

Os serviços públicos de saúde e os serviços privados contratados ou conveniados que integram o Sistema Único de Saúde (SUS) devem obedecer aos princípios abaixo, EXCETO:

Questão 25 de 40 Q25 da prova
Sobre o direito à saúde previsto na Lei Orgânica da Saúde (Lei nº 8080/1990) e na Constituição Federal (1988), avalie se são verdadeiras (V) ou falsas (F) as afirmativas a seguir:

As afirmativas I, II e III são, respectivamente:

Questão 26 de 40 Q26 da prova
Um grupo de pesquisadores deseja acompanhar o histórico de internações hospitalares de mães nascidas após o ano 1997 e que tiveram filhos com baixo peso ao nascer.

Para isso, os pesquisadores pretendem utilizar duas bases de dados disponíveis para download no DATASUS em acesso aberto:

Questão 27 de 40 Q27 da prova
Dataframes da biblioteca Pandas no Python são muito versáteis.

Os parâmetros e valores do método read_csv() que possibilitam isso são:

Questão 28 de 40 Q28 da prova
Para reproduzir a transformação ilustrada na figura abaixo, o código Python que faz uso da bilblioteca Pandas (pd) e pode ser utilizado para unir dois dataframes (df1 e df2), criando o dataframe (df3), é:

Para reproduzir a transformação ilustrada na figura abaixo, o código Python que faz uso da bilblioteca Pandas (pd) e pode ser utilizado para unir dois dataframes (df1 e df2), criando o dataframe (df3), é:

Questão 29 de 40 Q29 da prova
No campo da saúde, é comum a adoção de métodos para a reduzir a dimensionalidade dos dados, como a segmentação de idades em faixas etárias.

O comando Python, com o uso da biblioteca Pandas (pd), que pode ser utilizado para segmentar os valores de uma lista de idades (tipo inteiro) em 10 faixas etárias, é:

Questão 30 de 40 Q30 da prova
A biblioteca Pandas do Python possui diversas formas para selecionar partes de um objeto dataframe.

Utilizando os dados disponíveis no dataframe df (imagem abaixo), um programador deseja criar um dataframe (df_novo) contendo somente as colunas CODUFMUN e COMPETEN. Das opções abaixo, a única INCORRETA é:

Questão 31 de 40 Q31 da prova
Atributos numéricos diferentes podem possuir enorme discrepância de amplitude em um mesmo conjunto de dados.

Das opções a seguir, a única que NÃO representa um método para feature scaling é:

Questão 32 de 40 Q32 da prova
Bases de dados desbalanceadas podem afetar os resultados de muitos algoritmos que tentam identificar padrões nesses dados.

Sobre o processo de rebalanceamento de bases de dados, avalie se são verdadeiras (V) ou falsas (F) as afirmativas a seguir.

Questão 33 de 40 Q33 da prova
Na análise de dados textuais, é muito comum o uso de medidas de similaridade para agrupamento de documentos.

Sobre a similaridade por cosseno, das afirmativas utilizadas abaixo está correta:

Questão 34 de 40 Q34 da prova
A análise visual de dados, por meio de gráficos e dashboards, por exemplo, tem papel central na análise exploratória de dados.

Sobre o papel da análise visual na descoberta de padrões em dados, é possível afirmar que a análise visual:

Questão 35 de 40 Q35 da prova
Ao analisar dados do campo da saúde, é comum encontrar atributos com dados faltantes.

Sobre as estratégias para lidar com essa situação em pesquisas da saúde, avalie se são verdadeiras (V) ou falsas (F) as afirmativas a seguir:

Questão 36 de 40 Q36 da prova
Modelos de IA nem sempre são transparentes sobre quais fatores mais influenciam suas decisões.

Sobre o uso de XAI, avalie se são verdadeiras (V) ou falsas (F) as afirmativas a seguir:

Questão 37 de 40 Q37 da prova
Modelos de IA que apresentam vieses podem levar a um tratamento desigual e discriminatório contra indivíduos e grupos específicos.

Dentre os possíveis elementos que podem mitigar esse efeito está:

Questão 38 de 40 Q38 da prova
Sobre os impactos e riscos do uso de inteligência artificial (IA) e machine learning na saúde, é INCORRETO afirmar que:

Sobre os impactos e riscos do uso de inteligência artificial (IA) e machine learning na saúde, é INCORRETO afirmar que:

Questão 39 de 40 Q39 da prova
A Lei Geral de Proteção de Dados Pessoais (LGPD) prevê diversos requisitos para o tratamento de dados pessoais.

Avalie se são verdadeiras (V) ou falsas (F) as afirmativas I, II e III a seguir:

Questão 40 de 40 Q40 da prova
Segundo a LGPD, o controlador deve “comunicar à autoridade nacional e ao titular a ocorrência de incidente de segurança que possa acarretar risco ou dano relevante aos titulares”.

NÃO é obrigação do controlador comunicar:

Acertos
Erros
40
Total