O resultado da expressão: (1A5)16 + (11011)2 − (100)10, em notação hexadecimal é
Um pesquisador da área de Processamento de Linguagem Natural comparou duas abordagens de pré-processamento: uma usando apenas remoção de stop words e outra incluindo também stemming. Considerando seu objetivo e suas implicações, é correto afirmar que o stemming
Considerando o comportamento das saídas em função das entradas durante um pulso de clock dos flip-flops SR, JK e D, é correto afirmar que
Um engenheiro precisa escolher as técnicas de Entrada/Saída (E/S) para dois dispositivos, numa máquina com suporte a DMA e interrupções. O Dispositivo A é um sensor que envia 1 byte a cada 5 segundos. O Dispositivo B é uma controladora de disco que deve transferir um arquivo de 500 MB. Considere que o objetivo principal é maximizar o tempo de CPU disponível para processamento de dados, minimizar a sobrecarga de interrupções e reduzir o tempo de espera ativo da CPU. A combinação de técnicas mais apropriadas para A e B é, respectivamente,
A padronização de dados é uma das etapas do pré-processamento em aprendizagem de máquina, e visa transformar as variáveis para que tenham média 0 e desvio padrão 1. Nesse contexto, uma técnica de padronização de dados é:
Sistemas NoSQL resolvem problemas complexos, distribuindo funcionalidades em componentes simples pela rede. Essa simplicidade facilita a reutilização e o desenvolvimento das aplicações. Um desses sistemas utiliza um modelo que armazena dados de maneira semiestruturada, geralmente em coleções, em que cada registro pode conter diferentes atributos e estruturas internas, oferecendo flexibilidade e facilitando consultas voltadas ao conteúdo. O modelo em questão é orientado a
A área do Big Data destaca muitas oportunidades potenciais ao revisitar os conjuntos de dados coletados ou arquivados, tendo em vista o desenvolvimento de vários frameworks como Hadoop e Apache Spark. A respeito do Hadoop, é correto afirmar que
Um professor do IFPE coordena um projeto de machine learning para classificar pacientes quanto à presença de câncer de pele. Ele recebeu um conjunto de dados com 35.000 instâncias, contendo 500 exemplos de diagnósticos para câncer de pele. A equipe desse professor dividiu o dataset em 70% de treinamento e 30% de teste, utilizando Decision Tree (algoritmo c4.5) para a tarefa de classificação. Durante a fase de treinamento, o modelo alcançou uma acurácia de 98%, mas, na fase de teste, anotou uma acurácia de 61%. Para o fato descrito, é provável que tenha ocorrido um problema clássico em aprendizagem de máquina. Marque a opção que melhor descreve o problema e uma possível solução, respectivamente.
O SHAP (SHapley Additive exPlanations) é uma abordagem baseada em teoria dos jogos, para explicar os resultados apresentados por modelos de aprendizagem de máquina. A respeito do SHAP, analise as opções a seguir e marque a correta.
Uma empresa que atua na área de Internet das Coisas (IoT) está projetando um sistema de monitoramento agrícola, utilizando múltiplos sensores de temperatura. A arquitetura de comunicação deve seguir o paradigma RESTful, tratando cada sensor como um recurso que pode ser diretamente consultado e atualizado por meio de métodos de requisição e resposta (como GET e PUT). Além disso, o sistema precisa suportar notificações assíncronas para múltiplas aplicações na nuvem (análise, alertas, irrigação) sempre que o estado de um recurso (a leitura do sensor) for alterado, utilizando um mecanismo de observação nativo do protocolo. Para garantir a máxima eficiência energética em dispositivos com recursos limitados, a comunicação deve obrigatoriamente utilizar o protocolo UDP na camada de transporte. Diante desse contexto, assinale a opção em que o protocolo de comunicação atende a todos os requisitos.
Em sistemas de Computação em Nuvem, as APIs desempenham um papel crucial na gestão e provisionamento de recursos. No contexto de um ambiente IaaS, onde o provedor disponibiliza recursos de hardware virtualizados, as APIs têm o papel de
Em sistemas de informação distribuídos, podem ser executadas as RPC (Remote Procedure Call) Transacionais. No contexto de sistemas distribuídos, as propriedades das transações são
Suponha que você participa de um projeto de mineração de dados e está treinando um modelo de árvore de decisão para um problema de classificação com três categorias: Frutas Cítricas, Frutas Doces e Frutas Oleaginosas. Em um determinado nó da árvore, a distribuição das 80 amostras de treinamento é a seguinte: Frutas Cítricas: 40 amostras Frutas Doces: 20 amostras Frutas Oleaginosas: 20 amostras Com base nessa distribuição, os valores do Índice de Gini e da Entropia, em bits, são dados, respectivamente, por:
Um professor do IFPE é coordenador do projeto de monitoramento do rio Capibaribe em Recife-PE, ele utiliza séries temporais que incluem as variáveis nível_chuva (medido em mm), cota_rio (medido em cm) e turbidez_agua (medido de 1 a 4000 NTUs). Durante a fase de exploração, a equipe de análise de dados constatou que: ● Todas as três variáveis possuem valores ausentes de forma esparsa. ● Existe uma forte correlação multivariada (não necessariamente linear) entre as variáveis. Por exemplo, a cota e a turbidez aumentam significativamente após chuvas intensas. ● A distribuição da variável cota_rio é assimétrica, com a presença de outliers significativos que representam eventos de cheias extremas. Considerando esse cenário, a equipe decidiu usar uma técnica de imputação. A técnica mais robusta e apropriada para preservar a estrutura e as relações intrínsecas dos dados é:
Um professor do IFPE e sua equipe estão desenvolvendo um modelo de previsão da cota da barragem Tapacurá em Pernambuco. O modelo utilizará as variáveis IP(Índice Pluviométrico), medida em mm, e cota_da_barragem, medida em cm (da base da barragem ao topo). Após tratarem os valores ausentes e normalizarem os dados, avançam para a fase de Feature Engineering. O objetivo principal do modelo é prever a cota da barragem com um dia de antecedência, utilizando o histórico das variáveis. Considerando que a cota de uma barragem é um fenômeno com forte dependência temporal, dado que a chuva de hoje influencia a cota da barragem de amanhã, marque a opção que contém a estratégia mais adequada para o objetivo principal do modelo apresentado.

































