TEXTO V
Rotulagem de dados
O que é rotulagem de dados?
\(\quad\quad\) A rotulagem de dados, ou anotação de dados, faz
parte da etapa de pré-processamento para o
5 desenvolvimento de um modelo de aprendizado de
máquina (AM). Para que os modelos de aprendizado de
máquina façam previsões precisas, é preciso identificar
os dados brutos (ou seja, imagens, arquivos de texto,
vídeos) para depois adicionar um ou mais rótulos a eles,
10 especificando seu contexto.
\(\quad\quad\) A rotulagem de dados está na base de diferentes
casos de aprendizado de máquina e deep learning,
incluindo visão computacional e processamento de
linguagem natural (NLP).
15\(\quad\quad\) /.../
\(\quad\quad\) Como funciona a rotulagem de dados?
\(\quad\quad\) Além da assistência de máquina, as tarefas de
20 rotulagem de dados requerem a interação humana
(“human-in-the-loop” – HITL). A HITL aproveita a
avaliação de “rotuladores de dados” humanos para criar,
treinar, refinar e testar modelos de AM. Eles ajudam a
orientar o processo de rotulagem de dados, alimentando
25 os conjuntos de dados dos modelos que mais se aplicam
a um determinado projeto.
\(\quad\quad\) Casos de uso da rotulagem de dados
30\(\quad\quad\) Embora a rotulagem de dados possa melhorar a
precisão, a qualidade e a usabilidade em diversos
contextos em todos os setores, alguns dos casos de uso
mais destacados são:
\(\quad\quad\) /.../
35\(\quad\quad\) Processamento de linguagem natural (NLP): um
ramo de IA que combina linguística computacional com
estatística, aprendizado de máquina, e modelos de deep
learning para identificar e marcar seções importantes do
texto que geram dados de treinamento para análise de
40 impressões, reconhecimento de nome da entidade e
reconhecimento de caractere ótico. A NLP está sendo
cada vez mais utilizada em soluções corporativas como
detecção de spam, tradução de máquina, reconhecimento
de voz, sumarização de texto, assistentes virtuais e
45 chatbots, e em sistemas GPS operados por voz. Isso faz
da NLP um componente fundamental na evolução dos
processos de negócios críticos.
(Disponível em https://www.ibm.com/br-pt/cloud/learn/data-labeling. Acesso em 23/03/2023)
Assinale a alternativa em que a relação de sentido estabelecida pelo termo destacado é DIFERENTE das demais.
“Para que os modelos de aprendizado de máquina façam previsões precisas...” (𝓁. 6-7)
“A HITL aproveita a avaliação de ‘rotuladores de dados’ humanos para criar, treinar, refinar e testar modelos de AM.” (𝓁. 21-23)
A rotulagem de dados, ou anotação de dados, faz parte da etapa de pré-processamento para o desenvolvimento de um modelo de aprendizado de máquina (AM).” (𝓁. 3-6)
“...é preciso identificar os dados brutos (ou seja, imagens, arquivos de texto, vídeos) para depois adicionar um ou mais rótulos a eles, especificando seu contexto.” (𝓁. 7-10)