A aprendizagem profunda transformou fundamentalmente o processamento de imagens de pipelines algor tmicos criados manualmente em sistemas aprendidos de ponta a ponta capazes de superar o desempenho humano em tarefas de classifica o, dete o, segmenta o, gera o e restaura o. As redes neurais convolucionais substituem a filtragem, a limiariza o e a engenharia de carater sticas de d cadas anteriores por extractores de carater sticas hier rquicos que aprendem diretamente a partir de pixels brutos atrav s de milh es de filtros parametrizados treinados atrav s de descida gradiente.Esta mudan a de paradigma elimina as arquitecturas fr geis em cascata, em que a falha na dete o de limites se propaga atrav s da vota o de Hough para o colapso do rastreio, substituindo os modos de falha sequenciais por uma compreens o hol stica robusta que emerge da forma o estat stica. Os transformadores de vis o modernos alargam as bases convolucionais atrav s de mecanismos globais de auto-aten o que modelam as depend ncias espaciais de longo alcance ausentes dos campos receptivos puramente locais.