Meeting 98494215065 is not found or has expired.

SESSÃO PLENÁRIA

Aprendizagem Online com Seleção de Dados

Na era do big data, oportunidades lucrativas estão se tornando disponíveis para muitas aplicações. À medida que a quantidade de dados continua aumentando, o aprendizado online se torna uma ferramenta atraente para analisar as informações adquiridas. No entanto, o aproveitamento de dados significativos continua sendo um desafio. As ferramentas clássicas de aprendizado de máquina aplicam todos os dados de treinamento sem levar em consideração a relevância de alguns deles. Esta tendência atual de aquisição pervasiva de dados exige alguma estratégia de seleção de dados, especialmente no caso de um subconjunto de dados não trazer inovação suficiente. Como subproduto, além de reduzir o consumo de energia e alguns cálculos, o descarte de dados resulta em estimativas de parâmetros mais precisas. Em muitas situações práticas, é possível verificar se o conjunto de dados adquirido se qualifica para melhorar a inferência estatística relacionada ou se consiste em um outlier ou uma entrada não-inovadora. Destacando as soluções online, discutimos alguns algoritmos de filtragem adaptativa e aprendizado de máquina que permitem a seleção de dados que também aborda a censura de outliers medidos por meio de erros de estimativa elevados inesperados. Os algoritmos resultantes permitem a prescrição de quantas vezes os dados adquiridos devem ser incorporados no processo de aprendizagem com base em algumas suposições anteriores sobre os dados do ambiente ou alguma estimativa simples com base nas informações disponíveis. Os resultados dos testes também mostram a eficácia dos algoritmos propostos para selecionar dados durante a etapa de treinamento de redes neurais para obter as informações de dados mais significativas e melhorar o desempenho do algoritmo durante o treinamento. Os resultados se aplicam a problemas de classificação e regressão levando a economia computacional e redução de erros de classificação. Com base em conjuntos de dados abertos, os exemplos corroboram a eficácia da estratégia discutida.

Paulo Diniz

Universidade Federal Rio de Janeiro, Brazil