@MASTERSTHESIS{ 2024:904080131, title = {Sistema de Aprendizagem de Máquina Distribuído utilizando o VCube}, year = {2024}, url = "https://tede.unioeste.br/handle/tede/7354", abstract = "Com o crescimento do volume de informações geradas, seu armazenamento deixou de ser realizado de forma local, criando os cenários de dados distribuídos. Assim, quando é necessário realizar um processo de classificação, que é o processo de predizer a categoria de novas entradas com base em dados de treinamento, seria necessária a consolidação das informações em um ponto central da rede para efetuar o aprendizado. No entanto, em algumas situações a movimentação de dados pela rede não é viável, seja pela sobrecarga do enlace ou por sujeitar as informações a ataques. Como forma de contornar tais dificuldades neste trabalho, é proposto um método de classificação distribuída empregando-se uma estratégia do tipo peer-to-peer em conjunto com VCube que é um algoritmo de diagnóstico distribuído que organiza os nós da rede em uma topologia virtual de hipercubo permitindo a detecção eficiente de falhas nos nós da rede. Na solução proposta os modelos são treinados localmente e então compartilhados, evitando a necessidade de envio e exposição das informações. Durante os experimentos foram utilizados oito nós na rede no qual cada um realizava o treinamento local com o algoritmo Perceptron Multicamadas. Diferentes cenários de distribuição de dados na rede foram testados, desde variando-se a quantidade de instâncias quanto a distribuição das classes. Além disso, simulamos casos em que algum dos nós da rede poderia não estar disponível. Os resultados mostraram que o treinamento local é mais rápido em comparação ao treinamento centrado em um único nó. Os desempenhos em termos de acurácia foram maiores quando cada nó recebia os modelos treinados nos outros nós, ou seja, o sistema distribuído obteve acurácia maior em comparação à solução individual. Os resultados evidenciaram a aplicabilidade do VCube como topologia de compartilhamento dos modelos treinados. Nos casos em que um dos nós estava indisponível, a estratégia permitiu que o sistema de aprendizado distribuído pudesse funcionar adequadamente, obtendo desempenho superior aos modelos gerados em cada nó individualmente.", publisher = {Universidade Estadual do Oeste do Paraná}, scholl = {Programa de Pós-Graduação em Ciência da Computação}, note = {Centro de Ciências Exatas e Tecnológicas} }