Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/73526
Type: Dissertação
Title: Modelos de regressão linear para dados intervalares usando transformações logarítmicas
Title in English: Linear regression models for interval-valued data using log-transformations
Authors: Barbosa, Nykolas Mayko Maia
Advisor: Gomes, João Paulo Pordeus
Co-advisor: Mattos, César Lincoln Cavalcante
Keywords: Regressão linear;Dados intervalares;Aprendizado sequencial
Issue Date: 2019
Publisher: Universidade Federal do Ceará
Citation: BARBOSA, Nykolas Mayko Maia. Modelos de regressão linear para dados intervalares usando transformações logarítmicas. 2019. 48 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2019.
Abstract in Brazilian Portuguese: Resolver problemas de aprendizagem de máquina com conjuntos de dados intervalares é uma tarefa desafiadora que pode surgir em muitas aplicações do mundo real, por exemplo, na predição da pressão arterial (sistólica e diastólica). Diante disso, muitos pesquisadores propuseram métodos de regressão linear para lidar com dados intervalares nos últimos anos. Embora muitos esforços tenham sido aplicados nesses problemas, todos os métodos disponíveis dependem da modelagem do problema como uma tarefa de otimização restrita, as quais podem levar a resultados sub-ótimos. Além disso, nenhum trabalho anterior forneceu uma maneira de treinar um modelo de forma incremental, o qual é fundamental para problemas de big data. Nesse trabalho, atacou-se ambos esses problemas pela proposição de dois diferentes métodos de regressão linear baseados em transformações logarítmicas. Os métodos propostos serão referidos como Mínimos Quadrados Ordinários Log Transformados (Log-transformed Ordinary Least Squares for Interval Data) (LOID) e Mínimos Quadrados Estocásticos Log Transformados (Log-transformed Least Mean Squares for Interval Data) (LLID) para dados intervalares, ambos foram comparados com o método estado da arte em conjuntos de dados sintéticos e reais. Os resultados obtidos indicam a viabilidade de ambas abordagens propostas por este trabalho. Além disso, destaca-se que, diante do que foi pesquisado, o LLID é o primeiro método de regressão linear sequencial para dados intervalares.
Abstract: Solving linear regression problems on interval-valued data is a challenging task that may arise in many applications, for example, blood pressure prediction (sistolic and diastolic). Because of that, many researchers have designed methods for such task in recent years. Although much e!ort has been devoted to this problem, all available methods rely on modeling the problem as a constrained optimization task, which may lead to sub-optimal results. Moreover, no previous work provide a way to train a model in a incremental way, which is fundamental for big data problems. In this paper, we address both problems by proposing two di!erent linear regression methods based on log-transformations. The proposed methods, referred as Log-transformed OLS for interval data (LOID) and Logtransformed LMS for interval data (LLID), are compared to state-of-the-art methods on both synthetic and real-world datasets. The obtained results indicate the feasibility of our approaches. Furthermore, to the best of our knowledge, LLID is the first sequential linear regression method for interval valued.
URI: http://www.repositorio.ufc.br/handle/riufc/73526
Appears in Collections:DCOMP - Dissertações defendidas na UFC

Files in This Item:
File Description SizeFormat 
2019_dis_nmmbarbosa.pdf616,57 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.