Publicação
Machine Learning Models for Detecting Chronic Disease Progression Based on VO2max: A Study Applied to Cardiovascular Diseases and Type 2 Diabetes
| dc.contributor.advisor | Duarte, Rui Pedro Monteiro Amaro | |
| dc.contributor.author | Pina, Eduardo Manuel Abreu | |
| dc.date.accessioned | 2026-06-30T08:46:36Z | |
| dc.date.available | 2026-06-30T08:46:36Z | |
| dc.date.issued | 2026-04-20 | |
| dc.description.abstract | Chronic diseases, namely cardiovascular diseases and type 2 diabetes, remain the leading causes of mortality and morbidity around the world. The early detection and prevention of these conditions are crucial to improve health outcomes and reduce the burden on healthcare systems. Among existing health biomarkers, VO2max is a key feature traditionally used to evaluate individual performance during high in tensity activities. Moreover, there have been associations between VO2max levels and the presence of CVD and T2D. The appearance of wearable devices, such as smartwatches, enables the measurement of VO2max and other biomarkers, in a non invasive way, providing real time data for a reliable and validated set of information. The data obtained allows the implementation of machine learning models capable of predicting patterns and chronic disease progression. To this end, the project acqui sition of data using a Garmin Venu 2 Plus smartwatch, led to the creation of four datasets, with the help of OpenAI ChatGPT, due to the limited real world data collected for CVD and T2D assessment. These datasets comprised of data derived from the smartwatch and fully synthetic data to be benchmarked under different risk distributions. The feature selection technique using Recursive Feature Elimination identified VO2max, heart rate variability, sleep time, body mass index, respiration metrics, oxygen saturation and activity features as the most relevant features. The application of two supervised machine learning classification algorithms, SVM and LR, are evaluated, with SVM outperforming LR across both diseases. Notably, al though models trained on fully synthetic data showed a strong training performance, datasets derived from smartwatch data demonstrated a better generalisation dur ing testing. Overall, the results confirm the validity and effectiveness of combining non-invasive features with the application of machine learning models for chronic disease risk assessment, highlighting the importance of the application of realistic physiological data in predictive health monitoring systems. | eng |
| dc.description.abstract | As doenças crónicas, nomeadamente, doenças cardiovasculares e diabetes tipo 2, continuam a ser as principais causas de mortalidade e morbilidade no mundo. A deteção precoce e a prevenção destas condições são cruciais para melhorar o es tado de saúde da população e reduzir a carga sobre os sistemas de saúde. Dos biomarcadores de saúde existentes, o VO2max é uma métrica chave utilizada tra dicionalmente na avaliação do desempenho individual durante atividades de alta intensidade. Além disso, cientistas têm encontrado associações entre os níveis de VO2max e a presença de doenças cardiovasculares e diabetes tipo 2. O apareci mento de dispositivos vestíveis, como os relógios inteligentes, permitem a medição de VO2max e outros biomarcadores de forma não invasiva, proporcionando dados em tempo real para um conjunto de dados fiáveis e validados. A obtenção destes da dos permite a implementação de modelos de machine learning, capazes de encontrar padrões e prever a progressão de doenças crónicas. Neste sentido, a acquisição de dados do projeto, através do uso de um relógio inteligente da Garmin Venu 2 Plus, levou à criação de quatro datasets, com a ajuda da ferramenta ChatGPT OpenAI, devido à limitação de dados recolhidos no mundo real, para avaliar DCV e DT2. A utilização da técnica de seleção de características, Seleção Recursiva de Caracte rísticas, identificou VO2max, variabilidade da frequência cardíaca, índice de massa corporal, métricas respiratórias, saturação de oxigénio e características de atividade como os biomarcadores mais relevantes. A aplicação de dois algoritmos de classifi cação supervisionado, SVM e LR, é avaliada, com o SVM a superar o LR em ambas as doenças. Notavelmente, embora os modelos treinados com datasets totalmente sintéticos apresentam um forte desempenho de treino, os datasets derivados dos da dos do relógio inteligente demonstram uma melhor generalização durante a fase de testes. No geral, os resultados confirmam a validade e eficácia da combinação de características não invasivas, com a aplicação de modelos de machine learning para avaliar o risco de doenças crónicas, destacando a importância da aplicação de dados fisiológicos reais em sistemas de previsão de monitorização de saúde. | eng |
| dc.identifier.tid | 204318386 | |
| dc.identifier.uri | http://hdl.handle.net/10400.19/10047 | |
| dc.language.iso | eng | |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Cardiovascular Diseases (CVD) | |
| dc.subject | Type 2 Diabetes (T2D) | |
| dc.subject | Biomarkers | |
| dc.subject | Maximum Oxygen Consumption (VO2max) | |
| dc.subject | Machine Learning (ML) | |
| dc.subject | Smartwatches | |
| dc.subject | Doenças Cardiovasculares | |
| dc.subject | Diabetes Tipo 2 | |
| dc.subject | Biomarcadores | |
| dc.subject | VO2max | |
| dc.subject | Machine Learning | |
| dc.subject | Relógios Inteligentes | |
| dc.title | Machine Learning Models for Detecting Chronic Disease Progression Based on VO2max: A Study Applied to Cardiovascular Diseases and Type 2 Diabetes | por |
| dc.type | master thesis | |
| dspace.entity.type | Publication | |
| thesis.degree.name | Mestrado em Engenharia Informática - Sistemas de Informação |
Ficheiros
Principais
1 - 1 de 1
A carregar...
- Nome:
- Eduardo Manuel Abreu e Pina - Trabalho de Projeto - MEISI.pdf
- Tamanho:
- 9.39 MB
- Formato:
- Adobe Portable Document Format
Licença
1 - 1 de 1
Miniatura indisponível
- Nome:
- license.txt
- Tamanho:
- 1.79 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
