DSpace About DSpace Software
 

DSpace Biblioteca Universidad de Talca (v1.5.2) >
Facultad de Ingeniería >
Memorias de pregrado Ingeniería Civil en Bioinformática >

Please use this identifier to cite or link to this item: http://dspace.utalca.cl/handle/1950/11360

Title: Artificial intelligence for combinatorial biomarkers discovery
Authors: Duran, Claudio
Vittorio Cannistraci, Carlo (Prof. Tutor)
Reyes Suárez, José Antonio (Prof. Informante)
González Díaz, Wendy Karina (Prof. Oponente)
Issue Date: 2016
Publisher: Universidad de Talca (Chile). Escuela de Ingeniería en Bioinformática.
Abstract: Los sistemas biológicos complejos que emergen a diferente escala pueden ser representados y analizados como redes, por ejemplo: los ecosistemas pueden ser modelados como redes de especies que interactúan; una vía celular como una red de moléculas que interactúan; y las proteínas como una red de aminoácidos. Nodos y arístas son el componente básico de una red, que al mismo tiempo es una herramienta fundamental en la física de sistemas complejos. Los nodos representan características (o unidades) que señalan las partes en que el sistema complejo está organizado como red, mientras que las arístas representan la interacción entre unidades. Por lo tanto, debido a su conveniencia en la representación de la física de sistemas complejos, las redes son hoy en día sumamente usadas no solo en la representación y simulación de sistemas biológicos, sino que también en diversas áreas como, entre otras: ciencias sociales, comercio, administración y economía. Con el fin de inferir redes de características discriminativas directamente de un cohorte de muestra de datos o señales, es importante detectar patrones ocultos que revelen segregación de muestras en diferentes sub-grupos. Para obtener la mejor detección de patrones de muestra se adoptaron métodos de aprendizaje automático no supervisados para ejecutar reducción de dimensionalidad como: análisis de componentes principales (PCA) e incrustación curvilínea mínima (MCE). No obstante, una tarea importante y no trivial es encontrar la combinación óptima de estrategias de reconocimiento de patrones entre la normalización de datos, técnica de reducción de dimencionalidad (lineal y no lineal), número de dimensiones comparadas, detección de grupos y/o evaluación por medio de calificaciones cuantitativas. Después de reconocer los patrones de la muestra, el paso final fue detectar la combinación de características (y sus asociaciones respectivas) que son responsables para la segregación de patrones, y representar sus relaciones en una red, en donde los nodos son características. Esta red ayudó a encontrar combinatorias de biomarcadores cruciales (combinación de características) que pueden justificar las diferencias entre un estado normal y patológico, útil también para diseñar estrategias de detección temprana en pacientes. El proyecto está enmarcado entre física de sistemas complejos, aprendizaje automático y ciencia de redes, en el área de la inteligencia artificial y sistemas complejos. Más específico, este trabajo apuntó por el descubrimiento de un enfoque automático y explorativo que, dado un set de datos, es capaz de detectar la mejor combinación de estrategias de reconocimiento de patrones para la detección de biomarcadores basada en un enfoque de redes. Obteniendo interesantes resultados incluso de datos complejos/ ABSTRACT: Complex biological systems that emerge at different scales can be represented and analyzed as networks, for instance: ecosystems can be modeled as networks of interacting species, cellular pathways as networks of interacting molecules and proteins as networks of amino acids. Nodes and edges are the basic components of a network, which is a fundamental tool in the physics of complex systems. Nodes represent features (or units) that characterize the parts in which the complex system is organized as a network, while edges represent the interactions between the units. Therefore, due to their suitability in representation of the physics of complex systems, networks are nowadays widely employed not only in representation and simulation of biological systems, but also in several diverse areas such as among others: social science, commerce, management and economy. In order to infer networks of discriminate features directly from a cohort of samples of data or signals, it is important to detect hidden patterns that reveal sample segregation in different sub-groups or clusters. To obtain the best detection of sample patterns it was adopted methods of unsupervised machine learning for dimension reduction like principal component analysis and minimum curvilinear embedding. However, an important and nontrivial task is to find the optimal combination of pattern recognition strategies for data-normalization, dimension reduction technique (linear and nonlinear), number of dimensions of embedding and clustering detection and/or evaluation by quantitative scores. After recognizing the sample patterns, the final step was to detect the combination of features (and their respective associations) that are responsible for the pattern segregation, and to represent their relations in a network where the nodes are the features. This network helps to find crucial combinatorial biomarkers (combination of features) that can justify the differences between a normal and pathological stage, useful also for designing strategies of early diagnosis in patients. This project is framed at the interface between physics of complex systems, machine learning and network science, in the area of Artificial Intelligence (AI) and complex systems. More specifically, this work aimed to develop the automation of an exploratory approach that given a set of data is able to detect the best combination of pattern recognition strategies for network-based combinatorial biomarker detection. Obtaining interesting results even from complex data
Description: 78 p.
URI: http://dspace.utalca.cl/handle/1950/11360
Appears in Collections:Memorias de pregrado Ingeniería Civil en Bioinformática

Files in This Item:

File Description SizeFormat
duran_claudio.pdfTabla de Contenido51.4 kBAdobe PDFView/Open
duran_claudio.pdfResumen40.16 kBAdobe PDFView/Open
duran_claudio.htmlLink a Texto Completo3.51 kBHTMLView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2009  The DSpace Foundation - Feedback