CBIS 2016 Tutorial: Introdução ao Big Data e Suas Aplicações em Saúde (Prof.Renato Sabbatini) | |
Introdução ao Big Data e Suas Aplicações em Saúde Dia 27/11/2016 - 14:00 ás 17:00 Objetivo: Proporcionar uma introdução compacta e intensiva ao novo campo de análise de grandes volumes de dados na área de biologia, medicina e saúde, e quais são as principais abordagens e soluções técnicas e científicas para a descoberta e aplicação de novos conhecimentos na área. Ementa: 1. A exploração de grandes volumes de dados em sistemas de saúde. Impactos das tecnologias digitais. Objetivos finais: descoberta e aplicação de novos conhecimentos. O que são: Dados, informação, conhecimento, sabedoria. Construção de modelos. As operações cognitivas: indução, dedução e abdução. Tipos de dados biológicos e de saúde: qualitativos e quantitativos. Dados georeferenciados. As fontes de dados, e sua dimensionalidade, exemplos. Formas de representação do conhecimento. Exemplo: IBM Watson. Modelos lógicos: Regras, redes semânticas. Modelos quantitativos: determinísticos e probabilísticos. Modelos conexionistas: redes neurais artificiais, modelos genéticos. Análise e reconhecimento de padrões. Inteligência artificial, singularidade. 2. Tipos de abordagens e principais tecnologias: definição e diferenças entre Business Intelligence (BI), Big Data (BD), Data Analytics (DA), Data Integration (DI), Data Warehousing (DW), Data Mining (DM), Machine Learning (ML), Cognitive Computing (CC), Deep Learning (DL), Machine Intelligence (MI): suas aplicações e utilidades modernas. Impactos científicos, assistenciais, operacionais, administrativos, financeiros e sistêmicos. Importância: grandes empresas de tecnologia e empresas especializadas. Os quatro tipos de Data Analysis: descritiva, diagnóstica, preditiva e prescritiva. Exemplos em duas áreas: clínica e gerencial. 3. Como implementar Big Data: as nove fases de um projeto de Data Analytics. ERL: Extract, Reduce and Load. Ciência analítica: estatística, modelagem, simulação. Teste de hipóteses. Análise multivariada: alguns tipos: regressão linear e logística. Componentes principais e análise de aglomerados. Padrões de representação de dados. Tecnologias e infraestrutura de informática. Coleta automática, armazenamento e computação em nuvens, redes e clusters. Computação paralela e de alto desempenho. Exemplos de plataformas, bases de dados e aplicativos para a implementação. Hadoop, Hbase, MapReduce, TensorFlow e outros. Softwares de análise (EpiInfo/EpiMap, SAS, SPSS, Weka, Tableau, R, Python, etc.). A questão da qualidade dos dados. 4. Aplicações futuras: medicina de precisão, sinergia entre as ômicas (genômica, proteômica, etc.) e o Big Data. Saúde pública. 5. Como aprender mais e tornar-se um especialista em Data Science em Saúde. Centros de pesquisa. Bibliografia e cursos. Instrutor: Prof Dr. Renato M. E. Sabbatini, PhD, CPHIMS Graduado e doutorado em fisiologia pela Faculdade de Medicina de Ribeirão Preto da USP, desde 1972 é pesquisador e professor em informática em saúde e bioestatística. Foi professor da USP (1972-1983) e da UNICAMP (1983-2003) nessas áreas, atualmente atua no Instituto Edumed, Instituto HL7 Brasil e Associação IHE Brasil. Consultor nas áreas de certificação de softwares em saúde, segurança de sistemas de informação e Big Data/Data Integration & Analytics e padrões de informação e interoperabilidade em saúde. Email: sabbatini@edumed.org.br. |