Workshop do Sistema Nacional de Processamento de Alto Desempenho - Edição 2009



Em conjunto com o 21o. Simpósio Internacional em Arquitetura de Computadores e Processamento de Alto Desempenho (SBAC-PAC 2009)


Local: Universidade Presbiteriana Mackenzie, São Paulo, Brasil
Data/horário: 29 e 30 de outubro de 2009, de 14h às 16h




Descrição



O SINAPAD (Sistema Nacional de Processamento de Alto Desempenho) é uma rede de centros de computação de alto desempenho, geograficamente distribuídos, instituída pelo MCT (Ministério da Ciência e Tecnologia). São atualmente 8 centros regionais, denominados CENAPADs (Centros Nacionais de Processamento de Alto Desempenho), operados respectivamente pela UFRGS, UFMG, UFC, UNICAMP, UFRJ, UFPE, INPE e LNCC. Este último coordena o sistema por delegação do MCT. O SINAPAD propõe-se a ser uma infra-estrutura computacional dedicada, capaz de responder à demanda de ensino e pesquisa por processamento de desempenho realmente elevado e por alta capacidade de armazenamento e recuperação de dados, com segurança, facilidade de acesso e confiabilidade.

O objetivo deste workshop é reunir especialistas nas áreas de pesquisa e desenvolvimento de aplicações científicas e de tecnologias para computação de alto desempenho, a fim de discutir os avanços nessas áreas e de que formas o SINAPAD se insere nesse contexto.

A programação do Workshop do SINAPAD incluirá apresentações sobre a organização e a infraestrutura atual do sistema e de seus centros regionais, bem como palestras de pesquisadores em assuntos ligados às áreas supracitadas.


Programação



Dia 29/10 (5a-feira)


2.00pm — 2.30pm: Abertura


2.30pm — 3.50pm: Apresentação dos CENAPADs


3.50pm — 4:05pm: Coffee break


4.05pm — 6.00pm: Palestras

Título: O sistema HeMoLab: simulação numérica de larga escala na modelagem do sistema cardiovascular humano
Palestrantes: Paulo Ziemer / Daniel Golbert (LNCC/MCT)
Resumo: Nesta apresentação serão levantadas as principais problemáticas envolvidas na modelagem do escoamento sanguíneo nas maiores artérias do corpo humano. Para isto duas abordagens serão brevemente discutidas, o Método dos Elementos Finitos (MEF) e o Método de Lattice-Boltzmann (MLB). Os principais obstáculos em termos de recursos computacionais serão discutidos tanto no caso do MEF como do MLB e exemplos de tempos necessários para a execução das simulações serão também dados. Neste sentido, será salientado o papel do SINAPAD como peça fundamental a fim de contar com os recursos necessários de forma a reduzir os tempos envolvidos nas simulações numéricas.

Título: Modelagem numérica de eventos severos de tempo: Microbursts
Palestrante: Vagner Anabor (DF/UFSM)
Resumo: Tempestades Severas ocorrem comumente a redor do globo e muitas vezes geram, ventos fortes, alagamentos, granizo, micro explosões e até mesmo tornados. O mapeamento de áreas de tempestade através do satélite TRMM mostrou grande atividade convectiva na região Sul da América do Sul, a tempestade mais intensa em toda o histórico destes dados foi encontrada nesta região. Estima-se que esta área tenha mais de 60 dias/ano com condições favoráveis para o desenvolvimento de Tempo Severo. Durante o ciclo de vida da tempestade circulações complexas se desenvolvem. No início, correntes ascendentes alimentam a tempestade com calor e umidade, quando a tempestade colapsa, ocorre a precipitação e com ela intensas correntes descentes são geradas. Algumas vezes devido a processos termodinâmicos evaporativos estas correntes se intensificam, introduzindo aceleração ao ar descente. Estes ventos podem causar grandes danos, com velocidades superiores a 200km/h. Estes processos ocorrem em pequena escala ("Sub-Cloud scale") e raramente são bem representados por modelos regionais. Experimentos numéricos com modelo de Mesoescala WRF (Weather Research and Forecasting, ARW) e LES (Large Eddy Simulation), tem sido realizados para a correta representação destes eventos, demandando para isso a utilização de sistemas computacionais de alto desempenho.

Título: Proveniência em workflows científicos e o SINAPAD
Palestrante: Marta Mattoso (COPPE/UFRJ)
Resumo: One of the main advantages of using a scientific workflow management system (SWfMS) to orchestrate data flows among scientific activities is to control and register the whole workflow execution. Provenance, also referred as lineage or pedigree, represents the ancestry of an object. In scientific experiments, provenance is fundamental because it helps scientists not only to interpret and understand results by the examination of the sequence of steps that led to a particular result, but also to guarantee the reproducibility of the scientific experiments. Thus, provenance is a key feature of SWfMS, since the analysis of scientific results, using the whole data flow, can only be evaluated if provenance data has been collected in a structured manner and during all experiment phases. Provenance is managed by the SWfMS execution engine. Collecting this provenance data along high performance computing (HPC) is not simple, since the workflow execution engine does not run on remote HPC environments. Task scheduling in HPC is done by a specific software rather than the workflow engine. SWfMS are not aware of the parallel strategy of the activity workflow execution. Consequently, remote execution control and provenance registry of the parallel activities is very limited from the SWfMS point of view. In this talk we will present the main issues in scientific workflow provenance gathering and querying in HPC. We will discuss current solutions and our approach for provenance manangement within SINAPAD. We will show a set of "Many-task computing" components to be included on the workflow specification of any SWMfS to control parallelization of activities. We have evaluated our approach by performing parameter sweep parallelization in solving the incompressible 3D Navier-Stokes equations. Experimental results show the performance gains with the additional benefits of distributed provenance support.


Dia 30/10 (6a-feira)


2.00pm — 3.50pm: Palestras

Título (provisório): Gerência de execução de aplicações computacionalmente complexas
Palestrante: Renato Cerqueira (DI/PUC-Rio)

Título: Gerência de clusters através de Serviços Web e interfaces Web dinâmicas
Palestrante: Albino Aveleda (COPPE/UFRJ)
Resumo: Nesta palestra será apresentado o aplicativo LEMMing (Linux Enterprise Management and Monitoring), uma proposta aberta de tornar simples e intuitivo o gerenciamento e monitoramento de ambientes do tipo cluster voltados, principalmente, para computação de alto desempenho (HPC – High Performance Computing).

Título: Democratizando o acesso ao processamento de alto desempenho
Palestrante: Francisco Brasileiro (DSC/UFCG)
Resumo: Agora que a tecnologia de computação em grade (grid computing) já passou pela fase do entusiasmo exagerado e está vencendo o período de desilusão, ela começa vagarosamente a ser entendida de forma correta e, mais importante, ser usada de forma eficiente e útil. Nesse sentido, uma importante utilização da tecnologia é aquela que permite uma ampliação do acesso de usuários remotos a recursos computacionais distribuídos em domínios administrativos diferentes, viabilizando a realização de tarefas que seriam impossíveis de serem concretizadas sem se ter acesso a esses recursos. Nessa palestra será apresentado como o OurGrid, um middleware para dar suporte à criação de grades computacionais de estações de trabalho, tem sido usado para criar grades computacionais oportunistas em escala global, aproveitando os períodos de ociosidade desses computadores. Além disso, será discutido como o mecanismo de incentivo à reciprocidade do OurGrid pode viablizar a interoperação de grades computacionais distintas. Finalmente, será apresentada uma extensão trivial do middleware que pode ser usada para facilitar o acesso remoto a recursos dedicados como clusters e supercomputadores.


3.50pm — 4:05pm: Coffee break


4.05pm — 5.30pm: Palestras

Título: Gerência de dados para e-Science
Palestrante: Fábio Porto (LNCC/MCT)
Resumo: Aplicações científicas requerem a revisão de várias técnicas e algoritmos de gerência de dados. Diferentemente às aplicações convencionais, tais aplicações produzem dados com frequencia e volume em ordens de grandeza superiores às convencionais e, em sua grande maioria, armazenados em arquivos do sistema operacional (i.e fora de bancos de dados), distribuídos em um grid computacional. O projeto Dark Energy Survey (DES), por exemplo, anuncia a produção de até 100 PB de dados em 10 anos !! Além de volumosos, os dados assim produzidos apresentam novas características, tais como imprecisão, associada à incerteza em sua identificação , como, por exemplo na classificação de objetos astronômicos detectados em uma imagem. A imprecisão tem sido tratada com ajuda de modelos e inferiencia probabilística. Adicionalmente, dados científicos são referenciados por um grande número de dimensões tornando as técnicas de indexação ineficazes. Esta palestra vai abordar alguns destes temas e apontar para os esforços sendo desenvolvidos para gerenciar dados produzidos por grande projetos científicos.

Título: Transporte eficiente de grandes volumes de dados para computação de alto desempenho
Palestrante: José Ferreira de Rezende (COPPE/UFRJ)
Resumo:: Algumas comunidades científicas utilizam aplicações que requerem altas taxas de transmissão para realizar transferências maciças de dados. As grades computacionais dispersas em múltiplos domínios administrativos são um exemplo típico desse tipo de aplicação. No entanto, devido a problemas inerentes ao protocolo utilizado na transferência confiável de dados, essas aplicações não conseguem utilizar de forma eficiente os novos enlaces de alta velocidade implantados nas redes de núcleo da Internet. Nessa palestra serão apresentados os fatores que levam a um baixo desempenho na transferência maciça de dados na Internet. Em seguida, será apresentado o serviço Travel que oferece transferência rápida e confiável de dados no backbone da RNP. Este serviço consiste em segmentar conexões TCP e incluir armazenamento nos nós intermediários da rede. Por fim, será apresentada uma proposta de integração entre o serviço Travel e os sistemas de distribuição de processamento.


5.30pm — 6.00pm: Encerramento


Inscrição



A inscrição no Workshop do SINAPAD Edição 2009 está incluída na taxa de inscrição do SBAC-PAD 2009. Faça sua inscrição no SBAC-PAD 2009 aqui.


Organização



Coordenação geral


Antônio Tadeu Azevedo Gomes - secretário especial do SINAPAD


Comitê de programa


Álvaro Coutinho - coordenador do CENAPAD-COPPE/UFRJ


Denise Ewald - coordenadora do CENAPAD-UFRGS


Edison Zacarias - coordenador do CENAPAD-UNICAMP


Eugênio Almeida - coordenador do CENAPAD-CPTEC/INPE


Márcio de Carvalho - coordenador do CENAPAD-UFMG


Ramiro Willmersdorf - coordenador do CENAPAD-UFPE


Rossana Andrade - coordenadora do CENAPAD-UFC


Wagner Léo - coordenador do CENAPAD-LNCC