Em conjunto com o 21o. Simpósio Internacional em Arquitetura de Computadores e Processamento de Alto Desempenho (SBAC-PAC 2009)
Local: Universidade Presbiteriana Mackenzie, São Paulo,
Brasil
Data/horário: 29 e 30 de outubro de 2009, de 14h às 16h
O SINAPAD (Sistema Nacional de Processamento de Alto Desempenho) é uma rede de centros de computação de alto desempenho, geograficamente distribuídos, instituída pelo MCT (Ministério da Ciência e Tecnologia). São atualmente 8 centros regionais, denominados CENAPADs (Centros Nacionais de Processamento de Alto Desempenho), operados respectivamente pela UFRGS, UFMG, UFC, UNICAMP, UFRJ, UFPE, INPE e LNCC. Este último coordena o sistema por delegação do MCT. O SINAPAD propõe-se a ser uma infra-estrutura computacional dedicada, capaz de responder à demanda de ensino e pesquisa por processamento de desempenho realmente elevado e por alta capacidade de armazenamento e recuperação de dados, com segurança, facilidade de acesso e confiabilidade.
O objetivo deste workshop é reunir especialistas nas áreas de pesquisa e desenvolvimento de aplicações científicas e de tecnologias para computação de alto desempenho, a fim de discutir os avanços nessas áreas e de que formas o SINAPAD se insere nesse contexto.
A programação do Workshop do SINAPAD incluirá apresentações sobre a organização e a infraestrutura atual do sistema e de seus centros regionais, bem como palestras de pesquisadores em assuntos ligados às áreas supracitadas.
2.00pm — 2.30pm: Abertura
2.30pm — 3.50pm: Apresentação dos CENAPADs
3.50pm — 4:05pm: Coffee break
4.05pm — 6.00pm: Palestras
Título: O sistema HeMoLab: simulação numérica de larga escala na
modelagem do sistema cardiovascular humano
Palestrantes: Paulo Ziemer / Daniel Golbert (LNCC/MCT)
Resumo: Nesta apresentação serão levantadas as principais
problemáticas envolvidas na modelagem do escoamento sanguíneo nas
maiores artérias do corpo humano. Para isto duas abordagens serão
brevemente discutidas, o Método dos Elementos Finitos (MEF) e o Método
de Lattice-Boltzmann (MLB). Os principais obstáculos em termos de
recursos computacionais serão discutidos tanto no caso do MEF como do
MLB e exemplos de tempos necessários para a execução das simulações
serão também dados. Neste sentido, será salientado o papel do SINAPAD
como peça fundamental a fim de contar com os recursos necessários de
forma a reduzir os tempos envolvidos nas simulações numéricas.
Título: Modelagem numérica de eventos severos de
tempo: Microbursts
Palestrante: Vagner Anabor (DF/UFSM)
Resumo: Tempestades Severas ocorrem comumente a redor do globo
e muitas vezes geram, ventos fortes, alagamentos, granizo, micro
explosões e até mesmo tornados. O mapeamento de áreas de tempestade
através do satélite TRMM mostrou grande atividade convectiva na região
Sul da América do Sul, a tempestade mais intensa em toda o histórico
destes dados foi encontrada nesta região. Estima-se que esta área
tenha mais de 60 dias/ano com condições favoráveis para o
desenvolvimento de Tempo Severo. Durante o ciclo de vida da tempestade
circulações complexas se desenvolvem. No início, correntes ascendentes
alimentam a tempestade com calor e umidade, quando a tempestade
colapsa, ocorre a precipitação e com ela intensas correntes descentes
são geradas. Algumas vezes devido a processos termodinâmicos
evaporativos estas correntes se intensificam, introduzindo aceleração
ao ar descente. Estes ventos podem causar grandes danos, com
velocidades superiores a 200km/h. Estes processos ocorrem em pequena
escala ("Sub-Cloud scale") e raramente são bem representados por
modelos regionais. Experimentos numéricos com modelo de Mesoescala
WRF (Weather Research and Forecasting, ARW) e LES (Large Eddy
Simulation), tem sido realizados para a correta representação destes
eventos, demandando para isso a utilização de sistemas computacionais
de alto desempenho.
Título: Proveniência em workflows científicos e o
SINAPAD
Palestrante: Marta Mattoso (COPPE/UFRJ)
Resumo: One of the main advantages of using a scientific
workflow management
system (SWfMS) to orchestrate data flows among scientific activities
is to control and register the whole workflow execution.
Provenance, also referred as lineage or pedigree, represents the
ancestry of an object. In scientific experiments, provenance is
fundamental because it helps scientists not only to interpret and
understand results by the examination of the sequence of steps that
led to a particular result, but also to guarantee the reproducibility
of the scientific experiments. Thus, provenance is a key feature of
SWfMS, since the analysis of scientific results, using the whole data
flow, can only be evaluated if provenance data has been collected in a
structured manner and during all experiment phases. Provenance is
managed by the SWfMS execution engine. Collecting this provenance data
along high performance computing (HPC) is not simple, since the
workflow execution engine does not run on remote HPC environments.
Task scheduling in HPC is done by a specific software rather than the
workflow engine. SWfMS are not aware of the parallel strategy of the
activity workflow execution. Consequently, remote execution control
and provenance registry of the parallel activities is very limited
from the SWfMS point of view.
In this talk we will present the main issues in scientific workflow
provenance gathering and querying in HPC. We will discuss current
solutions and our approach for provenance manangement within SINAPAD.
We will show a set of "Many-task computing" components to be included
on the workflow specification of any SWMfS to control parallelization
of activities. We have evaluated our approach by performing parameter
sweep parallelization in solving the incompressible 3D Navier-Stokes
equations. Experimental results show the performance gains with the
additional benefits of distributed provenance support.
2.00pm — 3.50pm: Palestras
Título (provisório): Gerência de execução de aplicações
computacionalmente complexas
Palestrante: Renato Cerqueira (DI/PUC-Rio)
Título: Gerência de clusters através de Serviços Web e
interfaces Web dinâmicas
Palestrante: Albino Aveleda (COPPE/UFRJ)
Resumo: Nesta palestra será apresentado o aplicativo LEMMing (Linux Enterprise Management and
Monitoring), uma proposta aberta de tornar simples e intuitivo o gerenciamento e monitoramento
de ambientes do tipo cluster voltados, principalmente, para computação
de alto desempenho (HPC – High Performance Computing).
Título: Democratizando o acesso ao processamento
de alto desempenho
Palestrante: Francisco Brasileiro (DSC/UFCG)
Resumo: Agora que a tecnologia de computação em grade (grid
computing) já passou pela fase
do entusiasmo exagerado e está vencendo o período de desilusão, ela
começa vagarosamente
a ser entendida de forma correta e, mais importante, ser usada de
forma eficiente e útil.
Nesse sentido, uma importante utilização da tecnologia é aquela que
permite uma
ampliação do acesso de usuários remotos a recursos computacionais
distribuídos em domínios
administrativos diferentes, viabilizando a realização de tarefas que
seriam impossíveis de serem
concretizadas sem se ter acesso a esses recursos. Nessa palestra será
apresentado como
o OurGrid, um middleware para dar suporte à criação de grades
computacionais de estações de
trabalho, tem sido usado para criar grades computacionais oportunistas
em escala global,
aproveitando os períodos de ociosidade desses computadores. Além
disso, será discutido como
o mecanismo de incentivo à reciprocidade do OurGrid pode viablizar a
interoperação de
grades computacionais distintas. Finalmente, será apresentada uma
extensão trivial do
middleware que pode ser usada para facilitar o acesso remoto a
recursos dedicados como clusters
e supercomputadores.
3.50pm — 4:05pm: Coffee break
4.05pm — 5.30pm: Palestras
Título: Gerência de dados para e-Science
Palestrante: Fábio Porto (LNCC/MCT)
Resumo: Aplicações científicas requerem a revisão de várias
técnicas e algoritmos de gerência de dados.
Diferentemente às aplicações convencionais, tais aplicações produzem
dados com frequencia e volume em ordens de grandeza superiores às
convencionais
e, em sua grande maioria, armazenados em arquivos do sistema
operacional (i.e fora de bancos de dados), distribuídos em um grid
computacional.
O projeto Dark Energy Survey (DES), por exemplo, anuncia a produção de
até 100 PB de dados em 10 anos !!
Além de volumosos, os dados assim produzidos apresentam novas
características, tais como imprecisão, associada à incerteza em sua
identificação
, como, por exemplo na classificação de objetos astronômicos
detectados em uma imagem. A imprecisão tem sido tratada com ajuda de
modelos
e inferiencia probabilística. Adicionalmente, dados científicos são
referenciados por um grande número de dimensões tornando as técnicas
de
indexação ineficazes. Esta palestra vai abordar alguns destes temas e
apontar para os esforços sendo desenvolvidos para
gerenciar dados produzidos por grande projetos científicos.
Título: Transporte eficiente de grandes volumes de dados para
computação de alto desempenho
Palestrante: José Ferreira de Rezende (COPPE/UFRJ)
Resumo:: Algumas comunidades científicas utilizam aplicações
que requerem altas taxas de transmissão para realizar transferências
maciças de dados. As grades computacionais dispersas em múltiplos
domínios administrativos são um exemplo típico desse tipo de
aplicação. No entanto, devido a problemas inerentes ao protocolo
utilizado na transferência confiável de dados, essas aplicações não
conseguem utilizar de forma eficiente os novos enlaces de alta
velocidade implantados nas redes de núcleo da Internet. Nessa palestra
serão apresentados os fatores que levam a um baixo desempenho na
transferência maciça de dados na Internet. Em seguida, será
apresentado o serviço Travel que oferece transferência rápida e
confiável de dados no backbone da RNP. Este serviço consiste em
segmentar conexões TCP e incluir armazenamento nos nós intermediários
da rede. Por fim, será apresentada uma proposta de integração entre o
serviço Travel e os sistemas de distribuição de processamento.
5.30pm — 6.00pm: Encerramento
A inscrição no Workshop do SINAPAD Edição 2009 está incluída na taxa de inscrição do SBAC-PAD 2009. Faça sua inscrição no SBAC-PAD 2009 aqui.
Antônio Tadeu Azevedo Gomes - secretário especial do SINAPAD
Álvaro Coutinho - coordenador do CENAPAD-COPPE/UFRJ
Denise Ewald - coordenadora do CENAPAD-UFRGS
Edison Zacarias - coordenador do CENAPAD-UNICAMP
Eugênio Almeida - coordenador do CENAPAD-CPTEC/INPE
Márcio de Carvalho - coordenador do CENAPAD-UFMG
Ramiro Willmersdorf - coordenador do CENAPAD-UFPE
Rossana Andrade - coordenadora do CENAPAD-UFC
Wagner Léo - coordenador do CENAPAD-LNCC