Durante a Conferência de Supercomputação de 2010 em Nova Orleães, a decorrer, vai ser apresentado amanhã novo sistema de classificação de supercomputadores.
O novo sistema, designado por Graph500, irá testar as capacidades dos supercomputadores na análise de grandes estruturas baseadas em grafos que ligam a um número muito elevado de pontos de dados, tais como os que surgem nos problemas de biologia, sociologia e segurança, entre outras áreas.
«Ao criarem este teste, esperamos influenciar os fabricantes a construirem computadores com uma arquitectura que trate este género de programas cada vez mais complexos», disse Richard Murphy do Laboratório de Sandia
O director do Centro de Computações, Computadores e Matemática do Laboratório Sandia disse «A definição profundamente pensada deste novo padrão competitivo é súbtil e importante, pois pode influenciar fortemente a arquitectura de computadores para as próximas décadas».
O grupo não está a tentar competir com o Linpack, o padrão actual de teste de velocidade de supercomputadores é um teste complementar mais de acordo com as necessidades do laboratório. O Linpack é um mecanismo de teste para avaliação de computação de base, com pouca relação com os problemas que é suposto as máquinas resolverem.
Os problemas intensivos em dados são muito diferentes dos problemas ordinários intensivos em cálculo. Ao contrário de aplicações orientadas pela computação, a análise de grandes conjuntos de dados envolve, pesquisa em conjunto grandes e esparsos e operações de computação normalmente simples. O Graph500 cria dois cernes computacionais: um grande grafo que representa um número elevado de ligações de participantes e um cerne paralelo a este para busca no grafo.
O que os cientistas pretendem é resultados de conjuntos de simulações ou resultadosde grandes simulações de forma automatizada, sendo o Graph500 uma metodologia de o obter. Os problemas de grafos podem ser usados para compreender o que é que a simulação disse.
Cinco problemas tipícos para cernes computacionais como estes são a cibersegurança, a informática médica, o enriquecimento de dados, redes sociais e simbólicas:
Este grafo sintético foi gerado usando um método designado por multiplicação de Kronecker usado por Jeremiah Willcock da Universidade do Indiana um dos autores de «Active Messages for Parallel Graph Computations»
- As grandes empresas criam milhares de milhões de registos nos diários (entradas em log files) e necessitam de um varrimento completo.
- Há milhões de fichas médicas, havendo milhares de milhão de peças individuais de informação sobre pacientes que podem exigir uma resolução ao nível do indivíduo.
- Enriquecimento de dados: Por exemplo no domínio marítimo há um certo número de transponders, dezenas de milhares de navios e dezenas de milhão de peças individuais de carga. Estes problemas têm ainda diferentes tipos de entradas de dados.
- Redes sociais, praticamente sem limites.
- Redes simbólicas, como por exemplo, o cortex humano com 25 mil milhões de neurónios e com 7000 ligações em média cada um deles.
Sem comentários:
Enviar um comentário