Arquitetura
O StarRocks possui uma arquitetura MPP simples que possui apenas dois tipos de processos, Front End e Back End.
StarRocks MPP Architecture
Nesta figura, os nós de front-end (FE) são responsáveis pelo gerenciamento de metadados, enquanto os nós de back-end (BE) são responsáveis pelo armazenamento de dados e computação de dados local. À medida que o FE faz planos de consulta e agenda tarefas em todos os nós, os nós BE podem continuar a executar trabalhos de importação de dados e alterações de esquema.
Na figura anterior, o StarRocks divide logicamente uma consulta em vários fragmentos de consulta. Cada fragmento de consulta pode ter uma ou mais instâncias de fragmento, e cada instância será agendada para um BE. Um fragmento de consulta pode conter um ou mais operadores. Na figura anterior, o fragmento de consulta tem três operadores: Scan, Filter e Agg. Diferentes fragmentos podem ser executados com paralelismo diferente.
Conforme mostrado na figura acima, vários fragmentos de consulta são executados em paralelo em pipelines diferentes na memória, em vez de execução estágio a estágio, como um mecanismo de processamento em lotes. A operação aleatória (redistribuição de dados) desempenha um papel fundamental na melhoria do desempenho da consulta. Também é importante para obter agregação de alta cardinalidade e junções de tabela grandes.
Conclusão
Em conclusão, o Processamento Paralelo Massivo (MPP) marca um avanço significativo no processamento de dados, catalisando uma mudança para métodos mais simplificados e eficientes de lidar com volumes substanciais de dados. Ele funciona essencialmente como uma potência, capaz de dissecar enormes conjuntos de dados de forma rápida e hábil por meio dos esforços simultâneos de vários nós.
O sistema StarRocks MPP exemplifica essa abordagem inovadora, fragmentando consultas complexas em segmentos menores, facilitando assim um procedimento de análise rápido. Esse desenvolvimento anuncia uma nova era de gerenciamento de dados, em que as empresas podem navegar pelas complexidades do Big Data com uma perspectiva estratégica aprimorada e profundidade analítica.
À medida que uma infinidade de setores faz a transição para um modelo operacional centrado em dados, o MPP surge como uma ferramenta pioneira, pronta para elevar as organizações a níveis sem precedentes de precisão analítica e previsão estratégica.
Deixe um comentário