Gerenciamento inovador e de alto desempenho de Data Lake

Gerenciamento e processamento completos e comprovados de Data Lake

O que é o HPCC Systems?

Uma plataforma de computação em cluster de alto desempenho criada para engenharia de dados de alta velocidade.

A principal vantagem d HPCC Systems vem de sua arquitetura central leve. Melhor desempenho, resultados quase em tempo real e escala operacional de espectro total – sem necessidade de uma equipe de desenvolvimento numerosa, complementos desnecessários ou aumento dos custos de processamento.

Recursos Inovadores

Veja as muitas vantagens que o HPCC Systems traz para a manutenção do seu ambiente Data Lake ou Big Data.

Aproveite os benefícios do Kubernetes

Saiba como usar nossa versão da plataforma com suporte nativo para nuvem pode melhorar suas implantações em nuvem atuais. O HPCC Systems atualmente combina a usabilidade de nossa plataforma bare metal com a automação do Kubernetes para facilitar a configuração, o gerenciamento e o dimensionamento de sua implementação.

Executa em KubernetesA nova arquitetura de plano de armazenamento suportaElasticidadeSegurança
Suporte para Azure Kubernetes Service

Suporte para Amazon Elastic Kubernetes Service
Armazenamento de objetos: AWS Simple Storage Service (S3) e Azure Blob Storage

Armazenamento de disco: AWS Elastic Block Storage e Azure Files/Azure Disks
Dimensione um cluster sem mover os dados

Ativação automática para habilitar o processamento sob demanda por recursos de computação
Criptografia de ponta a ponta

Opções de Service Mesh (Linkerd e Istio)

Suporte OAuth 2.0 para Autenticação, com suporte integrado para Azure AD

JWT

Saiba mais sobre nossa versão da plataforma com suporte nativo para nuvem

Visit the Cloud Native Wiki page for access to Helm charts, blog content, videos and other instructional information.

Executando o HPCC Systems em uma máquina local

A Virtual Machine containerized deployment with Docker Desktop or Minikube is an excellent resource for experimenting, evaluating and training on the HPCC Systems platform.

Documentação para a versão conteinerizada da plataforma

Documentation useful for cloud-based deployments featuring Terraform, Helm, and other deployments (large or small) as well as local testing and development deployments.

Ultra desempenho

A principal vantagem do HPCC Systems vem de sua arquitetura central leve. Melhor desempenho, resultados quase em tempo real e escala operacional de espectro total — sem uma equipe de desenvolvimento numerosa, complementos desnecessários ou aumento dos custos de processamento.

Visão geral do HPCC Systems

HPCC Systems é uma plataforma de código aberto para implementações de big data,
seja como um data lake ou data warehouse, fornecendo aos usuários um
caminho claro desde a descoberta de dados até a produção.

Gerenciamento de data lake de ponta a ponta

Os data lakes estão ajudando organizações líderes de mercado a resolver os problemas
de conjuntos de dados extremamente grandes e não estruturados,
permitindo-lhes aumentar a capacidade de resposta e
escalabilidade e redução de custos.

Análise Comparativa Spark

Uma análise comparativa entre Spark e HPCC Systems do ponto de vista de arquitetura e recursos de um data lake, bem como seus respectivos enfoques em diferentes estágios do pipeline de big data.

Codifique menos — realize mais

Uma linguagem de programação declarativa, a ECL permite que um programador expresse a lógica de uma computação sem descrever seu controle de fluxo. Os desenvolvedores dizem ao sistema o que precisam, mas deixam que o sistema determine a melhor maneira de fazer isso.

Estudo de caso da DataSeers

With the efficiency of ECL, fewer lines of code allows prototypes that can be iterated quickly, speeding both time to market and time to revenue.

Experimente o ECL Playground

Try our Enterprise Control Language (ECL), the data-oriented programming language specially designed for data processing and analytics.

Acesse o Treinamento Gratuito

From free training courses to rich community resources and a comprehensive wiki, we have all the resources for every stage from initial installation all the way to power user.

Biblioteca de aprendizagem de máquina e análise de causalidade

A biblioteca de aprendizagem de máquina fornece uma ampla variedade de algoritmos e foi projetada para utilizar os recursos de computação paralela do HPCC Systems. Crie e teste modelos de aprendizagem de máquina e use esses modelos para prever valores qualitativos ou quantitativos.

Aprendizagem de Máquina desmistificado

A quick but potent intro to Machine Learning for those who are new to the subject. This article provides enough of the basic theory and terminology to make you dangerous.

Workshop sobre Aprendizagem de Máquina

Follow along with our trainers as they demonstrate our DBSCAN, K-Means, Logistic and Linear Regression, Generalized Neural Networks and Learning Trees bundles.

Biblioteca de Aprendizagem de Máquina

The HPCC Systems Machine Learning Library provides a wide range of Machine Learning algorithms accessible from ECL, and designed to utilize the parallel computing capabilities of HPCC Systems.

Integre com facilidade

O HPCC Systems continua a desenvolver novos plug-ins, conectores e aplicativos independentes que são gratuitos para a comunidade a fim de ajudar você a integrar ferramentas populares de terceiros com a plataforma HPCC Systems.

Módulos Complementares Gratuitos

HPCC Systems continues to develop new stand-alone applications and plug-in modules that extend the capabilities of the base HPCC Systems platform.

ECL Bundles

An ECL Bundle is a self-contained set of ECL files, designed to accomplish specific tasks. They are encapsulated for versioning, distribution and download.

Integrações com Terceiros

Use embedded languages and external datastores with HPCC Systems to integrate your system to your data.

Use sua linguagem de programação ou fonte de dados favorita

ECL é muito flexível. Você pode incorporar várias linguagens de programação diferentes em seu código ECL e processar dados em um cluster HPCC Systems de várias fontes diferentes usando os vários plug-ins e conectores que fornecemos especificamente para ajudar você a estabelecer essa conectividade.

Usando sua linguagem de programação ou fonte de dados favorita

How flexible is ECL? Read about supported languages, plugins and connectors.

Wiki de linguagens de programação e fontes de dados suportadas

The full list of supported languages, plugins and connectors, including links to other information you might find useful.

Incorporação avançada de código Python

Learn how ECL makes it easy to transition between declarative and procedural worlds through use of embedding.

Comprometidos com a inovação de código aberto

Disponível gratuitamente para a comunidade de código aberto por mais de 10 anos e licenciado sob a versão Apache 2.0, continuamos a ultrapassar os limites do Big Data com uma vibrante comunidade de desenvolvimento on-line e em instituições acadêmicas.

Repositório GitHub

HPCC Systems is an open source, massive parallel-processing computing platform for Big Data processing and analytics.

Fórum da Comunidade Stack Overflow

Receive peer to peer support on our Stack Overflow forums. Ask questions specific to your development or read and answer questions others have posted.

Pesquisa acadêmica

The HPCC Systems Team collaborates with multiple colleges, universities, high schools and institutions of higher learning around the world to help train and develop the future managers of Big Data projects.

Comprovado, estável e seguro

O HPCC Systems é uma plataforma madura que tem sido muito usada em aplicações comerciais por mais de duas décadas, antes mesmo do desenvolvimento do Hadoop. Criado pela LexisNexis Risk Solutions, uma pioneira inovadora em processamento de big data, e de código aberto há quase uma década, a HPCC Systems apresenta uma comunidade de desenvolvimento vibrante que continua a ultrapassar os limites do big data.

Protegendo seu ambiente e protegendo seus dados

Este blog destaca alguns dos muitos recursos de segurança que tornam o HPCC Systems uma solução atraente para usuários que precisam de uma plataforma de computação robusta, configurável e altamente segura.

Detail on the many security features that make HPCC Systems a compelling solution for users that require a robust, configurable, highly secure computing platform.

Curadoria e Governança do Data Lake com Tombolo

Conduct curation and governance operations in an automated fashion to consistently and reliably curate huge amounts of inbound new data and ensure continuous availability.

Tombolo fornece as ferramentas necessárias para implementar, documentar e manter uma infraestrutura organizacional e pode implementar proteções para controlar quais usuários e aplicativos têm acesso a esses ativos de dados.

O que você precisa saber sobre como proteger sua plataforma

Blog discutindo algumas das considerações básicas de segurança para proteger adequadamente uma plataforma de Big Data contra acesso não autorizado ou roubo de dados.

Comece a Usar

Quer fazer mais testes antes de instalar um cluster completo? Se estiver pronto para começar a criar seu data lake, você pode ir diretamente aprender sobre como instalar seu primeiro cluster HPCC Systems completo. Interessado em saber o quão poderoso, flexível e eficiente o ECL realmente é? Dê uma olhada em nosso guia ECL na seção Documentação.

Máquina Local

Implantações em contêiner usando Docker Desktop ou Minikube são mais fáceis de iniciar localmente e fornecem mais flexibilidade e estabilidade.

Documentação e Treinamento

Lidando com problemas de big data? Nós temos documentação e treinamento para apoiar você desde a instalação inicial até o uso avançado.

Comece a Trabalhar

Obtenha uma visão geral de alto nível para ajudar novos usuários a começar a usar o HPCC Systems e ECL (Enterprise Control Language).

Test Drive

Teste nosso código em um playground virtual usando um conjunto de dados de exemplo. Ou crie seu próprio cluster de computação de alto desempenho (Thor) e/ou cluster de consulta (Roxie).

HPCC Systems: a solução de gerenciamento de data lake de ponta a ponta

Preparar. Definir. Agir.

Você está pronto para começar a usar o HPCC Systems? Use as telas abaixo para obter uma visão geral rápida da plataforma HPCC Systems, saiba como você pode ingerir, limpar e entregar seus dados de diferentes tipos para torná-los úteis e relevantes para você e seus clientes.

Versátil. Flexível. Refinado.

Uma usuária experiente do HPCC Systems explica os benefícios e as vantagens de usar o HPCC Systems como sua solução de gerenciamento de big data.

Ingerir dados do seu Data Lake

Aqui estão alguns conjuntos de dados de exemplo para o uso com códigos de exemplo fornecidos por membros da comunidade HPCC Systems.

Obtenha mais de seus dados com a biblioteca de aprendizagem de máquina

A biblioteca de aprendizagem de máquina do HPCC Systems fornece uma ampla gama de algoritmos de aprendizagem de máquina acessíveis a partir de ECL e projetados para utilizar os recursos de computação paralela de HPCC Systems.

Projete e automatize seus fluxos de trabalho de dados

A tecnologia Tombolo é o console central para desenvolvedores e operadores, fornecendo todas as facilidades necessárias para projetar, desenvolver, automatizar, documentar e governar data lakes.

Um legado de inovação e software de código aberto por mais de 10 anos

Disponível gratuitamente para a comunidade de código aberto por mais de 10 anos e licenciado sob a versão Apache 2.0, continuamos a ultrapassar os limites do big data com uma vibrante comunidade de desenvolvimento on-line e em instituições acadêmicas.

Tem uma dúvida?

Confira nossa página de perguntas frequentes. Navegue pelos tópicos para descobrir mais sobre a tecnologia HPCC Systems e respostas para perguntas usuais sobre HPCC Systems, ECL e muito mais.

Mantenha-se informado

Fique por dentro das últimas notícias sobre desenvolvimentos HPCC Systems e informações da comunidade inscrevendo-se em nossa newsletter

Receba as notícias mais recentes sobre atualizações de plataforma, blogs técnicos, eventos e outros anúncios relacionados. Basta colocar seu endereço de e-mail no formulário abaixo. Não enviaremos lixo eletrônico ou venderemos seu endereço de e-mail. Apenas as informações mais recentes para mantê-lo atualizado.