Visão geral rápida
TPC-H
O benchmark TPC-H é um padrão para avaliação de sistemas de apoio à decisão, com foco em consultas complexas e manutenção de dados. Nesta análise, comparamos Databend Cloud e Snowflake usando o conjunto de dados TPC-H SF100 (SF1 = 6 milhões de linhas), que contém 100 GB de dados e aproximadamente 600 milhões de linhas, abrangendo 22 consultas.
Isenção de responsabilidade
TPC Benchmark™ e TPC-H™ são marcas registradas do Transaction Processing Performance Council ( TPC ). Nossos benchmarks, embora inspirados no TPC-H, não são diretamente comparáveis aos resultados oficiais do TPC-H.
Snowflake e Databend Cloud
- Snowflake : Snowflake é conhecido por seus recursos avançados, como armazenamento e computação desacoplados, computação escalonável sob demanda, compartilhamento de dados e recursos de clonagem.
- Databend Cloud : Databend Cloud oferece funcionalidade semelhante ao Snowflake e é um data warehouse nativo da nuvem que também separa o armazenamento da computação e fornece poder de computação escalonável conforme necessário. Ele foi desenvolvido a partir do projeto de código aberto Databend e se posiciona como uma alternativa moderna e econômica ao Snowflake, especialmente adequada para análises em larga escala.
Comparação de desempenho e custos
- Em termos de carregamento de dados, o custo do Databend é cerca de 67% menor que o do Snowflake.
- Em termos de execução de consultas, o Databend é aproximadamente 60% mais econômico do que o Snowflake.
Perceber
Nenhum ajuste foi realizado no benchmark. Os resultados são baseados nas configurações padrão do Snowflake e do Databend Cloud. Lembre-se, não acredite apenas na nossa palavra – encorajamos você a executá-lo sozinho e verificar esses resultados.
Comparativo de mercado de carregamento de dados
Nome da tabela | Floco de neve (695, custa US$ 0,77) | Databend Cloud (446s, custa US$ 0,25) | Número de linhas |
---|---|---|---|
cliente | 18.137 | 13.436 | 15.000.000 |
lineitem | 477.740 | 305.812 | 600.037.902 |
nação | 1.347 | 0,708 | 25 |
pedidos | 103.088 | 64.323 | 150.000.000 |
papel | 19.908 | 12.192 | 20.000.000 |
apoio partidário | 67.410 | 45.346 | 80.000.000 |
região | 0,743 | 0,725 | 5 |
fornecedor | 3.000 | 3.687 | 10.000.000 |
tempo total | Anos 695 | 446s | |
custo total | US$ 0,77 | US$ 0,25 | |
Tamanho de armazenamento | 20,8 GB | 24,5 GB |
Referência de consulta: inicialização a frio
Investigar | Floco de neve (207 no total, custa US$ 0,23) | Databend Cloud (166s no total, custa US$ 0,09) |
---|---|---|
TPC-H 1 | 11.703 | 8.036 |
TPC-H2 | 4.524 | 3.786 |
TPC-H3 | 8.908 | 6.040 |
TPC-H 4 | 8.108 | 4.462 |
TPC-H 5 | 9.202 | 7.014 |
TPC-H 6 | 1.237 | 3.234 |
TPC-H7 | 9.082 | 7.345 |
TPC-H 8 | 10.886 | 8.976 |
TPC-H 9 | 18.152 | 13.340 |
TPC-H 10 | 13.525 | 12.891 |
TPC-H 11 | 2.582 | 2.183 |
TPC-H 12 | 10.099 | 8.839 |
TPC-H 13 | 13.458 | 7.206 |
TPC-H 14 | 8.001 | 4.612 |
TPC-H 15 | 8.737 | 4.621 |
TPC-H 16 | 4.864 | 1.645 |
TPC-H 17 | 5.363 | 14.315 |
TPC-H 18 | 19.971 | 12.058 |
TPC-H 19 | 9.893 | 12.579 |
TPC-H 20 | 8.538 | 8.836 |
TPC-H 21 | 16.439 | 12.270 |
TPC-H 22 | 3.744 | 1.926 |
tempo total | 207 | 166s |
custo total | US$ 0,23 | US$ 0,09 |
Referência de consulta: início a quente
Investigar | Floco de neve (138s no total, custa US$ 0,15) | Databend Cloud (124s no total, custa US$ 0,07) |
---|---|---|
TPC-H 1 | 8.934 | 7.568 |
TPC-H2 | 3.018 | 3.125 |
TPC-H3 | 6.089 | 5.234 |
TPC-H 4 | 4.914 | 3.392 |
TPC-H 5 | 5.800 | 4.857 |
TPC-H 6 | 0,891 | 2.142 |
TPC-H7 | 5.381 | 4.389 |
TPC-H 8 | 5.724 | 5.887 |
TPC-H 9 | 10.283 | 9.621 |
TPC-H 10 | 10.368 | 8.524 |
TPC-H 11 | 1.165 | 1.364 |
TPC-H 12 | 7.052 | 5.352 |
TPC-H 13 | 12.829 | 6.180 |
TPC-H 14 | 3.288 | 2.725 |
TPC-H 15 | 3.475 | 2.748 |
TPC-H 16 | 4.094 | 1.124 |
TPC-H 17 | 4.203 | 13.757 |
TPC-H 18 | 18.583 | 11.630 |
TPC-H 19 | 3.888 | 7.881 |
TPC-H 20 | 6.379 | 5.797 |
TPC-H 21 | 10.287 | 9.806 |
TPC-H 22 | 1.573 | 1.122 |
tempo total | 138s | 124s |
custo total | US$ 0,15 | US$ 0,07 |
Reproduzindo benchmarks
Você pode reproduzir o benchmark seguindo as etapas abaixo.
Ambiente de referência
Tanto o Snowflake quanto o Databend Cloud foram testados em condições semelhantes:
parâmetro | Floco de neve | Nuvem de dados |
---|---|---|
Calcular o tamanho do cluster | pequeno | pequeno |
vCPU | 16 | 16 |
preço | US$ 4/hora | US$ 2/hora |
Região AWS | nós-leste-2 | nós-leste-2 |
armazenar | AWS S3 | AWS S3 |
- O conjunto de dados TPC-H SF100, proveniente do Amazon Redshift , foi carregado no Databend Cloud e no Snowflake sem nenhum ajuste específico.
Método de benchmarking
Executamos rodadas quentes e frias de execução de consultas:
- Execução a frio : o data warehouse é suspenso e retomado antes de executar a consulta.
- Execução a quente : o data warehouse não está suspenso e usa cache de disco local.
pré-requisitos
- Tenha uma conta Snowflake
- Crie uma conta Databend Cloud .
Carregamento de dados
-
Carregamento de dados do floco de neve :
- Faça login em sua conta Snowflake .
- Crie uma tabela correspondente ao esquema TPC-H. Roteiro SQL .
- Use
COPY INTO
comandos para carregar dados do AWS S3. Roteiro SQL .
-
Carregamento de dados do Databend Cloud :
- Faça login em sua conta Databend Cloud .
- Crie as tabelas necessárias, consistentes com o esquema TPC-H. Roteiro SQL .
- Carregue dados do AWS S3 usando uma abordagem semelhante ao Snowflake. Roteiro SQL .
Consulta TPC-H
-
Consulta de floco de neve :
- Faça login em sua conta Snowflake .
- Execute a consulta TPC-H. Roteiro SQL .
-
Databend Cloud 查询:
- 登录您的 Databend Cloud 账户.
- 运行 TPC-H 查询。SQL 脚本.