Referência TPC-H: Databend Cloud vs.

Visão geral rápida

TPC-H

O benchmark TPC-H é um padrão para avaliação de sistemas de apoio à decisão, com foco em consultas complexas e manutenção de dados. Nesta análise, comparamos Databend Cloud e Snowflake usando o conjunto de dados TPC-H SF100 (SF1 = 6 milhões de linhas), que contém 100 GB de dados e aproximadamente 600 milhões de linhas, abrangendo 22 consultas.

Isenção de responsabilidade

TPC Benchmark™ e TPC-H™ são marcas registradas do Transaction Processing Performance Council ( TPC ). Nossos benchmarks, embora inspirados no TPC-H, não são diretamente comparáveis ​​aos resultados oficiais do TPC-H.

Snowflake e Databend Cloud

  • Snowflake : Snowflake é conhecido por seus recursos avançados, como armazenamento e computação desacoplados, computação escalonável sob demanda, compartilhamento de dados e recursos de clonagem.
  • Databend Cloud : Databend Cloud oferece funcionalidade semelhante ao Snowflake e é um data warehouse nativo da nuvem que também separa o armazenamento da computação e fornece poder de computação escalonável conforme necessário. Ele foi desenvolvido a partir do projeto de código aberto  Databend e se posiciona como uma alternativa moderna e econômica ao Snowflake, especialmente adequada para análises em larga escala.

Comparação de desempenho e custos

  • Em termos de carregamento de dados, o custo do Databend é cerca de 67% menor que o do Snowflake.
  • Em termos de execução de consultas, o Databend é aproximadamente 60% mais econômico do que o Snowflake.

Perceber

Nenhum ajuste foi realizado no benchmark. Os resultados são baseados nas configurações padrão do Snowflake e do Databend Cloud. Lembre-se, não acredite apenas na nossa palavra – encorajamos você a executá-lo sozinho e verificar esses resultados.

Comparativo de mercado de carregamento de dados

Nome da tabela Floco de neve (695, custa US$ 0,77) Databend Cloud (446s, custa US$ 0,25) Número de linhas
cliente 18.137 13.436 15.000.000
lineitem 477.740 305.812 600.037.902
nação 1.347 0,708 25
pedidos 103.088 64.323 150.000.000
papel 19.908 12.192 20.000.000
apoio partidário 67.410 45.346 80.000.000
região 0,743 0,725 5
fornecedor 3.000 3.687 10.000.000
tempo total Anos 695 446s
custo total US$ 0,77 US$ 0,25
Tamanho de armazenamento 20,8 GB 24,5 GB

Referência de consulta: inicialização a frio

Investigar Floco de neve (207 no total, custa US$ 0,23) Databend Cloud (166s no total, custa US$ 0,09)
TPC-H 1 11.703 8.036
TPC-H2 4.524 3.786
TPC-H3 8.908 6.040
TPC-H 4 8.108 4.462
TPC-H 5 9.202 7.014
TPC-H 6 1.237 3.234
TPC-H7 9.082 7.345
TPC-H 8 10.886 8.976
TPC-H 9 18.152 13.340
TPC-H 10 13.525 12.891
TPC-H 11 2.582 2.183
TPC-H 12 10.099 8.839
TPC-H 13 13.458 7.206
TPC-H 14 8.001 4.612
TPC-H 15 8.737 4.621
TPC-H 16 4.864 1.645
TPC-H 17 5.363 14.315
TPC-H 18 19.971 12.058
TPC-H 19 9.893 12.579
TPC-H 20 8.538 8.836
TPC-H 21 16.439 12.270
TPC-H 22 3.744 1.926
tempo total 207 166s
custo total US$ 0,23 US$ 0,09

Referência de consulta: início a quente

Investigar Floco de neve (138s no total, custa US$ 0,15) Databend Cloud (124s no total, custa US$ 0,07)
TPC-H 1 8.934 7.568
TPC-H2 3.018 3.125
TPC-H3 6.089 5.234
TPC-H 4 4.914 3.392
TPC-H 5 5.800 4.857
TPC-H 6 0,891 2.142
TPC-H7 5.381 4.389
TPC-H 8 5.724 5.887
TPC-H 9 10.283 9.621
TPC-H 10 10.368 8.524
TPC-H 11 1.165 1.364
TPC-H 12 7.052 5.352
TPC-H 13 12.829 6.180
TPC-H 14 3.288 2.725
TPC-H 15 3.475 2.748
TPC-H 16 4.094 1.124
TPC-H 17 4.203 13.757
TPC-H 18 18.583 11.630
TPC-H 19 3.888 7.881
TPC-H 20 6.379 5.797
TPC-H 21 10.287 9.806
TPC-H 22 1.573 1.122
tempo total 138s 124s
custo total US$ 0,15 US$ 0,07

Reproduzindo benchmarks

Você pode reproduzir o benchmark seguindo as etapas abaixo.

Ambiente de referência

Tanto o Snowflake quanto o Databend Cloud foram testados em condições semelhantes:

parâmetro Floco de neve Nuvem de dados
Calcular o tamanho do cluster pequeno pequeno
vCPU 16 16
preço US$ 4/hora US$ 2/hora
Região AWS nós-leste-2 nós-leste-2
armazenar AWS S3 AWS S3
  • O conjunto de dados TPC-H SF100, proveniente do  Amazon Redshift , foi carregado no Databend Cloud e no Snowflake sem nenhum ajuste específico.

Método de benchmarking

Executamos rodadas quentes e frias de execução de consultas:

  1. Execução a frio : o data warehouse é suspenso e retomado antes de executar a consulta.
  2. Execução a quente : o data warehouse não está suspenso e usa cache de disco local.

pré-requisitos

Carregamento de dados

  1. Carregamento de dados do floco de neve :

  2. Carregamento de dados do Databend Cloud :

Consulta TPC-H

  1. Consulta de floco de neve :

  2. Databend Cloud 查询

Linus 亲自动手,阻止内核开发者用空格替换制表符 父亲是少数会写代码的领导人、次子是开源科技部主管、幼子是开源核心贡献者 华为:用 1 年时间将 5000 个常用手机应用全面迁移至鸿蒙 Java 是最容易出现第三方漏洞的语言 鸿蒙之父王成录:开源鸿蒙是我国基础软件领域唯一一次架构创新 马化腾周鸿祎握手“泯恩仇” 前微软开发人员:Windows 11 性能“糟糕得可笑” 虽然老乡鸡开源的不是代码,但背后的原因却让人很暖心 Meta Llama 3 正式发布 谷歌宣布进行大规模重组
{{o.name}}
{{m.name}}

Acho que você gosta

Origin my.oschina.net/u/5489811/blog/11044358
Recomendado
Clasificación