【区块链论文整理】SIGMOD篇(三)

SIGMOD(Special Interest Group On Management Of Data)是数据库三大顶会之一,近几年也发表了不少水平很高的文章。本文主要针对SIGMOD会议中区块链相关的论文进行简单整理。

ACM SIGMOD Conference 2021: Virtual Event, China

  • SharPer: Sharding Permissioned Blockchains Over Network Clusters. 
  • Permissioned Blockchains: Properties, Techniques and Applications
  • Why Do My Blockchain Transactions Fail?: A Study of Hyperledger Fabric.
  • Do the Rich Get Richer? Fairness Analysis for Blockchain Incentives
  • Blockchains vs. Distributed Databases: Dichotomy and Fusion.
  • DIV: Resolving the Dynamic Issues of Zero-knowledge Set Membership Proof in the Blockchain.
  • P2B-Trace: Privacy-Preserving Blockchain-based Contact Tracing to Combat Pandemics
  • A Byzantine Fault Tolerant Storage for Permissioned Blockchain

SIGMOD Conference 2020: Virtual Event / Portland, OR, USA

  • A Transactional Perspective on Execute-order-validate Blockchains.
  • FalconDB: Blockchain-based Collaborative Database.
  • Confidentiality Support over Financial Grade Consortium Blockchain.
  • vChain: A Blockchain System Ensuring Query Integrity.

SIGMOD Conference 2019: Amsterdam, The Netherlands

  • Blurring the Lines between Blockchains and Database Systems: the Case of Hyperledger Fabric.
  • Towards Scaling Blockchain Systems via Sharding.
  • vChain: Enabling Verifiable Boolean Range Queries over Blockchain Databases.
  • State of Public and Private Blockchains: Myths and Reality.
  • Database and Distributed Computing Foundations of Blockchains.
  • BlockchainDB - Towards a Shared Database on Blockchains
  • Fluid: A Blockchain based Framework for Crowdsourcing

计划分三篇文章进行整理,本篇为2019年的4篇论文

1 Blurring the Lines between Blockchains and Database Systems: the Case of Hyperledger Fabric.

摘要: 在过去几年中,市场上出现了无数个区块链系统,每一个都声称以这样或那样的方式彻底改变了分布式交易处理的方式。许多区块链功能,比如拜占庭式容错,在现代环境中确实是有价值的补充。然而,尽管围绕着这项技术大肆宣传,区块链系统必须面对的许多挑战都是基本的交易管理问题。传统的数据库系统已经存在了几十年,它们在很大程度上是共享的。

这些相似性对于模糊区块链系统和经典数据库系统之间界限的系统来说尤其明显。Hyperledger Fabric就是一个很好的例子,它是IBM正在开发的一个开源许可区块链系统。通过实现并行事务处理,Fabric的工作流受到经典数据库系统中乐观并发控制机制的高度激励。这提出了两个问题:(1)Fabric这样的系统和经典的分布式数据库系统在概念上究竟存在哪些相似性和差异?(2) 通过将技术从数据库世界过渡到区块链,从而进一步模糊这两类系统之间的界限,是否有可能改善Fabric的性能?为了解决这些问题,我们首先从数据库研究的角度探索Fabric,我们观察事务管道中的弱点。然后,我们通过将理解良好的数据库概念转换为Fabric来解决这些问题,即事务重新排序以及早期事务中止。我们在Smallbank基准测试和定制工作负载下的实验评估表明,我们改进的版本Fabric++比普通版本显著提高了12倍的成功事务吞吐量,同时将平均延迟降低到几乎一半。

也是优化Hyperledger Fabric性能的。

2 Towards Scaling Blockchain Systems via Sharding.

摘要:现有的区块链系统由于其分布式共识协议而难以扩展。目前改善区块链可伸缩性的尝试仅限于加密货币。在一般工作负载(即非货币应用程序)下扩展区块链系统仍然是一个悬而未决的问题。 这项工作采用了一种原则性的方法,将分片应用于区块链系统,以大规模提高其交易吞吐量。然而,这是一个挑战,因为数据库和区块链之间的故障模型存在根本差异。为了实现我们的目标,我们首先提高拜占庭共识协议的性能,提高单个碎片的吞吐量。接下来,我们设计了一个高效的分片形成协议,可以安全地将节点分配到分片中。我们依靠受信任的硬件,即Intel SGX,实现共识协议和碎片形成协议的高性能。第三,我们设计了一个通用的分布式事务协议,即使事务协调器是恶意的,也能确保安全性和活性。最后,我们在本地集群和谷歌云平台上对我们的设计进行了广泛的评估。结果表明,我们的共识和碎片形成协议在规模上优于最先进的解决方案。更重要的是,我们的分片区块链达到了可以处理Visa级别工作负载的高吞吐量,是现实环境中报告的最大吞吐量。

主要贡献:

  1. 据我们所知,我们是第一个推出分片区块链的,该区块链支持加密货币以外的工作负载,并可扩展至每秒数千笔交易。
  2. 我们的分片区块链设计包括三个关键创新点:(i)优化,提高每个分片内运行的共识协议的性能,(ii)高效的分片形成协议,以及(iii)处理跨分片分布式交易的安全分布式交易协议。

  3. 我们进行了广泛的大规模实验来评估我们设计的性能。我们在一个有100个节点的本地集群和一个由分布在8个地区的1400多个谷歌云平台(GPC)节点组成的真实设置上进行了实验。在GPC设置中,我们实现了每秒3000多个事务的吞吐量,据我们所知,

3 vChain: Enabling Verifiable Boolean Range Queries over Blockchain Databases.

摘要:由于加密货币和分散应用的繁荣,区块链最近受到了关注。查询存储在区块链数据库中的数据的需求越来越大。为了确保查询完整性,用户可以维护整个区块链数据库,并在本地查询数据。然而,由于区块链的巨大数据量和可观的维护成本,这种方法即使不可行也不经济。在本文中,我们迈出了研究区块链数据库上可验证查询处理问题的第一步。我们提出了一个名为vChain的新框架,该框架减轻了用户的存储和计算成本,并使用可验证查询来保证结果的完整性。为了支持可验证的布尔范围查询,我们提出了一种基于累加器的认证数据结构,该结构支持在任意查询属性上进行动态聚合。进一步开发了两个新的索引来聚合块内和块间数据记录,以实现高效的查询验证。我们还提出了一种反向前缀树结构,以加速同时处理大量订阅查询。安全性分析和实证研究验证了所提技术的鲁棒性和实用性。

主要贡献:

  1. 据我们所知,这是第一项利用内置ADS实现区块链数据库查询完整性的可验证查询处理工作。

  2. 我们提出了一个新的vChain框架,以及一个新的ADS方案和两个索引结构,它们可以聚合块内和块间数据记录,以实现高效的查询处理和验证。

  3. 我们开发了一个新的查询索引,可以同时处理大量订阅查询。

  4. 我们进行了安全性分析和实证研究,以验证所提出的技术。我们还讨论了实际实施问题。

优化区块链数据库查询效率。

vChain系统模型:

4 State of Public and Private Blockchains: Myths and Reality. (演讲)

摘要:区块链概念被发明为无许可或公共比特币加密货币网络的底层核心数据结构已经有十年了。此后,出现了几种加密货币、代币和ICO。经过大量的猜测和炒作,其中相当一部分已经成了问题或一文不值!公共区块链系统以太坊(Ethereum)是通过引入智能合约,将区块链用于管理任何类型的资产(无论是实物资产还是纯数字资产)而产生的。多年来,关于所谓的效用和对公共区块链的需求,出现了许多神话。我认为区块链和智能合约的采用和进一步调整,以在许可或私人环境中使用,是有用的,具有实际意义。因此,只有私有区块链系统的技术方面将是我的SIGMOD 2019主题演讲的重点。在此过程中,我将打破许多与公共区块链相关的神话。我还将把传统数据库技术与区块链系统的功能进行比较,并确定理想的未来研究主题。

结论:虽然在短时间内,在构建具有众多功能的生产级私有区块链系统方面取得了巨大进展,但要使这些系统易于使用,并使用适当的工具、标准和基准来评估其性能,还有很多工作要做。主流数据库和分布式系统的研究人员和技术人员需要参与这一领域,以确保他们丰富的经验得到有效利用,从而使这些系统在不同方面变得更好。

关于区块链系统的各种架构特征,这些系统的设计师做出了不同的选择。这些选择背后的理由很少得到充分阐述和充分证明。不同系统及其具体设计选择的系统比较仍有待进行。这些系统的许多方面都可以从研究人员和深入的技术专家进行的彻底和系统的调查中受益。创业者还可以找到一些主题来开发有用的工具和方法,以增强现有的区块链系统。要记住的一个有用的类比是,如今区块链系统的状态与大约35年前的RDBMS相似,当时DB2和Oracle等一些RDBMS产品刚刚发布。从那时起,关系技术、产品和用户从研究人员、以产品为中心的系统建设者和企业家的工作中受益匪浅。这样一个富有成效的未来等待着私有区块链系统及其用户。

5 Database and Distributed Computing Foundations of Blockchains. (教程)

摘要: 比特币和其他点对点加密货币的崛起,在密码学、分布式系统和数据库中引发了许多有趣且具有挑战性的问题。主要的底层数据结构是区块链,这是一种可扩展的完全复制结构,在所有参与者之间共享,并保证系统中所有参与者对所有用户交易的一致视图。在本教程中,我们将讨论区块链中使用的基本协议,并详细阐述其主要优势和局限性。为了克服这些限制,我们提供了管理大规模完全复制账本所需的分布式系统背景,使用拜占庭协议来解决一致性问题。最后,我们阐述了在无许可和许可环境下设计可伸缩高效区块链的一些最新建议。本教程的重点是区块链最新创新的分布式系统和数据库方面。

6 BlockchainDB - Towards a Shared Database on Blockchains (演示)

原文发表在2019 年VLDB上。

摘要:在本演示中,我们介绍了区块链数据库,它利用区块链作为存储层,并在顶部引入了一个数据库层,通过经典的数据管理技术(如分片)扩展区块链。此外,区块链数据库提供了一个标准化的基于键/值的查询接口,以促进区块链用于数据共享用例。因此,通过区块链数据库,我们不仅可以提高区块链用于数据共享的性能和可伸缩性,还可以降低打算在该用例中使用区块链的组织的复杂性。

主要贡献:在本演示中,我们介绍BlockchainDB来解决前面提到的问题。其主要思想是区块链数据库利用区块链作为存储层。这样,现有区块链系统就可以用作(无需修改)防回火和非集中化存储。在存储层之上,区块链数据库添加了一个数据库层,该数据库层实现以下功能:

  • 分区和复制:如今区块链的一个主要性能瓶颈是,所有对等方都持有状态的完整副本,但仍然只提供(有限的)切分功能。在BlockchainDB中,我们允许应用程序在数据库层定义如何在所有可用对等方之间复制和分区数据。因此,应用程序可以以声明的方式交换性能和安全保证。

  • 查询接口和一致性:在数据库层,区块链数据库还提供易于使用的抽象,包括不同的一致性协议(例如,最终一致性和顺序一致性),以及一个简单的键/值接口,用于在不了解区块链系统内部的情况下读取/写入数据。

7 Fluid: A Blockchain based Framework for Crowdsourcing(演示)

 摘要:近年来,众包已经成为一种新的计算范式,用于解决图像标注等人类固有的问题。然而,现有众包平台存在两个局限性,即不透明的激励机制和孤立的员工档案,这损害了请求者和员工的利益。与此同时,区块链技术引入了一种解决方案,在拜占庭环境中构建透明、不变的数据模型。此外,区块链系统(例如以太坊)也可以支持称为智能合约的调整完整脚本。因此,我们有动机利用区块链中透明数据模型和智能合约的特性来解决这两个限制。基于提出的解决方案,我们设计了一个基于区块链的框架,该框架支持一般众包平台的基础。此外,我们的框架还具有以下新特点:(1)提供了透明的激励机制;(2) 它支持在跨平台模式下共享受信任工作人员的个人资料。

附加:2篇差分隐私文章

8 Answering Multi-Dimensional Analytical Queries under Local Differential Privacy

摘要:多维分析(MDA)查询通常针对一个事实表发出,该事实表的谓词基于(分类或顺序)维度,聚合基于一个或多个度量。在本文中,我们研究了在局部差异隐私(LDP)下回答MDA查询的问题。在没有可信代理的情况下,敏感维度在发送到数据采集器之前在本地以私有保护(LDP)的方式进行编码。数据采集器根据编码的维度估计MDA查询的答案。我们提出了几种LDP编码器和估计算法,用于处理具有不同类型谓词和聚合函数的大量MDA查询。我们的技术能够以严格的误差范围回答这些问题,并在高维环境下很好地扩展(即,误差在维度大小上是多对数的)。我们在真实数据和合成数据上进行实验,以验证我们的理论结果,并将我们的解决方案与基于边际估计的解决方案进行比较。

9 APEx: Accuracy-Aware Differential Privacyally Private Data Exploration

摘要:组织对允许外部数据科学家探索其敏感数据集越来越感兴趣。由于差异隐私的流行,数据所有者希望数据探索能够确保可证明的隐私保障。然而,当前用于回答具有差异隐私的查询的系统给数据分析人员带来了过重的负担,使他们无法理解差异隐私、管理他们的隐私预算,甚至可以实现新的算法来回答有噪声的查询。此外,目前的系统并不能保证数据分析师所关心的质量,即查询答案的准确性。

我们介绍了APEx,这是一个新的系统,允许数据分析人员根据所需的准确度范围提出自适应选择的查询序列。通过将查询和准确度界限转换为隐私损失最小的差异私有算法,APEx向数据分析师返回满足准确度界限的查询答案,并向数据所有者证明整个数据探索过程是差异私有的。我们在真实数据集上的综合实验研究表明,APEx能够以中等到较小的隐私损失准确地回答各种查询,并且能够在合理的隐私设置下以高精度支持实体解析的数据探索。

猜你喜欢

转载自blog.csdn.net/RenLJ1895/article/details/124436587