6月20日-6月25日,ACM SIGMOD/PODS 2021会议在中国西安举行。SIGMOD会议是由ACM数据管理专业委员会发起的国际性学术会议,位列数据管理方向的三大顶级会议之首。会议旨在为国际数据库领域学者和开发者提供沟通的平台,共同探讨数据库领域的前沿技术和发展方向,促进更深层次的交流与合作,以进一步推动数据库领域的创新与发展。

由于疫情影响,本次会议采用线上线下混合的方式进行。作为正式会议的预热,西安主会场举办了系列研讨活动(Local Event),包括中国数据库产学研高峰论坛、企业数据库技术和生态发展研讨会、云原生数据库2.0研讨会等。SIGMOD 2021会议特别邀请了哥伦比亚大学Kenneth A. Ross教授、哈尔滨工业大学李建中教授、以及Facebook AI实验室Wang-Chiew Tan教授做了大会主题报告。本次会议共收录188篇研究论文,21篇工业界论文以及27篇系统演示论文。其中,我院师生与德国柏林工业大学合作发表了一篇面向分布式数据处理系统性能优化的研究论文,与蚂蚁集团区块链团队合作发表了一篇关于区块链数据存储的系统演示论文,并在大会分组研讨环节做了技术分享。此外,与会师生代表还参加了SIGMOD嘉宾走进华为西研所和Gauss松鼠会Meetup等活动。

1625639772071070477.jpg



面向分布式迭代矩阵运算的混合计算策略[1]

矩阵计算广泛存在于机器学习等应用中,在PageRank、GNMF等迭代式矩阵运算中,迭代矩阵的各个元素的收敛速度往往不同,但是系统执行计划反复计算其中收敛的元素。本文采用了增量计算的思想来解决该问题,即在运行过程中重用数值不变的项的计算结果,仅计算数值发生变化的项。然而,增量计算需要诸如提取增量等额外的操作,导致在部分情况下增量计算会降低执行效率。因此,在增量计算策略的基础上,本文进一步提出混合计算策略,在迭代计算过程中交替使用全量计算和增量计算以提升性能。通过修改SystemML实现了HyMAC原型系统,其性能相比于知名的分布式矩阵计算方案(如SystemML、SciDB)快了8倍。据悉,HyMAC系统的演示论文[3]目前已经被VLDB 2021国际会议录用。

 


许可链上的拜占庭容错存储引擎[2]

在目前的区块链系统中,每个节点都需要存储整个系统的完整数据,此全复制数据存储的机制成为了系统扩展的瓶颈。此外,由于拜占庭节点的存在,现有的分区方法虽然在分布式系统中被广泛采用了几十年,但并不能直接适用于区块链系统,因此为区块链系统设计新的存储机制至关重要。为此鉴于拜占庭容错协议(PBFT)和纠删码技术,该团队设计出BFT-Store,将每f+1个区块进行编码,产生3f+1个块,并将其分布在不同节点中,将原来每个区块的存储代价从O(n)降低至O(1)。其次,采用一种高效的在线重编码协议以及一种混合复制方案分别用以存储扩展及读取性能的提高。该团队也在开源的许可链Tendermint实现了BFT-Store。实验结果表明,在不牺牲查询性能以及安全性假设的前提下,系统极大地降低了节点的数据存储代价。据悉,该成果对应的研究论文[4]已于2021年初发表在IEEE TKDE期刊。

 


研究成果

[1] Zihao Chen, Chen Xu, Juan Soto, Volker Markl, Weining Qian and Aoying Zhou. Hybrid Evaluation for Distributed Iterative Matrix Computation. SIGMOD 2021.

[2] Xiaodong Qi, Zhihao Chen, Zhao Zhang, Cheqing Jin, Aoying Zhou, Haizhen Zhuo, Quangqing Xu. A Byzantine Fault Tolerant Storage for Permissioned Blockchain. SIGMOD 2021.

[3] Zihao Chen, Zhizhen Xu, Chen Xu, Juan Soto, Volker Markl, Weining Qian and Aoying Zhou. HyMAC: A Hybrid Matrix Computation System. PVLDB 2021.

[4] Xiaodong Qi, Zhao Zhang, Cheqing Jin, Aoying Zhou. A Reliable Storage Partitioning for Permissioned Blockchain. IEEE TKDE 2021

 



图文|徐辰

排版|甄逸飞


来源:华东师范大学数据学院