2021年7月18日,华东师范大学第八届数据科学与工程暑期学校(DaSESS2021)在中北校区科学会堂正式启航。此次暑期学校以“数据驱动的系统优化”为主题,邀请了海内外知名专家主讲课程,并组织业内顶尖学者及工业界人士参与研讨交流,共同探讨如何在有限的硬件系统资源配置下提升软件系统的性能,并深入学习软件系统优化的原理、技术和实践。活动由华东师范大学数据科学与工程学院主办。开幕暨首日报告会由学院副院长金澈清教授主持。
学院院长钱卫宁教授作开幕式致辞。钱老师介绍了DaSESS的基本情况及创办目的,并系统回顾了过去七届暑期学校的发展历程、师生收获。每一届DaSESS的选题都实时结合国际国内学术和技术发展的方向,深度契合数据科学与工程学院的研究和人才培养计划。今年以数据驱动的系统优化为主题,希望在各位具有不同学科背景的专家充分表述的基础上,共同建立新的知识体系。这一选题也充分体现了学院“应用驱动创新”的发展理念。
中国工程院院士郑纬民教授以“应鼓励年轻人从头构建先进的系统软件”为主题作首场报告。他首先介绍了计算机系统的概念,以及设计中需要考虑的因素,并解释了其复杂性的来源,强调具备编写和调试代码并能综合使用各种数学工具等能力是计算机系统研究对人的要求。随后,郑院士从新硬件和新型编程语言的出现这两方面讲述了为什么现在可以开发更先进的系统软件,并指出中国当前的问题在于缺少0到1的突破。他随后通过清华大学高性能计算所的学生科研经历,列举了图数据与大数据处理方面的工作Gemini、分布式文件系统MadFS、操作系统内核rCore、量子模拟器、TH-iSSD等7个例子,用事实说明了中国大学生也完全具备实现从0-1的能力。报告最后,郑院士再次勉励在场学生,表示从头构建先进的系统软件没有想象的那么难,中国大学生也应该能做到,关键是要开始做。
第二场报告由上海交通大学软件学院院长臧斌宇教授带来“系统软件能力培养”。臧斌宇教授首先阐述了什么是系统软件,并为在场学生推荐了入门级教材CSAPP。接着,他介绍了系统软件中技术上移的现象,强调软件构造是工程问题,并指出新系统软件除了包括计算、存储、通信等功能,还需具备高性能、容错、原子性、一致性和安全性。同时,臧斌宇教授详细讲解了CAP理论中各自代表的含义以及为什么三者不可兼得,并描述了工程教育所要求的技术能力,指出调研能力是重中之重,并以测试cache大小为例阐明了调研的具体内涵。最后,臧教授表示提升系统性能的通常方法仍存在部分问题:简单堆积更多的硬件资源导致性价比的下降以及如何同时利用好多个新硬件。对此,他尝试给出解决方案:软硬件协同设计,即硬件分析和软件重构;由硬件提出优化建议,软件根据建议重构系统。
华东师范大学副校长周傲英教授以 “历史照亮未来∶数字化时代的数据库”为主题作活动上午场总结报告。他首先指出数据是万物互联的桥梁,信息技术的发展已逐步从以计算为中心转为以数据为中心,数据是新的能源,是第五大生产要素。接着,周傲英教授围绕数据库的发展历程、经验教训、应用发展等,强调数据库是基础设施,并引出数据中台概念,表示数据中台是发挥数据要素作用的平台,更是新时代的数据库。他以Microsoft Power Platform为例讲述了数据中台数据大众化、开发大众化、AI大众化的特点。报告最后部分,周傲英教授提出数据库领域五大发展趋势:分布、并行、垂类、云原生和分享经济,强调数据库研究需要通过应用驱动创新、开发成就创新。周傲英在总结中表示:数据是第五要素、是新基建的核心,我们正处在数据库发展的最佳时机。
下午的首场报告,由上海交通大学特聘教授、华为操作系统首席科学家陈海波老师讲授“计算机系统研究与教学的一些体会”。陈教授从计算机系统研究中的个人思考开始讲起,提出计算机系统研究由Science、Engineering、Art 三个重要部分组成,是一门由理论和实践作为基石、开源驱动发展的有用学科。他认为,在计算机系统研究过程中不仅要“埋头拉车”还要“抬头看路”,在专注自身以外知悉世界技术的发展趋势,并以此为切入点,探讨分析当前计算机系统的七大发展趋势,分别为分层解耦合到垂直整合、后摩尔时代的三堵高墙、数据驱动软件优化、系统软件抽象与管理、新系统软件架构的需求、DSA与智能软件设备的崛起、开源驱动计算机系统发展。陈教授还通过多个案例来生动讲解计算机系统教学中的挑战和实践,并根据多年研究教学经历强调了社区服务的重要性,勉励青年人“研究是曲折的,前途是光明的”,同时建议同学们研究要做好时间管理、研究聚焦和构建标签,努力构筑研究系统所必备的五大能力。
蚂蚁集团OceanBase高级技术专家王国平老师带来首日的最后一场报告“自研分布式关系数据库系统OceanBase对HTAP的探索和实践”。他首先简要介绍了数据库OceanBase的发展历程、HTAP数据库原理及其面临的挑战。接着,王老师从OceanBase优化器和执行器两方面为切入点,展示了对HTAP的探索与实践。对于OceanBase优化器,王老师通过多个案例详细讲解了OceanBase在查询改写和分布式计划优化两个部分所做的工作。对于OceanBase执行器,王老师讲述了三代OceanBase SQL执行引擎的演进、并行执行引擎的重要作用等。王老师在总结中表示,希望在不久的将来,OceanBase能够做出一套同时实现OLTP和OLAP、资源组逻辑隔离、性价比高的数据库。
报告会结束后,南京大学教授、华为编程语言实验室主任冯新宇,同济大学教授、软件学院副院长江建慧,复旦大学教授张为华,华东师范大学教授、数据科学与工程学院副院长周烜,华东师范大学教授郭健美受邀出席“系统优化未来之路”主题圆桌会议,就系统优化的挑战和方法,以及如何培养人才、吸引人才来建设系统优化团队等问题展开讨论、发表看法。华东师范大学特聘教授黄波担任圆桌会议主持人。
针对系统优化的挑战和方法这一问题,冯新宇教授从开发效率、安全性、运行效率三个角度谈论了编程语言开发过程中优化的方向与措施;张为华教授从性能的角度提到了使用GPU进行索引优化的场景,并强调在数据量很大时系统要避免用户反响时间的长尾分布; 郭健美教授从应用的角度分析了批处理、流数据处理、电商交易等各个场景的系统优化指标和方法。
围绕如何培养人才、吸引人才进行团队建设这一问题,周烜教授从学习方法的角度建议同学们多阅读优秀代码和系统,并加入开源社区提交代码;江建慧教授通过总结自身教学经验,认为计算机体系结构学习是系统人才教育中不可或缺的重要一环,只有踏踏实实地啃硬骨头才会学有所成;黄波教授结合自身多年前在企业中从0到1组建团队的经验,指出团队建设中学习和实践的重要性。
各位专家学者各抒己见,撞碰出思想的火花。在场师生也获益良多,并积极向台上专家提问互动。
第八届数据科学与工程暑期学校开幕式暨主题报告中,数据、应用、系统优化、实践等词语被频频提及。应用驱动创新,做真正有用的研究,数据学院的精神和办学理念在DaSESS2021的第一天充分体现。
在随后的四天的报告中,DaSESS2021将邀请众多专家从多领域、多角度展示分享在数据驱动之下的系统优化之路。更多重磅报告和精彩讨论,敬请期待。
撰稿:曹汇杰、梅文娟
摄影:袁蕾
排版:陶慧玲