大数据能力提升项目|学生成果展系列之七

6c0ac50910280dc1d52062bf4d3210c1.png

导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

回首2022年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自8个院系的10位同学代表一起领略他们的风采吧!

两篇SCI论文

通过清华大学大数据能力提升项目的课程学习与实践经验,我掌握了大数据和机器学习的基本理论和技能,并将这些理论与技能应用于工程科学的基础研究工作中,为攻克相关领域内的疑难问题提出了新的方法。对于能源与动力系统中普遍存在的气-固(颗粒)流的时空不均匀性问题,我们通过建立循环卷积耦合神经网络(RCNN)针对性地学习气-固流的时间与空间不均匀性,并成功地实现了基于这种气-固流时空不均匀特征对动力与燃烧特性参数的高准确率的预测建模。我们的工作总结成了两篇SCI论文:“Modeling of dynamic characteristic of particle in transient gas–solid flow via a machine learning approach,POWDER TECHNOLOGY, 2022, 412: 117939. IF=5.640”与“Modeling of combustion characteristics of particles in transient gas–solid reacting flow via a machine learning approach,INDUSTRIAL & ENGINEERING CHEMISTRY RESEARCH, 2023, 62(1): 725–740. IF=4.326”,相关成果受到了领域内同行的认可。

受到人工智能相关研究的启发,我们将颗粒的不均匀分布抽象为一个二维0/1矩阵的图象用以描述颗粒流的空间不均匀性,并将颗粒图象以一定的时间间隔与时间长度排列成图象(矩阵)的序列以描述颗粒流的时间不均匀性,从而建立了统一的适用于机器学习模型的学习特征(输入)的数据形式。相应地,我们通过卷积神经网络(CNN)结构与循环神经网络(RNN)结构分别学习对空间与时间不均匀性,并将它们耦合成一个统一的机器学习模型:循环卷积耦合神经网络(RCNN)模型。我们以准确度处于最高水平的颗粒流直接数值模拟作为我们的数据来源。相通过轻量级的模型训练,我们在最终的测试集上证明了所提出的RCNN基于气-固流的时间与空间不均匀性对气-固动量交换系数预测有效性与稳健性。

将机器学习模型于应用工程领域内气-固(反应)流时空不均匀性的建模以解决常规统计学难以处理的问题是我们在交叉学科的一次创新。清华大学大数据能力提升项目为我将以往的“猜想”变为未来的“事实”的科研实践奠定了坚实的理论与经验基础。我们的研究工作不仅有助于在实际的工业问题中检验机器学习理论的有效性,还为工程领域开拓了更为广阔的研究与应用的空间。

a8f016d0eb24466fe530ff3f60ce8fc4.png

图1. 颗粒非均匀分布

175ad528a9119f80f10c7ec45dbcc437.png

图2. FCNN结构

编辑:文婧

校对:林亦霖

395719ea8bb0e1e5553fb24afd373955.png

猜你喜欢

转载自blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/130164300