专题三:机器学习催化剂设计

学习目标:

1.课程将系统引导学员深入理解电催化、热催化、光催化的核心原理,同时全面剖析机器学习、深度学习及图深度学习在催化领域的应用背景与适用范畴。通过 Python 语言基础与机器学习算法的专项学习,学员不仅能够清晰梳理机器学习从萌芽到蓬勃发展的历史脉络,洞悉其在信息时代于不同领域的多样化表现形式,更将通过实践操作,切实掌握将机器学习技术应用于科学研究的关键技能,为催化领域的前沿探索奠定坚实基础。

2.课程助力学员精准把握传统机器学习算法与深度学习算法的本质差异,熟练掌握 sklearn、torch 等主流第三方库的核心功能与应用技巧。通过系统学习与实践,学员将能够灵活运用树模型、深度神经网络、卷积神经网络、循环神经网络等算法模型,深度融入科学研究场景。同时,借助机器学习的可解释性分析方法,深入挖掘数据背后的科学规律,精准阐释催化反应机制,实现数据驱动与理论解析的深度融合,为科学研究提供创新分析视角与可靠技术支撑。

3.通过培养学员将机器学习应用在催化领域的研究思维,加速研究范式转变。将机器学习与第一性原理或者实验结合,以实现快速发现催化材料。这种结合能够充分发挥不同方法的优势,机器学习强大的数据处理和模式识别能力,可挖掘催化过程中的隐藏规律,第一性原理则能从量子力学层面揭示催化反应的本质,实验数据为模型提供真实可靠的验证基础。同时,引导学员运用迁移学习等技术,将在某一催化体系中训练得到的模型,快速应用到相似体系,实现知识的高效复用。此外,借助机器学习的可解释性研究,还能帮助学员深入理解催化反应机制,为进一步优化催化材料性能、设计新型催化体系提供理论支撑,推动催化领域朝着智能化、精准化方向迈进。

4.图拓扑结构和图神经网络在催化领域有着广泛的应用。由于催化过程中存在大量繁杂的中间体,这为图拓扑结构的构建提供了丰富的数据来源,从而更有利于发现新的催化路径。将晶体结构从欧式空间转化为非欧空间的图结构,相较于传统描述符,能够更有效地捕捉晶体结构与目标属性之间的映射关系。通过培养学员跨学科、跨领域、跨范式的科学思维,有望为新材料发现开辟新的研究范式。

讲师介绍:

来自全国重点大学、国家“985工程”、“211工程”重点高校,长期从事机器学习辅助的催化剂设计与预测研究,在机器学习深度学习辅助的催化剂设计研究领域深耕多年,具有丰富的经验和扎实的基础。在多个国际高水平期刊上发表 SCI检索论文30余篇。他的授课方式深入浅出,能够将复杂的理论知识和计算方法讲解得清晰易懂!

第一天:

第一天上午

理论内容:

1.机器学习概述

2.材料与化学中的常见机器学习方法

3.应用前沿

实操内容:

1.Python基础:变量和数据类型,列表,字典,if语句,循环,函数

2.Python科学数据处理:NumPy,Pandas,Matplotlib

案例一:随着AI For Science时代的到来,机器学习以优异的速度迅速扩展到各个领域。本次培训详细讲解从下载到安装,再到环境配置全流程。无论是数据科学新手还是进阶学习者,都能借此掌握 Anaconda 操作要点,轻松搭建编程环境,为后续 Python 开发、数据分析等工作筑牢基础。

第一天下午  

理论内容:

1.sklearn基础介绍

2.线性回归原理和正则化

实操内容:

1. 线性回归方法的实现与初步应用

2. L1和L2正则项的使用方法

3. 线性回归用于HER催化剂的筛选

4. 符号回归用于发现金属催化氧化载体中金属-载体相互作用

图片

案例二:金属-载体相互作用是多相催化中最重要的支柱之一,但由于其复杂的界面,建立一个基本的理论一直具有挑战性。基于实验数据、可解释的机器学习、理论推导和第一性原理模拟,以建立了基于金属-金属和金属-氧相互作用的金属-氧化物相互作用的一般理论(符号回归)。

———————————————————————————————

第二天上午

理论内容:

1.  逻辑回归

1.1原理

1.2 使用方法

2. K近邻方法(KNN)

2.1  KNN分类原理

2.2  KNN分类应用

3. 神经网络方法的原理

3.1 神经网络原理

3.2神经网络分类

3.3神经网络回归

实操内容:

1.逻辑回归的实现与初步应用

2.KNN方法的实现与初步应用

3.神经网络实现

图片

案例三:铜基合金催化剂因其良好的选择性和过电位低等特点,在二氧化碳还原反应(CO2RR)领域得到了广泛的应用。为了实现对CO2RR合金催化剂的高效探索,通过实施严格的特征选择过程,将特征空间的维数从13维降至5维,ML模型成功快速预测了CO2RR过程中关键中间体(HCOO、CO和COOH)的吸附能。

第二天下午

项目实操:

1.基于少特征模型的机器学习预测二氧化碳还原电催化剂

2.基于文本数据信息预测甲醇转化率

这两个实操项目同时穿插讲解如下内容

A1 机器学习材料与化学应用的典型步骤

A1.1 数据采集和清洗

A1.2 特征选择和模型选择

A1.3 模型训练和测试

A1.4 模型性能评估和优化

图片

案例四:结构化材料合成路线对于化学家进行实验和现代应用(如机器学习材料设计)至关重要。近年来,化学文献呈指数级增长,人工提取已发表文献耗时耗力。本研究的重点是开发一种从化学文献中提取pd基催化剂合成路线的自动化方法。并利用合成路线的结构化数据来训练机器学习模型并预测甲烷转化率的性能。

———————————————————————————————

第三天上午

理论内容:

1.决策树

1.1决策树的原理

1.2决策树分类

2. 集成学习方法

2.1集成学习原理

2.2随机森林

2.3Bosting方法

3.朴素贝叶斯概率

3.1原理解析

3.2 模型应用

4.  支持向量机

4.1分类原理

4.2核函数

实操内容

1.决策树的实现和应用

2.随机森林的实现和应用

3.朴素贝叶斯的实现和应用

4.支持向量机的实现和应用

图片

案例五:集成学习通过多层模型组合与融合,在提升模型性能方面极具优势。在数据挖掘中,面对海量且复杂的数据,单一模型往往难以全面捕捉数据特征。集成学习将弱学习器的性能结合,先由各基础模型从不同角度挖掘数据,再通过加权等方式融合结果,能更全面地剖析机器学习结果。

第三天下午

项目实操

1.机器学习加速设计ORR和OER双功能电催化剂

2.二元合金中双官能团氧电催化剂的有效机器学习模型设计

3.SHAP机器学习可解释性分析

这两个实操项目同时穿插讲解如下内容

A1 模型性能的评估方法

A1.1 交叉验证:评估估计器的性能

A1.2 分类性能评估

A1.3 回归性能评估

图片

案例六:氧还原反应(ORR)和析氧反应(OER)是清洁能源转化的关键。近年来,双金属位催化剂(DMSCs)因其原子利用率高、稳定性强、催化性能好而受到广泛关注。本研究采用密度泛函理论(DFT)和机器学习(ML)相结合的先进方法,研究吸附物在数百种潜在催化剂上的吸附自由能,来筛选对ORR和OER具有高活性的催化剂。

———————————————————————————————

第四天上午

理论内容:

1. 无监督学习

2.1 什么是无监督学习

2.2 无监督算法——聚类

2.3 无监督算法——降维

2. 材料与化学数据的特征工程

2.1分子结构表示

2.2 独热编码

实操内容:

鸢尾花数据集用于聚类实现和应用

T-SNE实现和应用

PCA的实现和应用

层次聚类的实现和应用

K-means聚类的实现和应用

图片

案例七:无监督学习是从无标签数据中挖掘模式与结构,t-SNE作为其重要降维工具,专注于保留高维数据点间局部结构。课程将深入讲解t-SNE核心原理,如通过概率分布衡量点间相似性,以优化KL散度实现降维,展示其在高维数据可视化中的强大作用。还会进行代码实操,涵盖数据加载、参数调优、降维及可视化等环节,让学员熟练掌握t-SNE在不同场景的应用,助力探索数据潜在结构与模式。

第四天下午

项目实操

理论内容:

1.深度学习理论基础

2.DNN、RNN、CNN、LSTM及Transformer基础框架介绍

实操内容

1. torch基础练习

2. 应用RNN、CNN、LSTM模型筛选光催化剂

图片

案例八:近年来,结合高通量(HT)和机器学习(ML)的策略以加速有前途的新材料的发现已经引起了人们的极大关注。因此,可以设计一种直观的方法,通过数据库并结合深度学习模型,并将它们与HT方法耦合,以寻找高效的2D水分解光催化剂。

———————————————————————————————

第五天上午

理论内容:

1.图深度学习理论基础

2.图深度学习应用实例OC20、OC22电催化剂开发挑战(ACS Catalysis)

实操内容:

1. 图结构构建及可视化

2. PyTorch Geometric基础介绍

图片

案例九:近年来,在晶体性能预测领域,图神经网络(graph neural network,GNN)模型取得了长足的发展。GNN模型可以有效地从晶体结构中捕捉高维晶体特征,从而在性能预测中获得最佳性能。指导学员搭建图深度学习开发环境,以顺利构建图结构,并进行机器学习训练。

第五天下午

项目实操

1.图神经网络模型基本概述及CGCNN代码深度解读应用

2.基于图论构建反应网络用于NO电还原反应研究

3.Transformer辅助水氧化制备过氧化氢(WOR)及可解释分析

图片

案例十:氮氧化物排放严重影响我们的环境和人类健康。光催化脱硝(deNOx)因其低成本、无污染而备受关注,但实际生产中产生的是不需要的亚硝酸盐和硝酸盐,而不是无害的氮气。揭示活性位点和光催化机理对改进工艺具有重要意义。本次课程以指导学员依据反应中间体,建立图反应网络结构以揭示反应机理。

Logo

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区,共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐