摘要
- 近年来,将生物质转化为生物炭(BC)作为功能生物催化剂来加速过硫酸盐活化以用于水体修复已经引起了人们的重视。
- 本文应用机器学习技术来指导合理设计BC以实现非自由基途径的有效加速,结果表明,高比表面积和O%值可以显著提高非自由基贡献。
贡献
- 本文提出了将机器学习应用于指导合理设计BC以实现非自由基途径的有效加速的概念,从而提高了水体修复的效率。
- 研究表明,高比表面积和O%值可以显著提高非自由基贡献,并且可以通过调节温度和生物质前体来同时调节这两个特征。
实际意义
- 本文提出的机器学习技术可以帮助快速筛选非自由基增强型生物炭,从而提高水体修复的效率。
- 通过调节温度和生物质前体,可以同时调节高比表面积和O%值,从而有效地提高非自由基贡献。
前言总结
- 本文介绍了硫酸盐自由基基础氧化过程(AOPs)在降解持久性有机污染物(如药物和个人护理产品)方面的广泛应用。
- 非自由基(NR)途径,包括O2-介导氧化和碳桥电子转移机制,由于其与自由基(如•OH)相比具有自身优势,因此受到了广泛关注。
文献综述
- 本文通过对主要数据库(如Google Scholar和Web of Science)进行广泛的文献调查,使用多个关键词(包括生物质废物、BC、过硫酸盐、过硫酸酯和AOPs),从2015年到2022年检索了311篇经过同行评审的文献研究,从而收集了403个数据点,并用于创建BC-AOP数据集。
- 详细的文献研究信息列在表S2中。
使用的方法
- 本文使用了Spearman相关系数和k-means聚类算法来研究特征之间的相关性。
- 基于最优XGB模型,研究了特征重要性,以解释输入特征与输出变量之间的关系。
- 应用两种特征分析方法来评估特征重要性和与NR贡献效率的相关性。
使用的数据
- 本文使用了主要数据库(如Google Scholar和Web of Science)的文献调查,收集了403个数据点,并用于创建BC-AOP数据集。
- 此外,还考虑了来自UC Davis的公共BC数据集,该数据集包含一千个数据点(地址:http://biochar.ucdavis.edu/),以验证BC-AOP数据集训练的模型。
结果
- 通过Spearman相关系数和k-means聚类算法,发现BC的比表面积和O%值与NR贡献效率之间存在显著的正相关关系。
- 基于XGB模型,发现比表面积和O%值是影响NR贡献效率的主要特征。
- 基于机器学习(ML)技术,设计了两种不同活性位点的非自由基增强BC,以提高硫酸盐活化的效率。
结论
- 本文提出了一种基于机器学习(ML)技术的合成BC的新方法,以提高硫酸盐活化的效率。
- 通过Spearman相关系数和k-means聚类算法,发现BC的比表面积和O%值与NR贡献效率之间存在显著的正相关关系。
- 基于XGB模型,发现比表面积和O%值是影响NR贡献效率的主要特征。
- 本研究为应用ML技术合成定制BC以加速硫酸盐活化提供了一个有效的概念证明,从而揭示了ML在加速基于生物的催化剂开发方面的显著能力。
局限性
- 本文的研究局限于硫酸盐活化,因此无法推广到其他水处理技术。
- 同时,本文仅考虑了比表面积和O%值,而没有考虑其他特征,因此可能会忽略其他重要特征。
未来展望
- 建议进一步研究其他特征,如碳含量、碳结构和碳热稳定性,以更好地理解BC的活性位点。
- 建议进一步研究其他水处理技术,以探索ML技术在其他水处理技术中的应用。
你问我答
- 问:如何使用机器学习技术来引导生物质转化为生物炭(BC)的合理设计以促进高效脱氢反应?
答:1. 首先,通过文献调查收集403个数据点,并用于创建BC-AOP数据集,以及考虑来自UC Davis的公共BC数据集,该数据集包含一千个数据点。
2. 然后,使用机器学习(ML)技术对BC-AOP数据集进行预处理,并使用XGB模型进行训练,以预测BC的比表面积和O%值。
3. 最后,根据ML结果,准备了两种不同活性位点的非自由基增强BC,以提高硫酸盐活化的效率。
- 问:提取的特征如何影响BC加速高效脱氢反应的能力?
答:1. 通过Spearman相关系数和k-means聚类算法,发现BC的比表面积和O%值与高效脱氢反应的贡献效率之间存在显著的正相关关系。
2. 基于XGB模型,发现比表面积和O%值是影响高效脱氢反应的主要特征。
3. 同时,可以通过调节温度和生物质前体来同时调节这两个特征,以实现高效的定向非自由基降解。
- 问:经过优化后XGB模型在预测NR对于AOPs中扮演着怎样重要作用?
答:1. 通过优化XGB模型,可以有效地预测BC的比表面积和O%值,从而指导BC的合理设计,以促进高效脱氢反应。
2. XGB模型可以帮助快速筛选出非自由基增强BC,以提高硫酸盐活化的效率。
- 问:针对不同相关因子,SHAP方法是如何识别出它们之间相互依存关系并衡量它们地影响大小的?
答:1. SHAP方法通过计算每个特征的局部偏导数,来识别出它们之间的相互依存关系。
2. SHAP方法还可以通过计算每个特征的局部偏导数的绝对值之和,来衡量它们的影响大小。
- 问:Eli5工具是如何帮助我们理解单一样本中不同因子之间相互作用情况并把它显而易见地呈现出来的?
答:1. Eli5工具可以帮助我们理解单一样本中不同因子之间的相互作用情况,并使用可视化技术将其显而易见地呈现出来。
2. Eli5工具可以通过计算每个特征的局部偏导数,来识别出它们之间的相互依存关系,并衡量它们的影响大小。
Personal interests
- Their high degree of graphitization and the abundant oxygen-containing functional groups can tune the electronic structure inside BC, causing the degradation to be predominately controlled by the NR pathways. Thus, contaminant degradation can be enhanced by regulating the active sites present on the catalyst surface.
它们(biochar materials)的高度石墨化和丰富的含氧官能团可以调节BC内的电子结构,导致降解主要由NR途径控制。因此,污染物的降解可以通过调节催化剂表面上存在的活性位点来提高。
- a public BC data set containing a thousand datapoints from UC Davis (address: http://biochar.ucdavis.edu/)
来自加州大学戴维斯分校的一千个数据点的公共BC数据集
- four ML algorithms (XGB, RFR, SVR, and NN)
- A graphical user interface (GUI) web software was developed using Python (version 3.7) and Flask (version 2.1.3) web framework (Figure S6) to ensure that the prediction model is accessible to scientists and practitioners. (http://39.106.141.96:5000/)
- Schematic diagram of the synthesis of the two NEBCs by controlling of the preparation parameters.
- 通过引入 ML 算法来加快生物炭催化剂的合理设计思路: a specialized BC-AOPs data set containing three aspects of information (textural properties, elemental compositions, and preparation parameters) was firstly summarized and constructed for data mining. After data preprocessing, the supervised XGB model performed the best prediction score when trained with our BC- AOP data set.
- since the BMP is a categorical variable, techniques based on supervised models are hard to elucidate correlations between preparation parameters and BC properties. For this reason, the unsupervised k-means clustering method was employed to investigate. Overall, the combination of supervised and unsupervised learning techniques would allow us to selectively control biochar properties.
由于 BMP(biomass precursor) 是⼀个分类变量,基于监督模型的技术很难阐明制备参数与 BC 特性之间的相关性。为此,采用无监督 k 均值聚类方法进行调查。总的来说,监督和非监督学习技术的结合将使我们能够有选择地控制生物炭的性质。
References
DOI: https://doi.org/10.1021/acs.est.2c07073