|
当前,人工智能领域的自动图机器学习研究悄然兴起,小到蛋白质分子结构,大到城市交通网络,都有自动图机器学习的用武之地。
澎湃新闻(www.thepaper.cn)记者从清华大学计算机系朱文武教授领导的网络与媒体实验室获悉,该实验室于2020年12月21日发布了世界首个自动图学习框架与开源工具包AutoGL。AutoGL框架及开源工具包能够为开发人员进行图学习算法设计和调优提供便利,简化图学习算法开发与应用的流程,提升图学习相关的科研和应用效率。
AutoGL 框架图
自动机器学习是指将机器学习算法自动化的一系列研究与应用。完整的自动机器学习包括自动数据处理、自动特征工程、自动模型选择、自动模型评价等步骤。
相比传统机器学习,自动机器学习可以降低机器学习中的人类干预;在降低人力成本与人类偏见的同时,取得与人类专家相当或更优的结果,并更加便于机器学习算法在真实应用场景中的落地应用。
自动图机器学习中的“图”(graph)则是一种广泛用于描述实体之间关系的数据类型,图的基本组成单元为代表实体的节点和代表节点间关系的边。大部分现有的自动机器学习研究和框架,没有考虑图数据的特殊性,因此无法应用在图机器学习模型中。
朱文武
朱文武教授在接受澎湃新闻(www.thepaper.cn)记者采访时介绍,很多不同领域的问题都可以很自然地建模成图机器学习,例如蛋白质建模、物理系统模拟、组合优化等基础研究,社交媒体分析、推荐系统、虚假新闻检测等互联网应用,以及金融风控、知识表征、交通流量预测和新药发现等。
“由于图数据在结构、内容和任务上千差万别,所需要的图机器学习模型也可能相差甚远,这导致图机器学习的自动化面临巨大挑战。”参与该项目的清华大学计算机系助理教授王鑫表示,自动机器学习将减少对人类专家知识的依赖,自动图机器学习也会降低算法的学习与使用门槛,使其他领域研究者、业界使用者和初学者,能快速将自动图机器学习技术应用到不同的场景中。
王鑫
据介绍,AutoGL在设计时遵循模块化思想,每个模块均可扩展,用户只需要实现对应模块类的接口,即可方便地测试自己的算法,为公平对比不同模型性能提供方便。
AutoGL由清华大学计算机系朱文武教授团队研发,核心成员包括助理教授王鑫、博士生张子威、硕士生关超宇等10余人。该项目得到了国家自然科学基金委重大项目等的资助与支持。
目前,AutoGL 研发团队期待得到各类使用反馈,以更好地完善 AutoGL 的各项功能。“我们的最终目的是推动自动图机器学习在学术界与工业界的深层次探索和应用”。 |
|