百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

20年磨一剑周志华团队的「演化学习」开启了新的机器学习范式

toyiye 2024-06-21 12:26 9 浏览 0 评论

数据与智能 本公众号关注大数据与人工智能技术。由一批具备多年实战经验的技术极客参与运营管理,持续输出大数据、数据分析、推荐系统、机器学习、人工智能等方向的原创文章,每周至少输出7篇精品原创。同时,我们会关注和分享大数据与人工智能行业动态。欢迎关注。


今天给大家推荐一本机器学习大牛周志华团队近20年研究的新成果,一本超级棒的专著。


周志华教授团队深耕演化学习


演化算法(Evolutionary Algorithms,EA)是指一大类受自然演化启发的启发式随机优化算法,通过考虑“突变重组”和“自然选择” 这两个关键因素来模拟自然演化过程。演化算法有很多种实现方法,如遗传算法(genetic algorithm)、遗传编程(genetic programming,GP)、演化策略(evolutionary strategy) ,等等。


而在机器学习领域,一些复杂的学习问题往往归结为复杂优化问题,演化算法这种强大的优化工具常常取得不错的结果。然而,在什么条件下、为什么能取得这样的结果,人们并不清楚。因而在崇尚理论的机器学习研究群体中间,演化算法难以得到认可,仅仅被作为”启发式”方法使用,未能得到从理论到算法、再到应用的蓬勃发展。


南京大学周志华教授在二十多年前与合作者提出了一种利用常见演化算法的“选择性集成” 学习方法,对于一组学习器,该方法能产生仅包含少量个体、泛化性能却超越全体学习器集成的模型。自此他深受演化算法应用成效的鼓舞,相信它不是”魔法”。周志华坚信利用演化算法求解机器学习中的复杂优化问题——也就是演化学习,一定能建立起相应的理论基础,于是下定决心开展起这个方向的研究。现在已经分别是南京大学教授和副教授的俞扬博士和钱超博士,分别于2004年、2009年加入了钻研演化学习理论与算法的行列。


周志华教授


俞扬教授


钱超副教授



二十年弹指一挥间,在周志华教授团队的努力下,演化学习研究取得了体系性的成果。用团队俞扬教授的话说,就是”从理论、算法、到应用效果都能打通……回答了一个长久以来演化计算领域面临的核心挑战:”有什么问题能证明是以往算法做不到而演化算法能做到的”。这背后付出的艰辛,可以想象。



俞扬教授就团队演化学习著作在知乎发帖


功夫不负有心人,在理论、算法和应用效果明朗之后,演化学习不再是冷板凳。2019年4月周志华、俞扬、钱超的英文书Evolutionary Learning: Advances in Theories and Algorithms出版,反响热烈,引发了出版中文版的呼声,在Springer电子书平台下载量迄今也已超过三万。


在英文书出版商签返中文版权后,周志华团队开始利用疫情下各种活动减少的窗口期,推敲出了中文版书稿,几经校改,终于面市:《演化学习:理论与算法进展》。该书还在预售期间时,媒体首发文章的阅读数就超过了2.8万,上市后3天即库存告急重印。本文将对其主要内容进行梳理介绍。



周志华教授团队《演化学习:理论与算法进展》一书封面



《演化学习:理论与算法进展》一书出版


这本书由四部分组成:预备知识、分析方法、理论透视、学习算法。


第一部分简要介绍演化学习和一些关于理论研究的预备知识,对机器学习、演化学习、多目标优化、演化算法、伪布尔函数及一些衡量标准和分析工具等进行简单介绍。


为了分析运行时间复杂度(running time complexity)和近似能力(approximation ability)这两个关于随机搜索启发式(randomized search heuristics)的最重要的理论性质[Neumann and Witt,2010; Auger and Doerr,2011],本书第二部分给出了分析演化算法运行时间(bound)的两种通用方法,即收敛分析法(convergence-based analysis)和调换分析法(switch analysis),以及刻画演化算法近似性能的一般框架SEIP。这些为获得本书后续介绍的一些理论结果提供了通用工具。



收敛分析法示意


第三部分给出了关于演化算法的一系列理论结果。 本书先探讨了如何辨识一个问题类(problem class)中关于某个给定演化算法的边界问题(boundary problem),即找到对于这个算法最简单和最困难的问题。 然后,本书探讨了演化算法关键技术要素对其性能的影响,包括交叉算子、解的表示、非精确适应度评估(fitness evaluation)和种群的影响等。 最后,本书考察了演化算法在求解机器学习任务中常见的约束优化(constrained optimization)问题时的性能。


第四部分给出了一系列基于理论结果启发的具有一定理论保障的演化学习算法。本书先考虑选择性集成(selective ensemble)任务,即尝试选择出个体学习器子集以获得更好的泛化性能,给出的帕累托优化(Pareto optimization)算法在优化泛化性能的同时最小化学习器数目,其性能显著优于其他著名的选择性集成算法。然后,本书研究了更具一般性的子集选择(subset selection) 问题,即选择有限项来优化一个给定的目标函数。本书给出的帕累托优化算法可获得目前已知的最佳多项式时间近似保证(polynomial-time approximation guarantee)。本书进一步为两个扩展子集选择问题给出了帕累托优化算法的变种,均可获得目前已知的最佳多项式时间近似保证。最后,考虑到实际学习任务通常是带噪的且规模很大,本书还为子集选择问题给出了相应的容噪和并行算法。




集成学习和选择性集成的一般结构


作者希望第二部分的通用理论工具能为有兴趣探索演化学习理论基础的读者提供帮助,第三部分的理论结果能加深读者对演化学习过程行为的理解且提供一些关于算法设计的洞察,第四部分的算法能在多种机器学习应用中发挥作用。



演化学习前景展望


演化计算从20世纪六七十年代在欧美逐渐被提出、汇聚成共识,之后经历了较为快速的发展。已经在模式识别、图象处理、人工智能、经济管理、机械工程、电气工程、通讯、生物学等众多领域都获得了较为成功的应用,如利用进化算法研究小生境理论和生物物种的形成,通信网络的优化设计,超大规模集成电路的布线,飞机外形的设计,人类行为规范进化过程的模拟等。



演化搜索示例


在机器学习领域,“启发式”应用演化算法的研究人员和工程人员大有人在,也有不少人将其视为机器学习和人工智能领域的“Next Big Thing”。比如2018年8月,来自麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的Una-May O'Reilly教授、密歇根大学Erik Goodman教授、德克萨斯大学奥斯汀分校Risto Miikkulainen教授,以及来自佛蒙特大学、法国国家信息与自动化研究所、Google AI等研究机构的十余位知名学者,对演化学习在机器学习中的前景专门进行了讨论,认为演化学习和机器学习结合,将会推动更具创造性的新AI能力的产生。不过那个时候,这方面的理论框架尚不明朗,算法和应用的发展仍旧受限。正如原英国诺丁汉大学计算机科学教授、副校长Graham Kendall博士2018年在“对话”(The Conversation)网站撰文指出的,(包含演化算法在内的)演化计算需要有人建立易用的框架把底层的复杂性封装起来,才能从学术界推广到业界,发挥更大的作用。


周志华教授团队在演化学习领域做出的原创性、系统性的探索,相关成果这些年来已经陆续在AAAI、IJCAI、NIPS等国际顶级人工智能学术会议和期刊上发表,得到了全球同行的认可,事实上在全球引领和极大推动了演化学习这个领域得发展。现在《演化学习:理论与算法进展》一书英文版、中文版均已上市且受到高度关注,更是为有志于进入该领域的人士提供了全面、集中的学习材料。相信其中的理论框架、分析方法、算法思想和实现,以及对应用的示例和展望,将极大推动演化算法在机器学习领域的应用,使演化学习成为机器学习中的重要方向,最终催生一个真正的“Next Big Thing”。同时,周志华教授团队认定一条道路二十年如一日甘坐冷板凳、把冷板凳坐热的科研精神,相信对广大科研工作者带来启发。


相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码