由中国计算机学会 (CCF)主办,中国计算机学会计算经济学专业组、中国计算机学会香港会员活动中心、香港科技大学(广州)、中科南京人工智能创新研究院共同承办的“CCF决策智能会议暨RLChina 2024”于10月12-18日在香港科技大学(广州)校园隆重举行。为期7天的盛会汇聚了90余位国内外专家学者以及约500名参会者共同探讨决策智能研究。
在10月12日的开幕式上,RLChina 2024 迎来了众多重要嘉宾,包括主办方代表、学术界教授、工业界专家等。香港科技大学(广州)校长倪明选、伦敦大学学院汪军教授、新加坡南洋理工大学安波教授发表了开幕致辞。各位领导和专家在致辞中提到,大模型与强化学习的结合已成为当今的研究热点,同时强调了人工智能在教育、基础科学等领域的重要性,并对全体参会嘉宾表示热烈欢迎。开幕式由 RLChina 2024 程序委员会共同主席、中科院自动化所张海峰副研究员主持。
在开幕式之后,大会迎来了三个主旨报告。报告由香港科技大学(广州)协理副校长杨旸主持。香港科技大学(广州)陈雷教授、清华大学孙富春教授以及伦敦大学学院汪军教授分别发表了精彩的演讲。
陈雷教授从大语言模型的“幻觉”和“灾难性遗忘”等问题出发,探讨了数据在大模型时代的核心地位。他强调,无论是研究者还是从业者,都需要深化对数据本质的理解,并严格把控数据质量,以确保数据的有效利用并减少计算资源的浪费。这一要求贯穿了从数据准备到模型训练的全过程。陈教授还介绍了图神经网络(GNN)和向量数据库(Vector DB)在大模型相关应用中的最新进展。
孙富春教授则聚焦于具身智能在行业实践中的具体应用。他首先回顾了具身智能的历史与发展背景,引出具身智能体的概念,并详细介绍了具身智能在感知、认知及行为层面上的研究现状。孙教授深入探讨了在具身多模态大模型应用中面临的问题及其解决方案,并展望了具身智能未来的发展趋势。
汪军教授从宏观角度概述了当前大模型的发展状况及其未来走向。他对OpenAI的o1进行了解析,并开源了OpenR,这是首个集过程奖励模型(PRM)训练、强化学习、多种搜索框架为一身的类o1开源框架,旨在增强大型语言模型(LLM)的复杂推理能力。汪教授最后号召大家积极讨论和参与贡献。
三位讲者分别从数据科学、具身智能、决策大模型三个不同角度引出本次大会的主题。他们的演讲和分享引发了与会者的广泛兴趣和讨论,也正式拉开了RLChina 2024大会的精彩序幕。
主会议的11个专题论坛(Workshop)覆盖了强化学习前沿、智能体创新应用、多智能体合作与博弈、大模型与智能体、决策智能理论、智能体训练系统与仿真环境、智能体的价值对齐与安全鲁棒性、计算经济学、具体智能体与机器人、智能体跨学科交叉、以及智能运筹优化等主题。现场座无虚席,与会者们积极交流,共同分享对大模型和 AI 智能体的见解,展示各自的研究成果与实践经验。每场报告不仅呈现了理论和实践上的创新突破,还激发了与会者对未来研究方向的深入思考与探讨。
讲习班的授课团队由汪军老师领衔,联合伦敦大学学院、上海交通大学、中国科学院自动化研究所、华为诺亚实验室和腾讯开悟平台等高校和企业的专家组成。此次讲习班旨在为与会者系统培训强化学习与大模型领域的基础知识和实践技能。教学内容涵盖基础大模型的理论与实际操作、强化学习与具身智能的应用实践以及基于大模型的智能体开发等主题。通过这些精心设计的教学环节,力求为每一位与会者提供详尽而精准的指导,帮助他们掌握前沿技术的核心要领。
在海报交流环节,来自国内外各大高校、企业和研究机构的师生们展示了涵盖强化学习、大模型智能体等多个领域的学术成果,激发了与会者之间的深入讨论与互动。此外,大会邀请多位成功企业家共同探讨如何利用决策智能技术推动创业创新,并分享他们在这一领域的实践经验,助力与会者在创业过程中做出更明智的决策。
RLChina 2024 圆满落幕,为与会者深入了解当前领域的最新进展与趋势,拓展学术视野,增进学术合作,为大模型与AI智能体的发展贡献更多的智慧与力量。大会所有报告、课程的录播视频经过讲者同意后,将通过RLChina官网、B站、黄大年茶思屋等渠道发布,欢迎关注。