中国中文信息学会计算语言学前沿论坛在国家超级计算济南中心顺利举办

发布时间:2024-10-22通讯员:李春林出处:计算机科学与技术学部供稿审核人:王玉立责任编辑:浏览次数:25

10月20日,中国中文信息学会(CIPS)计算语言学专委会在国家超级计算济南中心顺利举办计算语言学前沿论坛活动。此次论坛由中国中文信息学会计算语言学专委会(简称专委会)主办,齐鲁工业大学(山东省科学院)计算学部自然语言处理与认知计算团队承办。哈尔滨工业大学教授车万翔、西湖大学教授张岳、复旦大学教授邱锡鹏、复旦大学副研究员桂韬等专委会委员参加本次论坛。与会人员围绕计算语言学领域的前沿热点问题展开了深入研讨。来自山东省内多所高校和相关企业的100余名师生和专家,共同参加了本次论坛。 



在论坛开幕式上,计算学部副主任赵大伟研究员致欢迎辞,向与会专委们表示热烈欢迎并向长期以来支持计算学部发展的广大同仁致以诚挚谢意。赵大伟详细介绍了计算学部的整体情况,并回顾了国家超级计算济南中心的发展历程。他表示希望各位专家畅所欲言,碰撞思想、凝聚共识,激发出更多创新的思维和灵感,预祝此次论坛取得圆满成功。


专委会副主任、哈尔滨工业大学教授车万翔代表专委会对承办单位表示由衷感谢,并对出席论坛的专家和师生表示热烈欢迎。车万翔详细介绍了第二十四届全国计算语言学大会(CCL 2025)会议的筹备进展,对齐鲁工业大学(山东省科学院)积极承办CCL 2025会议表示感谢,并对后续承办事宜作了展望。


随后,车万翔作了题为《基于草稿自拟的投机解码技术》的报告,同与会人员探讨了大语言模型(LLM)在计算和内存需求方面的挑战,强调投机解码技术作为一种系统级推理加速方法,能够有效解决这一问题。此外,他重点介绍了团队所提出的基于草稿自拟的投机解码技术,围绕草稿自拟技术中的两个关键方法——利用模型自身生成草稿、利用模型历史信息生成草稿,展开了详细介绍。报告最后,车万翔从草稿生成层面和并行验证层面提出了总结和展望,为在资源受限的场景中提升大语言模型的性能提供了新的思路和解决方案。


专委会副主任、西湖大学教授张岳作了题为《模型生成文本的自动检测》的报告。张岳首先通过展示人类文本与模型生成文本的实际案例,引出模型生成文本自动检测的概念,同参会人员探讨了人工智能生成文本的自动检测任务的难度,围绕自动检测任务中的两种主要方法——监督检测和零样本检测,分析现有方法的局限性,重点介绍了团队提出的MAGE框架和Fast-DetectGPT模型。随后,他分享了团队在细粒度检测的最新进展,展示了对机器润色文本进行检测识别的效果,并在报告最后,展望了模型生成文本自动检测任务在多语言、多领域环境下的未来发展方向,指出了优化检测算法的潜在技术路径。


专委会执委、复旦大学教授邱锡鹏作了题为《从大语言模型到世界模型》的报告。他首先介绍了“世界模型”以及“具身智能”的概念,并通过Sora、JEPA等一系列大模型实例,说明“世界模型”以及“具身智能”所存在的问题,并对大模型下一阶段目标,即两者相结合的超级智能,同与会人员进行了深入探讨。邱锡鹏还介绍了大语言模型MOSS2的最新研究进展,讨论了实现世界模型所面临的技术挑战与未来研究方向,在报告最后,展望了“打造强交互世界模型、探索强推理具身场景”的研究前景。


专委会委员、复旦大学副研究员桂韬作了题为《大模型智能体基座构建》的报告。他首先介绍了智能体与大语言模型的基本概念,并通过经典哲学中的智能体定义,引出关于智能体与大语言模型的本质思考。而后,从智能体RLHF对齐、智能体环境反馈等多个方面对大模型对齐技术展开介绍。报告最后,桂韬展望了大语言模型的技术发展方向,并指出了多智能体竞争与环境反馈训练在未来研究中的重要前景。


论坛最后,计算学部教授鹿文鹏对本次计算语言学前沿论坛进行了闭幕总结,对专委会能够走进校(院)举办前沿论坛表示衷心感谢,鼓励与会师生积极投身自然语言处理研究工作,共同办好CCL 2025会议。


在前沿论坛举办期间,与会专家参观了国家超级计算济南中心,详细了解了济南超算的发展历程、主要业务及科研成果。


本次前沿论坛的成功举办,为相关领域的学者们提供了良好的交流平台,加强了CIPS计算语言学专委会与校(院)的联系,为将来的深入合作奠定了良好的基础。与会专家积极分享最新的研究成果,为参会师生提供了启发,为山东自然语言处理相关研究和产业的发展注入了新的动力。本次前沿论坛的举办有助于促进大模型的技术创新,加强计算语言学与相关领域的融合发展。