数据科学学院团队研发首个开源运筹大模型ORLM,助力运筹学步入智能新时代
近日,由开元985棋牌最新官网(深圳)、上海交通大学、上海财经大学、杉数科技等联合研发的ORLM智能决策大模型相关成果被运筹学领域国际顶级期刊《运筹学》(Operations Research)正式接收,这是该期刊创刊70余年来首次收录开元935棋盘app下载大语言模型的研究论文。
在此论文中,港中大(深圳)团队参与提出的ORLM模型展现出显著的工程应用价值:在决策问题的建模环节,该模型能够大幅提升工程师的工作效率,可以辅助工程师将决策问题中建模环节效率大大提升,同时较其他大模型提升10%-25%的准确率,这将显著提升工业场景中的人机协作效率。此次研究成果实现了开源大语言模型在自动化优化建模领域的重要突破,不仅填补了该方向的学术空白,更为企业决策优化提供了可落地的技术路径。
港中大(深圳)团队核心贡献
开元985棋牌最新官网(深圳)科研团队在项目中发挥了重要作用,其中包括:
??共同第一作者:计算机与信息工程博士生唐正阳,负责框架设计和实验验证;
??通讯作者:数据科学学院王本友教授和王子卓教授。
三位研究者在优化决策、大语言模型训练与数学推理方面各展所长,充分体现了港中大(深圳)在人工智能与运筹学交叉领域的研究实力,也再次展示了大学在前沿科技领域的创新能力和国际影响力。
?
研究背景与意义
传统运筹学的瓶颈与大模型解决方案
运筹学作为一门优化决策的科学,广泛应用于工业、物流、金融等领域。其中,优化建模与求解技术是运筹学实际应用的核心环节。然而,传统运筹优化方法长期面临两大挑战:
??高度依赖专家经验,存在建模周期长、泛化能力弱等瓶颈;
??现有基于闭源大模型(如GPT-4)的解决方案虽能提升效率,却面临数据隐私泄露、技术垄断等问题。
此研究中所提出的ORLM为解决这些行业痛点提供了创新方案。该研究首次提出了一种创新的、可定制化的开源大语言模型训练框架OR-INSTRUCT,专为优化建模任务设计。该框架支持对开源大模型进行领域定制训练,显著提升了模型在自动化建模与求解方面的能力。在制造、物流、电商与零售等多个行业测试中展现出卓越性能:
效率、精度与信息安全全面提升
??决策效率提升:辅助工程师平均缩短2小时决策时间;
??决策质量优化:使决策准确率提升10%-25%;
??数据安全保障:通过本地化部署,解决企业数据隐私泄露风险的定制难题。
?
技术创新与突破
从数据生产到场景落地的完整闭环
方法上,联合研究团队构建了从数据生产、模型训练到场景落地的完整技术闭环,主要包括三大技术创新:
创新的OR-INSTRUCT框架
研究团队设计了一种半自动化的数据生成方法——OR-Instruct,结合扩展策略(Expansion)与增强策略(Augmentation),有效缓解了高质量标注数据匮乏的问题,从600余条基础数据出发共合成30,000余条高质量训练样本。
首个工业级优化建模基准数据集
团队构建了IndustryOR基准数据集,涵盖13个行业与5类典型问题(包括线性、整数、混合整数、非线性及其他),并设有多级难度划分。相比国际已有数据集,IndustryOR在多样性与现实性方面具有显著优势。
开源模型系列“ORLMs”
实验结果表明,开源模型系列“ORLMs”在多个公开基准数据集上的表现均显著优于如GPT-4等的主流闭源模型及其他开源大模型,达到了当前该领域的最先进水平。
?
学生作者介绍
唐正阳
港中大(深圳)计算机与信息工程专业博士研究生
研究领域:
自然语言处理、信息检索、应用机器学习
个人简介:
唐正阳现为开元985棋牌最新官网(深圳)计算机与信息工程专业博士研究生,师从王本友教授。目前他在阿里巴巴通义千问团队实习,此前曾在微软亚洲研究院、腾讯QQ浏览器搜索以及阿里巴巴夸克搜索等多个知名团队积累了丰富的实习与工作经验。
他的研究专注于提升大语言模型在数学推理领域的能力,涵盖自然语言推理、优化建模、工具集成推理以及自我进化评估等创新方向,已在ICML、ICLR、Operations Research、COLING和KDD等顶级机器学习会议、Workshop和期刊上发表多篇论文。
他开发的算法已成功应用于多个领域,包括在2022年MSMAROCO段落排序权威榜单中名列第三,以及在2022全球语言与智能挑战赛中斩获亚军。
?
教授介绍
王本友
港中大(深圳)数据科学学院 助理教授
研究领域:
自然语言处理、信息检索、应用机器学习
个人简介:
王本友教授于2022年在意大利帕多瓦大学取得博士学位(受欧盟玛丽居里奖学金资助),曾在丹麦哥本哈根大学、加拿大蒙特利尔大学、荷兰阿姆斯特丹大学、华为诺亚方舟实验室、中国科学院理论物理所、社科院语言所交流访问。王教授的主要研究方向为大模型应用、多模态大语言模型、AI4Math和Human-Agent Interaction。他曾四次获得了会议最佳论文或提名奖,包括CCF A类会议SIGIR 2017的最佳论文提名奖、CCF B类会议NAACL 2019最佳可解释NLP论文,CCF C类会议NLPCC 2022的最佳论文和ICLR 2025 Financial AI最佳论文。他还获得了华为火花奖、腾讯犀牛鸟项目、滴滴盖亚学者项目和华为AI百校计划。团队开发了医疗大模型华佗GPT等多个大模型,相关工作得到了Nature、金融时报(Financial Times)、CCTV、环球时报、深圳卫视、南方都市报等采访和报道。
?
王子卓
港中大(深圳)数据科学学院教授、副院长(教学)
研究领域:
随机和鲁棒优化、数据驱动决策问题、定价和收益管理
个人简介:
王子卓博士现为数据科学学院教授、副院长(教学)。王子卓教授于2007年本科毕业于清华大学数学与应用数学系,2011年获得斯坦福大学金融数学硕士学位,2012年获斯坦福大学管理科学与工程博士学位。王子卓曾任职明尼苏达大学工业与系统工程系助理教授、副教授。王子卓教授现担任广东省人工智能数理基础实验室主任。
王子卓教授的主要研究方向为在线机器学习及收益与运营管理。在机器学习方面,王子卓教授在在线学习方面做了开创性的工作,对在线线性规划、在线凸规划问题中获得了开创性的结果。在收益管理方面,王子卓教授对消费者行为,商品定价和市场量化营销有着深入研究。他在运筹学和管理科学国际顶尖杂志上发表过超过60篇文章,在国内国际会议上多次应邀进行报告,并担任Management Science、Operations Research、M&SOM、POMS等顶级管理科学杂志编委,并且获得多项学术奖项。王子卓教授曾经或正在主持包括来自中国国家自然科学基金、美国国家自然基金等多项研究项目,总金额超千万元人民币。
王子卓教授在工业界有着丰富的经验,曾参与IBM定价项目,也曾为希捷、美国运通等做过项目咨询,也曾在华尔街量化基金担任过研究员。2016年起,王子卓与他人共同创立杉数科技并担任CTO,过去九年在国内为超百家企业做智能决策方面的咨询与服务,客户包括京东、顺丰、滴滴、华为、南航等国内领头企业。
?
港中大(深圳)数据科学学院介绍
数据科学学院是开元985棋牌最新官网(深圳)人工智能的科研与教学基地,致力于为学校提供包括计算机科学、统计学、大数据科学等在内的人工智能基础教育。学院现有90余位来自世界各地的全职教授,汇聚了多位国际知名学者,超过35%的全职教授为院士、会士或全球顶尖科学家。这些学者在机器学习、自然语言处理、计算机视觉等前沿领域具有卓越的学术成就与科研贡献。作为学校在人工智能领域的重要支柱,数据科学学院不断推动技术创新与跨学科合作,为培养具备全球视野的人工智能人才提供了坚实的基础。
粤公网安备 44030702004458号