近日,人工智能领域顶级国际会议AAAI 2026(The 40th Annual AAAI Conference on Artificial Intelligence,CCF-A)公布录用结果,华体会体育买球(华东)青岛软件学院、计算机科学与技术学院4篇学术论文成功入选。AAAI会议是计算机人工智能领域中国计算机学会(CCF)推荐A类顶级学术会议,专注于人工智能领域的理论创新、技术突破与跨学科应用研究,致力于展示领域内具有开创性的科研成果与前沿发展趋势。会议主论坛共计收到23680篇有效投稿,最终共接收4167篇论文,录用率仅为17.6%。AAAI2026将于2026年1月20日至27日在新加坡博览中心召开。
论文一:Subspace-Aware Graph Construction and Contrastive Alignment for Multimodal Recommendation with Large Language Models
第一作者:李浩东(2024级博士研究生)
收录会议:The Fortieth AAAI Conference on Artificial Intelligence (AAAI-26), Main Technical Track
指导教师:齐连永
论文概述:多媒体内容为推荐系统提供了额外的上下文信息,有助于更好地理解用户兴趣。目前,多模态推荐(Multimodal Recommendation)研究主要集中在构建项目-项目语义图,但多数方法仅基于特征相似性捕捉浅层语义结构,难以有效建模更复杂或跨实体的语义关系(例如用户-项目关系)。此外,在这些方法中,协同信号往往占据主导地位,从而削弱了语义知识在表示学习中的作用。为了解决上述问题,本文提出了一种新颖的结合子空间感知图构建与对比对齐的大语言模型多模态推荐框架SCALE。具体而言,首先利用大语言模型和多模态编码器提取用户与项目特征;随后基于子空间聚类假设,采用正交匹配追踪(Orthogonal Matching Pursuit, OMP)算法,在项目-项目、用户-用户以及用户-项目空间中挖掘复杂的语义结构,并将其整合为统一的语义图。接着,在语义图和交互图上分别进行图卷积操作,并融合结果以生成最终推荐。为进一步提升语义融合与对齐效果,模型还引入了对比损失机制。在五个真实世界数据集上的大量实验结果表明,SCALE在性能上显著优于当前最先进的多模态推荐模型,充分证明了其在复杂关系建模以及语义知识与协同信号融合方面的有效性。

论文二:Retrieval-driven Reasoning for Deliberative Visual Classification
第一作者:谢建业(2024级博士研究生)
收录会议:The Fortieth AAAI Conference on Artificial Intelligence (AAAI-26), Main Technical Track
指导教师:齐连永
论文概述:视觉语言模型(Vision-Language Models, VLMs)在视觉分类任务中展现出了卓越的能力。然而,现有用于增强VLM性能的方法通常过度依赖于直接的类别到图像匹配,这种方式限制了模型的泛化能力,并导致性能次优。此外,这些方法无法解释模型为何选择某一特定类别。为了解决这些问题,我们提出了一种新的审议式视觉分类任务(deliberative visual classification task),该任务将分类过程分解为多个审议步骤,并利用大型语言模型(Large Language Models, LLMs)在最终决策前执行显式推理。具体而言,我们提出了一个检索驱动推理模型(Retrieval-driven Reasoning, RdR),包含两个核心模块:(1)检索数据库构建(retrieval database construction):利用LLM提取与类别相关的描述符(descriptors),并构建一个高效的检索数据库,用于图像与描述符之间的匹配;(2)审议式类别预测(deliberative category prediction):通过多步审议推理,基于检索到的描述符进行显式推理,从而辅助最终的类别预测。在多个数据集上的大量实验结果表明,我们的方法在鲁棒性与泛化能力方面均显著优于强基线模型,充分验证了其有效性。

论文三:Hyperbolic-Enhanced Mixture-of-Experts Mamba for Sequential Recommendation
第一作者:刘玉文(2022级博士研究生)
收录会议:The Fortieth AAAI Conference on Artificial Intelligence (AAAI-26), Main Technical Track
指导教师:齐连永
论文概述:序列推荐旨在根据用户的历史行为预测其下一次可能的交互,是推荐系统的重要分支。尽管近年来基于Transformer和Mamba的模型在长序列建模方面取得了显著进展,但仍存在两大关键瓶颈:其一,多数方法仅在欧几里得空间中进行特征学习,难以捕获用户与项目间潜在的层次结构与高阶关系;其二,Mamba结构中的静态前馈网络限制了模型对多样化用户偏好的动态适应能力。针对这些问题,本文提出了一种双曲增强混合专家Mamba框架(Hyperbolic-Enhanced Mixture-of-Experts Mamba, HM2Rec),在结构表示与序列建模两方面实现协同优化。具体而言,HM2Rec首先构建用户—项目交互图,并通过双曲图卷积网络(Hyperbolic GCN)在双曲空间中嵌入节点,有效保留层次化与全局结构特征。随后,采用变分图自编码器(VGAE)对节点嵌入进行分布式重构,从而增强图结构的鲁棒性与抗噪性。在此基础上,模型引入改进的Mamba序列编码器,并结合旋转位置编码以捕捉相对时序依赖;同时,以混合专家模块(Mixture-of-Experts, MOE)替代静态FFN,实现动态专家路由机制,使每个时间步的特征变换能够自适应地选择最合适的专家子网络,从而提升对动态用户兴趣的建模能力。实验表明,HM2Rec在推荐性能上显著优于18个主流基线模型。综上,HM2Rec通过融合几何结构建模与动态专家机制,在结构表达与序列建模层面均取得突破,为复杂用户行为场景下的个性化推荐提供了一种高效、鲁棒且具有理论创新性的解决方案。


当前位置: