在CVPR2025会议上,清华大学与中国科学院大学联合推出了一项创新研究——Mona(多认知视觉适配器)。作为一种新型视觉微调框架,Mona通过仅调整骨干网络参数的5%,实现了高效的即插即用效果,显著提升了视觉识别任务中的性能与效率,突破了传统全参数微调的限制。
Magi-1,一款源自中国的现实世界模拟器,凭借其强大的视频生成能力一夜爆红。作为一款领先的AI技术,Magi-1在北京五道口开源后迅速引起全球关注。它不仅能够高度还原真实场景,还能通过算法生成极具创意的虚拟内容,为用户带来前所未有的视觉体验。这一技术的突破标志着AI在内容创作领域的又一里程碑。
英伟达团队NemoSkills在AI奥赛中凭借卓越的OpenMath-Nemotron系列AI模型荣获冠军。该模型仅1.5B参数,却超越了14B参数的DeepSeek-R1模型。更值得一提的是,英伟达将所有代码开源,这一举动获得了著名数学家陶哲轩的高度评价,展现了技术共享对推动人工智能发展的积极作用。
香港中文大学(深圳)的研究团队发布了一个名为TASTE-Rob的大规模人手交互视频数据集,包含超过10万个视频,每个视频均与精确的语言指令相匹配。这一数据集通过模仿学习提升机器人操作的泛化能力。此外,团队还开发了三阶段视频生成流程,优化手部姿态,显著提高视频真实感和机器人操作准确度。
在2025年的ICLR会议上,华人学者凭借卓越的研究成果荣获杰出论文奖,彰显了其在人工智能领域的研究实力与国际影响力。值得注意的是,获奖的三篇论文第一作者均为华人。其中,中国科学技术大学何向南教授团队、清华大学姚班以及北京大学校友的表现尤为突出,为全球人工智能发展贡献了重要力量。
上海交通大学航空航天学院李元祥教授团队与上海飞机设计研究院、东方航空技术有限公司MCC部门合作,在国产大型飞机核心系统的智能诊断技术领域取得突破。他们开发了一种基于时序大模型的智能诊断方法,有效解决了跨机型诊断难题,为国产大飞机的安全运行提供了重要技术支持。
具身交互推理通过将图像、思考与行动交织成思维链,为机器人提供了更自然的交互方式。当前,OpenAI的o1系列模型与Deepseek-R1等前沿技术引领了推理模型的研究潮流,但这些模型的应用仍主要集中在数学和编程领域。未来,随着技术进步,具身交互推理有望拓展至更多场景,实现更广泛的人机协作。
提升大型语言模型(LLMs)的元认知能力对其发展至关重要。这不仅关乎语言模型能否准确表达自身知识的不确定性,更直接影响其在关键决策场景中的应用效果。随着LLMs被广泛应用于复杂任务,增强其识别、评估和表达知识限制的能力显得尤为必要。
在ICLR 2025会议上,一篇备受瞩目的口头报告将探讨大型语言模型(LLMs)的高效训练方法。报告指出,单纯增加数据量对提升LLMs性能效果有限,而提出了一种基于最优控制理论的PDS框架。该框架通过系统化指导训练过程,助力LLMs在自然语言理解、代码生成及通用推理等任务中取得突破性进展,进一步推动通用人工智能的发展。
量子位智库发布了首份《空间智能研究报告》,全面解析了空间智能的核心认知、关键要素及行业参与者图谱。通过广泛的调研与数据分析,报告系统梳理了各应用领域的重要参与者,并深入评估了推动产业迭代的关键因素,为理解空间智能的现状与未来趋势提供了专业视角。
一项由马里兰大学等机构联合开发的新型视觉推理方法——ThinkLite-VL,在效率上显著超越了GPT模型。该方法仅需GPT模型数据量的1/20,即可大幅提升视觉语言模型的推理能力。通过蒙特卡洛树搜索技术,ThinkLite-VL能够筛选出高难度样本,进一步优化性能,同时避免了知识蒸馏的需求,为模型训练提供了高效的新途径。
在本期《极客有约》节目中,嘉宾洪涛深入探讨了从MCP到项目管理的转型过程中,开放性为何逐渐成为新趋势。他分享了飞书项目开放平台如何通过其强大的开放生态能力,为企业与开发者带来全新的项目管理理念,助力高效协作与创新。
网易有道国际App产品部业务负责人赵越分享了AI创新应用在商业化实践中的宝贵经验。这些经验聚焦于如何将中国的产品推向全球市场,实现国际化发展。通过深入探索AI技术的应用场景,赵越展示了从本地化到全球化战略转型的关键步骤,为行业提供了可借鉴的路径。
在AICon上海会议上,华为昇腾推理技术优化实践成为焦点。会议深入探讨了AI模型优化的三个关键层面:模型层、推理框架层和算子层优化。通过技术方案的选择与实际案例分析,展示了如何有效提升AI推理性能与效率,为行业提供了宝贵的实践经验。
近日,DeepSeek前成员与知名学者李飞飞等业界专家共同推出了一款名为RAGEN的开源框架。该框架旨在训练智能体在任务执行过程中具备思考能力,从而提升其智能化水平。此外,与RAGEN相关的StarPO和StarPO-S框架也已同步上线GitHub,均采用MIT开源协议,为全球开发者提供了灵活且强大的工具支持。
Testin云测与一家领先的股份制银行达成合作,共同推动金融行业的人工智能测试转型。该银行已具备扎实的数字化基础,通过自主研发的接口自动化测试系统和测试管理平台,实现了测试流程的线上化管理,为行业树立了标杆。