技术博客
惊喜好礼享不停
Mona框架:开启视觉微调新纪元

在CVPR2025会议上,清华大学与中国科学院大学联合推出了一项创新研究——Mona(多认知视觉适配器)。作为一种新型视觉微调框架,Mona通过仅调整骨干网络参数的5%,实现了高效的即插即用效果,显著提升了视觉识别任务中的性能与效率,突破了传统全参数微调的限制。

Mona框架视觉微调CVPR2025多认知适配器骨干网络参数
2025-04-26
揭秘Magi-1:一夜爆红的视频生成AI解析

Magi-1,一款源自中国的现实世界模拟器,凭借其强大的视频生成能力一夜爆红。作为一款领先的AI技术,Magi-1在北京五道口开源后迅速引起全球关注。它不仅能够高度还原真实场景,还能通过算法生成极具创意的虚拟内容,为用户带来前所未有的视觉体验。这一技术的突破标志着AI在内容创作领域的又一里程碑。

Magi-1视频生成AI一夜爆红现实世界模拟器北京五道口
2025-04-26
英伟达团队NemoSkills AI奥赛夺冠:小规模模型的大作为

英伟达团队NemoSkills在AI奥赛中凭借卓越的OpenMath-Nemotron系列AI模型荣获冠军。该模型仅1.5B参数,却超越了14B参数的DeepSeek-R1模型。更值得一提的是,英伟达将所有代码开源,这一举动获得了著名数学家陶哲轩的高度评价,展现了技术共享对推动人工智能发展的积极作用。

英伟达团队AI奥赛OpenMath开源代码陶哲轩评价
2025-04-26
探索未来:香港中文大学(深圳)TASTE-Rob人手交互视频数据集解析

香港中文大学(深圳)的研究团队发布了一个名为TASTE-Rob的大规模人手交互视频数据集,包含超过10万个视频,每个视频均与精确的语言指令相匹配。这一数据集通过模仿学习提升机器人操作的泛化能力。此外,团队还开发了三阶段视频生成流程,优化手部姿态,显著提高视频真实感和机器人操作准确度。

人手交互视频语言指令匹配机器人操作模仿学习视频生成流程
2025-04-26
华人学者在ICLR 2025上的辉煌成就:杰出论文奖的背后

在2025年的ICLR会议上,华人学者凭借卓越的研究成果荣获杰出论文奖,彰显了其在人工智能领域的研究实力与国际影响力。值得注意的是,获奖的三篇论文第一作者均为华人。其中,中国科学技术大学何向南教授团队、清华大学姚班以及北京大学校友的表现尤为突出,为全球人工智能发展贡献了重要力量。

ICLR会议华人学者杰出论文奖人工智能研究实力
2025-04-26
国产大飞机智能诊断技术的新篇章:时序大模型的突破

上海交通大学航空航天学院李元祥教授团队与上海飞机设计研究院、东方航空技术有限公司MCC部门合作,在国产大型飞机核心系统的智能诊断技术领域取得突破。他们开发了一种基于时序大模型的智能诊断方法,有效解决了跨机型诊断难题,为国产大飞机的安全运行提供了重要技术支持。

智能诊断技术国产大飞机时序大模型跨机型诊断李元祥团队
2025-04-26
探索具身交互推理:机器人思维与交互的未来

具身交互推理通过将图像、思考与行动交织成思维链,为机器人提供了更自然的交互方式。当前,OpenAI的o1系列模型与Deepseek-R1等前沿技术引领了推理模型的研究潮流,但这些模型的应用仍主要集中在数学和编程领域。未来,随着技术进步,具身交互推理有望拓展至更多场景,实现更广泛的人机协作。

具身交互推理图像思考行动OpenAI_o1系列Deepseek_R1数学编程领域
2025-04-26
探索大型语言模型元认知能力的提升之路

提升大型语言模型(LLMs)的元认知能力对其发展至关重要。这不仅关乎语言模型能否准确表达自身知识的不确定性,更直接影响其在关键决策场景中的应用效果。随着LLMs被广泛应用于复杂任务,增强其识别、评估和表达知识限制的能力显得尤为必要。

元认知能力语言模型知识不确定性关键决策表达能力
2025-04-26
突破传统界限:ICLR 2025探讨大型语言模型高效训练新策略

在ICLR 2025会议上,一篇备受瞩目的口头报告将探讨大型语言模型(LLMs)的高效训练方法。报告指出,单纯增加数据量对提升LLMs性能效果有限,而提出了一种基于最优控制理论的PDS框架。该框架通过系统化指导训练过程,助力LLMs在自然语言理解、代码生成及通用推理等任务中取得突破性进展,进一步推动通用人工智能的发展。

大型语言模型PDS框架最优控制理论自然语言理解通用人工智能
2025-04-26
《解码空间智能:一份全面的行业洞察报告》

量子位智库发布了首份《空间智能研究报告》,全面解析了空间智能的核心认知、关键要素及行业参与者图谱。通过广泛的调研与数据分析,报告系统梳理了各应用领域的重要参与者,并深入评估了推动产业迭代的关键因素,为理解空间智能的现状与未来趋势提供了专业视角。

空间智能研究报告行业参与者未来趋势关键要素
2025-04-26
突破性进展:ThinkLite-VL如何引领视觉推理新篇章

一项由马里兰大学等机构联合开发的新型视觉推理方法——ThinkLite-VL,在效率上显著超越了GPT模型。该方法仅需GPT模型数据量的1/20,即可大幅提升视觉语言模型的推理能力。通过蒙特卡洛树搜索技术,ThinkLite-VL能够筛选出高难度样本,进一步优化性能,同时避免了知识蒸馏的需求,为模型训练提供了高效的新途径。

ThinkLite-VL视觉推理模型优化蒙特卡洛树高效训练
2025-04-26
《探索未来:从MCP到项目管理,开放性如何引领变革》

在本期《极客有约》节目中,嘉宾洪涛深入探讨了从MCP到项目管理的转型过程中,开放性为何逐渐成为新趋势。他分享了飞书项目开放平台如何通过其强大的开放生态能力,为企业与开发者带来全新的项目管理理念,助力高效协作与创新。

项目管理开放生态飞书项目极客有约洪涛分享
2025-04-25
AI创新应用的国际舞台:网易有道赵越的全球化实践之路

网易有道国际App产品部业务负责人赵越分享了AI创新应用在商业化实践中的宝贵经验。这些经验聚焦于如何将中国的产品推向全球市场,实现国际化发展。通过深入探索AI技术的应用场景,赵越展示了从本地化到全球化战略转型的关键步骤,为行业提供了可借鉴的路径。

AI创新应用国际化发展全球市场商业化实践网易有道
2025-04-25
华为昇腾推理技术:AICon上海会议中的优化策略与实践

在AICon上海会议上,华为昇腾推理技术优化实践成为焦点。会议深入探讨了AI模型优化的三个关键层面:模型层、推理框架层和算子层优化。通过技术方案的选择与实际案例分析,展示了如何有效提升AI推理性能与效率,为行业提供了宝贵的实践经验。

昇腾推理技术AI模型优化推理框架层算子层优化AICon上海
2025-04-25
RAGEN框架:引领智能体思考新时代的开源革命

近日,DeepSeek前成员与知名学者李飞飞等业界专家共同推出了一款名为RAGEN的开源框架。该框架旨在训练智能体在任务执行过程中具备思考能力,从而提升其智能化水平。此外,与RAGEN相关的StarPO和StarPO-S框架也已同步上线GitHub,均采用MIT开源协议,为全球开发者提供了灵活且强大的工具支持。

RAGEN框架开源协议智能体思考StarPO框架李飞飞合作
2025-04-25
引领金融行业变革:Testin 云测与股份制银行的人工智能测试之路

Testin云测与一家领先的股份制银行达成合作,共同推动金融行业的人工智能测试转型。该银行已具备扎实的数字化基础,通过自主研发的接口自动化测试系统和测试管理平台,实现了测试流程的线上化管理,为行业树立了标杆。

人工智能测试金融行业软件测试数字化基础测试管理平台
2025-04-25