OPPO算法专家宋阳将出席2024年AICon北京站活动,分享其在Citywalk场景下VideoAgent的设计与实践。他将系统阐述CityWalk Agent的完整交互流程,深入解析各子模块的技术架构与设计逻辑,涵盖视觉感知、语义理解与动态决策等关键环节。作为OPPO在智能视频交互领域的前沿探索,该Agent致力于提升用户在城市漫步场景中的智能化体验。此次演讲将为开发者与研究人员提供宝贵的实践经验与技术洞察。
本文介绍了一种名为SimKO(Simple Pass@K Optimization)的算法,旨在解决强化学习中策略生成时出现的概率过度集中问题。该算法通过直接优化pass@K性能,显著提升了在K=1及K>1场景下的表现效果。研究指出,传统方法常依赖熵来衡量输出分布的多样性,但存在明显缺陷:相同熵值的分布可能具有截然不同的形态,例如一个均匀分布在多个候选上,另一个则极度集中于单一选项。SimKO通过规避对熵的依赖,转而聚焦于提升多候选解的覆盖能力,有效缓解了集中效应,增强了生成结果的多样性与实用性。
近日,OpenHands开发团队在机器之心的报道中宣布,已发布一篇新论文,正式对广受欢迎的开源智能体框架OpenHands进行全面重构。该框架在GitHub上已获得超过6.4万星标,此次升级将重点优化其智能体组件,显著提升性能与扩展性。此举标志着OpenHands将更加积极地参与全球人工智能框架的竞争,直接对标OpenAI和谷歌等科技巨头,推动开源智能体技术的发展与普及。
大型语言模型(LLM)在语言处理能力上实现了重要突破,OpenAI的o1模型首次展现出与人类语言专家相媲美的元语言能力。该模型在句法解析、语言歧义识别及音律推理等任务中表现卓越,表明其不仅能够生成语言,还能对语言结构进行深层次分析与思考。尽管LLM基于预测下一个词的机制运行,与人类的语言理解机制存在本质差异,部分语言学家因此质疑其是否真正“理解”语言,但o1的表现仍标志着模型能力的重大进步,为语言智能的发展提供了新的视角。
快手算法专家吴翔宇将出席AICon北京站,分享快手在直播领域中AI技术的前沿实践。他将重点探讨如何融合大模型与用户行为数据,构建精准的兴趣模型,以提升直播内容的个性化推荐效果与用户体验。通过深度学习与大规模行为分析,快手实现了对用户兴趣的动态捕捉与实时响应,推动直播互动效率显著提升。此次演讲将为业界提供AI在内容推荐系统中落地应用的重要参考。
随着建筑行业迈入数字化转型的关键阶段,AI技术与虚拟孪生正成为打破数据孤岛、提升协同效率的核心驱动力。据相关研究显示,超过60%的建筑项目因信息割裂导致进度延误与成本超支。通过构建全生命周期的虚拟孪生模型,结合AI对设计、施工与运维数据的智能分析,企业可实现跨部门、跨平台的高效协同。例如,某大型基建项目应用虚拟孪生技术后,协同效率提升达40%,变更返工率下降35%。数字化不仅重塑了建筑项目的管理方式,更推动建筑制造向精细化、智能化迈进,为行业可持续发展提供技术支撑。
vivo AI Lab与香港中文大学MMLab联合推出了一种名为UI-Genie的自进化移动图形用户界面(GUI)智能体,该技术无需依赖人工标注数据,即可通过持续交互实现性能自主提升。UI-Genie融合多模态大模型与智能体学习框架,标志着在无监督环境下智能交互系统的重要进展。研究由专注于多模态大模型与智能体学习的肖涵担任主要作者,王国志等合作作者在Agent强化学习方向提供了关键技术支撑。该方法为移动端AI自动化操作开辟了新路径。
智源研究院(BAAI)、Spin Matrix、乐聚机器人与新加坡南洋理工大学联合研发了RoboBrain-Memory,一种面向全双工、全模态模型的终身记忆系统。该系统专为具身智能体在复杂现实环境中的交互挑战而设计,具备实时音视频多用户身份识别与社会关系理解能力,可动态更新个体档案与社会关系图谱。通过整合全模态感知与持续学习机制,RoboBrain-Memory实现了机器人对人类用户的长期个性化记忆,使其能够像熟人一般进行自然、连贯的互动,推动服务机器人向真正智能化、人性化方向迈进。
一项由香港中文大学、北京大学和东北大学联合开展的研究,提出了一项名为MME-CoF的新基准,旨在系统评估视频生成模型的推理能力。该研究构建了包含12个推理维度的测试体系,用于考察如Veo-3等先进视频模型在复杂情境下的理解与推断水平。研究发现,尽管当前模型能够生成高度逼真的视频内容,但在涉及因果关系、逻辑推演等深层推理任务时表现有限,主要局限于模仿表面视觉模式,缺乏对事件内在机制的理解。该研究为视频模型的认知能力评估提供了标准化框架,并指明了未来在提升模型语义理解与因果推理方面的发展方向。
11月7日,Xsignal(奇异因子)与中欧国际工商学院(CEIBS)AI与营销创新实验室联合举办“AI驱动营销新范式:GEO白皮书发布暨AI搜索时代的品牌竞争力”论坛,并发布行业内首份《AI搜索时代:从GEO到AIBE的品牌新蓝图|GEO白皮书|2026》。该白皮书旨在定义AI时代下品牌建设的全新标准,重构营销底层逻辑,推动品牌在AI搜索环境中的战略升级。此次合作标志着学术研究与技术实践的深度融合,为品牌应对AI驱动的市场变革提供系统性框架与实证指导。
新华网财经观察栏目专题报道《“全勤生”的进博之约》,聚焦中国国际进口博览会(进博会)的持续吸引力。文章以“全勤生”为喻,生动展现全球企业对进博会的高度认可与积极参与。作为推动国际贸易的重要平台,进博会已连续举办六届,累计吸引145个国家和地区的超3,000家企业参展,其中近90家世界500强企业连续六年参展,彰显其在深化国际合作、促进全球供应链融合中的关键作用。通过高水平开放,进博会不仅助力中国经济高质量发展,也为全球经济复苏注入新动能。
在人工智能领域,强化学习与大模型记忆管理的结合正成为一项前沿研究方向。由加州大学圣地亚哥分校的Yu Wang在Anuttacon实习期间研发的Mem-α技术,首次成功将强化学习应用于大型模型的记忆管理过程,实现了模型对记忆存储、更新与组织的自主学习。该技术突破了传统记忆机制的局限,显著提升了智能体在复杂环境中的适应性与学习效率,推动了智能体记忆能力的革命性发展。Mem-α为未来具备持续学习与高效知识调用能力的AI系统奠定了技术基础。
“全勤生”已成为进博会的一道独特风景线,这些连续多年参展的企业与个人,以坚定步伐践行着与中国同行的承诺。他们不仅见证了进博会从首届至今的蓬勃发展——累计吸引145个国家和地区参展,意向成交额达735.2亿美元(2023年数据),更在开放合作中捕捉到广阔机遇。从科技创新到消费升级,“全勤生”深度融入中国市场的脉动,在共享发展机遇中实现自身跃升。他们的坚持,是信任的体现,更是对共同发展的有力诠释。
在第八届中国国际进口博览会上,贝加莱(B&R)展示了其在数智创新领域的最新成果——一系列融合人工智能技术的工业自动化新品。此次发布的AI新品聚焦智能工业场景,通过边缘计算与深度学习算法的结合,显著提升了生产过程中的预测性维护、质量检测与系统优化能力。作为全球领先的工业自动化解决方案提供商,贝加莱依托强大的技术研发实力,推动AI在复杂制造环境中的实时应用,助力企业实现高效、柔性与可持续发展。
在《大厂CIO独家分享:AI如何重塑开发者未来10年》一文中,一位大型科技企业的首席信息官深入剖析了人工智能对未来十年软件开发行业的深远影响。他指出,AI将显著提升代码生成效率,预计到2030年,超过70%的常规编码任务将由AI自动完成。然而,开发者的角色不会被取代,而是向系统设计、架构优化和复杂问题解决等高阶能力转移。CIO强调,未来的开发者需具备AI协作能力、跨领域思维与持续学习意识,以适应技术范式变革。企业也将重构人才培养体系,推动“AI+人类”协同开发新模式,实现创新效率的跃升。
传统搜索技术在应对复杂、特定场景需求时存在明显局限,难以高效满足开发者对精准信息的获取需求。本文探讨了通过优化数据组织方式与引入智能代理(Agent)推理机制,提升信息检索的智能化水平。借助结构化数据管理与自主学习能力的智能代理,系统可实现更深层次的语义理解与上下文关联分析,显著提高搜索效率与准确性。此外,为帮助开发者深入掌握相关技术,扫描二维码添加企业微信小助手并加入专属开发者群,即可免费获取讲师PPT资料,助力技术学习与实践应用。


