在最新的模力工场第023周AI应用榜单中,AI技术的广泛应用再次引发关注。从旅行生活到AI基础设施建设,各类创新应用不断涌现,推动“Agent时代拼图”持续完善。榜单显示,超过70%的上榜项目聚焦于智能代理的实际场景落地,涵盖客户服务、内容生成与决策支持等多个维度。这一趋势不仅体现了技术革新的加速推进,也反映出AI正逐步融入日常生活的方方面面。随着开发者生态的成熟与工具链的完善,模力工场持续为AI应用提供坚实支撑,助力构建更加智能化的未来。
随着大模型技术的日益成熟,中关村科金公司正式发布了企业级智能体的落地路线图,全面展示其在人工智能领域的战略布局。此次发布的路线图涵盖了七大核心平台,集中呈现了300余款可即时调用的智能体,覆盖客户服务、运营优化、数据分析等多个企业应用场景。这些智能体依托大模型能力,具备自主决策与持续学习特性,标志着企业智能化正从单点应用迈向系统化落地。中关村科金的这一举措,不仅加速了AI技术在企业端的规模化部署,也预示着未来生产方式将迎来深层次重构。
在5G基站建设快速推进的背景下,工程质检成为保障网络稳定与覆盖质量的关键环节。传统人工监理模式已难以应对大规模、高密度的建设需求。通过引入AI技术赋予质量检测“智慧大脑”,实现对施工全过程的智能监控与实时分析,显著提升检测精度与效率。AI监理可自动识别基站安装偏差、线缆连接异常等问题,及时预警并生成整改建议,确保每个环节符合标准规范。这一创新模式不仅强化了监理角色的专业性与前瞻性,也为5G基础设施的高质量落地提供了有力支撑。
随着人工智能技术的快速发展,AI Agent正逐步成为企业核心系统重构的关键驱动力。通过智能化代理与多模态交互技术的融合,企业得以实现对关键业务系统的自主托管与动态优化。当前,已有超过40%的大型企业在试点AI驱动的流程重塑项目,涵盖客户服务、供应链管理及决策支持等多个领域。AI Agent不仅提升了系统响应效率,更推动了组织架构与运营模式的深层变革。文章结合实战路径,探讨了智能体在复杂业务环境中的部署策略,以及多模态能力如何增强人机协同效能,为企业数字化转型提供可落地的技术框架与管理范式。
在最近三个月内,极佳视界公司连续完成总额达5亿人民币的融资,并在A2轮中再度获得2亿元人民币投资。此次融资将主要用于推进物理领域人工智能(AI)的技术研发。公司指出,物理AI正迈入一个关键发展期,未来2至3年有望迎来通用人工智能(AGI)的重大突破。随着世界模型与行动模型技术的不断成熟,物理世界中或将出现类似“ChatGPT”的里程碑式进展,推动智能体在现实环境中的感知、决策与执行能力实现质的飞跃。
IBM宣布以110亿美元全现金收购Confluent,此举引发Kafka开源社区的广泛焦虑。作为Apache Kafka背后的商业化公司,Confluent的独立性曾是社区生态的重要保障,此次被IBM纳入麾下,令开发者担忧其开源承诺可能受到影响。与此同时,在流计算领域与Kafka形成竞争关系的Flink,或将因此迎来发展契机。在业界普遍聚焦GPU、大模型训练与算力竞赛的当下,IBM通过此次收购展现出其在数据集成与实时流处理领域的战略布局,选择了一条不同于主流的技术路径,凸显其对企业级数据基础设施长期价值的重视。
星巴克中国技术团队正推进一项为期三年的“数字员工助手”计划,旨在为每位员工配备基于Agentic AI技术的智能助手。该举措通过自动化处理重复性任务,显著提升工作效率,释放人力资源以专注于创造性与战略性工作。这一技术创新不仅优化了运营流程,更推动了人机协同模式的发展,凸显人类在思考、情感连接和创新方面的独特价值。
智谱科技近日推出两款开源多模态AI模型——GLM-4.6V与AutoGLM,标志着其在多模态技术领域达到SOTA(State of the Art)水平。其中,GLM-4.6V具备原生多模态处理能力,上下文窗口扩展至128k tokens,在视觉理解精度方面于同类参数规模模型中处于领先地位。该模型提供两个版本:GLM-4.6V(106B-12B)适用于云端及高性能集群环境;轻量版GLM-4.6V-Flash(9B)则专为本地部署和低延迟应用场景设计。AutoGLM进一步拓展了自动化多模态理解能力。此次开源举措有望推动多模态AI技术的广泛应用与创新。
DeepSeek创始人梁文锋近日被《Nature》杂志评为年度十大科学人物之一,被誉为“科技颠覆者”。作为一位源自中国的金融奇才,梁文锋凭借其领导开发的DeepSeek人工智能模型在国际舞台上引发广泛关注。《自然》杂志评价该模型“震惊世界”,并强调其开源特性为全球科研人员提供了强大工具,极大推动了AI在科学研究中的应用。DeepSeek的开放架构不仅提升了模型透明度,还促进了全球技术协作,成为科学界的重要助力。
Cursor Composer大模型通过深度自研训练路径,实现了从初期模仿中国大型模型到全面自主研发的关键跃迁。文章首次披露其在模型架构与基础设施上的系统性构建方法,展现了如何通过优化训练流程与数据闭环提升代码生成能力。相较于GPT-5.1 Codex,Composer在代码生成效率上实现高达四倍的性能提升,显著增强其在智能编程领域的竞争力。该创新方法论不仅加速了模型迭代,也为代码生成Agent的发展提供了全新范式与技术启示。
本文探讨了全图与切片处理在多模态大模型(MLLMs)中的应用差异,重点分析了LLaVA-UHD-v3模型如何揭示两种方法在高分辨率图像理解中的不同表现。研究表明,传统切片处理虽能缓解计算压力,但易丢失全局语义信息,而全图建模更有利于捕捉图像细节与整体结构,显著提升视觉语言任务的性能。LLaVA-UHD-v3提出了一种高效的全图建模方案,在保持计算效率的同时实现了对高分辨率图像的精细理解,为多模态模型的发展提供了新思路。
Snapchat近日推出了一项创新的图像创作工具——Canvas-to-Image框架,彻底改变了传统的图像生成方式。该工具摒弃了以往分散式的控制模式,将身份标识图、空间布局与姿态草图等多种控制元素整合于单一画布之上,实现了“画布集成”的全新创作体验。用户在画布上的每一笔绘制或操作,都会被系统实时识别并转化为精确的控制指令,直接驱动图像生成过程。这一技术不仅大幅简化了创作流程,还提升了用户对生成结果的掌控力与创作自由度,标志着Snapchat在AI图像创作工具领域的重大突破。
摩尔线程将于2025年12月19日至20日在北京中关村国际创新中心举办首届MUSA开发者大会(MUSA Developer Conference,简称MDC 2025)。作为国内GPU领域的新兴力量,摩尔线程将在此次大会上展示其备受期待的新一代GPU架构,全面呈现基于MUSA计算架构的软硬件生态进展。本次大会聚焦开发者社区,旨在搭建技术交流平台,推动国产GPU在人工智能、高性能计算等关键领域的应用发展,预计将吸引众多行业专家、技术开发者及合作伙伴参与。
智谱推出的GLM Coding Plan以仅1/7的价格提供接近Claude三倍调用量的服务,凭借显著的性价比优势赢得广泛好评。此举不仅降低了开发者使用AI编码工具的成本,更标志着中国工程师在构建本土化AI编码基础设施上的重要进展。长期以来,国内软件行业依赖国外技术生态,面临插件兼容性差、配置复杂等问题。GLM Coding Plan的出现,推动了国产AI模型在开发工具链中的深度集成,其战略意义超越技术本身,助力实现软件研发的自主可控。
在近日举行的Open Source Summit Japan上,Linux基金会执行董事Jim Zemlin指出,尽管人工智能技术发展迅猛,但其尚未全面进入泡沫化阶段,而大型语言模型(LLM)可能已显现泡沫化迹象。他认为,当前AI并未真正实现根本性的技术变革,对社会的深远影响仍有限。尽管LLM在生成能力和应用广度上取得突破,但其实际价值仍需时间验证。开源生态在此过程中将发挥关键作用,推动技术回归理性发展。
一位曾被OpenAI解雇的天才少年阿申布伦纳,如今正与谷歌联手,投身于打破英伟达在算力领域垄断的激烈竞赛。谷歌正大力支持云服务提供商Fluidstack,推动其自主研发的TPU芯片的分发与应用。作为谷歌算力生态布局的关键一环,Fluidstack目前正进行一轮高达7亿美元的融资,潜在领投者正是阿申布伦纳。这场融合技术革新、巨头博弈与资本助力的算力竞赛,不仅凸显了谷歌在AI基础设施上的雄心,也标志着前OpenAI核心成员的强势回归与复仇序幕的拉开。


