今年是人工智能概念提出70周年,同时也是新智元峰会迎来十周年庆典的重要时刻。9月7日,该峰会在北京中关村软件园隆重举行,以“新天终启,万象智生”为主题,聚焦人工智能的前沿发展趋势。会上发布了《2025新智元ASI前沿趋势报告》,并邀请了包括百度CTO和NVIDIA副总裁在内的十位行业领袖,通过“十人十题”的形式,深入探讨AI发展的五个阶段。议题涵盖大模型、Physical AI、具身智能、医疗AI、视频AI、脑科学、AI Agent及人才培养等多个领域,旨在描绘未来十年人工智能的发展蓝图。
张晓,一位28岁的内容创作者和写作顾问,近期启动了一项全新的创业项目——“模力工场”。该项目专注于每天推荐高质量的人工智能应用,旨在帮助用户筛选并发现真正有价值的人工智能工具。作为一名成长于上海艺术家庭的写作者,她始终致力于通过内容激发思考、传播知识。此次创业不仅是她职业生涯的一次重要拓展,也是她应对内容创作竞争、提升自身写作技巧的全新尝试。尽管在时间管理和追求完美之间仍面临挑战,张晓希望通过“模力工场”连接更多热爱科技与创作的人群。
自与Meta公司建立合作关系以来,Scale AI公司面临了一系列挑战,包括客户流失和员工离职问题。据报道,公司失去了一些重要客户,同时一名任职六年的老员工也选择离开。这一系列变动引发了外界对公司内部稳定性和未来发展方向的关注。分析认为,合作关系的调整可能对公司的运营和企业文化产生深远影响,进而导致客户和员工的不安。面对当前困境,Scale AI亟需采取有效措施,以稳定现有客户关系并提升员工归属感。
本文旨在系统性地梳理测试时计算(Test-Time Compute, TTC)的主要实现方法。研究表明,TTC可能遵循与预训练相似的扩展规律:增加训练计算量可以显著提升模型性能,同理,在推理阶段增加计算资源(即延长模型的思考时间),理论上也可能导致模型性能出现可预测的指数级增长。通过合理分配推理阶段的计算资源,有望在不改变模型结构的前提下进一步挖掘模型潜力。
本文探讨了智能推荐技术的新发展阶段,聚焦于快手在生成式技术领域的创新实践。通过参考快手科技副总裁周国睿先生在AICon全球人工智能开发与应用大会上的演讲内容,文章分析了快手在推荐模型和基础大模型方面的探索,特别是在系统边界消融与重建中的关键作用。这些技术进展不仅推动了智能推荐系统的进一步发展,也为AI在内容生成和分发领域的深度融合提供了新的思路。本文旨在为读者提供一份专业且详尽的技术总结,帮助理解智能推荐技术的未来趋势。
Cursor公司CEO的创业理念强调,代码并非决定创业成功的唯一因素。他倡导一种激进的增长策略,致力于通过全自动化实现颠覆性创新,而非渐进式改进。在2023年,Cursor团队仍在探索是否需要调整战略方向,并努力推动业务增长。尽管公司最终实现了盈利,但这一过程较为漫长,反映出创业道路上的挑战与坚持。
随着科技领域的快速发展,00后开发者逐渐成为苹果开发领域的重要力量。近期,Xcode中广受欢迎的编程辅助插件Alex被OpenAI收购,其开发团队将加入Codex项目,开启全新的工作篇章。这一动态不仅体现了人工智能在编程领域的持续渗透,也预示着Codex项目在Mac开发者社区中的竞争力或将迎来显著提升。对于00后开发者而言,这一变化既带来了新的机遇,也加剧了行业竞争,促使他们不断学习和适应新技术。
香港科技大学(广州)与腾讯的联合研究团队将广受欢迎的沙盒游戏《我的世界》作为测试和训练通用人工智能(AI)技术的理想平台。通过利用400张游戏截图对AI进行训练,该团队成功实现了让AI自动挖掘资源并通关游戏的目标,将操作成本大幅降低至原来的5%。这一研究成果将在EMNLP 2025会议上展示,彰显了AI在复杂任务自动化中的巨大潜力。
字节跳动与浙江大学联合推出商用级音频驱动数字人模型——InfinityHuman,这一技术突破了传统音频驱动技术在生成长视频内容方面的限制,推动了AI数字人在实际应用中的发展。InfinityHuman能够实现长时长、高质量数字人视频的生成,满足了市场对智能化内容创作日益增长的需求。该模型的发布不仅展示了音频驱动技术的创新潜力,也为行业未来的发展指明了方向。
亚马逊网络服务(AWS)宣布其弹性Kubernetes服务(Amazon Elastic Kubernetes Service, EKS)在容器编排领域实现了重大技术突破。EKS现在能够支持高达10万个节点的集群规模,相较于之前的上限提升了10倍。这一扩展能力极大地增强了对人工智能(AI)和机器学习(ML)工作负载的支持,使得单个Kubernetes集群能够容纳多达160万个AWS Trainium芯片或80万个NVIDIA GPU,为大规模AI/ML工作负载提供了前所未有的计算资源。
本文介绍了一种名为DiMo-GUI的图形用户界面(GUI)定位框架,由vivo等机构在EMNLP 2025会议上提出。该框架专为解决多模态大型语言模型(MLLMs)在处理复杂GUI定位任务时所面临的挑战而设计,无需额外训练即可实现高效应用。DiMo-GUI通过动态视觉推理和模态感知优化技术,显著提升了模型在GUI定位任务中的表现,为多模态模型的实际应用提供了新的解决方案。
字节跳动与浙江大学携手合作,推出了商用级长视频AI数字人模型——InfinityHuman。该模型能够根据音频输入生成长时间的人物视频,突破了传统技术的限制,标志着长时序音频驱动视频生成技术在商业应用领域迈出了重要一步。这一创新为内容创作、虚拟主播、在线教育等行业带来了全新的可能性,大幅提升了视频生成的效率和应用潜力。
美团近期在人工智能领域取得重大突破,推出名为LongCat-Flash的AI模型。该模型拥有高达5600亿个参数,却展现出比参数较少模型更快的运行速度,标志着美团在AI技术领域的显著进展。
自OpenAI推出ChatGPT以来,通用人工智能(GenAI)正以迅猛的速度改变商业格局。根据OpenAI的最新报告,人工智能已不再是企业可有可无的辅助工具,而是决定企业存亡的关键战略资源。这一转变促使各行各业加速整合人工智能技术,以提升效率、优化决策流程,并在竞争中占据先机。随着ChatGPT等技术的广泛应用,企业不仅在内部运营中依赖人工智能,在客户服务、市场营销和产品开发等方面也深度应用人工智能,重塑商业模式与价值链条。
在SIGCOMM 2025会议上,快手与清华大学联合推出了一项突破性技术——灵犀(LingXi)系统,标志着个性化视频流服务迈入新纪元。该系统摒弃了传统视频流优化中单一、静态的目标,转而采用为每位用户量身定制的动态策略,真正实现了“千人千面”的个性化体验。这一创新不仅提升了用户体验,也为视频流技术的发展树立了新标杆。
近日,人形机器人在家庭服务领域的应用取得重要进展,已成功掌握洗碗技能,标志着其在家务劳动场景中的实用性进一步提升。此前,Figure机器人在物流领域展示了卓越的包裹分拣能力,仅用一小时便识别、抓取并翻转各类形状包裹,运送至传送带,其操作速度与灵活性已接近人类水平,展现出强大的应用潜力。