阿里版“Her”已正式上线并开源,其核心模型Qwen2.5-Omni-7B被定义为全能模型,具备卓越的多模态处理能力。该模型可同时处理文本、音频、图像和视频等多种输入形式,并生成高质量的文本和音频输出。与同规模的单模态或封闭源模型(如Qwen2.5-VL-7B、Qwen2-Audio及Gemini-1.5-pro)相比,Qwen2.5-Omni在各模态任务中均展现出领先性能,为用户提供全面的试用体验。
2025年,苹果公司公布了其AI学者名单,表彰了12位杰出的年轻华人学者。这些新星包括黄子琪、孔令东、北京大学的吉嘉铭以及清华大学的顾煜贤等。他们在人工智能领域展现了卓越的研究能力,被全球学术界公认为AI研究的前沿力量,代表了未来技术发展的方向。
据外媒报道,英伟达计划以数亿美元收购由贾扬清创立的Lepton AI公司。此次收购完成后,Lepton AI将融入英伟达AI云基础设施,助力其在人工智能领域进一步提升竞争力。这一动作标志着英伟达在拓展AI技术生态方面的又一重要布局。
近日,港科大广州与伦敦大学学院联合研究团队发布了一项突破性成果——边缘语言模型(PLM)。该模型创新性地将机器学习中的最大似然估计(MLA)和稀疏激活技术应用于端侧设备。这一技术进步解决了大规模模型结构实验中的诸多挑战,尤其在预训练研究领域显得尤为稀缺。通过优化算法设计,PLM显著提升了端侧设备的处理效率,为边缘计算领域的语言处理能力开辟了新路径。
阿里巴巴近期开源了一款7B模型,该模型具备AI视频通话功能,可实时处理文本、音频、图像和视频等全模态数据,并生成自然语言与语音。这一技术突破为开发者和企业提供了免费商用的机会,大幅提升了多模态数据交互的效率。
华东师范大学与东华大学的研究团队联合发表了一篇题为《A Survey on the Optimization of Large Language Model-based Agents》的综述文章。该文章聚焦于大型语言模型为基础的智能代理优化问题,系统梳理了这一领域的最新进展,旨在帮助读者构建清晰的知识体系,避免学习过程中的混乱无序。
OpenAI宣布采用竞争对手Anthropic的MCP协议,这一决定使MCP成为行业内的热门话题。前特斯拉AI总监Karpathy对此表示,MCP之所以被广泛讨论,是因为其本身已成为了焦点。此举不仅引发了业界对合作协议的深入探讨,也体现了AI领域中开放与竞争并存的趋势。
复旦大学与微软合作,成功研发出一种名为MagicMotion的新型图像到视频生成框架。该技术实现了对视频中任意物体运动轨迹的精准控制,支持掩码级、边界框级和稀疏框级三种轨迹控制级别。MagicMotion的主要贡献者包括复旦大学研究生李全昊、邢桢及通讯作者吴祖煊副教授,这一突破为视频生成领域提供了创新解决方案。
上海财经大学统计与数据科学学院的张立文教授及其领导的SUFE-AIFLM-Lab课题组,联合多方力量,发布了金融领域推理型大模型Fin-R1。该模型属于DeepSeek-R1类别,参数规模仅7B,却展现出卓越性能,平均得分达75分,与671B参数的DeepSeek-R1满血版性能相当,为金融行业提供了高效解决方案。
自动排程排产系统作为一种智能工具,能够根据订单需求、生产能力和资源状况等因素,科学制定并动态调整生产计划。该系统通过综合分析设备可用性与人力资源配置等限制条件,确保生产流程的高效与顺畅执行,为企业提供智能化解决方案。
AI驱动的大数据自治技术正成为解决复杂运维挑战的关键。通过智能故障检测与自动化处理,系统能够实现自我诊断和修复,显著提升效率与稳定性。这一技术将在QCon北京大会上深入探讨,为行业提供前沿解决方案。
火山引擎边缘大模型网关现已接入5家DeepSeek模型提供商,用户可通过一键式访问享受便捷服务。该网关不仅支持多厂商服务调用,还具备自动故障迁移功能,确保DeepSeek模型的稳定运行,为智能服务提供持续保障。这一技术突破将大幅提升智能服务的可靠性和效率,满足更多场景化需求。
火山引擎veImageX团队针对鸿蒙操作系统推出了三款软件开发工具包(SDK),包括图片上传SDK、图片编码SDK和图片加载SDK。这三款SDK全面覆盖了客户端的图片处理需求,助力企业和开发者提升应用性能,优化用户体验。通过高效、优质的图片处理能力,这些工具为构建更强大的鸿蒙应用提供了坚实支持。
火山引擎端智能解决方案的更新,为智能设备管理带来了全新范式。通过精准管理每台设备的AI服务使用量,并集成多种大型模型与智能体,实现了设备间高效连接与接入。这一突破不仅优化了资源分配,还为企业抢占市场先机提供了可能,推动AI与硬件结合进入新阶段。
DeepSeek的推出标志着企业级AI应用的重大突破。自年初以来,其推理模型通过模拟完整思考过程,自主规划企业任务,显著提升了企业在智能服务领域的专业能力。DeepSeek不仅助力智能商业决策的形成,还优化了业务流程,为企业智能化转型提供了强有力的支持。
在AI时代,编程范式正经历深刻变革。构建AI Native产品时,语义结构化成为关键区别于传统产品的核心要素。通过语义结构化,产品能够更好地理解与处理复杂数据,从而提升用户体验和效率。这种转变不仅改变了开发流程,还重新定义了产品与用户之间的交互方式。