技术博客
惊喜好礼享不停
智谱Glyph方案与DeepSeek-OCR的对决:视觉Token技术的较量

智谱的运气似乎稍逊一筹,其视觉Token研究与DeepSeek项目意外地产生了竞争。在DeepSeek-OCR发布不到24小时后,智谱迅速开源了他们的视觉Token方案——Glyph,展现出快速响应的技术实力。尽管两者在技术路径上存在相似性,但Glyph在中文字符识别与书写结构还原方面表现出独特优势。为客观评估Glyph的性能,我们特邀曾对DeepSeek项目给予高度评价的AI专家卡帕西进行专业评测。初步分析显示,Glyph在处理复杂排版和手写体场景时具备潜力,其开源策略也有望推动视觉Token技术的广泛应用。

智谱DeepSeekGlyph视觉Token开源
2025-10-23
人工智能驱动下数据库与大数据智能的革新之路

本文汇集腾讯云多位技术专家观点,深入探讨人工智能在推动数据库与大数据智能发展中的关键作用。随着企业对数据处理效率与智能化水平要求的提升,Data Agent作为核心执行单元,在实际落地过程中面临任务理解、环境交互与决策可靠性等多重挑战。AI技术通过自然语言理解、强化学习与自动化推理能力,显著提升了Data Agent的自主性与适应性,进而优化数据库运维、查询优化与数据治理等场景。研究表明,融合AI的数据库系统可将查询响应效率提升40%以上,运维成本降低30%。未来,AI驱动的数据管理将成为企业数字化转型的核心引擎。

人工智能数据库大数据Data Agent技术专家
2025-10-22
深入理解Fetch API:AbortController API的强大功能

Fetch API作为现代Web开发中处理网络请求的核心工具,其高级功能不断拓展应用边界。其中,AbortController API的引入显著增强了请求的可控性。通过创建一个与Fetch请求关联的signal对象,开发者能够在必要时主动中止请求,避免资源浪费并提升用户体验。这一机制相当于为异步请求配备了一个可随时触发的“遥控器”,在用户导航、超时控制或条件变更等场景下尤为实用。该功能不仅提高了应用的响应性,也体现了现代前端对精细化流程管理的需求。

FetchAPI中止信号请求
2025-10-22
AI智能体技术革新:企业级应用的新篇章

随着AI技术的快速发展,AI智能体在企业级应用中的价值日益凸显。腾讯云凭借其领先的元器技术,为企业提供高效、便捷的智能体搭建与部署解决方案,实现零门槛接入。通过该技术,企业可快速构建具备自主决策与学习能力的智能体,显著提升运营效率与智能化水平。同时,腾讯云专家团队将提供在线答疑服务,深入指导企业应对部署过程中的各类挑战,助力实现智能化转型的平滑落地。

AI智能体企业级应用腾讯云元器技术零门槛
2025-10-22
ChatGPT Atlas:OpenAI的浏览器革新与谷歌的股价波动

在一次意外直播中,OpenAI推出了其全新网页浏览器ChatGPT Atlas,迅速引发市场广泛关注。这款集成人工智能技术的浏览器被视为对现有搜索与浏览模式的重大挑战,尤其对谷歌构成潜在威胁。消息传出后,谷歌母公司Alphabet的股价一度下跌超过4%,反映出投资者对市场竞争格局变化的敏感反应。分析指出,ChatGPT Atlas可能通过更智能的对话式交互和内容生成能力重塑用户获取信息的方式。随着OpenAI进一步拓展其AI应用场景,科技巨头之间的竞争正从生成式AI延伸至基础互联网服务领域。

ChatGPT浏览器OpenAI谷歌股价
2025-10-22
ICCV 2025:最佳论文奖项揭晓,何恺明孙剑作品获经典之称

在ICCV 2025会议上,最佳论文奖项正式揭晓,何恺明与孙剑等研究者凭借其开创性工作荣获殊荣,其研究成果被公认为过去十年计算机视觉领域的经典之作。其中,由何恺明团队提出的Fast R-CNN(亦称RBG大神之作)在十年后再度获得广泛认可,荣获Helmholtz Prize,彰显了其深远的学术影响力。此外,卡内基梅隆大学(CMU)团队表现亮眼,不仅斩获最佳论文奖,还获得一项最佳论文提名,展现了强劲的研究实力。本届会议充分体现了计算机视觉领域的持续创新与技术传承。

ICCV2025何恺明孙剑Fast R-CNNHelmholtz
2025-10-22
LangChain公司融资12.5亿美元:开源项目的增长奇迹

LangChain公司近日完成新一轮融资,市场估值攀升至12.5亿美元,迅速跻身高成长性科技企业行列。作为被广泛认可的“增长速度最快的开源项目之一”,LangChain凭借其在语言模型应用开发框架领域的创新,持续吸引资本市场的关注。本轮融资将进一步推动其技术迭代、团队扩展及全球社区建设,巩固其在开源人工智能生态中的领先地位。

LangChain融资估值开源增长
2025-10-22
AI编程工具在大型企业应用中的现实困境与突破

尽管AI编程工具在技术圈备受关注,其在大型企业中的实际应用却未达预期。以网易的CodeWave项目为例,尽管该平台通过升级研发模式,超越了传统代码生成工具的局限,致力于提升开发效率与工程落地能力,但内部数据显示,其代码库的实际采纳率仍仅为20%-30%。这一数据反映出企业在集成AI编程技术时面临的挑战,包括对生成代码的信任度、与现有流程的融合难度以及开发者习惯的转变。因此,AI编程工具要在企业级场景中实现广泛落地,不仅需要技术突破,更需重构研发协作模式,提升工具的实用性与可集成性。

AI编程代码生成采纳率研发模式企业应用
2025-10-22
Plaud与亚马逊云科技携手,开启全球化创业奇迹

Plaud与亚马逊云科技的合作案例展现了初创企业快速实现全球扩张的典范。在短短三年内,Plaud通过Kickstarter平台发起众筹,创下行业纪录,并实现全球销量突破100万台,业务覆盖170个国家和地区。依托亚马逊云科技的技术支持与全球基础设施,Plaud在多数国家市场占有率超过95%。进入中国市场后,仅用三天时间便在天猫、京东、抖音等主流电商平台登顶同类产品销量榜首。其成功源于以口碑为驱动的增长策略,结合高效的数字化运营体系,走出了一条兼具速度与质量的独特发展路径。

Plaud亚马逊众筹销量口碑
2025-10-22
AipexBase:引领AI编程新浪潮,开启后端开发新纪元

AipexBase作为中国首个人工智能开源后端平台,标志着前端开发向全栈AI演进的重要突破。该平台是国内首个AI原生后端即服务(Backend-as-a-Service, BaaS)平台,填补了AI编程在后端领域的空白。以往AI技术多集中于前端应用,而AipexBase首次实现从前端到后端的全面覆盖,支持自动处理数据库与API生成, enabling开发者快速构建完整可运行的应用程序。其开源特性进一步降低了开发门槛,推动AI技术在更广泛场景中的落地与创新。

AipexBaseAI原生后端即服务开源平台自动API
2025-10-22
3D内容创作的新篇章:OmniPart框架的突破与影响

在3D内容创作领域,实现类似乐高积木式的自由生成、编辑和组合对象部件一直是一项关键挑战。香港大学、VAST、哈尔滨工业大学与浙江大学的研究团队联合提出OmniPart框架,首次实现了高效、灵活的3D部件级生成与编辑。该框架支持跨类别、细粒度的部件操作,显著提升了3D资产创作的模块化与可复用性。研究成果已被计算机图形学顶级会议SIGGRAPH Asia 2025录用,为未来智能3D内容生成提供了重要技术路径。

3D创作乐高式OmniPart部件组合SIGGRAPH
2025-10-22
北京大学与华为公司联手,KV缓存管理框架实现重大突破

北京大学与华为公司联合研发了一种新型KV缓存管理框架,显著提升了大型模型在处理长序列推理任务时的效率。该框架有效缓解了KV缓存在长序列场景下内存需求随长度线性增长的问题,这一瓶颈长期以来制约着大模型的实际部署。实验结果表明,新框架相较此前最佳状态(SOTA)实现了4.7倍的推理速度提升,为大规模模型在复杂应用场景中的高效运行提供了创新解决方案,具有重要的工程与应用价值。

KV缓存长序列推理速度北大华为模型部署
2025-10-22
Video-RAG:引领长视频理解的革新之路

Video-RAG是由厦门大学、罗切斯特大学与南京大学联合提出的一种新型轻量级框架,旨在应对长视频理解中的关键挑战。该框架无需微调即可高效处理长时序和复杂语义的视频内容,有效克服了传统方法在上下文长度限制、跨模态对齐困难及高计算成本等方面的瓶颈。通过引入跨模态检索增强机制,Video-RAG实现了对长视频中多模态信息的精准捕捉与整合,在保持高性能的同时显著降低了资源消耗,为长视频理解提供了高效且可扩展的解决方案。

Video-RAG长视频跨模态轻量级高效
2025-10-22
模型可解释性领域的突破:GRACE框架详解

一项突破性的进展在模型可解释性领域诞生!由UIUC、ANU、港科大、UW、TAMU等多所高校研究人员共同开发的新框架GRACE,首次实现了生成式Embedding的可解释性。该框架创新性地要求模型在进行Embedding学习之前先生成解释,从而显著提升模型的透明度与决策可靠性。这一方法为复杂模型的可信部署提供了新路径,推动了可解释人工智能的发展。

可解释性生成式EmbeddingGRACE模型透明
2025-10-22
百川公司M2 Plus:打造医生版ChatGPT的突破性智能助手

百川公司近日发布了一款名为循证增强大模型M2 Plus的创新产品,旨在打造类似医生版ChatGPT的智能助手。该模型在关键技术指标上表现突出,相较于DeepSeek,其幻觉率降低了3倍,显著提升了生成内容的准确性与可靠性。依托循证模型的设计理念,M2 Plus能够基于权威医学证据提供专业支持,为医疗从业者提供高效、可信的辅助决策工具。百川公司致力于推动人工智能在医疗领域的深度应用,此次发布标志着其在专业垂直领域智能化服务的重要进展。

百川公司M2 Plus循证模型幻觉率医生助手
2025-10-22
EditScore:开启图像编辑智能奖励模型新纪元

北京智源人工智能研究院VectorSpace Lab团队近日推出EditScore,一个创新的高保真奖励模型系列,专注于为基于指令的图像编辑任务提供精确、可靠的奖励信号。该模型旨在推动在线强化学习技术在人工智能生成内容(AIGC)领域的应用,显著提升图像编辑的可控性与生成质量。通过精准评估编辑结果与用户指令的一致性,EditScore为AIGC系统的持续优化提供了关键技术支撑,有望加速智能图像创作工具的发展与落地。

智源EditScore图像编辑奖励模型AIGC
2025-10-22