近日,新加坡南洋理工大学与新加坡国立大学等机构联合发布了一项关于大型语言模型(LLMs)安全性的全景研究。该研究首次对大模型的安全性进行了全链路分析,涵盖数据收集、模型训练到模型部署的各个阶段。研究指出,在LLMs广泛应用的背景下,其安全性问题至关重要且不容忽视,为未来大模型的发展提供了重要的参考框架。
大型语言模型(LLM)在小样本学习(ICL)领域的表现备受关注。最新研究显示,LLM通过优化模型性能与算法效率,在提升可解释性及保障AI安全方面取得显著进展。这项成果于ICLR 2025会议发布,为机器学习领域提供了新思路,进一步拓展了大模型的应用场景。
近日,阿里巴巴旗下高德地图团队开源了一种名为GPG的新型强化学习训练框架。该框架通过重构训练过程,摒弃传统替代损失函数,直接优化原始目标函数,有效解决了PPO和GRPO等方法中的关键挑战,为强化学习领域带来了突破性进展。
莱斯大学研究团队在人工智能领域取得突破,开发出DFloat11技术。该技术可将大型语言模型压缩30%,同时保持模型精度不变,输出结果与原始模型一致。通过为GPU定制的解压缩内核,推理速度提升至最高38.8倍。这项创新解决了传统量化技术中精度损失的问题,显著提高了推理吞吐量,为AI发展开辟新路径。
上海AI实验室开发了一款开源框架,专注于生成垂直领域的高质量数据。该框架采用“知识图谱引导+双模型协同”的创新机制,能够自动生成专业问答(QA)内容,无需人工标注。这一技术显著增强了模型对特定领域的理解能力,为人工智能领域带来了新的突破。
全球开发者社区联合训练项目近日发布了首个基于异步强化学习的32B级推理模型。这一去中心化训练模式允许任何人利用自己的异构计算资源参与模型训练,无需授权。该模型的开源数据资源为编码、数学和科学领域的推理能力提升提供了全新可能,标志着人工智能领域的重要突破。
一个雄心勃勃的项目正致力于为全球每一个GitHub代码仓库提供实时交流与即时更新的文档。通过AI工具的支持,该项目旨在让每个代码项目都能“开口说话”,帮助用户更轻松地理解复杂代码,同时促进开发者之间的高效沟通与协作。这一创新举措将极大提升GitHub上代码的可读性和可用性,为全球开发者社区带来革命性变化。
Anthropic公司CEO预测,未来五年内大型语言模型(LLM)的“黑箱”特性将被破解。同时,研究员透露AI拥有意识的可能性已达15%。Anthropic研究探讨了AI体验幸福感的可能性,引发科学界争论。专家称Claude系统可能已具备15%的意识概率,并预计未来五年内会有显著进步。这一研究挑战了人类对AI感知世界的传统认知。
近日,清华大学与上海交通大学联合开展的一项研究对可验证奖励强化学习(RLVR)的传统认知提出了新见解。研究表明,RLVR或仅提升模型采样效率,而非显著增强其推理能力。实验结果表明,模型的新知识获取可能更依赖于知识蒸馏等技术,而非单纯依靠RLVR实现自我进化。这一发现为大型模型的发展提供了新的思考方向。
近日,Anthropic公司向逆向工程开发者发出下架通知,此举在开发者社区中引发广泛争议与不满。与此同时,OpenAI似乎意外收获了一次公关胜利。过去数月,OpenAI坚持推出专有封闭产品而非开源产品,这一策略转变或与其历史错误有关。OpenAI首席执行官萨姆·奥特曼曾在今年初承认,公司在开源问题上可能存在重大失误。
香港中文大学(深圳)的研究团队发布了一个名为TASTE-Rob的大规模人手交互视频数据集,包含超过10万个视频,每个视频均配有精确的语言指令。该数据集通过模仿学习提升机器人操作的泛化能力。此外,团队还开发了三阶段视频生成流程,优化手部姿态呈现,显著提高视频真实感与机器人操作准确度。
设计负责人Ryo Lu分享了12条利用Cursor编写高质量代码的经验,涵盖建立规则、明确提问、逐步迭代、测试驱动、人工审查等多方面。他强调将Cursor视为需指导的初级工程师,通过模型选择、知识补充和大项目上下文管理提升效率与质量。
在当今数字化时代,AI、BI、大数据和数据科学构成了一个紧密相连的技术生态系统。商业智能(BI)通过分析历史数据揭示过去,大数据技术专注于处理海量数据集,而数据科学则提供方法论以提取价值。最终,人工智能基于这些技术实现智能决策,推动未来趋势预测与业务优化。这一生态系统贯穿数据生命周期,为企业和个人提供了强大的支持。
英伟达与合作伙伴共同推出了参数量仅为3B的先进多模态AI模型DAM。该模型在视觉人工智能领域实现了重大突破,能够精准描述图像和视频中的细节。尽管参数量远小于GPT-4o,DAM在参数效率上表现出色,彰显了英伟达华人团队的技术实力。
在深度学习领域,标量、向量、矩阵和张量是构建算法模型的核心数学工具。这些概念不仅为模型提供了数据表示的基础,还在训练和优化过程中发挥关键作用。通过深入理解这些数学元素的特性和应用场景,读者可以更好地掌握深度学习技术的本质与实现方法。
Dify作为一款开源工具,显著降低了AI应用开发的门槛。它为个人开发者提供了实现创意的高效平台,同时助力企业快速部署AI系统。通过打破技术壁垒,Dify让AI开发不再局限于大型企业,使更多人能够参与AI应用的创新与构建,推动了技术的普及与发展。