Gemini-2.5-pro 大语言模型 MathArena 数学能力评测 Gemini-2.5-pro在MathArena评测中展现卓越数学能力 远超其他模型 ⭐0 👥0 2025年4月3日消息:根据MathArena最新发布的大语言模型数学能力评测结果显示,Google的Gemini-2.5-pro以绝对优势领跑,在未污染的高难度数学竞赛中展现出令人瞩目的表现。突破性成绩Gemini-2.5-pro在MathArena平台的严格评测中取得了24.40%的准确率,这一成绩不仅位居榜首,更是与第二名DeepSeek-R1 的4.76%形成鲜明对比,领先优势达到惊人的五
发现《铸剑山庄》 探索deepseek 数据可视化 AI 编程 chatgpt 大语言模型 豆包 kimi LLM 语言模型 国内最好用的AI软件,deepseek、Kimi、豆包!DeepSeek获顶级域名认可!【虎扑锐评】 ⭐0 👥0
RAG NodeRAG Retrieval-AugmentedGeneration 大语言模型 RAG增强系统Node:AI检索革命,效率飙升30%! ⭐0 👥0 随着生成式人工智能技术的飞速发展,检索增强生成(Retrieval-Augmented Generation, RAG)系统正成为提升大语言模型(LLM)准确性和上下文相关性的关键技术。近日,一款名为NodeRAG的创新RAG增强系统引起了业界广泛关注,其独特的异构图结构为RAG工作流带来了革命性突破。NodeRAG:异构图驱动的RAG新范式NodeRAG是一个以图结构为核心的RAG框架,通过引入
ZeroSearch 大语言模型 通义实验室 北京大学 通义实验室、北大发布新技术ZeroSearch 让LLM检索能力激活,成本降低88% ⭐0 👥0 最近,通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架,这一新技术可以在不需要真实搜索的情况下,激活大语言模型的检索能力,并且训练成本降低了惊人的88%。这一突破为大语言模型的训练和应用提供了全新的思路。传统的训练方法通常依赖于真实的搜索引擎来获取信息,这不仅造成了高昂的 API 调用成本,还可能因搜索结果的质量不稳定而影响模型的表现。ZeroSearch 巧妙地通过
大语言模型 人工智能 文字掌握 人类文明 AI进化论——音乐、绘画和舞蹈的DeepSeek时刻 ⭐0 👥0 声明:本文来自于微信公众号 AI微果酱,作者:黄永轩,授权站长之家转载发布。“昔者仓颉作书,而天雨粟,鬼夜哭”——人类掌握文字后,天地为之动容,因为属于人类的文明诞生了。“仓颉作书”出自西汉《淮南子》,距离人类掌握文字已经过去了千年。也许,下一个千年,后人记载2025年大语言模型的涌现时,也会做出类似的描述。当机器掌握文字后,人类文明必然发生嬗变,只是身在局中的我们,感知不到这种天地动容的震撼
大语言模型 LLM 北京大学 宋国杰 北大团队首次系统性评估大语言模型心理特征,推动AI评估新标准 ⭐0 👥0 在人工智能迅猛发展的今天,大语言模型(LLM)展现出了超凡的能力,但如何科学评估它们的 “心智” 特征,比如价值观、性格和社交智能,依旧是一个亟待解决的难题。近期,北京大学的宋国杰教授团队发布了一篇全面的综述论文,系统梳理了大语言模型心理测量学的研究进展,为 AI 的评估提供了新视角。这篇论文名为《大语言模型心理测量学:评估、验证与增强的系统综述》,长达63页,引用了500篇相关文献。随着 LLM
LMEval AI评测 大语言模型 谷歌 谷歌放大招!LMEval开源评测框架上线,AI模型比拼从此更透明 ⭐0 👥0 近日,谷歌正式发布了开源框架 LMEval,旨在为大语言模型(LLM)和多模态模型提供标准化的评测工具。这一框架的推出,不仅简化了跨平台模型性能比较,还支持文本、图像和代码等多领域的评估,展现了谷歌在AI评测领域的最新突破。AIbase为您整理了LMEval的最新动态及其对AI行业的影响。标准化评测:跨平台模型比较更简单LMEval的推出标志着AI模型评测进入了一个新阶段。该框架基于LiteLLM
大语言模型 API聚合服务 OpenRouter 模型调用次数 OpenRouter调整API政策:重新定义免费与付费模型调用限制 ⭐0 👥0 2025 年 4 月 9 日报道:知名大语言模型API聚合服务商OpenRouter近日宣布重大政策调整,对其免费模型调用限制进行了显著变更。根据最新消息,该平台已将每日免费模型调用次数从原先的 200 次调整至 50 次,同时推出新的激励措施——账户余额超过 10 美元的用户将享有每日 1000 次的调用上限。这一政策变更在开发者社区引发了广泛讨论,反映了AI服务提供商在快速发展市场中的战略调整
大语言模型 多模态生成模型 MaaS平台 ViduAPI 智谱与生数科技达成战略合作 专注大模型联合创新 ⭐0 👥0 4月27日,清华大学旗下的两家明星人工智能公司智谱(Z.ai)和生数科技(shengshu.com)宣布达成重大战略合作。此次合作旨在通过双方在大语言模型和多模态生成模型的技术积累与优势,共同推进国产大模型的技术创新与产业落地。智谱和生数科技的合作涵盖了联合研发、产品联动、解决方案整合以及行业协同等多个方面。在产品合作层面,智谱的MaaS平台将接入生数科技的Vidu API,整合Vidu在视频生成