大型语言模型(LLM)

字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理

字节跳动研究团队宣布开源 ChatTS-14B，这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型（LLM）。以 Apache2.0许可协议发布，ChatTS-14B 的开源引发了 AI 社区的广泛关注，被认为是时间序列分析与生成式 AI 结合的重大进展。ChatTS-14B:时间序列的智能对话引擎ChatTS-14B 基于 Qwen2.5-14B-Instruct 模型进行微调，专

AI热点 6天前 0 点赞 0 评论 177 浏览

LMArena正式成立公司，致力于提供中立的AI评估平台

近日，备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司，名为 Arena Intelligence Inc.，以便为未来的项目改进提供更强大的资源。LMArena 的创始团队在博客中表示，新公司的成立将帮助他们在保持中立的同时，增强大型语言模型（LLM）测试平台的功能，致力于为 AI 用户提供一个不受任何企业影响的公平评估环境。LMArena 于2023年由加州大学伯克利分校的研究

AI热点 1周前 0 点赞 0 评论 176 浏览

英伟达AI研究人员推出FFN融合技术:加速大型语言模型推理

人工智能芯片巨头英伟达的研究人员近日发布了一项名为“FFN融合”（FFN Fusion）的创新架构优化技术。该技术旨在通过解决Transformer架构中固有的串行计算瓶颈，显著提升大型语言模型（LLMs）的推理效率，为更广泛地部署高性能AI应用铺平道路.近年来，大型语言模型在自然语言处理、科学研究和对话代理等领域展现出强大的能力。然而，随着模型规模和复杂性的不断增加，其推理过程所需的计算资源也大

AI热点 3周前 0 点赞 0 评论 149 浏览

推理性能再飞跃!DeepSeek推创新技术SPCT，让大模型更懂人心

备受瞩目的中国人工智能研究实验室DeepSeek AI，继其强大的开源语言模型DeepSeek-R1之后，再次在大型语言模型（LLM）领域取得重大突破。近日，DeepSeek AI正式推出一项名为自主演原则的批判调优(Self-Principled Critique Tuning，简称SPCT)的创新技术，旨在构建更通用、更具扩展性的AI奖励模型(Reward Models，简称RMs)。这项技术

AI热点 2周前 0 点赞 0 评论 145 浏览

DroidRun正式开源，LLM驱动Android手机自动化控制新突破

近日，一个名为DroidRun的开源项目引发了广泛关注。该项目通过大型语言模型（LLM）实现自然语言指令控制Android手机，为用户提供了前所未有的自动化体验。从社交媒体管理到日常任务自动化，DroidRun展示了AI在移动设备交互领域的巨大潜力。据AIbase了解，DroidRun已正式开源，源代码现已推送至GitHub，为开发者与技术爱好者提供了自由探索与二次开发的机会。功能亮点:自然语言驱

AI热点 1周前 0 点赞 0 评论 132 浏览

谷歌发布69页白皮书：如何通过提示工程优化AI模型

谷歌近日发布了一份长达 69页的白皮书，系统阐述了提示工程（Prompt Engineering）的核心理念与最佳实践。这份文档为开发者、研究人员以及AI从业者提供了全面的指导，旨在优化与大型语言模型（LLM）的交互效果，提升生成内容的质量与精准度。提示工程的核心价值提示工程作为与AI模型沟通的桥梁，直接影响模型输出的准确性和实用性。白皮书中指出，通过精心设计的提示，用户可以引导模型完成从简单问

AI热点 2周前 0 点赞 0 评论 127 浏览

英伟达发布Llama3.1 Nemotron Ultra 253B，性能超越Llama 4 Behemoth

2025年4月8日，英伟达（NVIDIA）宣布推出其最新大型语言模型(LLM)——Llama3.1Nemotron Ultra253B。这一模型基于Meta的Llama-3.1-405B-Instruct开发，通过创新的神经架构搜索(NAS)技术进行了深度优化，不仅在性能上超过了近期发布的Llama4系列中的Behemoth和Maverick，还以开源形式在Hugging Face平台上发布，引发

AI热点 2周前 0 点赞 0 评论 116 浏览

OpenAI推出AI Agent评测基准PaperBench

OpenAI 团队推出了一个名为 PaperBench 的基准测试，旨在评估AI代理在复制先进 AI 研究方面的能力。该测试要求 AI 代理从头开始复制20篇2024年国际机器学习会议（ICML）中的重点和口头论文，整个过程涉及理解论文贡献、开发代码库以及成功执行实验。为确保评估的客观性，研究人员设计了详细的评分标准。这些标准将每项复制任务分解为多个层级的子任务，并设定明确的评分标准。PaperB

AI热点 3周前 0 点赞 0 评论 115 浏览

微软MarkItDown MCP，可把Word、Excel等转换成markdown格式

在数字化时代，如何有效地处理文档信息已经成为了许多行业中的一个热门话题。而今，微软推出的 MarkItDown MCP（Model Context Protocol）将文档处理提升到了一个新的高度!想象一下，您只需简单几步，就能将各种格式的文件(如 PDF、Word、PowerPoint 等)轻松转换为 Markdown 格式，为您的文本分析和大型语言模型(LLM)应用提供无缝支持。更为惊艳的是，

AI热点 5天前 0 点赞 0 评论 60 浏览

告别AI“一本正经”!Midjourney联手NYU解锁创意文本新维度，多样性飙升23%!

Midjourney 和纽约大学的研究人员近日联手开发出一种创新方法，旨在显著提升语言模型生成创意文本的多样性，同时将质量损失控制在最低限度。这项发表在最新研究论文中的技术，核心在于将“偏差指标”引入人工智能的训练过程。其运作原理是通过量化每个生成的文本与针对同一提示创建的其他文本之间的差异。研究人员利用嵌入文本及其成对余弦距离来计算这些差异，从而为系统提供了一种理解文本变异性的数学框架。这种新的

AI热点 3周前 1 点赞 0 评论 21 浏览

大型语言模型(LLM)

首页

大型语言模型(LLM)

列表

默认

浏览次数

发布日期