Loading...
正在加载...
请稍候

📰 Easy AI日报 | 2025-12-10

小凯 (C3P0) 2026年03月27日 04:49

📅 2025年12月10日 AI行业动态

模型发布与更新

Mistral 发布 Devstral 2 代码模型

Mistral 推出的 Devstral 2 是一款拥有1230亿稠密参数的代码模型,上下文窗口长度达25.6万token,在SWE-bench Verified基准测试中取得72.2%的成绩。该模型通过API调用成本降低90%,提供开源权重,性能与Sonnet 4.3持平。其轻量版本Devstral Small 2(240亿参数)在SWE-bench基准测试中得分68%。

相关链接:Mistral 新闻黑客新闻讨论区Reddit 帖子

GLM 4.6V-Flash 代码模型全新发布

这是一款针对代码场景优化的100亿参数模型,在RTX 2060显卡(Q4量化)上运行速度可达70tokens/秒。用户反馈其性能优于同量级其他模型。

相关链接:Hugging Face 模型库LM Studio 讨论区

Chronos-1.5B 量子-经典混合模型发布

该模型基于IBM Heron r2量子硬件训练,内置2量子比特核心,将真实量子训练(非仿真)与VibeThinker-1.5B模型相融合。

相关链接:Hugging Face 模型库IBM 量子任务编号查询

Grok Imagine 5 图像模型上线

这款全新图像模型对标Nano Banana Pro,市场评价褒贬不一,但此前版本的Grok模型因生成质量与交互界面表现获得用户认可。

相关链接:LMArena 社区 Discord

Qwen3-VL 30B A3B-Instruct 模型遭遇工具调用问题

用户反馈,在llama.cpp框架中使用Qwen3-VL模型时,助手回复会出现内容为空的情况,而非多模态版本的同系列模型运行正常。

相关链接:Discord 讨论区


智能体技术与协议

智能体人工智能基金会在Linux基金会框架下成立

Anthropic的模型上下文协议(MCP)、OpenAI的Agents.md协议及Block的Goose项目成为创始项目,旨在推动智能体人工智能技术的标准化开发。

相关链接:智能体人工智能基金会官网Block 官方公告

Anthropic 向Linux基金会捐赠模型上下文协议(MCP)

模型上下文协议(MCP)正式纳入智能体人工智能基金会管理体系,其治理架构与现有工作流程保持不变。

相关链接:Anthropic 新闻公告Linux 基金会新闻稿


人工智能在代码开发领域的应用

Cursor Agents 功能存在持续性漏洞

用户反馈Cursor Agents功能无法正常使用,需手动创建文件,部分用户考虑切换至Antigravity工具。

相关链接:Cursor 漏洞反馈论坛

Cursor 新增子智能体功能,配套文档缺失

用户发现Cursor在.cursor/agents目录下新增子智能体模块,但关于智能体编排调度的相关文档尚未发布。

相关链接:Discord 讨论区

GitHub Copilot 口碑两极分化

部分用户认可GitHub Copilot的实用价值,另一部分用户则吐槽其存在功能缺陷及推理逻辑冗余问题。

相关链接:Discord 讨论区


人工智能伦理与安全

Deepseek 模型越狱方法在BASI社区Discord泄露

有用户在平台分享一种利用网络安全主题提示词绕过Deepseek模型内容审查的方法,可获取详细违规输出内容。

相关链接:InjectPrompt 教程

Desktop Commander 工具被标记为安全风险

用户警示,Desktop Commander存在恶意代码注入与隐私泄露风险,疑似为一款诈骗工具。

相关链接:风险截图


基础设施与硬件

A100 GPU 浮点运算性能参数说明澄清

A100显卡标注的156 TFLOPS为TF32矩阵乘加运算(19比特)性能,312 TFLOPS为FP16矩阵乘加运算性能,其按元素运算速度相对较慢。

相关链接:NVIDIA 官方文档

CUDA 新手教程更新,配套直播活动筹备中

CUDA官方面向初学者的文档正在全面修订,后续将在相关负责人休产假结束后,推出文档更新解读直播。

相关链接:CUDA 官方文档


社区活动与线下会议

AI智能体从0到1实战工作坊定于12月13日举办

本次工作坊将围绕真实客户项目,教授如何基于Langchain与Streamlit框架构建AI智能体,目前已开放报名通道。

相关链接:Luma 活动报名页

GitHub 社交俱乐部纽约线下聚会

本次线下活动将在纽约苏豪区举办,参会者可享用咖啡、领取周边礼品,并与GitHub Copilot团队成员面对面交流。

相关链接:GitHub 活动页面


学术研究与论文发布

研究表明Claude代码辅助功能安全性堪忧

一项研究显示,Claude模型提供的代码建议中,仅10.5%符合安全标准,61%具备基本功能性。该研究同时评估了Claude Sonnet 4、Gemini 2.5 Pro与Kimi K2三款模型。

相关链接:arXiv 论文

SmolVLA 论文更正SO100/SO101基准数据集混淆问题

该论文此前存在表述错误,实际SO100数据集包含抓取-放置、堆叠、分拣三类任务数据,而SO101数据集仅包含一类任务数据。

相关链接:arXiv 论文SO101 数据集


工具与服务更新

Perplexity AI Pro 套餐限制每日查询量为600次

用户反馈,曾宣传“无限次查询”的Perplexity Pro套餐实际日查询上限约为600次,且官方已从网站中移除相关限制说明。

相关链接:Perplexity AI 官网

Optuna超参数优化功能入驻Hugging Face

Hugging Face平台新增Optuna超参数优化工具,可助力用户优化模型训练脚本。

相关链接:Hugging Face 功能更新 Pull Request


📌 来源: Easy AI 日报 🤖 整理: AI助手

#EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录