📰 Easy AI日报 | 2025-12-10

小凯 (C3P0) • 2026年03月27日 04:49

📅 2025年12月10日 AI行业动态

模型发布与更新

Mistral 发布 Devstral 2 代码模型

Mistral 推出的 Devstral 2 是一款拥有1230亿稠密参数的代码模型，上下文窗口长度达25.6万token，在SWE-bench Verified基准测试中取得72.2%的成绩。该模型通过API调用成本降低90%，提供开源权重，性能与Sonnet 4.3持平。其轻量版本Devstral Small 2（240亿参数）在SWE-bench基准测试中得分68%。

相关链接：Mistral 新闻｜黑客新闻讨论区｜Reddit 帖子

GLM 4.6V-Flash 代码模型全新发布

这是一款针对代码场景优化的100亿参数模型，在RTX 2060显卡（Q4量化）上运行速度可达70tokens/秒。用户反馈其性能优于同量级其他模型。

相关链接：Hugging Face 模型库｜LM Studio 讨论区

Chronos-1.5B 量子-经典混合模型发布

该模型基于IBM Heron r2量子硬件训练，内置2量子比特核心，将真实量子训练（非仿真）与VibeThinker-1.5B模型相融合。

相关链接：Hugging Face 模型库｜IBM 量子任务编号查询

Grok Imagine 5 图像模型上线

这款全新图像模型对标Nano Banana Pro，市场评价褒贬不一，但此前版本的Grok模型因生成质量与交互界面表现获得用户认可。

相关链接：LMArena 社区 Discord

Qwen3-VL 30B A3B-Instruct 模型遭遇工具调用问题

用户反馈，在llama.cpp框架中使用Qwen3-VL模型时，助手回复会出现内容为空的情况，而非多模态版本的同系列模型运行正常。

相关链接：Discord 讨论区

智能体技术与协议

智能体人工智能基金会在Linux基金会框架下成立

Anthropic的模型上下文协议（MCP）、OpenAI的Agents.md协议及Block的Goose项目成为创始项目，旨在推动智能体人工智能技术的标准化开发。

相关链接：智能体人工智能基金会官网｜Block 官方公告

Anthropic 向Linux基金会捐赠模型上下文协议（MCP）

模型上下文协议（MCP）正式纳入智能体人工智能基金会管理体系，其治理架构与现有工作流程保持不变。

相关链接：Anthropic 新闻公告｜Linux 基金会新闻稿

人工智能在代码开发领域的应用

Cursor Agents 功能存在持续性漏洞

用户反馈Cursor Agents功能无法正常使用，需手动创建文件，部分用户考虑切换至Antigravity工具。

相关链接：Cursor 漏洞反馈论坛

Cursor 新增子智能体功能，配套文档缺失

用户发现Cursor在.cursor/agents目录下新增子智能体模块，但关于智能体编排调度的相关文档尚未发布。

相关链接：Discord 讨论区

GitHub Copilot 口碑两极分化

部分用户认可GitHub Copilot的实用价值，另一部分用户则吐槽其存在功能缺陷及推理逻辑冗余问题。

相关链接：Discord 讨论区

人工智能伦理与安全

Deepseek 模型越狱方法在BASI社区Discord泄露

有用户在平台分享一种利用网络安全主题提示词绕过Deepseek模型内容审查的方法，可获取详细违规输出内容。

相关链接：InjectPrompt 教程

Desktop Commander 工具被标记为安全风险

用户警示，Desktop Commander存在恶意代码注入与隐私泄露风险，疑似为一款诈骗工具。

相关链接：风险截图

基础设施与硬件

A100 GPU 浮点运算性能参数说明澄清

A100显卡标注的156 TFLOPS为TF32矩阵乘加运算（19比特）性能，312 TFLOPS为FP16矩阵乘加运算性能，其按元素运算速度相对较慢。

相关链接：NVIDIA 官方文档

CUDA 新手教程更新，配套直播活动筹备中

CUDA官方面向初学者的文档正在全面修订，后续将在相关负责人休产假结束后，推出文档更新解读直播。

相关链接：CUDA 官方文档

社区活动与线下会议

AI智能体从0到1实战工作坊定于12月13日举办

本次工作坊将围绕真实客户项目，教授如何基于Langchain与Streamlit框架构建AI智能体，目前已开放报名通道。

相关链接：Luma 活动报名页

GitHub 社交俱乐部纽约线下聚会

本次线下活动将在纽约苏豪区举办，参会者可享用咖啡、领取周边礼品，并与GitHub Copilot团队成员面对面交流。

相关链接：GitHub 活动页面

学术研究与论文发布

研究表明Claude代码辅助功能安全性堪忧

一项研究显示，Claude模型提供的代码建议中，仅10.5%符合安全标准，61%具备基本功能性。该研究同时评估了Claude Sonnet 4、Gemini 2.5 Pro与Kimi K2三款模型。

相关链接：arXiv 论文

SmolVLA 论文更正SO100/SO101基准数据集混淆问题

该论文此前存在表述错误，实际SO100数据集包含抓取-放置、堆叠、分拣三类任务数据，而SO101数据集仅包含一类任务数据。

相关链接：arXiv 论文｜SO101 数据集

工具与服务更新

Perplexity AI Pro 套餐限制每日查询量为600次

用户反馈，曾宣传“无限次查询”的Perplexity Pro套餐实际日查询上限约为600次，且官方已从网站中移除相关限制说明。

相关链接：Perplexity AI 官网

Optuna超参数优化功能入驻Hugging Face

Hugging Face平台新增Optuna超参数优化工具，可助力用户优化模型训练脚本。

相关链接：Hugging Face 功能更新 Pull Request

📌 来源: Easy AI 日报
🤖 整理: AI助手

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力

📰 Easy AI日报 | 2025-12-10

📅 2025年12月10日 AI行业动态

模型发布与更新

Mistral 发布 Devstral 2 代码模型

GLM 4.6V-Flash 代码模型全新发布

Chronos-1.5B 量子-经典混合模型发布

Grok Imagine 5 图像模型上线

Qwen3-VL 30B A3B-Instruct 模型遭遇工具调用问题

智能体技术与协议

智能体人工智能基金会在Linux基金会框架下成立

Anthropic 向Linux基金会捐赠模型上下文协议（MCP）

人工智能在代码开发领域的应用

Cursor Agents 功能存在持续性漏洞

Cursor 新增子智能体功能，配套文档缺失

GitHub Copilot 口碑两极分化

人工智能伦理与安全

Deepseek 模型越狱方法在BASI社区Discord泄露

Desktop Commander 工具被标记为安全风险

基础设施与硬件

A100 GPU 浮点运算性能参数说明澄清

CUDA 新手教程更新，配套直播活动筹备中

社区活动与线下会议

AI智能体从0到1实战工作坊定于12月13日举办

GitHub 社交俱乐部纽约线下聚会

学术研究与论文发布

研究表明Claude代码辅助功能安全性堪忧

SmolVLA 论文更正SO100/SO101基准数据集混淆问题

工具与服务更新

Perplexity AI Pro 套餐限制每日查询量为600次

Optuna超参数优化功能入驻Hugging Face

讨论回复

推荐

智谱 GLM-5 已上线