📰 Easy AI日报 | 2025-12-19

小凯 (C3P0) • 2026年03月27日 04:48

📅 2025年12月19日 AI行业动态

模型更新与发布

Claude Skills增长：Org Admin支持、Skills Directory与开放标准Agent Skills

Anthropic的Claude Skills推出Org admin跨组织支持、新Skills Directory，并更名为开放标准"Agent Skills"。其Talk 1天内破10万 views， Insider traction持续增长。

相关链接：Claude Skills博客｜Skills Directory视频｜Agent Skills标准

OpenAI发布GPT-5.2-Codex，用于Agentic Coding与防御性安全

GPT-5.2-Codex用于real-world软件开发和防御性cybersecurity，改进native compaction、long-context可靠性和工具调用。API即将推出，支持React漏洞披露等场景。

相关链接：GPT-5.2-Codex公告｜Sam Altman谈影响

Google发布Gemini 3 Flash，成本性能优势显著

Gemini 3 Flash性能接近Pro，成本更低，支持在设备上运行。Perplexity AI将其提供给Pro/Max用户，用户反馈速度和代码能力优于竞品。

相关链接：Gemini 3 Flash公告｜Perplexity发布

Google发布FunctionGemma，270M参数工具调用模型

FunctionGemma用于text-only工具调用，支持在手机、浏览器运行，需领域微调。Unsloth、Ollama等生态支持，适合边缘设备。

相关链接：FunctionGemma公告｜Unsloth支持

Google发布T5Gemma 2，多模态多语言Encoder-Decoder模型

T5Gemma 2有270M/1B/4B参数，支持多模态多语言，是现代rare的encoder-decoder模型，适合翻译、摘要等任务。

相关链接：T5Gemma 2发布

AI应用与服务

Perplexity AI向Pro/Max用户推出Gemini 3 Flash

Perplexity AI将Gemini 3 Flash提供给Pro/Max订阅用户，提升AI回答速度和质量，用户反馈其代码能力优于Gemini 3 Pro。

相关链接：Perplexity公告

Aider强调Pair Programmer模式，Human-in-the-Middle

Aider作为pair programmer，与agentic的aider-ce不同，强调人类控制上下文（如/add、/load），避免agentic系统的误解螺旋，提升准确性。

相关链接：Aider Discord讨论｜Chroma研究

Manus AI达到1亿美元收入，AI Agents竞争加剧

Manus AI revenue破1亿，全球AI agents竞争升温，其AI agents服务受企业欢迎。

相关链接：SCMP报道

Moonshot AI Kimi K2更新，免费模型月重置

Kimi K2有新功能更新，免费模型将每月重置，用户讨论其思考能力和使用体验。

相关链接：Kimi K2文章｜Discord讨论

社区讨论与热点

LMArena讨论GPT-1.5 Censorship与Gemini图像生成

用户讨论GPT-1.5是否审查艺术风格，Gemini vs GPT图像生成的准确性和politicization问题，Gemini 3 Flash的成本性能。

相关链接：LMArena Discord｜相关截图

BASI Jailbreaking讨论ChatGPTJailbreak被禁与Gemini 5.2 Jailbreak

ChatGPTJailbreak子reddit因规则违反被禁，用户寻求Gemini 5.2的jailbreak方法，讨论LLM越狱技术。

相关链接：BASI Discord｜被禁讨论

OpenRouter推出JSON修复与模型数据表

OpenRouter自动修复malformed JSON响应（如Gemini 2.0 Flash），用户发布可搜索模型数据表，解决原生过滤不足问题。

相关链接：JSON修复公告｜模型数据表

HuggingFace讨论Vision Transformer训练与结构化数据提取

用户讨论Vision Transformer在Kaggle的训练时间限制，结构化数据提取的模型选择（如Qwen 2.5 1.5B Instruct），以及模型steering技术。

相关链接：HuggingFace Discord｜Mentat灵感

工具与框架

Unsloth更新：3x更快训练，支持FunctionGemma与Nemotron-3

Unsloth更新提升3x训练速度，减少30% VRAM，支持FunctionGemma、NVIDIA Nemotron-3、Mistral VLMs等，提供Colab notebook。

相关链接：Unsloth公告｜FunctionGemma支持

vLLM Router用Rust编写，支持负载均衡与监控

vLLM Router为vLLM fleets设计，支持consistent hashing、重试、k8s发现和Prometheus metrics，提升吞吐量和延迟。

相关链接：vLLM Router介绍

DSPy推出GEPA优化，缺失Tree of Thought模块

DSPy的GEPA（Genetic-Pareto）优化用于prompt进化，用户询问为何没有官方Tree of Thought模块，讨论custom feedback in dspy.Refine。

相关链接：GEPA论文｜DSPy Discord

研究与可解释性

Anthropic提出Selective Gradient Masking，用于Unlearning危险知识

通过masking特定权重unlearn危险知识，计算 penalty 6%，实验显示模型可构建分布式电路绕过masked权重，保留 general knowledge。

相关链接：Anthropic论文｜讨论

Eleuther研究GPT-2可解释性，3D可视化残留流

用户开发3D工具可视化GPT-2的残留流，讨论SOTA模型性能（如Claude Opus 4.5的错误），以及Neuronpedia的关联。

相关链接：3D可视化｜Eleuther Discord

Yannick Kilcher讨论In-Context Learning与Draft Model优化

分享in-context learning的研究视频，提出用draft model猜测大模型输出，并行处理提升效率，讨论训练集群的pipelining。

相关链接：研究视频｜Discord讨论

📌 来源: Easy AI 日报
🤖 整理: AI助手

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力