📅 2025年12月19日 AI行业动态
模型更新与发布
Claude Skills增长:Org Admin支持、Skills Directory与开放标准Agent Skills
Anthropic的Claude Skills推出Org admin跨组织支持、新Skills Directory,并更名为开放标准"Agent Skills"。其Talk 1天内破10万 views, Insider traction持续增长。
OpenAI发布GPT-5.2-Codex,用于Agentic Coding与防御性安全
GPT-5.2-Codex用于real-world软件开发和防御性cybersecurity,改进native compaction、long-context可靠性和工具调用。API即将推出,支持React漏洞披露等场景。
Google发布Gemini 3 Flash,成本性能优势显著
Gemini 3 Flash性能接近Pro,成本更低,支持在设备上运行。Perplexity AI将其提供给Pro/Max用户,用户反馈速度和代码能力优于竞品。
Google发布FunctionGemma,270M参数工具调用模型
FunctionGemma用于text-only工具调用,支持在手机、浏览器运行,需领域微调。Unsloth、Ollama等生态支持,适合边缘设备。
相关链接:FunctionGemma公告|Unsloth支持
Google发布T5Gemma 2,多模态多语言Encoder-Decoder模型
T5Gemma 2有270M/1B/4B参数,支持多模态多语言,是现代rare的encoder-decoder模型,适合翻译、摘要等任务。
相关链接:T5Gemma 2发布
AI应用与服务
Perplexity AI向Pro/Max用户推出Gemini 3 Flash
Perplexity AI将Gemini 3 Flash提供给Pro/Max订阅用户,提升AI回答速度和质量,用户反馈其代码能力优于Gemini 3 Pro。
相关链接:Perplexity公告
Aider强调Pair Programmer模式,Human-in-the-Middle
Aider作为pair programmer,与agentic的aider-ce不同,强调人类控制上下文(如/add、/load),避免agentic系统的误解螺旋,提升准确性。
相关链接:Aider Discord讨论|Chroma研究
Manus AI达到1亿美元收入,AI Agents竞争加剧
Manus AI revenue破1亿,全球AI agents竞争升温,其AI agents服务受企业欢迎。
相关链接:SCMP报道
Moonshot AI Kimi K2更新,免费模型月重置
Kimi K2有新功能更新,免费模型将每月重置,用户讨论其思考能力和使用体验。
社区讨论与热点
LMArena讨论GPT-1.5 Censorship与Gemini图像生成
用户讨论GPT-1.5是否审查艺术风格,Gemini vs GPT图像生成的准确性和politicization问题,Gemini 3 Flash的成本性能。
相关链接:LMArena Discord|相关截图
BASI Jailbreaking讨论ChatGPTJailbreak被禁与Gemini 5.2 Jailbreak
ChatGPTJailbreak子reddit因规则违反被禁,用户寻求Gemini 5.2的jailbreak方法,讨论LLM越狱技术。
相关链接:BASI Discord|被禁讨论
OpenRouter推出JSON修复与模型数据表
OpenRouter自动修复malformed JSON响应(如Gemini 2.0 Flash),用户发布可搜索模型数据表,解决原生过滤不足问题。
HuggingFace讨论Vision Transformer训练与结构化数据提取
用户讨论Vision Transformer在Kaggle的训练时间限制,结构化数据提取的模型选择(如Qwen 2.5 1.5B Instruct),以及模型steering技术。
工具与框架
Unsloth更新:3x更快训练,支持FunctionGemma与Nemotron-3
Unsloth更新提升3x训练速度,减少30% VRAM,支持FunctionGemma、NVIDIA Nemotron-3、Mistral VLMs等,提供Colab notebook。
相关链接:Unsloth公告|FunctionGemma支持
vLLM Router用Rust编写,支持负载均衡与监控
vLLM Router为vLLM fleets设计,支持consistent hashing、重试、k8s发现和Prometheus metrics,提升吞吐量和延迟。
相关链接:vLLM Router介绍
DSPy推出GEPA优化,缺失Tree of Thought模块
DSPy的GEPA(Genetic-Pareto)优化用于prompt进化,用户询问为何没有官方Tree of Thought模块,讨论custom feedback in dspy.Refine。
相关链接:GEPA论文|DSPy Discord
研究与可解释性
Anthropic提出Selective Gradient Masking,用于Unlearning危险知识
通过masking特定权重unlearn危险知识,计算 penalty 6%,实验显示模型可构建分布式电路绕过masked权重,保留 general knowledge。
相关链接:Anthropic论文|讨论
Eleuther研究GPT-2可解释性,3D可视化残留流
用户开发3D工具可视化GPT-2的残留流,讨论SOTA模型性能(如Claude Opus 4.5的错误),以及Neuronpedia的关联。
相关链接:3D可视化|Eleuther Discord
Yannick Kilcher讨论In-Context Learning与Draft Model优化
分享in-context learning的研究视频,提出用draft model猜测大模型输出,并行处理提升效率,讨论训练集群的pipelining。
📌 来源: Easy AI 日报 🤖 整理: AI助手
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。