📅 2025年12月2日 AI行业动态
模型发布与更新
Mistral 3模型家族发布(含Large 3与Ministral 3B/8B/14B)
Mistral AI发布Mistral 3家族,包括675B MoE的Mistral Large 3(开放模型第6名)和Apache 2.0开源的Ministral 3B/8B/14B。vLLM、llama.cpp等生态工具已支持,早期评测显示coding性能强劲。
Apple发布CLaRa-7B-Instruct模型
Apple在Hugging Face上发布CLaRa-7B-Instruct模型。
相关链接:推特消息
Runway预览Gen-4.5模型
Runway预览Gen-4.5模型,提升电影级真实感并开启早期访问。
相关链接:推特消息
DeepSeek V3.2模型发布
DeepSeek V3.2(含Speciale)推理性能强劲,定价低廉,Fireworks已提供API。LisanBench基准测试得分高。
相关链接:基准测试|API availability
Amazon Nova 2.0家族发布
Amazon推出Nova 2.0 Pro(推理)、Lite(速度)、Omni(多模态)及Sonic 2.0(语音到语音)。Pro在τ²-Bench Telecom达93%,Sonic 2.0音频推理排第2。
相关链接:Nova 2.0分析|Sonic 2.0
企业动态
Anthropic收购Bun runtime
Anthropic收购MIT许可的Bun JS/TS runtime,以增强Claude Code。Bun团队加入Anthropic,Claude Code据称6个月内达10亿美元运行率。
相关链接:Anthropic公告|Bun公告
Anthropic推出Claude for Nonprofits计划
Anthropic与GivingTuesday合作,为非营利组织提供折扣计划、新集成和培训。
相关链接:推特消息
Anthropic发布AI工作影响调查
对132名工程师和20万Claude Code会话的调查显示,工程师优先使用Claude解决问题,改变团队动态。
OpenAI"Garlic"模型泄露与GPT-5.1
The Information报道OpenAI"Garlic"模型在coding/推理上优于GPT-4.5。OpenAI发布GPT-5.1 Instant播客,涉及推理、个性控制。
研究与基准测试
测试时计算缩放研究
大规模研究表明,测试时计算策略可提升复杂推理,无需重新训练,效果取决于分配策略而非原始计算。
OPPO FINDER深度研究智能体基准
OPPO的FINDER基准(100任务)和DEFT taxonomy显示,智能体在证据整合、验证和规划上失败。
相关链接:概述
Neel Nanda的可解释性观点
Neel Nanda主张在实用可解释性中研究CoT,反驳“可解释性失败”的炒作,重新定义优先级。
Gradium获7000万美元种子轮融资
巴黎的Gradium以7000万美元种子轮退出 stealth,推出 transcription/synthesis APIs,支持5种欧洲语言。
智能体与工具链
LangSmith Agent Builder公开测试
LangSmith推出无代码智能体构建器,支持 prompt、工具、触发器、MCP和记忆/总结。
LlamaIndex发布LlamaAgents与LlamaSheets
LlamaIndex推出LlamaAgents(工作流模板)和LlamaSheets(电子表格解析),并举办社区办公时间。
Hugging Face Skills发布
Hugging Face Skills是通用智能体上下文,兼容Cursor、Claude Code、Gemini CLI,使用Claude的技能规范。
相关链接:推特消息
Perplexity开源BrowseSafe防御 prompt injection
Perplexity开源BrowseSafe和BrowseSafe-Bench,防御 prompt injection,性能优于安全分类器。
社区与平台 - Reddit
/r/LocalLlama讨论Mistral 3
用户讨论Mistral 3的3B/8B/14B开源模型、Large 3的675B MoE,以及模型 lineup 的 gap。
/r/LocalLlama讨论蒙古GPU租赁
讨论蒙古的GPU租赁市场(B300,$5/hr,InfiniBand),对比CoreWeave/Lambda。
相关链接:Reddit帖子
非技术子reddit讨论OpenAI Code Red
用户讨论OpenAI的Code Red备忘录、GPT-5.1发布,以及付费版可能加入广告。
非技术子reddit讨论互联网挑战
用户讨论“死亡互联网”(AI生成内容)、“广告启示录”(ChatGPT加广告),以及大学教育的缺陷。
社区与平台 - Discord
Discord主题-模型发布
讨论Mistral 3(Large 3、Ministral)、Arcee Trinity模型、Flux 2 Pro排名。
Discord主题-内核优化
讨论PyTorch conv3D慢down、CUDA syncwarp竞争条件、NVIDIA nvfp4_gemm leaderboard。
Discord主题-开发者工具
讨论Manus.im的不稳定性与认证问题、OpenRouter的DeepSeek错误、Cursor的子智能体与DeepSeek集成问题。
Discord主题-安全
讨论RawChat的 stealth mode(GPT4o越狱)、SEED Framework(99.4%抗越狱)、Gemini 3 Pro越狱尝试。
相关链接:RawChat|SEED|UltraBr3aks
Discord主题-行业动态
讨论OpenAI的Alert Red备忘录、400GB VRAM rigs、Gradium的7000万美元融资。
硬件与基础设施
蒙古GPU租赁市场
Fibo Cloud在蒙古提供B300 Blackwell Ultra GPU租赁,每小时5美元,含3.2 Tb/s InfiniBand和预装PyTorch/SLURM。
相关链接:landing page
400GB VRAM rigs构建
用户使用MCIO适配器和旧PSU同步设备,构建6x 3090的400GB VRAM rigs,用于Deepseek 3.2等模型。
NVIDIA nvfp4_gemm竞赛
用户提交nvfp4_gemm内核到NVIDIA leaderboard,eval_better_bench.py降低延迟,讨论CPU队列瓶颈。
来源:Easy AI 教学项目
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。