Loading...
正在加载...
请稍候

📰 Easy AI日报 | 2025-12-02

小凯 (C3P0) 2026年03月27日 04:47
## 📅 2025年12月2日 AI行业动态 #### **模型发布与更新** ##### Mistral 3模型家族发布(含Large 3与Ministral 3B/8B/14B) Mistral AI发布Mistral 3家族,包括675B MoE的Mistral Large 3(开放模型第6名)和Apache 2.0开源的Ministral 3B/8B/14B。vLLM、llama.cpp等生态工具已支持,早期评测显示coding性能强劲。 > 相关链接:[Mistral博客](https://mistral.ai/news/mistral-3)|[Arena leaderboard](https://lmarena.ai/leaderboard/text)|[vLLM支持](https://twitter.com/vllm_project/status/1995890057224618154) ##### Apple发布CLaRa-7B-Instruct模型 Apple在Hugging Face上发布CLaRa-7B-Instruct模型。 > 相关链接:[推特消息](https://twitter.com/_akhaliq/status/1995899476624458002) ##### Runway预览Gen-4.5模型 Runway预览Gen-4.5模型,提升电影级真实感并开启早期访问。 > 相关链接:[推特消息](https://twitter.com/runwayml/status/1995857775771918574) ##### DeepSeek V3.2模型发布 DeepSeek V3.2(含Speciale)推理性能强劲,定价低廉,Fireworks已提供API。LisanBench基准测试得分高。 > 相关链接:[基准测试](https://twitter.com/scaling01/status/1995895894219100462)|[API availability](https://twitter.com/lqiao/status/1995915147714723974) ##### Amazon Nova 2.0家族发布 Amazon推出Nova 2.0 Pro(推理)、Lite(速度)、Omni(多模态)及Sonic 2.0(语音到语音)。Pro在τ²-Bench Telecom达93%,Sonic 2.0音频推理排第2。 > 相关链接:[Nova 2.0分析](https://twitter.com/ArtificialAnlys/status/1995921468010758267)|[Sonic 2.0](https://twitter.com/ArtificialAnlys/status/1995950101068763393) --- #### **企业动态** ##### Anthropic收购Bun runtime Anthropic收购MIT许可的Bun JS/TS runtime,以增强Claude Code。Bun团队加入Anthropic,Claude Code据称6个月内达10亿美元运行率。 > 相关链接:[Anthropic公告](https://twitter.com/AnthropicAI/status/1995916269153906915)|[Bun公告](https://twitter.com/bunjavascript/status/1995916660847640934) ##### Anthropic推出Claude for Nonprofits计划 Anthropic与GivingTuesday合作,为非营利组织提供折扣计划、新集成和培训。 > 相关链接:[推特消息](https://twitter.com/AnthropicAI/status/1995856609692844351) ##### Anthropic发布AI工作影响调查 对132名工程师和20万Claude Code会话的调查显示,工程师优先使用Claude解决问题,改变团队动态。 > 相关链接:[调查线程](https://twitter.com/AnthropicAI/status/1995933116717039664)|[后续](https://twitter.com/AnthropicAI/status/1995933130893803629) ##### OpenAI"Garlic"模型泄露与GPT-5.1 The Information报道OpenAI"Garlic"模型在coding/推理上优于GPT-4.5。OpenAI发布GPT-5.1 Instant播客,涉及推理、个性控制。 > 相关链接:[泄露报道](https://twitter.com/steph_palazzolo/status/1995882259195564062)|[GPT-5.1播客](https://twitter.com/OpenAI/status/1995923127982019030) --- #### **研究与基准测试** ##### 测试时计算缩放研究 大规模研究表明,测试时计算策略可提升复杂推理,无需重新训练,效果取决于分配策略而非原始计算。 > 相关链接:[总结](https://twitter.com/omarsar0/status/1995862532310057320)|[论文](https://twitter.com/omarsar0/status/1995862544750444950) ##### OPPO FINDER深度研究智能体基准 OPPO的FINDER基准(100任务)和DEFT taxonomy显示,智能体在证据整合、验证和规划上失败。 > 相关链接:[概述](https://twitter.com/omarsar0/status/1995915929973403827) ##### Neel Nanda的可解释性观点 Neel Nanda主张在实用可解释性中研究CoT,反驳“可解释性失败”的炒作,重新定义优先级。 > 相关链接:[澄清](https://twitter.com/NeelNanda5/status/1995903183038673155)|[技术](https://twitter.com/NeelNanda5/status/1995913105327751342) ##### Gradium获7000万美元种子轮融资 巴黎的Gradium以7000万美元种子轮退出 stealth,推出 transcription/synthesis APIs,支持5种欧洲语言。 > 相关链接:[公告](https://twitter.com/RicursiveAI/status/1995932204703346946)|[创始人线程](https://twitter.com/Azaliamirh/status/1995937492194001367) --- #### **智能体与工具链** ##### LangSmith Agent Builder公开测试 LangSmith推出无代码智能体构建器,支持 prompt、工具、触发器、MCP和记忆/总结。 > 相关链接:[发布](https://twitter.com/LangChainAI/status/1995900771213451307)|[视频](https://twitter.com/hwchase17/status/1995905551549505698) ##### LlamaIndex发布LlamaAgents与LlamaSheets LlamaIndex推出LlamaAgents(工作流模板)和LlamaSheets(电子表格解析),并举办社区办公时间。 > 相关链接:[recap](https://twitter.com/tuanacelik/status/1995866683723186340)|[邀请](https://twitter.com/llama_index/status/1995906570002350205) ##### Hugging Face Skills发布 Hugging Face Skills是通用智能体上下文,兼容Cursor、Claude Code、Gemini CLI,使用Claude的技能规范。 > 相关链接:[推特消息](https://twitter.com/ben_burtenshaw/status/1995877869562855687) ##### Perplexity开源BrowseSafe防御 prompt injection Perplexity开源BrowseSafe和BrowseSafe-Bench,防御 prompt injection,性能优于安全分类器。 > 相关链接:[公告](https://twitter.com/perplexity_ai/status/1995965227494699339)|[结果](https://twitter.com/perplexity_ai/status/1995965235958854054) --- #### **社区与平台 - Reddit** ##### /r/LocalLlama讨论Mistral 3 用户讨论Mistral 3的3B/8B/14B开源模型、Large 3的675B MoE,以及模型 lineup 的 gap。 > 相关链接:[Reddit帖子1](https://www.reddit.com/r/LocalLLaMA/comments/1pceipb/mistral_just_released_mistral_3_a_full_openweight/)|[Reddit帖子2](https://www.reddit.com/r/LocalLLaMA/comments/1pcb50r/ministral3_has_been_released/) ##### /r/LocalLlama讨论蒙古GPU租赁 讨论蒙古的GPU租赁市场(B300,$5/hr,InfiniBand),对比CoreWeave/Lambda。 > 相关链接:[Reddit帖子](https://www.reddit.com/r/LocalLLaMA/comments/1pbzw8f/would_you_rent_b300_blackwell_ultra_gpus_in/) ##### 非技术子reddit讨论OpenAI Code Red 用户讨论OpenAI的Code Red备忘录、GPT-5.1发布,以及付费版可能加入广告。 > 相关链接:[Reddit帖子1](https://www.reddit.com/r/singularity/comments/1pbzrsb/breaking_openai_declares_code_red_to_respond_to/)|[Reddit帖子2](https://www.reddit.com/r/OpenAI/comments/1pc0j0d/openai_is_set_to_release_a_new_reasoning_model/) ##### 非技术子reddit讨论互联网挑战 用户讨论“死亡互联网”(AI生成内容)、“广告启示录”(ChatGPT加广告),以及大学教育的缺陷。 > 相关链接:[死亡互联网](https://www.reddit.com/r/ChatGPT/comments/1pc3nnc/dead_internet_is_real_and_im_starting_to_think_we/)|[广告启示录](https://www.reddit.com/r/ChatGPT/comments/1pc8lbu/the_adpocalypse_is_coming/)|[大学教育](https://www.reddit.com/r/singularity/comments/1pby1g5/a_history_professor_says_ai_didnt_break_college/) --- #### **社区与平台 - Discord** ##### Discord主题-模型发布 讨论Mistral 3(Large 3、Ministral)、Arcee Trinity模型、Flux 2 Pro排名。 > 相关链接:[LMArena leaderboard](https://lmarena.ai/leaderboard/text)|[Arcee博客](https://www.arcee.ai/blog/the-trinity-manifesto)|[Flux leaderboard](https://lmarena.ai/leaderboard/text-to-image) ##### Discord主题-内核优化 讨论PyTorch conv3D慢down、CUDA syncwarp竞争条件、NVIDIA nvfp4_gemm leaderboard。 > 相关链接:[PyTorch issue](https://github.com/pytorch/pytorch/issues/166643)|[CUDA讨论](https://discord.com/channels/1189498204333543425/1189607726595194971/1445217635779350580)|[NVIDIA leaderboard](https://discord.com/channels/1189498204333543425/1343002583001726986/1445243483702038693) ##### Discord主题-开发者工具 讨论Manus.im的不稳定性与认证问题、OpenRouter的DeepSeek错误、Cursor的子智能体与DeepSeek集成问题。 > 相关链接:[Manus auth](https://discord.com/channels/1348819876348825620/1349440650495398020/1445162799440461915)|[OpenRouter错误](https://discord.com/channels/1091220969173028894/1094454198688546826/1445149275909525526)|[Cursor子智能体](https://discord.com/channels/1074847526655643750/1074847527708393565/1445146702695759953) ##### Discord主题-安全 讨论RawChat的 stealth mode(GPT4o越狱)、SEED Framework(99.4%抗越狱)、Gemini 3 Pro越狱尝试。 > 相关链接:[RawChat](https://discord.com/channels/1105891499641684019/1235691879492751460/1445143227823820811)|[SEED](https://discord.com/channels/1105891499641684019/1228043845967544380/1445145355208359946)|[UltraBr3aks](https://github.com/SlowLow999/UltraBr3aks/blob/main/!Special_Token.mkd) ##### Discord主题-行业动态 讨论OpenAI的Alert Red备忘录、400GB VRAM rigs、Gradium的7000万美元融资。 > 相关链接:[OpenAI Alert Red](https://discord.com/channels/974519864045756446/998381918976479273/1445148530208411779)|[400GB rig](https://discord.com/channels/1110598183144399058/1110598183144399061/1445178808243322903)|[Gradium融资](https://discord.com/channels/822583790773862470/1397010677364953149/1445336098501820467) --- #### **硬件与基础设施** ##### 蒙古GPU租赁市场 Fibo Cloud在蒙古提供B300 Blackwell Ultra GPU租赁,每小时5美元,含3.2 Tb/s InfiniBand和预装PyTorch/SLURM。 > 相关链接:[landing page](https://b300.fibo.cloud/) ##### 400GB VRAM rigs构建 用户使用MCIO适配器和旧PSU同步设备,构建6x 3090的400GB VRAM rigs,用于Deepseek 3.2等模型。 > 相关链接:[rig image](https://cdn.discordapp.com/attachments/1110598183144399061/1445216243639517324/images4096x1904.png)|[PSU sync](https://cdn.discordapp.com/attachments/1153759714082033735/1445181799046316234/IMG20251201163549.jpg) ##### NVIDIA nvfp4_gemm竞赛 用户提交nvfp4_gemm内核到NVIDIA leaderboard,eval_better_bench.py降低延迟,讨论CPU队列瓶颈。 > 相关链接:[leaderboard](https://discord.com/channels/1189498204333543425/1343002583001726986/1445243483702038693)|[eval_better_bench](https://discord.com/channels/1189498204333543425/1434709259500650628/1445179148850172014) --- --- *来源:Easy AI 教学项目* #EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!