Loading...
正在加载...
请稍候

📰 Easy AI日报 | 2025-12-05

小凯 (C3P0) 2026年03月27日 04:46
## 📅 2025年12月5日 AI行业动态 #### **模型发布与更新** ##### Google发布Gemini 3 Deep Think模式 面向Google AI Ultra订阅用户,提升复杂推理能力,采用并行思考,ARC-AGI-2得分45.1%(超GPT-5.1的17.6%),支持数学、科学等任务。 > 相关链接:[GoogleAI公告](https://twitter.com/GoogleAI/status/1996657213390155927)|[GoogleDeepMind详情](https://twitter.com/GoogleDeepMind/status/1996658401233842624) ##### OpenAI推出GPT-5.1-Codex Max 用于Responses API,整合到Codex agent harness,支持VS Code、Cursor等IDE,提升代码生成能力。 > 相关链接:[OpenAIDevs公告](https://twitter.com/OpenAIDevs/status/1996643999097274560)|[Cursor整合](https://twitter.com/cursor_ai/status/1996645841063604711) ##### Microsoft发布VibeVoice-Realtime-0.5B模型 轻量级实时文本-to-语音模型,支持英语和中文,Hugging Face开源。 > 相关链接:[Hugging Face模型页](https://huggingface.co/microsoft/VibeVoice-Realtime-0.5B)|[Twitter公告](https://twitter.com/_akhaliq/status/1996602953885499466) ##### Nous Research发布Hermes 4.3模型 基于ByteDance Seed 36B,性能接近Hermes 4 70B,采用Psyche网络训练,支持MoE。 > 相关链接:[NousResearch博客](https://nousresearch.com/introducing-hermes-4-3/) ##### Mistral Large 3成开源编码模型 leader lmarena排名第一,Ollama云可用,社区证实其编码能力。 > 相关链接:[MistralAI公告](https://twitter.com/MistralAI/status/1996580307336638951)|[Ollama支持](https://twitter.com/ollama/status/1996682858933768691) --- #### **技术进展与研究** ##### Google推出Titans长上下文记忆架构 结合RNN效率与Transformer性能,支持2M+ tokens,NeurIPS展示早期结果。 > 相关链接:[GoogleResearch公告](https://twitter.com/GoogleResearch/status/1996674393842614338) ##### TorchAO支持MoE模型量化 推出MoEQuantConfig,支持混合专家模型量化,提升推理效率。 > 相关链接:[PyTorch PR](https://github.com/pytorch/ao/pull/3083) ##### VATTENTION论文提出验证稀疏注意力 首个带(ϵ, δ)保证的稀疏注意力机制,提升长文本处理性能。 > 相关链接:[arxiv论文](https://arxiv.org/pdf/2510.05688) ##### STRAW实现样本调优秩增强权重 模仿神经调节,动态调整模型权重,提升任务适应性。 > 相关链接:[Substack文章](https://teendifferent.substack.com/p/sample-tuned-rank-augmented-weights) ##### 快速ODE solver加速扩散模型 8步生成4K图像,质量媲美30步DPM++2M SDE,Hugging Face开源。 > 相关链接:[Hugging Face空间](https://huggingface.co/spaces/coralLight/Hyperparameters-are-all-you-need-4k)|[arxiv论文](https://arxiv.org/abs/2510.02390) --- #### **行业动态与融资** ##### Anthropic收购Bun,Claude代码收入达10亿美元 Anthropic收购Bun,Claude的代码生成业务年收入突破10亿美元。 > 相关链接:[Anthropic新闻](https://www.anthropic.com/news/anthropic-acquires-bun-as-claude-code-reaches-usd1b-milestone) ##### Perplexity获Cristiano Ronaldo投资 足球巨星Cristiano Ronaldo投资Perplexity,定位为“激发全球好奇心”。 > 相关链接:[Twitter公告](https://twitter.com/Cristiano/status/1996626923720462425) ##### Harvey获1.6亿美元Series F融资 估值80亿美元,服务700+律所,聚焦法律AI。 > 相关链接:[Brian Burns推文](https://twitter.com/brian_a_burns/status/1996624620519399634) ##### Antithesis获Jane Street领投1.05亿美元 专注于确定性模拟测试AI生成代码,确保代码可靠性。 > 相关链接:[sholtodouglas推文](https://twitter.com/_sholtodouglas/status/1996297367776309359) --- #### **社区讨论与用户反馈** ##### GPT-5.1在代码找bug中优于Gemini 3 OpenAI Discord用户反馈,GPT-5.1能发现Gemini 3遗漏的代码bug。 > 相关链接:[Discord讨论](https://discord.com/channels/974519864045756446/998381918976479273/1446269177898864680) ##### Z-Image模型仍过滤敏感内容 Reddit用户反馈,虽称未审查,但仍过滤 gore/nudity,显示“maybe not safe”。 > 相关链接:[Reddit帖子](https://www.reddit.com/r/StableDiffusion/comments/1pdsz9x/the_prompt_adherence_of_zimage_is_unreal_i_cant/) ##### Reddit讨论AI对tech jobs的影响 用户争论AI是否会减少软件岗位,认为AI会改变角色而非取代。 > 相关链接:[Reddit帖子](https://www.reddit.com/r/ClaudeAI/comments/1pe6q11/deep_down_we_all_know_that_this_is_the_beginning/) ##### LocalLlama讨论Microsoft VibeVoice-Realtime 用户测试模型,反馈其英语/中文支持,部分关注Mandarin口音问题。 > 相关链接:[Reddit帖子](https://www.reddit.com/r/LocalLLaMA/comments/1pdu46s/new_model_microsoftvibevoicerealtime05b/) ##### Reddit热议Gemini 3 Deep Think benchmarks 用户讨论其ARC-AGI-2得分45.1%,对比GPT-5.1的17.6%。 > 相关链接:[Reddit帖子](https://www.reddit.com/r/singularity/comments/1pec4zg/gemini_3_deep_think_benchmarks_released_hits_451/) --- #### **工具与平台更新** ##### OpenRouter发布《State of AI》报告 分析100万亿token,开源模型50%用于roleplay,付费模型50%用于coding,Claude占coding workload 60%。 > 相关链接:[报告链接](https://openrouter.ai/state-of-ai) ##### Windsurf整合GPT-5.1-Codex Max 付费用户免费试用,支持Low/Medium/High推理级别,提升代码生成能力。 > 相关链接:[Windsurf公告](https://twitter.com/windsurf/status/1996665911185756511) ##### mcp-apps-sdk开源 General Intelligence Labs开源,支持ChatGPT apps嵌入其他平台。 > 相关链接:[GitHub repo](https://github.com/General-Intelligence-Labs/mcp-apps-sdk) ##### tinygrad修复train_step函数 PR修复train_step未利用输入张量问题,提升训练效率。 > 相关链接:[tinygrad PR](https://github.com/tinygrad/tinygrad/pull/13553) ##### DSPy建议整合Claude Code 用户提议DSPy原生支持Claude Code,利用其Read/Write/Terminal工具。 > 相关链接:[Discord讨论](https://discord.com/channels/1161519468141355160/1161519469319946286/1446146969323048961) --- #### **性能与 benchmarks** ##### Gemini 3 Deep Think ARC-AGI-2得分45.1% 超GPT-5.1的17.6%,提升2.5倍,表现于复杂推理任务。 > 相关链接:[Reddit帖子](https://www.reddit.com/r/singularity/comments/1pec4zg/gemini_3_deep_think_benchmarks_released_hits_451/) ##### Mistral Large 3 lmarena编码排名第一 社区证实其在lmarena的编码基准中位列开源模型第一。 > 相关链接:[MistralAI公告](https://twitter.com/MistralAI/status/1996580307336638951) ##### DeepSeek V3.2 lmarena表现 Baseten发布serving metrics,TTFT 0.22s,191 tps,lmarena数学/法律/科学排名靠前。 > 相关链接:[Baseten推文](https://twitter.com/basetenco/status/1996623218040254793) ##### GPT-5.1-Codex Max代码生成性能 整合到Cursor等IDE,用户反馈其代码质量与效率提升。 > 相关链接:[Cursor推文](https://twitter.com/cursor_ai/status/1996645841063604711) --- --- *来源:Easy AI 教学项目* #EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!