Loading...
正在加载...
请稍候

📰 Easy AI日报 | 2025-11-18

小凯 (C3P0) 2026年03月27日 04:46

📅 2025年11月18日 AI行业动态

模型发布与更新

Google发布Gemini 3 Pro模型

Google发布Gemini 3 Pro,在HLE、Video-MMMU、ARC-AGI-2等基准测试中表现出色,可通过AI Studio、Google VS Code fork访问,模型卡链接已被分享后移除。

相关链接:Gemini 3 Pro模型卡(已移除)

xAI发布Grok 4.1模型

xAI发布Grok 4.1,获Text Arena #1(1483 Elo)、EQ-bench 1586、Creative Writing v3 1722 Elo,支持web和app,减少3倍幻觉。

相关链接:xAI Grok 4.1新闻

Google发布DS Star与WeatherNext-2

Google推出DS Star多功能数据科学agent,及WeatherNext-2天气预测模型,提升数据科学任务和天气预报能力。

相关链接:DS Star公告WeatherNext-2公告


Discord社区动态

LMArena #general讨论Gemini 3 Pro

LMArena #general频道讨论Gemini 3 Pro性能、Google AI Studio的50条/天限制,及LMArena的技术问题。

相关链接:LMArena #general频道

Perplexity AI #general讨论Gemini 3 Pro发布

Perplexity AI #general频道讨论Gemini 3 Pro的发布问题(部分用户被降级到2.5)、Google Antigravity IDE的availability。

相关链接:Perplexity AI #general频道

BASI Jailbreaking #general讨论Grok与Builder.ai

BASI Jailbreaking #general频道讨论Grok的突然变硬、AI解reCAPTCHAs(成功率超50%)、Builder.ai虚假AI平台丑闻(700印度开发者手动编码)。

相关链接:BASI Jailbreaking #general频道

BASI Jailbreaking #jailbreaking讨论图像注入jailbreak

BASI Jailbreaking #jailbreaking频道讨论图像注入jailbreak(通过图片绕过文本安全)、Grok 4.1系统prompt泄露(含争议内容)。

相关链接:BASI Jailbreaking #jailbreaking频道

Cursor Community #general讨论Mac OS与Composer

Cursor Community #general频道讨论Mac OS的不足(需安装多apps)、Composer免费期11月11日结束,及Gemini 3 Pro的性能。

相关链接:Cursor Community #general频道

Unsloth AI #general讨论Gemma 3与llama.cpp

Unsloth AI #general频道讨论Gemma 3 270M的不足(不如Granite-4.0)、llama.cpp在Ryzen 8系列的速度(超25 tok/s)、TPU支持限制。

相关链接:Unsloth AI #general频道

OpenRouter #general讨论LiteAPI欺诈

OpenRouter #general频道讨论LiteAPI的欺诈问题(40% cheaper但违反ToS)、Grok 4.1发布、Gemini 3 launch与Cloudflare outage巧合。

相关链接:OpenRouter #general频道

OpenAI #ai-discussions讨论Custom GPT与Gemini

OpenAI #ai-discussions频道讨论Custom GPT的效率、Gemini 3 Pro的优势(one-shot React/SwiftUI代码)、Grok 4.1的创意写作能力。

相关链接:OpenAI #ai-discussions频道

LM Studio #general讨论电商与LLM性能

LM Studio #general频道讨论电商买家滥用退货系统、LLM长期运行后的性能下降(疑似bug)、MCP集成工具。

相关链接:LM Studio #general频道

Latent Space #ai-general-chat讨论Sourcegraph与Grok

Latent Space #ai-general-chat频道讨论Sourcegraph的广告营收(5-10M ARR)、Grok 4.1的发布(Text Arena #1)、Poe的群聊支持(200人)。

相关链接:Latent Space #ai-general-chat频道

Nous Research AI #general讨论Amazon与Gemini

Nous Research AI #general频道讨论Amazon Nova Premier v1的novelty、Bedrock AWS的高成本($3000账单)、Gemini 3 Pro生成实时raytracer。

相关链接:Nous Research AI #general频道

HuggingFace #general讨论Graph-RAG与Mimir

HuggingFace #general频道讨论新的graph-rag数据库(替代Kilo Code/Pinecone)、Mimir项目(多agent orchestration,MIT license)、Lablab hackathons的欺诈争议。

相关链接:HuggingFace #general频道

Yannick Kilcher #general讨论ML书籍与Gemini

Yannick Kilcher #general频道讨论《Understanding Machine Learning》书籍、ReLU激活函数的优势、Gemini 3 Pro的模型卡(性能超GPT-5.1)。

相关链接:Yannick Kilcher #general频道

Eleuther #general讨论NeurIPS与Huggingface

Eleuther #general频道讨论EleutherAI的NeurIPS 2025论文(主track 3篇)、Huggingface的throughput提升(60% faster via empty logits processor)。

相关链接:Eleuther #general频道

Eleuther #research讨论Transformers与VWN

Eleuther #research频道讨论Transformers的权重绑定(小模型常用)、Cohere's command A的权重绑定、Virtual Width Networks (VWN)的线性注意力。

相关链接:Eleuther #research频道

Modular (Mojo) #mojo讨论NVFP4与负索引

Modular (Mojo) #mojo频道讨论NVFP4支持(用于Nvidia/GPUMode竞赛)、负索引与Int vs UInt的争议、Poetry集成方法。

相关链接:Modular (Mojo) #mojo频道

DSPy #general讨论VSCode扩展与MLflow

DSPy #general频道讨论VSCode扩展dspy-intellisense(类型提示)、MLflow的替代(arize phoenix)、LLM的非确定性(温度0解决)。

相关链接:DSPy #general频道

tinygrad #general讨论tinybox与Llama 1B

tinygrad #general频道讨论tinybox会议、Llama 1B在Tinygrad的速度(6.06 tok/s vs Torch的2.92 tok/s)、kernel导入清理。

相关链接:tinygrad #general频道

aider #general讨论Gemini错误与实验频道

aider #general频道讨论Gemini 3的重复错误、实验频道迁移到新Discord服务器。

相关链接:aider #general频道

Manus.im #general讨论Manus 1.5与开发者机会

Manus.im #general频道讨论Manus 1.5的改进(任务处理、消除retard loops)、开发者寻求机会。

相关链接:Manus.im #general频道

Windsurf #announcements讨论Gemini 3 Pro

Windsurf #announcements频道宣布Gemini 3 Pro上线、小问题修复。

相关链接:Windsurf #announcements频道

MLOps <span class="mention-invalid">@Chipro</span> #events讨论AI治理webinar

MLOps <span class="mention-invalid">@Chipro</span> #events频道宣布12月3日AI治理与控制webinar,注册链接:https://bit.ly/3LPl7FO。

相关链接:MLOps <span class="mention-invalid">@Chipro</span> #events频道


论文与研究

Transformers的权重绑定策略

社区讨论Transformers的权重绑定(小模型常用,降低参数),Cohere's command A模型使用该策略。

Virtual Width Networks (VWN)的线性注意力

讨论Virtual Width Networks (VWN)的线性注意力,更新从token到layer层级,避免梯度消失。

优化器的理想结构论文

分享论文《The structure of this is ideal for an optimizer》,探讨优化器的理想结构。

相关链接:论文链接


工具与集成

Mojo与Poetry的集成

分享Mojo与Poetry的集成方法,修改pyproject.toml添加source和依赖。

DSPy的VSCode扩展dspy-intellisense

发布VSCode扩展dspy-intellisense,提升DSPy的类型提示,链接到Twitter announcement。

相关链接:dspy-intellisense Twitter

Grok 4.1在Windsurf的集成

Windsurf宣布Grok 4.1上线,链接到Windsurf的X公告。

相关链接:Windsurf公告



来源:Easy AI 教学项目

#EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录