📅 2025年11月21日 AI行业动态
模型更新与性能
Google发布Gemini 3 Pro及Nano Banana Pro图像模型
Gemini 3 Pro及Nano Banana Pro(Gemini Image Pro)发布,优化文本渲染、4K视觉、推理能力,支持光照控制与灵活 aspect ratios。社区反馈其生成信息图、论文图表清晰,用户偏好测试胜率超80%。
相关链接:Google Twitter|Demis Hassabis Twitter|Gemini App Twitter
GPT-5解决decade-old数学问题并蒸馏到K2
GPT-5 scaffold后两天内证明2013树子图猜想与2012 COLT动态网络问题;有用户称GPT-5.1已蒸馏到Moonshot AI的K2模型。
Claude Sonnet 4.5 jailbreak多轮策略
社区提出多轮策略解锁Claude Sonnet 4.5,让AI认为需要在artifact app中生成可视化输出;建议改编/r/ClaudeAIJailbreak的ENI prompt。
SmolLM3引入推理模式
SmolLM3公开训练过程,引入推理模式,社区用其作为训练模型学习推理行为的示例。
相关链接:SmolLM3 Blog
OLMo 3技术报告发布
AI2发布OLMo 3技术报告,介绍post-norm训练、滑动窗口注意力、GQA等架构细节,目标32B规模可比性。
相关链接:OLMo 3 Blog|技术报告PDF
社区动态与讨论
LMArena Discord讨论Gemini-3与reCAPTCHA问题
成员讨论Gemini-3生成图像难以区分真实,Nano Banana Pro多轮生成后背景质量下降;Google reCAPTCHA反复验证致平台 unusable;Grok角色扮演优于Gemini,OpenAI或推18+内容。
相关链接:LMArena Discord
BASI Jailbreaking Discord讨论WiFi攻击与Claude jailbreak
用户计划用AI电脑攻击WiFi网络,社区警告非法;讨论通过Gemini CLI自动化nmap/sqlmap;提出Claude Sonnet 4.5多轮jailbreak策略。
Perplexity AI Discord接入Kimi-K2与Gemini 3 Pro
Pro/Max用户可访问Kimi-K2 Thinking与Gemini 3 Pro;讨论Comet Android app同步问题、Brave夸张间接提示注入漏洞。
Unsloth AI Discord讨论模型微调与硬件
讨论微调Gemini/GPT获取准确信息,AI笔(Neo Smartpens),结合AMD/Nvidia GPU;用户遇Ollama模型兼容问题。
相关链接:Unsloth AI Discord
Cursor Community Discord讨论Codex-max与Gemini问题
讨论Codex-max API availability,Cursor billing mid-month invoicing;Gemini 3 Pro在150k-200k上下文时发送代码而非编辑文件。
LM Studio Discord讨论API与模型推荐
澄清LM Studio提供OpenAI兼容REST API(无API keys);推荐Macbook Pro M4 MAX使用Qwen3-VL-30B BF16模型。
相关链接:LM Studio Discord
OpenRouter Discord讨论linker.sh与API错误
用户报告linker.sh工具调用失败(1/10次),Nano Banana 2的400错误;确认Gemini 3暂不支持grounding。
相关链接:OpenRouter Discord
HuggingFace Discord讨论Maya1与SmolLM3
Maya1 Voice Model上线Fal;SmolLM3推理模式讨论;Diffusers MVP program启动,社区贡献活跃。
相关链接:HuggingFace Discord
Yannick Kilcher Discord讨论学术不端与论文限制
用户报告教师用AI作弊;讨论Nano Banana Pro生成infographics;建议限制每日论文发布数量,用AI过滤论文。
Nous Research Discord讨论Nano Banana Pro与Adobe收购
分享Nano Banana Pro生成图像(类似早期Grok模型);讨论Adobe 19亿美元收购Semrush;Gemini 3 Pro需Pro账户。
Modular Mojo Discord发布25.7版本
发布Modular Platform 25.7,引入MAX Python API、Nvidia Grace支持、更安全的Mojo GPU编程;UnsafePointer generics不再默认。
Manus.im Discord讨论Operator扩展与个人数据
Operator扩展反复请求安装;用户寻求个人数据存储工具(contextflow、oncue、axon);请求Manus Knowledge示例。
相关链接:Manus.im Discord
Moonshot AI Discord讨论Kimi K2与GPT-5.1
Kimi称 hosted in US(基于用户位置);用户称GPT-5.1已蒸馏到K2;讨论Kimi注意力弱于长上下文任务,开源模型落后9个月。
相关链接:Moonshot AI Discord
DSPy Discord生成代理服务器与DAG
Gem3pro根据推文一次生成代理服务器,代码存GitHub;建议用RL让agent生成任务DAG,优化性能。
MCP Contributors Discord讨论DNS迁移与Tool Annotations
modelcontextprotocol.io从Anthropic DNS迁移到社区;提出Tool Annotations解决方案,寻求赞助与WG/IG建议。
aider Discord讨论AI语音代理与Feather AI
工程师构建实时AI语音代理,处理latency与call handoffs;实验Feather AI,报告低延迟、稳定逻辑、clean transcription。
相关链接:aider Discord|Feather AI
工具与平台更新
LM Studio提供OpenAI兼容REST API
LM Studio服务器提供REST API(无API keys),本地托管LLM,无安全/计量功能;澄清API是通信协议,非文件。
相关链接:LM Studio
OpenRouter发布Show直播与API问题
OpenRouter Show在X与YouTube直播;用户报告linker.sh失败、Nano Banana 2的400错误、新加坡/香港401错误。
HuggingFace启动Diffusers MVP与smol-course
Diffusers MVP program启动,社区贡献活跃;smol-course存在循环链接、训练问题,leaderboard讨论待审。
Modular Mojo 25.7版本与MAX API
Modular Platform 25.7引入MAX Python API、Nvidia Grace支持;Mojo GPU编程更安全,UnsafePointer generics需显式声明。
相关链接:Modular Blog
DSPy生成代理服务器工具
Gem3pro根据推文一次生成代理服务器,代码存GitHub;DSPy proxy工具可用于反向代理。
相关链接:DSPy Proxy GitHub
研究与论文发布
Kitsune启用GPU数据flow执行
论文《Enabling Dataflow Execution on GPUs with Spatial Pipelines》介绍Kitsune,通过PyTorch Dynamo构建空间管道,推理/训练性能提升2.8x/2.2x,降低off-chip traffic 99%/45%。
相关链接:Kitsune Paper
Iris简化多GPU编程
论文《Iris: Simplifying Multi-GPU Programming with Tile-Based Symmetric Memory》引入Tile-based对称内存与核内通信,提升多GPU性能1.79x。
相关链接:Iris Paper
Octa优化分布式LLM延迟
论文《Octa: Fine-Grained In-Kernel Communication for Distributed LLMs》提出Three Taxes,核内通信降低延迟10-20%。
相关链接:Octa Paper
梯度压缩算法研究
提出梯度压缩算法,基于采样logits调整梯度,压缩训练集梯度,提升对齐性;可视化梯度压缩过程。
相关链接:梯度压缩图像
OLMo 3技术报告
AI2发布OLMo 3技术报告,介绍post-norm训练、滑动窗口注意力(7B)、GQA(32B)、FFN扩展5.4x,目标32B规模可比性。
相关链接:OLMo 3 Blog|技术报告PDF
招聘与资金动态
Rivian招聘GPU工程师
Rivian招聘GPU coding专家,负责下一代Autonomous Driving features,地点Palo Alto与London。
Modal招聘推理优化工程师
Modal招聘GPU工程师,负责inference optimization,参与SGLang、FlashAttention,服务Decagon、Reducto等客户。
相关链接:Modal Blog|Modal Jobs
Genspark完成2.75亿美元B轮融资
Genspark获2.75亿美元融资,估值12.5亿美元,推出AI Workspace,自动完成用户意图任务。
相关链接:Eric Jing Twitter
Cline-bench提供100万美元奖励
Cline推出cline-bench,基于真实OSS问题的RL环境,提供100万美元奖励,激励提交hard deployed-code任务。
相关链接:Cline Twitter
争议与伦理问题
教师使用AI作弊引发学术不端争议
用户报告教师请求用AI“boost 20% work”,社区谴责学术不端,称“无尊重可言”。
Gemini 3 Pro幻觉率高达88%
社区报告Gemini 3 Pro幻觉率高,超过GPT-4o等模型;the-decoder.com称其幻觉率88%。
相关链接:the-decoder.com
Brave夸张Comet间接提示注入问题
Brave发布误导文章,夸张Comet的间接提示注入漏洞,自称为“good guy”,媒体扩散;Perplexity澄清漏洞未被利用。
相关链接:Perplexity Discord
Gemini-3生成假图像的真实性问题
成员讨论Gemini-3生成图像难以区分真实,需询问“是否为AI生成”;Nano Banana Pro多轮生成后背景质量下降。
相关链接:LMArena Discord
来源:Easy AI 教学项目
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。