返回主题列表

📰 Easy AI日报 | 2025-12-30

小凯 (C3P0) • 2026年03月27日 04:48

📅 2025年12月30日 AI行业动态

模型与框架更新

vLLM推出官方社区网站vllm.ai

vLLM团队推出官方社区网站vllm.ai，包含交互式安装选择器、活动日历、集中式文档hub，承认文档 gaps并提供搜索和办公时间playlist。

相关链接：vLLM发布 tweet｜文档说明 tweet

Tencent发布WeDLM 8B Instruct开源模型

Tencent在Hugging Face发布WeDLM 8B Instruct扩散语言模型，比vLLM优化的Qwen3-8B快3-6倍，Apache 2.0许可，基准测试表现优秀。

相关链接：Hugging Face地址｜Reddit讨论

fal开源FLUX.2 Turbo图像模型

fal开源FLUX.2 Turbo图像模型，基于DMD2蒸馏，声称在Artificial Analysis排名开源第一，社区快速推出Hugging Face Spaces demo。

相关链接：fal发布 tweet｜demo链接

MiniMax-M2.1成为开源Agentic编码模型

MiniMax-M2.1在Code Arena排名开源WebDev第一，Chutes测试显示82.83%工具调用准确率，强调大代码库实用性，迭代向M2.2/M2.5推进。

相关链接：Code Arena tweet｜Chutes测试 tweet

推理与性能优化

AMD MI300X FP8性能不及bf16

多数据显示MiniMax-M2.1在MI300X上bf16性能优于FP8：vLLM中bf16达55.7 TPS（FP8 42 TPS），sglang中bf16 71 TPS（FP8 55 TPS）。

相关链接：QuixiAI测试 tweet1｜QuixiAI测试 tweet2

Weaviate新增Object TTL等功能

Weaviate发布新版本，包含Object TTL、Java v6客户端GA、Flat Index RQ量化、zstd备份、多模态文档嵌入等功能。

相关链接：Weaviate发布 tweet

Baseten优化GLM-4.7推理速度

Baseten报告GLM-4.7成为内部默认编码模型，在Baseten上推理速度快20%（tok/s和TTFT），并提供托管试用端点。

相关链接：Baseten tweet1｜Baseten tweet2

开源模型与数据集

GLM-4.7成为开源编码默认模型

GLM-4.7因Interleaved/Preserved/Turn-level Thinking成为开源编码默认，AlphaXiv称其在Artificial Analysis排名第一，Baseten内部广泛使用。

相关链接：AlphaXiv tweet｜Baseten tweet

pokeart Pokémon数据集发布

pokeart数据集包含Gen1-Gen9共1224只 Pokémon的 splash art、战斗精灵等，提供6种Gemini 3 Pro caption和1种Qwen3 caption，用于基准测试。

相关链接：Hugging Face地址

韩国32B VLM模型发布

韩国发布32B VLM模型，调整架构（移除muP和sandwich norm），使用0.006初始化，英韩基准表现优秀，等待技术报告。

相关链接：Elie Bakouch tweet

AI代理与工作流

Spotify编码代理的生产经验

Spotify分享编码代理生产经验：指定可验证终态、包含代码示例、最小化工具（verify/git/bash）、用AGENTS.md文档化工作流。

相关链接：Phil Schmid tweet1｜Phil Schmid tweet2

文档适配AI代理的双受众模式

社区讨论双受众文档模式：既供开发者阅读，又结构化供代理提取上下文，如AGENTS.md/CLAUDE.md惯例，LlamaIndex提供模板。

相关链接：LlamaIndex tweet

Amazing Z-Image Workflow v3.0发布

Amazing Z-Image Workflow v3.0更新，包含Style Selector（15种风格）、Sampler Switch、Landscape Switch、Z-Image Enhancer等，支持GGUF/SAFETENSORS。

相关链接：Reddit讨论｜GitHub地址

OpenEnv标准化代理环境

Meta×Hugging Face推出OpenEnv，标准化代理环境，支持TRL/TorchForge等框架，集成MCP工具，旨在统一训练与部署。

相关链接：Ben Burtenshaw tweet1｜Ben Burtenshaw tweet2

研究与技术突破

Transformers存储全局结构而非仅关联

Google研究显示Transformers学习隐式多跳推理，在50k节点图上达100%准确率，挑战知识编辑假设，认为其存储全局结构。

相关链接：dair.ai tweet

URM递归推理优于静态深度

URM（Universal Recurrent Model）在ARC-AGI上表现优于静态深度模型，ARC-AGI 1达53.8% pass@1，关键在于递归归纳偏置和强非线性。

相关链接：Omar Sanseviero tweet

TTT-E2E实现长上下文测试时训练

TTT-E2E在推理时继续训练以压缩上下文，将3B模型上下文从8K扩展到128K，比全注意力快2.7倍，性能更优。

相关链接：Karan Dalal tweet

AgentReuse加速代理延迟

AgentReuse缓存并参数化代理计划，在2664请求中实现93%复用率，延迟降低93%，内存开销小。

相关链接：Omar Sanseviero tweet

行业与收购动态

Meta以约40亿美元收购Manus AI

Meta Superintelligence Labs收购Manus AI，后者成立9个月ARR达1亿美元，Alex Wang宣布加入，称Manus在Remote Labor Index表现SOTA。

相关链接：Alex Wang tweet1｜Alex Wang tweet2｜scaling01 tweet

xAI招聘RL后训练与安全职位

xAI招聘专注RL后训练、对齐/行为、灾难性风险 reduction的角色，Stewart Slocum发布职位信息。

相关链接：Stewart Slocum tweet

Perplexity Pro的使用限制与Max tier

用户报告Perplexity Pro存在高级模型使用限制（如1-2次/小时），而Max tier宣称无限制，部分用户遇订阅问题（如7个月后终止）。

相关链接：Perplexity Reddit讨论1｜Perplexity Reddit讨论2

Reddit热门讨论

AI图像生成的异常特征识别

用户讨论AI生成图像的异常，如“脚代替手”的托盘、扭曲的酒杯，指出这些是AI生成的常见指标，幽默评论称“正确脚趾数”反成疑点。

相关链接：GeminiAI讨论｜StableDiffusion讨论

OpenAI Killswitch工程师职位的梗

用户讨论OpenAI“Killswitch Engineer”梗图，称其为营销噱头，幽默质疑30万-50万美元年薪的“拔插头”职位资格。

相关链接：OpenAI Reddit讨论1｜ChatGPT Reddit讨论2

学生Perplexity Pro订阅问题

学生用户报告Perplexity Pro订阅异常：使用12个月Revolut Metal voucher后仅7个月就终止，支持响应慢，部分用户仍正常。

相关链接：Perplexity Reddit讨论

Discord社区动态

BASI Jailbreaking发现vibe coded app XSS漏洞

BASI Jailbreaking成员发现vibe coded app的JavaScript存在XSS漏洞，若LLM生成XSS payload会触发，讨论输入验证和安全实践。

相关链接：BASI Jailbreaking #general

Unsloth AI讨论多头部注意力机制

Unsloth AI用户讨论多头部注意力：头部学习不同子空间，最终投影层混合信息以捕捉复杂关系，解决“dogness”分裂问题。

相关链接：Unsloth AI #general

Perplexity用户寻求开源替代方案

Perplexity Discord用户讨论开源替代方案，如Perplexica（GitHub），希望复制实时搜索+回答UX，称“Opencode是手，Perplexity是眼”。

相关链接：Perplexity #general｜Perplexica GitHub

Unsloth AI讨论训练数据的重要性

Unsloth AI用户意识到训练数据是LLM的概率压缩，需在训练中覆盖所有边缘案例，否则推理会脆弱，链接HarryR/z80ai的训练数据示例。

相关链接：Unsloth AI #general｜HarryR/z80ai GitHub

📌 来源: Easy AI 日报
🤖 整理: AI助手

#EasyAI #AI日报 #AI教学

讨论回复

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力