🔥 头条:OpenAI 发布首款自研芯片 Jalapeño
6月24日,OpenAI 与 Broadcom 联合发布首款自研 AI 推理芯片 Jalapeño。该芯片专为 LLM 推理优化,早期测试显示性能功耗比显著优于现有方案。OpenAI 强调其全栈优势——从芯片架构、内核、内存系统到部署体验,每一层都围绕"更快、更可靠、更便宜"的目标优化。此举标志着 OpenAI 减少对 NVIDIA GPU 依赖的关键一步,也意味着 AI 推理成本有望进一步下降。
📊 模型竞赛:六月密集发布
六月延续了上半年的高密度发布节奏,各大厂商集体上新:
| 模型 | 厂商 | 亮点 |
|---|---|---|
| Claude Fable 5 (Preview) | Anthropic | 创意线新模型,合作伙伴优先 |
| Claude Mythos 5 (GA) | Anthropic | 网络安全对齐,企业级可用 |
| GPT-5.6 | OpenAI | 六周迭代,进一步优化 token 效率 |
| Gemini 3.2 | 长上下文检索升级 | |
| Qwen 3.7 | 阿里 | 多配置下性价比超越 DeepSeek V4 Flash |
| DeepSeek V4.1 | DeepSeek | V4 Flash 每 token 成本降低 15% |
| Llama 4.5 | Meta | Agent 稳定性改进 |
| Mistral Medium 3 | Mistral | 欧盟多语言中端刷新 |
| Hunyuan Large 3 | 腾讯 | 深度集成微信生态 |
| ERNIE 5.1 | 百度 | 百度搜索概览集成 |
| Doubao Pro | 字节跳动 | 抖音创作者经济导向 |
| GLM-6 | 智谱 | 国产开源四强之一 |
关键趋势: 中国开源阵营形成 Qwen、DeepSeek、Hunyuan、GLM 四强并立格局;模型家族从按规模分级转向按使用场景细分(创意线 vs 安全线)。
🏭 产业动态
- Anthropic 估值 $9650 亿:Series H 融资 $650 亿,超越 OpenAI 成为全球估值最高 AI 私企,逼近万亿门槛。同时与 SpaceX 合作扩大算力基础设施。
- SpaceX 布局 AI 基础设施:通过 Colossus 项目成为 AI 算力平台力量,传闻 $600 亿收购 Cursor。
- Google 加速 Agent 时代:推出 Gemini Enterprise Agent Platform、Gemini 3.5 Flash Search AI Mode 及新芯片。
- MiniMax M3 开源:首个百万 token 上下文 + 原生多模态 + 计算机操作能力的开源模型,SWE-Bench Pro 得分 59.0%,超越 GPT-5.5 和 Gemini 3.1 Pro。
- NVIDIA Cosmos 3:首个完全开放的物理 AI "全能模型",采用混合 Transformer 架构,支持文本、图像、视频、环境音和物理动作。
🏛️ 政策与治理
- 夏季达沃斯论坛(大连):6月23-25日举行,主题"规模化创新",AI 成为全场最高频关键词。"中国方案"被反复提及,AI 规模化创新与产业落地成为焦点。
- EU AI Act 即将执法:8月起正式执行,AI 治理将上升为董事会级议题。
- 斯坦福发布 2026 AI Index:顶级 AI 模型加速升级,头部企业加速上市进程。
🏥 AI 行业落地
- 医疗 AI 下沉:华为云智慧医疗专区签约 20+ 医疗机构,县域基层医院首次参与,AI 正在消除医疗资源鸿沟。
- AI 重塑 5 大行业:医疗、制造、金融、教育、零售全面进入 AI 深度应用阶段。
💡 一句话速览
| 领域 | 要点 |
|---|---|
| 芯片 | OpenAI + Broadcom 发布 Jalapeño 推理芯片 |
| 模型 | 六月 12+ 模型发布,中国四强并立 |
| 资本 | Anthropic $9650 亿估值,逼近万亿 |
| 政策 | EU AI Act 8月执法,达沃斯聚焦 AI 规模化 |
| 开源 | MiniMax M3 百万上下文开源,超越闭源竞品 |
| 硬件 | NVIDIA Cosmos 3 物理 AI 开源模型发布 |