聚焦設計 Focus4Design ｜新聞研究與分析｜ 2026-06-25

OpenAI 首款自訂推論晶片 Jalapeño 亮相：九個月完成設計，專為降低成本而來

2026 年 6 月 24 日，OpenAI 與博通（Broadcom）正式公布首款自訂推論晶片「Jalapeño」。這款晶片專為大型語言模型的推論工作負載設計，由 OpenAI 與博通共同開發，從初始設計到製造 tape-out 僅花了九個月。

與一般通用型處理器不同，Jalapeño 是「空白畫布」設計，意味著它是從零開始針對 LLM 推論的需求量身打造。OpenAI 總裁葛雷格·布羅克曼（Greg Brockman）表示，這款晶片利用了 OpenAI 對工作負載的深度理解，專門尋找現有硬體未能妥善服務的特定場景。

根據 OpenAI 公布的資料，早期測試顯示 Jalapeño 在每瓦特效能（performance-per-watt）方面顯著優於目前業界最先進的替代方案。OpenAI 強調，這款晶片在運行即時編碼模型時的運作成本尤其低。不過，對於需要更高算力的任務如預訓練（pre-training），OpenAI 仍然依賴 Nvidia 硬體。

值得注意的是，這項合作並非突然決定。OpenAI 與博通的合作計劃最早於 2025 年 10 月首次公布，當時已被媒體視為 OpenAI 試圖降低對 Nvidia GPU 依賴的重要一步。在此之前，Google 與 Amazon 都已推出自己的客製化 AI 加速器晶片。

開發過程中的一個亮點是，OpenAI 自身的 AI 模型參與了晶片的設計加速。這體現了 OpenAI 所強調的「飛輪效應」──服務使用者的模型，同時也在改進支撐這些模型的基礎設施。

OpenAI 在官方公告中指出，Jalapeño 只是第一步。他們計劃與資料中心合作夥伴以吉瓦（GW）級規模部署這款晶片，並持續發展多世代平台。這意味著未來還會有第二代、第三代晶片陸續推出。

對台灣企業的意義：這則新聞的關鍵不在於能否直接購買這款晶片，而在於它揭示了一個產業趨勢──當推論成本成為 AI 商業化的瓶頸時，垂直整合的硬體設計正在成為頭部 AI 公司的標準動作。對於使用 OpenAI API 的企業，推論效率提升若轉化為價格優勢，將直接降低日常營運成本。

聚焦設計建議

持續監控 OpenAI API 定價變化：推論成本下降通常會反映在 API 費率上，及時調整 AI 服務用量可節省預算。
評估工作流程中的推論資源消耗：找出最耗用推論的環節，優先優化高頻使用的 AI 功能。
關注博通的企業級解決方案：其客製化晶片經驗可能外溢到其他產業應用，特別是在網路與資料中心領域。

限制觀察

目前晶片仍在測試階段，尚未量產部署。OpenAI 也未公布具體的效能數字或預計降價幅度。對於中小型企業，短期內不會有直接的硬體採購機會，應以觀察與準備為主，不宜過度投機。

新聞原始連結

TechCrunch: OpenAI unveils its first custom chip, built by Broadcom OpenAI Official: OpenAI and Broadcom unveil LLM-optimized inference chip

OpenAI 自研推理晶片 Jalapeño 亮相——成本降半，誰在重新定義 AI 基礎設施？

OpenAI 首款自訂推論晶片 Jalapeño 亮相：九個月完成設計，專為降低成本而來

聚焦設計建議

限制觀察

新聞原始連結

文章分類

人氣文章

熱門標籤