OpenAI 自研推理晶片 Jalapeño 亮相——成本降半,誰在重新定義 AI 基礎設施?

  • 14
聚焦設計 Focus4Design | 新聞研究與分析 | 2026-06-25

OpenAI 首款自訂推論晶片 Jalapeño 亮相:九個月完成設計,專為降低成本而來

2026 年 6 月 24 日,OpenAI 與博通(Broadcom)正式公布首款自訂推論晶片「Jalapeño」。這款晶片專為大型語言模型的推論工作負載設計,由 OpenAI 與博通共同開發,從初始設計到製造 tape-out 僅花了九個月。

與一般通用型處理器不同,Jalapeño 是「空白畫布」設計,意味著它是從零開始針對 LLM 推論的需求量身打造。OpenAI 總裁葛雷格·布羅克曼(Greg Brockman)表示,這款晶片利用了 OpenAI 對工作負載的深度理解,專門尋找現有硬體未能妥善服務的特定場景。

根據 OpenAI 公布的資料,早期測試顯示 Jalapeño 在每瓦特效能(performance-per-watt)方面顯著優於目前業界最先進的替代方案。OpenAI 強調,這款晶片在運行即時編碼模型時的運作成本尤其低。不過,對於需要更高算力的任務如預訓練(pre-training),OpenAI 仍然依賴 Nvidia 硬體。

值得注意的是,這項合作並非突然決定。OpenAI 與博通的合作計劃最早於 2025 年 10 月首次公布,當時已被媒體視為 OpenAI 試圖降低對 Nvidia GPU 依賴的重要一步。在此之前,Google 與 Amazon 都已推出自己的客製化 AI 加速器晶片。

開發過程中的一個亮點是,OpenAI 自身的 AI 模型參與了晶片的設計加速。這體現了 OpenAI 所強調的「飛輪效應」──服務使用者的模型,同時也在改進支撐這些模型的基礎設施。

OpenAI 在官方公告中指出,Jalapeño 只是第一步。他們計劃與資料中心合作夥伴以吉瓦(GW)級規模部署這款晶片,並持續發展多世代平台。這意味著未來還會有第二代、第三代晶片陸續推出。

對台灣企業的意義:這則新聞的關鍵不在於能否直接購買這款晶片,而在於它揭示了一個產業趨勢──當推論成本成為 AI 商業化的瓶頸時,垂直整合的硬體設計正在成為頭部 AI 公司的標準動作。對於使用 OpenAI API 的企業,推論效率提升若轉化為價格優勢,將直接降低日常營運成本。

聚焦設計建議

  • 持續監控 OpenAI API 定價變化:推論成本下降通常會反映在 API 費率上,及時調整 AI 服務用量可節省預算。
  • 評估工作流程中的推論資源消耗:找出最耗用推論的環節,優先優化高頻使用的 AI 功能。
  • 關注博通的企業級解決方案:其客製化晶片經驗可能外溢到其他產業應用,特別是在網路與資料中心領域。


限制觀察

目前晶片仍在測試階段,尚未量產部署。OpenAI 也未公布具體的效能數字或預計降價幅度。對於中小型企業,短期內不會有直接的硬體採購機會,應以觀察與準備為主,不宜過度投機。

新聞原始連結

TechCrunch: OpenAI unveils its first custom chip, built by Broadcom OpenAI Official: OpenAI and Broadcom unveil LLM-optimized inference chip