Cuối cùng OpenAI cũng sản xuất chip.
Nhiều người khi xem tin tức này, phản ứng đầu tiên là: NVIDIA có vấn đề rồi.
Nhưng điều tôi thấy lại hoàn toàn ngược lại.
Ý nghĩa quan trọng nhất của con chip đầu tiên Jalapeño, không phải là hướng thẳng tới NVIDIA.
Đây là lần đầu tiên OpenAI công khai thừa nhận, mình không hài lòng với việc chỉ là một công ty mô hình nữa.
Nó muốn kiểm soát toàn bộ quá trình sản xuất trí tuệ.
Từ mô hình, tới chip. Từ trung tâm dữ liệu, tới năng lượng. Từ huấn luyện, tới suy luận. Từ sản xuất Token, tới bán Token.
Bề ngoài Jalapeño là một con chip, thực chất lại giống như một lộ trình hơn.
OpenAI cuối cùng cũng đặt tham vọng của mình lên bàn.
1. Khoảng cách mô hình đang thu hẹp, khoảng cách tính toán đang mở rộng
Từ khi mô hình lớn bùng nổ, gần như toàn bộ sự chú ý của ngành AI đều đổ dồn vào mô hình.
GPT-4 ra mắt khiến ngành chấn động một lần, Claude đuổi theo, Gemini đuổi theo, DeepSeek đánh bật ra tính hiệu quả chi phí, Meta đẩy mạnh mã nguồn mở. Mỗi lần ra mắt mọi người đều dán mắt vào cùng một nhóm thứ: tham số, bảng xếp hạng, khả năng viết mã, khả năng toán học, ngữ cảnh dài, đa phương thức.
Mô hình tất nhiên quan trọng. Nhưng một thay đổi đã xuất hiện, cửa sổ dẫn đầu về mô hình đang trở nên ngắn hơn. Ngày nay một mô hình vừa ra mắt, vài tháng sau cộng đồng mã nguồn mở, đối thủ cạnh tranh, nhà cung cấp dịch vụ đám mây sẽ đuổi kịp. Khoảng cách năng lực vẫn tồn tại, nhưng ngày càng khó để tự nó tạo thành rào cản lâu dài.
Thứ thực sự kéo dài khoảng cách, đang bắt đầu đi sâu hơn về phía hạ tầng. Cung cấp năng lực tính toán, chi phí suy luận, thông lượng hệ thống, khả năng mạng, xây dựng trung tâm dữ liệu, tiếp cận năng lượng. Không bắt mắt như ra mắt mô hình, cũng không lập tức lan truyền mạnh mẽ. Nhưng chúng quyết định một công ty AI có thể chạy lâu dài hay không.
Huang Renxun (Jensen Huang) gần đây đã nói một câu: Hệ thống của NVIDIA có lẽ không phải là có giá mua thấp nhất, nhưng có thể tạo ra Token với chi phí thấp nhất, thông lượng Token cao nhất, cuối cùng mang lại doanh thu cao nhất.
Lời của Huang rất trực tiếp. Ngành vẫn luôn phàn nàn NVIDIA đắt đỏ, Huang không biện giải về giá mua, mà chuyển vấn đề sang một chiều khác: Đừng nhìn tiền mua máy bao nhiêu, hãy xem chi phí sản xuất mỗi Token.
Đây chính là cuốn sổ sách mới của thời đại AI. Máy chủ và GPU không phải là đơn vị cuối cùng, Token mới là.
OpenAI tình cờ đứng ở trung tâm nhất của vấn đề này.
ChatGPT mỗi ngày xử lý lượng lớn yêu cầu, Codex cần tiêu hao nhiều bước suy luận hơn, tương lai còn có Agent, tạo video, robot, chuỗi suy luận dài. Mô hình càng hữu dụng, Token tiêu thụ càng lớn. Sản phẩm càng thành công, hóa đơn suy luận càng dày.
Nơi khắc nghiệt là ở đây, người dùng OpenAI càng nhiều, NVIDIA càng kiếm tiền. Sản phẩm OpenAI càng mạnh, thuế năng lực tính toán cơ bản càng nặng.
Nếu mỗi Token đều phải trải qua một lần thuế từ nền tảng phần cứng bên ngoài, OpenAI sẽ rất khó sở hữu hào bảo vệ hoàn chỉnh. Nó có thể có mô hình mạnh nhất, có siêu cổng vào, có hệ sinh thái nhà phát triển. Nhưng chi phí sản xuất cốt lõi nhất luôn bị kẹt trong tay người khác.
Bản chất của Jalapeño ở ngay đây. OpenAI bắt đầu tự xây dựng nhà máy sản xuất Token.
2. GPT Bắt Đầu Thiết Kế GPT
Chi tiết dễ bị đánh giá thấp nhất của con chip Jalapeño này, là thời gian sản xuất 9 tháng.
Dự án ASIC hiệu suất cao truyền thống, chu kỳ thường từ 18 tháng đến 36 tháng. Công nghệ tiên tiến càng phiền phức hơn, kiến trúc, xác minh, thực hiện vật lý, đóng gói, ngăn xếp phần mềm, gỡ lỗi, bất kỳ khâu nào có vấn đề chi phí sẽ nhanh chóng phóng đại. OpenAI và Broadcom đã ép chu kỳ xuống còn 9 tháng.
Điều này không thể hiểu là ngành công nghiệp chip đột nhiên trở nên đơn giản. OpenAI không tự nhiên mọc ra một chuỗi công nghiệp bán dẫn. Broadcom có kinh nghiệm sâu rộng trong chip tùy chỉnh và cơ sở hạ tầng mạng, Celestica chịu trách nhiệm bo mạch, giá đỡ và kỹ thuật hệ thống.
Thứ OpenAI thực sự đóng góp là thứ khan hiếm hơn, nó biết mô hình tương lai sẽ chạy như thế nào.
Nhiều công ty chip làm bộ tăng tốc AI, khó khăn nằm ở việc đoán tải. Cấu trúc mô hình sẽ thay đổi, cách thức suy luận sẽ thay đổi, chế độ dịch vụ sẽ thay đổi. Chip một khi đã sản xuất, thế giới vật lý không dễ lăn lại như thế giới phần mềm.
OpenAI không cần hoàn toàn dựa vào đoán. Hàng ngày vận hành ChatGPT, Codex và API, biết nhân nào được dùng nhiều nhất, việc di chuyển bộ nhớ nào lãng phí nhất, nút cổ chai mạng nào ảnh hưởng hiệu suất cụm máy nhất, độ trễ nào sẽ trực tiếp làm tổn hại trải nghiệm sản phẩm. Nó còn biết sản phẩm Agent tương lai sẽ tiêu hao tài nguyên suy luận như thế nào.
Những kinh nghiệm này trước đây chỉ là kiến thức kỹ thuật hậu trường, giờ đã được viết vào kiến trúc chip.
Trong bản tin chính thức của OpenAI có một câu rất quan trọng: OpenAI sử dụng mô hình của chính mình để tăng tốc một phần quy trình thiết kế và tối ưu hóa. Còn nói, mô hình cung cấp cho người dùng cũng đang giúp cải thiện cơ sở hạ tầng để chạy các mô hình tương lai.
GPT bắt đầu tham gia thiết kế máy móc cho thế hệ GPT tiếp theo.
Chuỗi của chip trong vài chục năm qua là, trước tiên thiết kế chip, chip chạy phần mềm, phần mềm chạy AI. Giờ đây chuỗi bắt đầu quay ngược lại, AI giúp con người thiết kế chip, chip lại chạy thế hệ AI tiếp theo.
Một khi vòng khép kín này được thiết lập, 9 tháng có thể chỉ là bắt đầu. Tương lai có thể là 6 tháng, 3 tháng, thậm chí lặp lại dày đặc hơn.
Ngành công nghiệp chip trước đây có nhịp điệu riêng, ngành công nghiệp mô hình có nhịp điệu riêng. Cái trước chậm, cái sau nhanh. Jalapeño kéo hai nhịp điệu đó lại gần nhau.
Bước này nếu đi thông, bánh đà của OpenAI sẽ trở nên rất đáng sợ. Mô hình tốt hơn giúp thiết kế chip tốt hơn, chip tốt hơn giảm chi phí vận hành mô hình thế hệ tiếp theo, chi phí thấp hơn hỗ trợ nhiều người dùng và sản phẩm hơn, nhiều người dùng và sản phẩm hơn mang lại nhiều dữ liệu tải thực tế hơn, những dữ liệu này lại ngược lại định nghĩa chip thế hệ tiếp theo.
Đây mới là vòng tuần hoàn OpenAI thực sự muốn.
3. Cắt Giảm Thuế Suy Luận, Kiểm Soát Dòng Tiền
Jalapeño không phải là chip huấn luyện, nó hướng tới suy luận mô hình ngôn ngữ lớn. Điểm này rất quan trọng.
Huấn luyện giống như đóng tàu sân bay. Một lần đầu tư khổng lồ, cần khả năng tổng hợp cực mạnh, cần liên tục thích ứng với kiến trúc mô hình mới, thử nghiệm mới. Thị trường huấn luyện vẫn phụ thuộc cao vào NVIDIA, không chỉ là GPU, mà là toàn bộ nền tảng CUDA, mạng, hệ thống, thư viện phần mềm, hệ sinh thái nhà phát triển.
Suy luận giống như đội xe taxi hơn. Chạy mỗi ngày, mỗi giờ, mỗi phút. Mỗi khi người dùng đặt một câu hỏi, API đáp ứng một lần, Agent tiến một bước, đều phải xảy ra suy luận. Nó quan tâm hơn đến độ trễ thấp, chi phí thấp, thông lượng cao, tỷ lệ sử dụng cao.
Huấn luyện đốt số tiền lớn theo giai đoạn, suy luận đốt dòng tiền hàng ngày.
Đây cũng là vấn đề đau đầu nhất của công ty AI khi bước vào giai đoạn thương mại hóa. Huấn luyện GPT một lần rất đắt, nhưng suy luận xảy ra hàng ngày. Thời đại Agent sẽ tiếp tục khuếch đại vấn đề này, một nhiệm vụ có thể bao gồm vài chục thậm chí vài trăm lần gọi mô hình. Ngữ cảnh dài, suy luận chuỗi, tạo đa phương thức, thực thi mã, đều tiếp tục đẩy cao tiêu thụ Token.
Jalapeño nhắm vào chính là loại thuế suy luận này. Nó giống TPU của chính OpenAI hơn. Google, Amazon, Meta, Microsoft đều đã đi qua lộ trình tương tự, chỉ cần tải đủ lớn, ASIC tự nghiên cứu sẽ có ý nghĩa kinh tế về hiệu quả chi phí cao.
OpenAI hiện nay đã có điều kiện này. Có yêu cầu thực tế, có lộ trình sản phẩm, có đội ngũ mô hình, có đối tác ngành như Broadcom, và còn có áp lực chi phí khổng lồ.
Jalapeño không cần bán ra ngoài cũng có thể chứng minh giá trị. Chỉ cần nó làm cho ChatGPT trả lời rẻ hơn, cho Codex chạy nhanh hơn, cho API có biên lợi nhuận cao hơn, nó đã có ý nghĩa.
OpenAI còn đề cập, Jalapeño sẽ giảm truyền dữ liệu, cân bằng tài nguyên tính toán, bộ nhớ và mạng, làm cho tỷ lệ sử dụng thực tế gần với đỉnh lý thuyết hơn. Năng lực tính toán đắt đôi khi đắt ở chỗ không được sử dụng đầy đủ, GPU chờ mạng, di chuyển bộ nhớ làm chậm tính toán, điều phối không tốt gây lãng phí, tất cả lãng phí cuối cùng đều trở thành tiền điện và chi phí vốn.
Giá mua chỉ là tầng thứ nhất, hiệu suất hệ thống mới là sổ sách cuối cùng.
4. OpenAI Ngày Càng Giống Apple
Nhiều người sẽ hiểu Jalapeño là OpenAI thách thức NVIDIA, nhưng tôi nghĩ OpenAI không muốn trở thành NVIDIA tiếp theo, mà giống như đang học Apple hơn.
Chỗ mạnh nhất của Apple chưa bao giờ là một điểm đơn lẻ nào. iPhone mạnh, iOS mạnh, chip dòng A và M mạnh, App Store mạnh. Nhưng chỗ khó đánh thực sự của Apple, là những thứ này được đặt trong cùng một vòng khép kín.
Chip được tối ưu cho hệ thống, hệ thống được tối ưu cho ứng dụng, trải nghiệm ứng dụng lại ngược lại định nghĩa chip thế hệ tiếp theo. Vòng khép kín này cho phép Apple trong cùng ràng buộc về pin, thể tích, tản nhiệt, có thể tạo ra trải nghiệm mà người khác khó sao chép.
OpenAI đang xây dựng thứ tương tự. Mô hình là nhân trí tuệ, ChatGPT là siêu cổng vào, Codex là công cụ phát triển, API là tầng phân phối hệ sinh thái, Jalapeño là chip tự nghiên cứu, trung tâm dữ liệu là nhà máy AI.
CEO OpenAI Altman hai năm nay liên tục nói về chip, năng lượng, hợp hạch hạt nhân, trung tâm dữ liệu, giờ nhìn lại có thể căn bản không phải đuổi theo khái niệm, ông ấy đã không còn lên kế hoạch cho OpenAI theo cách của một công ty khởi nghiệp AI nữa.
Nếu nói NVIDIA bán cuốc xẻng, vậy OpenAI muốn sở hữu mỏ.
NVIDIA muốn làm nhà cung cấp thiết bị nhà máy cho tất cả công ty AI, bán GPU, bán mạng, bán hệ thống, bán hệ sinh thái phần mềm, bán phương án nhà máy AI, khách hàng lý tưởng là mỗi công ty cần sản xuất Token.
OpenAI muốn xây cho mình một bộ nhà máy, bán không phải thiết bị, mà là trí tuệ được tạo ra cuối cùng.
Ngắn hạn, OpenAI không thể rời khỏi NVIDIA. Huấn luyện và tính toán tổng hợp vẫn cần nền tảng GPU, Jalapeño cũng không thể nhanh chóng bao phủ toàn bộ tải. Nó có lẽ sẽ tiến vào kịch bản suy luận xác định nhất, quy mô lớn nhất, lợi ích tối ưu cao nhất của OpenAI trước.
Dài hạn, vết nứt đã xuất hiện. Khi công ty mô hình bắt đầu có lộ trình chip của riêng mình, khách hàng của NVIDIA không còn chỉ là khách hàng. Họ cũng sẽ trở thành một loại người chơi khác trong cơ sở hạ tầng AI.
Những Lời Bên Ngoài Trang
Hai mươi năm qua, tài sản quan trọng nhất của Internet là lưu lượng. Ai nắm người dùng, người đó nắm giá trị.
Ngày nay, thời đại AI đang xuất hiện quy luật mới.
Mô hình ngày càng giống lưu lượng, còn tính toán ngày càng giống đất đai.
Mô hình sẽ lặp lại, sản phẩm sẽ thay đổi, bảng xếp hạng sẽ liên tục làm mới. Nhưng những nhà máy sản xuất trí tuệ đó, chip, mạng, trung tâm dữ liệu, năng lượng, sẽ ngày càng tập trung trong tay một số ít người chơi.
GPT bắt đầu thiết kế GPT, trông giống như chỉ là một lần sản xuất chip.
Nhưng điều nó thực sự tuyên bố là:
OpenAI đã không còn hài lòng với việc trở thành công ty thông minh nhất, nó muốn trở thành công ty kiểm soát sản xuất trí tuệ.
Bài viết từ tài khoản công chúng WeChat:Bên Ngoài Trang, Tác giả: Họa Họa
Bài viết từ tài khoản công chúng WeChat:Bên Ngoài Trang, Tác giả: Họa Họa, Hình ảnh tiêu đề: AI tạo






