GPT Thiết Kế GPT

marsbitXuất bản vào 2026-06-25Cập nhật gần nhất vào 2026-06-25

Tóm tắt

OpenAI đã công bố chip AI đầu tiên của họ, Jalapeño, đánh dấu bước đi quan trọng vượt ra ngoài việc chỉ là một công ty mô hình. Động thái này cho thấy tham vọng kiểm soát toàn bộ quá trình sản xuất trí tuệ, từ mô hình, chip, trung tâm dữ liệu đến năng lượng. Bài viết chỉ ra rằng khoảng cách về mô hình giữa các công ty đang thu hẹp, trong khi khoảng cách về năng lực tính toán ngày càng mở rộng. Chi phí sản xuất mỗi token mới là thước đo thực sự trong kỷ nguyên AI. Jalapeño, một chip chuyên cho suy luận (inference), là nhà máy token của chính OpenAI, nhằm giảm "thuế suy luận" và kiểm soát dòng tiền hàng ngày. Điểm đáng chú ý là chu kỳ sản xuất chip chỉ 9 tháng, được rút ngắn nhờ OpenAI sử dụng chính các mô hình AI của mình để hỗ trợ thiết kế và tối ưu hóa. Điều này tạo nên một vòng lặp kín: mô hình tốt hơn giúp thiết kế chip tốt hơn, chip tốt hơn giảm chi phí vận hành thế hệ mô hình tiếp theo. Tác giả so sánh OpenAI đang dần trở nên giống Apple – xây dựng một hệ sinh thái khép kín từ chip, hệ thống đến ứng dụng và trải nghiệm người dùng, thay vì chỉ cạnh tranh trực tiếp với NVIDIA. OpenAI muốn sở hữu "mỏ khai thác" và bán sản phẩm trí tuệ cuối cùng, chứ không chỉ dừng ở việc mua "công cụ". Bài viết kết luận, trong kỷ nguyên AI, mô hình có thể thay đổi nhanh chóng như "lưu lượng", nhưng cơ sở hạ tầng sản xuất trí tuệ như chip, trung tâm dữ liệu sẽ là "mảnh đất" quyền lực, ngày càng tập trung vào một số ít người chơi. Jalapeño là lời tuyên bố rằng OpenAI muốn trở thành công t...

Cuối cùng OpenAI cũng sản xuất chip.

Nhiều người khi xem tin tức này, phản ứng đầu tiên là: NVIDIA có vấn đề rồi.

Nhưng điều tôi thấy lại hoàn toàn ngược lại.

Ý nghĩa quan trọng nhất của con chip đầu tiên Jalapeño, không phải là hướng thẳng tới NVIDIA.

Đây là lần đầu tiên OpenAI công khai thừa nhận, mình không hài lòng với việc chỉ là một công ty mô hình nữa.

Nó muốn kiểm soát toàn bộ quá trình sản xuất trí tuệ.

Từ mô hình, tới chip. Từ trung tâm dữ liệu, tới năng lượng. Từ huấn luyện, tới suy luận. Từ sản xuất Token, tới bán Token.

Bề ngoài Jalapeño là một con chip, thực chất lại giống như một lộ trình hơn.

OpenAI cuối cùng cũng đặt tham vọng của mình lên bàn.

1. Khoảng cách mô hình đang thu hẹp, khoảng cách tính toán đang mở rộng

Từ khi mô hình lớn bùng nổ, gần như toàn bộ sự chú ý của ngành AI đều đổ dồn vào mô hình.

GPT-4 ra mắt khiến ngành chấn động một lần, Claude đuổi theo, Gemini đuổi theo, DeepSeek đánh bật ra tính hiệu quả chi phí, Meta đẩy mạnh mã nguồn mở. Mỗi lần ra mắt mọi người đều dán mắt vào cùng một nhóm thứ: tham số, bảng xếp hạng, khả năng viết mã, khả năng toán học, ngữ cảnh dài, đa phương thức.

Mô hình tất nhiên quan trọng. Nhưng một thay đổi đã xuất hiện, cửa sổ dẫn đầu về mô hình đang trở nên ngắn hơn. Ngày nay một mô hình vừa ra mắt, vài tháng sau cộng đồng mã nguồn mở, đối thủ cạnh tranh, nhà cung cấp dịch vụ đám mây sẽ đuổi kịp. Khoảng cách năng lực vẫn tồn tại, nhưng ngày càng khó để tự nó tạo thành rào cản lâu dài.

Thứ thực sự kéo dài khoảng cách, đang bắt đầu đi sâu hơn về phía hạ tầng. Cung cấp năng lực tính toán, chi phí suy luận, thông lượng hệ thống, khả năng mạng, xây dựng trung tâm dữ liệu, tiếp cận năng lượng. Không bắt mắt như ra mắt mô hình, cũng không lập tức lan truyền mạnh mẽ. Nhưng chúng quyết định một công ty AI có thể chạy lâu dài hay không.

Huang Renxun (Jensen Huang) gần đây đã nói một câu: Hệ thống của NVIDIA có lẽ không phải là có giá mua thấp nhất, nhưng có thể tạo ra Token với chi phí thấp nhất, thông lượng Token cao nhất, cuối cùng mang lại doanh thu cao nhất.

Lời của Huang rất trực tiếp. Ngành vẫn luôn phàn nàn NVIDIA đắt đỏ, Huang không biện giải về giá mua, mà chuyển vấn đề sang một chiều khác: Đừng nhìn tiền mua máy bao nhiêu, hãy xem chi phí sản xuất mỗi Token.

Đây chính là cuốn sổ sách mới của thời đại AI. Máy chủ và GPU không phải là đơn vị cuối cùng, Token mới là.

OpenAI tình cờ đứng ở trung tâm nhất của vấn đề này.

ChatGPT mỗi ngày xử lý lượng lớn yêu cầu, Codex cần tiêu hao nhiều bước suy luận hơn, tương lai còn có Agent, tạo video, robot, chuỗi suy luận dài. Mô hình càng hữu dụng, Token tiêu thụ càng lớn. Sản phẩm càng thành công, hóa đơn suy luận càng dày.

Nơi khắc nghiệt là ở đây, người dùng OpenAI càng nhiều, NVIDIA càng kiếm tiền. Sản phẩm OpenAI càng mạnh, thuế năng lực tính toán cơ bản càng nặng.

Nếu mỗi Token đều phải trải qua một lần thuế từ nền tảng phần cứng bên ngoài, OpenAI sẽ rất khó sở hữu hào bảo vệ hoàn chỉnh. Nó có thể có mô hình mạnh nhất, có siêu cổng vào, có hệ sinh thái nhà phát triển. Nhưng chi phí sản xuất cốt lõi nhất luôn bị kẹt trong tay người khác.

Bản chất của Jalapeño ở ngay đây. OpenAI bắt đầu tự xây dựng nhà máy sản xuất Token.

2. GPT Bắt Đầu Thiết Kế GPT

Chi tiết dễ bị đánh giá thấp nhất của con chip Jalapeño này, là thời gian sản xuất 9 tháng.

Dự án ASIC hiệu suất cao truyền thống, chu kỳ thường từ 18 tháng đến 36 tháng. Công nghệ tiên tiến càng phiền phức hơn, kiến trúc, xác minh, thực hiện vật lý, đóng gói, ngăn xếp phần mềm, gỡ lỗi, bất kỳ khâu nào có vấn đề chi phí sẽ nhanh chóng phóng đại. OpenAI và Broadcom đã ép chu kỳ xuống còn 9 tháng.

Điều này không thể hiểu là ngành công nghiệp chip đột nhiên trở nên đơn giản. OpenAI không tự nhiên mọc ra một chuỗi công nghiệp bán dẫn. Broadcom có kinh nghiệm sâu rộng trong chip tùy chỉnh và cơ sở hạ tầng mạng, Celestica chịu trách nhiệm bo mạch, giá đỡ và kỹ thuật hệ thống.

Thứ OpenAI thực sự đóng góp là thứ khan hiếm hơn, nó biết mô hình tương lai sẽ chạy như thế nào.

Nhiều công ty chip làm bộ tăng tốc AI, khó khăn nằm ở việc đoán tải. Cấu trúc mô hình sẽ thay đổi, cách thức suy luận sẽ thay đổi, chế độ dịch vụ sẽ thay đổi. Chip một khi đã sản xuất, thế giới vật lý không dễ lăn lại như thế giới phần mềm.

OpenAI không cần hoàn toàn dựa vào đoán. Hàng ngày vận hành ChatGPT, Codex và API, biết nhân nào được dùng nhiều nhất, việc di chuyển bộ nhớ nào lãng phí nhất, nút cổ chai mạng nào ảnh hưởng hiệu suất cụm máy nhất, độ trễ nào sẽ trực tiếp làm tổn hại trải nghiệm sản phẩm. Nó còn biết sản phẩm Agent tương lai sẽ tiêu hao tài nguyên suy luận như thế nào.

Những kinh nghiệm này trước đây chỉ là kiến thức kỹ thuật hậu trường, giờ đã được viết vào kiến trúc chip.

Trong bản tin chính thức của OpenAI có một câu rất quan trọng: OpenAI sử dụng mô hình của chính mình để tăng tốc một phần quy trình thiết kế và tối ưu hóa. Còn nói, mô hình cung cấp cho người dùng cũng đang giúp cải thiện cơ sở hạ tầng để chạy các mô hình tương lai.

GPT bắt đầu tham gia thiết kế máy móc cho thế hệ GPT tiếp theo.

Chuỗi của chip trong vài chục năm qua là, trước tiên thiết kế chip, chip chạy phần mềm, phần mềm chạy AI. Giờ đây chuỗi bắt đầu quay ngược lại, AI giúp con người thiết kế chip, chip lại chạy thế hệ AI tiếp theo.

Một khi vòng khép kín này được thiết lập, 9 tháng có thể chỉ là bắt đầu. Tương lai có thể là 6 tháng, 3 tháng, thậm chí lặp lại dày đặc hơn.

Ngành công nghiệp chip trước đây có nhịp điệu riêng, ngành công nghiệp mô hình có nhịp điệu riêng. Cái trước chậm, cái sau nhanh. Jalapeño kéo hai nhịp điệu đó lại gần nhau.

Bước này nếu đi thông, bánh đà của OpenAI sẽ trở nên rất đáng sợ. Mô hình tốt hơn giúp thiết kế chip tốt hơn, chip tốt hơn giảm chi phí vận hành mô hình thế hệ tiếp theo, chi phí thấp hơn hỗ trợ nhiều người dùng và sản phẩm hơn, nhiều người dùng và sản phẩm hơn mang lại nhiều dữ liệu tải thực tế hơn, những dữ liệu này lại ngược lại định nghĩa chip thế hệ tiếp theo.

Đây mới là vòng tuần hoàn OpenAI thực sự muốn.

3. Cắt Giảm Thuế Suy Luận, Kiểm Soát Dòng Tiền

Jalapeño không phải là chip huấn luyện, nó hướng tới suy luận mô hình ngôn ngữ lớn. Điểm này rất quan trọng.

Huấn luyện giống như đóng tàu sân bay. Một lần đầu tư khổng lồ, cần khả năng tổng hợp cực mạnh, cần liên tục thích ứng với kiến trúc mô hình mới, thử nghiệm mới. Thị trường huấn luyện vẫn phụ thuộc cao vào NVIDIA, không chỉ là GPU, mà là toàn bộ nền tảng CUDA, mạng, hệ thống, thư viện phần mềm, hệ sinh thái nhà phát triển.

Suy luận giống như đội xe taxi hơn. Chạy mỗi ngày, mỗi giờ, mỗi phút. Mỗi khi người dùng đặt một câu hỏi, API đáp ứng một lần, Agent tiến một bước, đều phải xảy ra suy luận. Nó quan tâm hơn đến độ trễ thấp, chi phí thấp, thông lượng cao, tỷ lệ sử dụng cao.

Huấn luyện đốt số tiền lớn theo giai đoạn, suy luận đốt dòng tiền hàng ngày.

Đây cũng là vấn đề đau đầu nhất của công ty AI khi bước vào giai đoạn thương mại hóa. Huấn luyện GPT một lần rất đắt, nhưng suy luận xảy ra hàng ngày. Thời đại Agent sẽ tiếp tục khuếch đại vấn đề này, một nhiệm vụ có thể bao gồm vài chục thậm chí vài trăm lần gọi mô hình. Ngữ cảnh dài, suy luận chuỗi, tạo đa phương thức, thực thi mã, đều tiếp tục đẩy cao tiêu thụ Token.

Jalapeño nhắm vào chính là loại thuế suy luận này. Nó giống TPU của chính OpenAI hơn. Google, Amazon, Meta, Microsoft đều đã đi qua lộ trình tương tự, chỉ cần tải đủ lớn, ASIC tự nghiên cứu sẽ có ý nghĩa kinh tế về hiệu quả chi phí cao.

OpenAI hiện nay đã có điều kiện này. Có yêu cầu thực tế, có lộ trình sản phẩm, có đội ngũ mô hình, có đối tác ngành như Broadcom, và còn có áp lực chi phí khổng lồ.

Jalapeño không cần bán ra ngoài cũng có thể chứng minh giá trị. Chỉ cần nó làm cho ChatGPT trả lời rẻ hơn, cho Codex chạy nhanh hơn, cho API có biên lợi nhuận cao hơn, nó đã có ý nghĩa.

OpenAI còn đề cập, Jalapeño sẽ giảm truyền dữ liệu, cân bằng tài nguyên tính toán, bộ nhớ và mạng, làm cho tỷ lệ sử dụng thực tế gần với đỉnh lý thuyết hơn. Năng lực tính toán đắt đôi khi đắt ở chỗ không được sử dụng đầy đủ, GPU chờ mạng, di chuyển bộ nhớ làm chậm tính toán, điều phối không tốt gây lãng phí, tất cả lãng phí cuối cùng đều trở thành tiền điện và chi phí vốn.

Giá mua chỉ là tầng thứ nhất, hiệu suất hệ thống mới là sổ sách cuối cùng.

4. OpenAI Ngày Càng Giống Apple

Nhiều người sẽ hiểu Jalapeño là OpenAI thách thức NVIDIA, nhưng tôi nghĩ OpenAI không muốn trở thành NVIDIA tiếp theo, mà giống như đang học Apple hơn.

Chỗ mạnh nhất của Apple chưa bao giờ là một điểm đơn lẻ nào. iPhone mạnh, iOS mạnh, chip dòng A và M mạnh, App Store mạnh. Nhưng chỗ khó đánh thực sự của Apple, là những thứ này được đặt trong cùng một vòng khép kín.

Chip được tối ưu cho hệ thống, hệ thống được tối ưu cho ứng dụng, trải nghiệm ứng dụng lại ngược lại định nghĩa chip thế hệ tiếp theo. Vòng khép kín này cho phép Apple trong cùng ràng buộc về pin, thể tích, tản nhiệt, có thể tạo ra trải nghiệm mà người khác khó sao chép.

OpenAI đang xây dựng thứ tương tự. Mô hình là nhân trí tuệ, ChatGPT là siêu cổng vào, Codex là công cụ phát triển, API là tầng phân phối hệ sinh thái, Jalapeño là chip tự nghiên cứu, trung tâm dữ liệu là nhà máy AI.

CEO OpenAI Altman hai năm nay liên tục nói về chip, năng lượng, hợp hạch hạt nhân, trung tâm dữ liệu, giờ nhìn lại có thể căn bản không phải đuổi theo khái niệm, ông ấy đã không còn lên kế hoạch cho OpenAI theo cách của một công ty khởi nghiệp AI nữa.

Nếu nói NVIDIA bán cuốc xẻng, vậy OpenAI muốn sở hữu mỏ.

NVIDIA muốn làm nhà cung cấp thiết bị nhà máy cho tất cả công ty AI, bán GPU, bán mạng, bán hệ thống, bán hệ sinh thái phần mềm, bán phương án nhà máy AI, khách hàng lý tưởng là mỗi công ty cần sản xuất Token.

OpenAI muốn xây cho mình một bộ nhà máy, bán không phải thiết bị, mà là trí tuệ được tạo ra cuối cùng.

Ngắn hạn, OpenAI không thể rời khỏi NVIDIA. Huấn luyện và tính toán tổng hợp vẫn cần nền tảng GPU, Jalapeño cũng không thể nhanh chóng bao phủ toàn bộ tải. Nó có lẽ sẽ tiến vào kịch bản suy luận xác định nhất, quy mô lớn nhất, lợi ích tối ưu cao nhất của OpenAI trước.

Dài hạn, vết nứt đã xuất hiện. Khi công ty mô hình bắt đầu có lộ trình chip của riêng mình, khách hàng của NVIDIA không còn chỉ là khách hàng. Họ cũng sẽ trở thành một loại người chơi khác trong cơ sở hạ tầng AI.

Những Lời Bên Ngoài Trang

Hai mươi năm qua, tài sản quan trọng nhất của Internet là lưu lượng. Ai nắm người dùng, người đó nắm giá trị.

Ngày nay, thời đại AI đang xuất hiện quy luật mới.

Mô hình ngày càng giống lưu lượng, còn tính toán ngày càng giống đất đai.

Mô hình sẽ lặp lại, sản phẩm sẽ thay đổi, bảng xếp hạng sẽ liên tục làm mới. Nhưng những nhà máy sản xuất trí tuệ đó, chip, mạng, trung tâm dữ liệu, năng lượng, sẽ ngày càng tập trung trong tay một số ít người chơi.

GPT bắt đầu thiết kế GPT, trông giống như chỉ là một lần sản xuất chip.

Nhưng điều nó thực sự tuyên bố là:

OpenAI đã không còn hài lòng với việc trở thành công ty thông minh nhất, nó muốn trở thành công ty kiểm soát sản xuất trí tuệ.

Bài viết từ tài khoản công chúng WeChat:Bên Ngoài Trang, Tác giả: Họa Họa

Bài viết từ tài khoản công chúng WeChat:Bên Ngoài Trang, Tác giả: Họa Họa, Hình ảnh tiêu đề: AI tạo

Tiền kỹ thuật số thịnh hành

Câu hỏi Liên quan

QOpenAI đã công bố chip mới tên là gì và mục tiêu chính của nó là gì?

AOpenAI đã công bố chip mới tên là Jalapeño. Mục tiêu chính của nó không phải để cạnh tranh trực tiếp với Nvidia, mà là nhằm kiểm soát toàn bộ quy trình sản xuất trí tuệ, tập trung vào việc giảm chi phí suy luận (inference) và quản lý dòng tiền hàng ngày cho các sản phẩm như ChatGPT và API.

QTheo bài viết, tại sao sự chênh lệch về khả năng mô hình (model) ngày càng thu hẹp, trong khi sự chênh lệch về khả năng tính toán lại mở rộng?

ASự chênh lệch về khả năng mô hình đang thu hẹp vì các đối thủ cạnh tranh, cộng đồng mã nguồn mở và nhà cung cấp dịch vụ đám mây có thể nhanh chóng bắt kịp công nghệ mới. Trong khi đó, sự chênh lệch về tính toán (như cung cấp năng lực tính toán, chi phí suy luận, hiệu suất hệ thống, mạng lưới, trung tâm dữ liệu và năng lượng) mới là yếu tố quyết định khả năng cạnh tranh lâu dài của một công ty AI, vì chúng ảnh hưởng trực tiếp đến chi phí sản xuất mỗi Token.

QChi tiết nào về chip Jalapeño cho thấy một bước đột phá trong quy trình thiết kế chip truyền thống?

AChi tiết đột phá là thời gian sản xuất thử nghiệm (tape-out) chỉ trong 9 tháng, nhanh hơn nhiều so với chu kỳ thông thường từ 18 đến 36 tháng của các dự án ASIC hiệu suất cao. Điều này đạt được nhờ OpenAI sử dụng chính các mô hình AI của mình để tối ưu hóa một phần quy trình thiết kế, tạo thành một vòng lặp khép kín nơi AI giúp thiết kế phần cứng để chạy thế hệ AI tiếp theo.

QTại sao bài viết so sánh OpenAI với Apple thay vì Nvidia?

ABài viết so sánh OpenAI với Apple vì OpenAI đang xây dựng một hệ sinh thái khép kín tương tự: mô hình (model) là lõi thông minh, ChatGPT là cổng siêu kết nối, API là lớp phân phối hệ sinh thái, chip Jalapeño là phần cứng tự thiết kế, và trung tâm dữ liệu là nhà máy AI. Giống như Apple tối ưu hóa phần cứng, phần mềm và trải nghiệm người dùng trong một vòng lặp, OpenAI muốn kiểm soát toàn bộ quá trình từ sản xuất đến phân phối 'trí tuệ', chứ không chỉ đơn thuần bán công cụ (như Nvidia).

QTheo tác giả, tuyên bố thực sự đằng sau việc OpenAI phát triển chip Jalapeño là gì?

ATuyên bố thực sự là OpenAI không còn hài lòng với việc chỉ là công ty có mô hình thông minh nhất. Họ muốn trở thành công ty kiểm soát toàn bộ quá trình *sản xuất* trí tuệ. Họ muốn sở hữu 'mỏ khai thác' thay vì chỉ mua 'cái xẻng', từ mô hình, chip, trung tâm dữ liệu đến năng lượng, nhằm kiểm soát chi phí cốt lõi và xây dựng lợi thế cạnh tranh lâu dài trong kỷ nguyên AI.

Nội dung Liên quan

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua PEOPLE

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua ConstitutionDAO (PEOPLE) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua ConstitutionDAO (PEOPLE) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ ConstitutionDAO (PEOPLE) của BạnSau khi mua ConstitutionDAO (PEOPLE), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch ConstitutionDAO (PEOPLE)Giao dịch ConstitutionDAO (PEOPLE) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 722Xuất bản vào 2024.12.12Cập nhật vào 2026.06.02

Làm thế nào để Mua PEOPLE

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của PEOPLE (PEOPLE) được trình bày dưới đây.

活动图片