Codex Sử Dụng Máy Tính Như Thế Nào? Ba Lối Vào Và Ranh Giới Quyền Hạn

marsbitXuất bản vào 2026-06-21Cập nhật gần nhất vào 2026-06-21

Tóm tắt

Bài viết phân tích ba phương thức chính để Codex tương tác với máy tính: Computer Use, Tiện ích Chrome và Trình duyệt trong ứng dụng. Computer Use là phương thức mạnh mẽ nhất, cho phép Codex điều khiển giao diện đồ họa của các ứng dụng macOS/Windows, cài đặt hệ thống, thậm chí iOS Simulator. Nó phù hợp cho các quy trình không có API hoặc công cụ cấu trúc, nhưng chậm hơn và có ranh giới quyền truy cập rộng nhất, đòi hỏi sự giám sát cẩn thận. Tiện ích Chrome cấp cho Codex quyền truy cập vào trạng thái Chrome đã đăng nhập của người dùng, bao gồm cookie, hồ sơ và các tab mở. Nó lý tưởng cho các tác vụ trên Gmail, LinkedIn, Salesforce, bảng điều khiển nội bộ hoặc nghiên cứu xuyên nhiều trang web, đồng thời hỗ trợ kiểm soát đa tab hiệu quả. Trình duyệt trong ứng dụng là một trình duyệt biệt lập bên trong luồng Codex, không kế thừa trạng thái đăng nhập hay tiện ích mở rộng. Nó hoàn hảo cho việc phát triển và gỡ lỗi web (máy chủ cục bộ, lỗi giao diện, bố cục responsive) và cho phép chú thích trực tiếp trên các phần tử trang, tạo vòng phản hồi nhanh giữa chỉnh sửa mã và xem trước. Appshots không phải là một phương thức điều khiển, mà là công cụ để người dùng cung cấp ngữ cảnh hình ảnh (chụp cửa sổ) cho Codex, giúp nó hiểu vấn đề cần giải quyết. Thông điệp cốt lõi: Không phải mọi tác vụ đều cần Computer Use. Nên chọn phương thức có phạm vi quyền hẹp nhất, an toàn nhất và được cấu trúc hóa nhất cho từng công việc cụ thể. Ưu tiên sử dụng plugin/MCP nếu có, sau đó mới xem xét đến Trì...

Lời biên tập: Bài viết này hệ thống hóa ba lối vào để Codex tương tác với môi trường bên ngoài: Computer Use, Tiện ích mở rộng Chrome và Browser trong ứng dụng. Cả ba đều có vẻ như đang giải quyết vấn đề "để Codex sử dụng máy tính", nhưng tương ứng với các tình huống nhiệm vụ, ranh giới quyền hạn và mức độ tin cậy khác nhau.

Trong đó, Computer Use có phạm vi bao phủ rộng nhất, có thể trực tiếp thao tác các ứng dụng gốc, cài đặt hệ thống, giả lập iOS trên macOS/Windows đã được ủy quyền, thậm chí thực hiện quy trình công việc xuyên qua nhiều ứng dụng. Nó phù hợp với các quy trình GUI không có hỗ trợ API, plugin hay công cụ có cấu trúc, nhưng cái giá phải trả là tốc độ chậm hơn và ranh giới quyền hạn cũng rộng nhất. Tiện ích mở rộng Chrome phù hợp với các nhiệm vụ phụ thuộc vào trạng thái đăng nhập, Cookies, nhiều tab và danh tính trình duyệt, chẳng hạn như Gmail, LinkedIn, Salesforce, hệ thống nội bộ, hoặc nghiên cứu đã đăng nhập xuyên qua nhiều trang web. Browser trong ứng dụng thiên về các tình huống phát triển và gỡ lỗi hơn, đặc biệt phù hợp với dịch vụ cục bộ, lỗi giao diện, bố cục đáp ứng và chú thích thiết kế; nó không kế thừa trạng thái đăng nhập từ trình duyệt bình thường của người dùng, khả năng hẹp hơn, nhưng tính cách ly cũng mạnh hơn.

Phán đoán cốt lõi của bài viết là, Codex không chỉ có một cách "dùng máy tính", điều thực sự quan trọng là chọn giao diện thao tác hẹp nhất, an toàn nhất và có cấu trúc nhất dựa trên nhiệm vụ. Nếu có thể dùng plugin hoặc MCP, thì không nên sử dụng kiểm soát hình ảnh trước; nhiệm vụ chỉ liên quan đến phát triển web, thì ưu tiên sử dụng Browser trong ứng dụng; khi cần danh tính trình duyệt và trạng thái đăng nhập của người dùng, hãy chuyển sang Chrome; chỉ khi các công cụ có cấu trúc không thể bao phủ, và nhiệm vụ bắt buộc phải phụ thuộc vào giao diện đồ họa trên máy tính để bàn, thì Computer Use mới là giải pháp cuối cùng.

Appshots không phải là cách thứ tư để điều khiển máy tính, mà là công cụ "chỉ cho Codex xem" ngữ cảnh màn hình hiện tại. Nó giải quyết vấn đề đầu vào ngữ cảnh, trong khi Browser, Chrome và Computer Use giải quyết vấn đề hành động. Nhìn chung, hệ thống phân tầng này thực chất tiết lộ chìa khóa cho việc sản phẩm hóa AI Agent: không phải là để mô hình có được quyền hạn vô hạn, mà là liên tục thu hẹp quyền hạn, làm rõ ranh giới trong các nhiệm vụ cụ thể, và để người dùng giữ quyền xem xét các hành động then chốt.

Dưới đây là bài viết gốc:

Codex sử dụng máy tính có ba cách: Computer Use, Tiện ích mở rộng Chrome, và trình duyệt trong ứng dụng.

Chúng có một số phần chồng lấp, đủ để dễ gây nhầm lẫn.

Sau khi đọc bài viết này, bạn sẽ biết cách cài đặt và kích hoạt ba cách này, nên sử dụng trong tình huống nào, Appshots và Chế độ nhà phát triển kết nối chúng ra sao, và nên viết gì trong AGENTS.md để Codex có thể tự chọn giao diện thao tác phù hợp.

Phiên bản đơn giản là:

Dù vậy, chỉ cần có thể, vẫn nên ưu tiên sử dụng plugin hoặc MCP. Ví dụ, plugin Slack có thể tìm kiếm một luồng hội thoại chính xác hơn so với việc nhấp chuột khắp nơi trong Slack; các thao tác do plugin GitHub tạo ra cũng dễ kiểm tra hơn so với việc để Codex điều khiển trang web. Kiểm soát hình ảnh phù hợp nhất khi được sử dụng ở những nơi khả năng của công cụ có cấu trúc đạt đến giới hạn.

Tất cả đều có thể là @Computer

Computer Use là giao diện thao tác có phạm vi bao phủ rộng nhất trong ba loại này. Nó cho phép Codex xem và thao tác giao diện đồ họa trên macOS và Windows, bao gồm cửa sổ, menu, nhập liệu bàn phím và clipboard trong các ứng dụng bạn ủy quyền.

Nó thường cũng là chậm nhất. Plugin có cấu trúc có thể gọi trực tiếp API; Computer Use cần quan sát giao diện, phán đoán nên nhấp vào đâu, chờ ứng dụng phản hồi, rồi kiểm tra trạng thái bước tiếp theo. Vòng lặp hình ảnh này sẽ tiêu tốn thời gian, nhưng cũng có nghĩa là Codex có thể thao tác những ứng dụng hoàn toàn không có API khả dụng.

Trên macOS, chậm không nhất thiết có nghĩa là sẽ làm phiền bạn. Computer Use có thể thao tác các ứng dụng bạn ủy quyền ở chế độ nền, trong khi bạn vẫn có thể tiếp tục sử dụng các phần khác của máy tính. Nhiều lúc, tôi mở một ứng dụng nào đó khi đang dùng Codex, mới phát hiện Codex đã âm thầm hoàn thành một quy trình công việc ở chế độ nền.

Tùy thuộc vào những ứng dụng nào được cài đặt và ủy quyền trên máy tính của bạn, các đối tượng thao tác này có thể bao gồm Spotify, Xcode, Cài đặt Hệ thống, Giả lập iOS, thậm chí là điều khiển iPhone của bạn bằng iPhone Mirroring. Nó cũng có thể chuyển đổi giữa nhiều ứng dụng, xử lý các quy trình công việc trải dài trên các ứng dụng khác nhau.

Hãy sử dụng nó khi nhiệm vụ phụ thuộc vào:

Ứng dụng máy tính để bàn gốc, như Spotify hoặc các ứng dụng tài chính;

Giả lập iOS, iPhone Mirroring, hoặc các quy trình khác chỉ có thể thao tác qua giao diện đồ họa;

Cài đặt hệ thống hoặc ứng dụng;

Nguồn dữ liệu không có plugin hoặc API;

Quy trình công việc cần chuyển đổi giữa nhiều ứng dụng;

Thao tác bước cuối cùng bị thiếu trong một tích hợp có cấu trúc.

Cách cài đặt: Mở Settings > Computer Use trong Codex, sau đó nhấp Install.

Cách kích hoạt: Nhắc đến @Computer, hoặc yêu cầu rõ ràng Codex sử dụng Computer Use. Khi năng lực mô hình được nâng cao, trong tương lai nó cũng sẽ tự gọi khi cần.

Bạn có thể thử vài ví dụ trước:

Một ví dụ tôi thích nhất, bắt nguồn từ việc một gói hàng bị đánh cắp. Amazon nói với tôi rằng phải đợi khoảng 25 phút mới có thể kết nối với nhân viên hỗ trợ khách hàng. Tôi giao một luồng Codex cho Computer Use, yêu cầu nó cứ năm phút kiểm tra cửa sổ trò chuyện một lần, chờ cho đến khi nhân viên xuất hiện thì đổi thành mỗi phút kiểm tra một lần, và cố gắng giúp tôi nhận được khoản hoàn tiền. Khi tôi tắm xong trở lại, khoản hoàn tiền đã hoàn tất.

Tôi cũng sử dụng Computer Use như "bước cuối cùng" trong quy trình công việc có cấu trúc. Trong một video phát hành, Codex có thể đọc phản hồi từ Slack, sửa mã và render video mới, nhưng tại thời điểm đó, tích hợp Slack trong luồng đó không thể tải tệp lên. Vì vậy, Computer Use đã nhấp vào Add file, bổ sung bước còn thiếu này.

Nó cũng là loại có ranh giới tin cậy rộng nhất trong ba loại. Mỗi lần chỉ cấp cho nó một ứng dụng hoặc quy trình rõ ràng. Khi một số ứng dụng nhạy cảm không phải là một phần của nhiệm vụ, hãy giữ chúng ở trạng thái đóng; kiểm tra kỹ các cửa sổ bật lên yêu cầu quyền; đối với các thay đổi liên quan đến tài chính, tài khoản, thanh toán, chứng chỉ, quyền riêng tư và bảo mật hệ thống, tốt nhất nên có người giám sát tại chỗ.

Sử Dụng @Chrome Để Xử Lý Nhiều Tab Và Trạng Thái Đăng Nhập

Tiện ích mở rộng Chrome của Codex cho phép Codex truy cập trạng thái Chrome mà bạn đã đăng nhập. Khi nhiệm vụ phụ thuộc vào tài khoản, cookies, hồ sơ trình duyệt, hoặc các tab bạn đã mở và xác thực, thì nên sử dụng nó.

Loại giao diện thao tác này phù hợp với công việc trong các công cụ như:

Gmail hoặc LinkedIn;

Salesforce hoặc hệ thống hỗ trợ khách hàng;

Bảng điều khiển nội bộ;

Nghiên cứu đã đăng nhập xuyên qua nhiều trang web;

Biểu mẫu phụ thuộc vào tài khoản hoặc tiện ích mở rộng trình duyệt của bạn.

Cách cài đặt: Mở Plugins trong Codex, thêm Chrome và làm theo quy trình thiết lập. Codex sẽ hướng dẫn bạn cài đặt Tiện ích mở rộng Codex Chrome và phê duyệt quyền của Chrome. Khi tiện ích mở rộng hiển thị Connected, hãy mở một luồng mới.

Cách kích hoạt: Nhắc đến @Chrome, hoặc yêu cầu rõ ràng Codex sử dụng trình duyệt Chrome mà bạn đã đăng nhập:

Các nhiệm vụ Chrome sẽ chạy trong nhóm tab, điều này giúp nhóm các tab liên quan đến một luồng Codex cụ thể lại với nhau. Khác với trình duyệt trong ứng dụng, giao diện thao tác này mang theo danh tính trình duyệt của bạn. Điều này làm cho nó mạnh hơn, nhưng cũng nhạy cảm hơn.

Một lợi thế chính khác là kiểm soát nhiều tab. Chrome có thể liên kết nhiều tab với cùng một nhiệm vụ, đọc ngữ cảnh trong một trang, đối chiếu thông tin trong trang khác, rồi tiếp tục quy trình công việc trong trang thứ ba. Computer Use cũng có thể điều khiển trình duyệt bằng hình ảnh, nhưng Chrome sẽ hiểu nhiệm vụ như một quy trình công việc trên trình duyệt, thay vì một chuỗi thao tác tọa độ màn hình.

Gần đây có một luồng, tôi giao một tab Strudel Composer đã mở cho Codex, yêu cầu nó làm cho bản nhạc thú vị hơn. Chrome đã cấp cho nó tab được chọn, cùng với các công cụ WebMCP mà trang này cung cấp. Codex kiểm tra cấu trúc bài hát, viết lại hòa âm và toàn bộ hình thức dài bốn phút, sửa đổi tốc độ, lưu bài hát và để nó tiếp tục phát. Nó không cần phải tìm kiếm từng điều khiển trên giao diện bằng hình ảnh, vì Chrome có thể kết hợp ngữ cảnh tab với khả năng có cấu trúc mà trang cung cấp.

Tôi còn dùng nó để chạy một luồng Twitter dài hạn. Chỉ dẫn đại khái là:

Điều thú vị không phải là Codex có thể mở Twitter, mà là luồng này có thể quay lại cùng một môi trường làm việc đã đăng nhập trong thời gian dài, kết nối nội dung phát hiện được với các tệp cục bộ và để lại một kết quả cho tôi xem xét.

Ranh giới tin cậy ở đây rất quan trọng. Các trang web có thể coi các lần nhấp chuột, gửi biểu mẫu và gửi tin nhắn của Codex như những hành động do chính bạn thực hiện. Bản thân nội dung trang web cũng là đầu vào không đáng tin cậy. Hãy phân biệt rõ ràng các bước có hậu quả nặng nề: nghiên cứu, điều hướng và soạn thảo có thể hoàn thành tự động; gửi, đăng, mua hoặc gửi đi trước đó, cần có sự xem xét của bạn.

Nếu toàn bộ nhiệm vụ được hoàn thành trong trình duyệt, hãy ưu tiên dùng Chrome, thay vì Computer Use. Chrome có ngữ cảnh gốc của trình duyệt mà loại nhiệm vụ này cần, đồng thời không mở rộng phạm vi truy cập ra toàn bộ máy tính để bàn.

Sử Dụng @Browser Trong Ứng Dụng Để Xử Lý Trang Web Bạn Đang Phát Triển

Trình duyệt trong ứng dụng là trình duyệt tồn tại bên trong luồng Codex. Bạn và Codex chia sẻ cùng một trang được render, vì vậy nó đặc biệt phù hợp để xây dựng và gỡ lỗi ứng dụng web.

Tôi thường bắt đầu xử lý từ đây với:

Máy chủ phát triển cục bộ;

Trang xem trước dựa trên tệp;

Trang công khai không cần đăng nhập;

Tái hiện lỗi giao diện;

Kiểm tra bố cục đáp ứng;

Để lại phản hồi thiết kế cho các phần tử trang.

Ràng buộc quan trọng nhất của nó là tính cách ly. Trình duyệt trong ứng dụng không sử dụng hồ sơ, cookies, tiện ích mở rộng, phiên đăng nhập hoặc tab hiện có của trình duyệt thông thường của bạn. Khi nhiệm vụ cần danh tính tài khoản, đây là một hạn chế; nhưng khi nhiệm vụ không cần tài khoản, đây lại là một ranh giới hữu ích.

Cách thiết lập: Mở Plugins trong Codex, thêm và bật plugin Browser.

Cách kích hoạt: Nhắc đến @Browser trong lời nhắc, hoặc yêu cầu rõ ràng Codex sử dụng trình duyệt trong ứng dụng:

Điều này tạo thành một vòng phản hồi chặt chẽ: Codex có thể chỉnh sửa mã, thao tác trang, kiểm tra trạng thái render, chụp ảnh màn hình, rồi xác minh lại cùng quy trình sau khi sửa.

Phần tôi thích nhất là chú thích. Khi tôi đánh giá một ứng dụng cục bộ, có thể trực tiếp nhấp vào một phần tử, hoặc chọn một khu vực và để lại nhận xét. Các điều khiển kiểu dáng cũng cho phép tôi xem trước và phản hồi về văn bản, phông chữ, khoảng cách và màu sắc một cách chính xác hơn. Tôi thường kết hợp nó với đầu vào bằng giọng nói và hướng dẫn quy trình: Tôi đánh giá trang, để lại nhận xét và tiếp tục xếp hàng thêm ý kiến trong khi Codex xử lý phản hồi hiện tại. Bản thân trang này trở thành bản đặc tả kỹ thuật.

Điều này đặc biệt hữu ích cho công việc thiết kế. Tôi thường yêu cầu Codex tổ chức một ý tưởng, một gói nghiên cứu hoặc trạng thái dự án thành một tệp index.html duy nhất, sau đó mở nó bằng trình duyệt trong ứng dụng. Thay vì cố gắng mô tả toàn bộ thiết kế trong một lời nhắc khác, tôi có thể trực tiếp chú thích trên trang thực: "Thứ bậc ở đây bị đảo ngược", "Ở đây đừng giống thẻ quá", "Các điều khiển này cần thêm không gian", hoặc "Toàn trang dùng tỷ lệ cỡ chữ này". Codex sẽ nhận được nhận xét kèm theo ảnh chụp màn hình liên quan và ngữ cảnh phần tử, sửa đổi tệp, sau đó mở lại cùng một trang để bước vào vòng tiếp theo.

Vòng lặp này mang cảm giác gần giống như làm việc cùng một nhà thiết kế trên cùng một bảng vẽ, hơn là truyền qua lại ảnh chụp màn hình và mô tả bằng văn bản.

Trình duyệt trong ứng dụng cũng phù hợp làm điểm khởi đầu cho quy trình công việc hỗn hợp. Trong một luồng khác, tôi đã dùng trình duyệt trong ứng dụng để mở một bài đăng X, yêu cầu Codex điều tra các thảo luận liên quan. Trang hiển thị giúp nó xác nhận tôi đang đề cập đến bài đăng nào; sau đó Codex chuyển sang Twitter CLI, truy xuất 38 phản hồi, bao gồm cả những phản hồi lồng nhau bị ẩn khỏi chế độ xem trình duyệt. Đây là thực hành nguyên tắc "sử dụng giao diện thao tác hẹp nhất": dùng trình duyệt để xác nhận ngữ cảnh trên màn hình, rồi dùng công cụ có cấu trúc để truy xuất sâu hơn.

Ở đây cũng có sự đánh đổi. Tính cách ly của trình duyệt trong ứng dụng khiến nó trở thành giao diện phát triển tốt, nhưng cũng có nghĩa là nó không phù hợp để xử lý đăng nhập Google, passkey hoặc các trang web phụ thuộc vào tiện ích mở rộng trình duyệt. Khi danh tính quan trọng, hãy chuyển sang Chrome.

Appshots

Appshot không phải là cách thứ tư để Codex điều khiển máy tính. Nó là một phương pháp để chỉ cho Codex thấy ngữ cảnh trước mắt bạn.

Trên Mac, nhấn hai lần phím CMD để chụp cửa sổ gần nhất. Codex sẽ đính kèm một hình ảnh cùng với tất cả văn bản khả dụng vào luồng. Bạn có thể chụp Appshot cho một lỗi, một email, một thiết kế, một bảng cài đặt hoặc một biểu mẫu lạ, sau đó nói trực tiếp:

Đây là mô hình tư duy tôi cảm thấy dễ nhớ nhất: Appshots là cách bạn dùng để chỉ vào thứ gì đó trên máy tính; Browser, Chrome và Computer Use là cách Codex thực hiện hành động.

Appshots hiện được tạo thông qua ứng dụng Codex trên macOS. Nó chụp cửa sổ ở phía trước nhất, không phải toàn bộ màn hình. Điều này làm cho nó trở thành một cách hữu ích: bạn có thể cung cấp ngữ cảnh tập trung mà không cần cấp quyền kiểm soát ứng dụng đó.

Cách Theo Dõi Những Tiến Triển Này

Các giao diện thao tác này thay đổi rất nhanh. Nếu bạn muốn nhận được chi tiết thực tế, thay vì chờ đợi một bài tổng kết phát hành lớn:

Theo dõi Ari Weinstein (@AriX) để biết về Computer Use và Appshots;

Theo dõi James Sun (@JamesZmSun) để biết về nội dung liên quan đến Browser;

Theo dõi Andrew Ambrosino (@ajambrosino) để biết về phát hành ứng dụng Codex và câu chuyện sản phẩm máy tính để bàn lớn hơn;

Theo dõi OpenAI Developers (@OpenAIDevs) để biết tin tức rộng hơn về Codex và OpenAI Platform.

Câu hỏi Liên quan

QCó bao nhiêu cách để Codex sử dụng máy tính và chúng là gì?

ACó ba cách để Codex sử dụng máy tính: Computer Use, Tiện ích mở rộng Chrome và Trình duyệt trong ứng dụng.

QKịch bản nào phù hợp nhất để sử dụng Computer Use?

AComputer Use phù hợp nhất cho các tác vụ cần thao tác giao diện đồ họa trên các ứng dụng gốc của máy tính để bàn (như Spotify), cài đặt hệ thống, mô phỏng iOS, hoặc các quy trình công việc kéo dài nhiều ứng dụng mà không có API hoặc công cụ có cấu trúc hỗ trợ.

QƯu điểm chính của việc sử dụng Tiện ích mở rộng Chrome so với Computer Use cho các tác vụ trình duyệt là gì?

AƯu điểm chính của Tiện ích mở rộng Chrome là nó cung cấp trạng thái đăng nhập, cookie, hồ sơ trình duyệt và khả năng điều khiển nhiều tab của người dùng, phù hợp cho các tác vụ như Gmail, LinkedIn hoặc nghiên cứu đa trang web đã đăng nhập. Nó hoạt động ở cấp độ ngữ cảnh trình duyệt có cấu trúc hơn so với việc điều khiển bằng thị giác từng tọa độ màn hình.

QTrình duyệt trong ứng dụng phù hợp cho những loại công việc nào và tại sao nó bị cô lập?

ATrình duyệt trong ứng dụng phù hợp cho việc phát triển và gỡ lỗi web, như xem máy chủ phát triển cục bộ, tái tạo lỗi giao diện, kiểm tra bố cục đáp ứng và đưa ra nhận xét thiết kế. Nó bị cô lập vì không sử dụng hồ sơ, cookie, tiện ích mở rộng hoặc phiên đăng nhập của trình duyệt thông thường, tạo ra một ranh giới an toàn cho các tác vụ không cần danh tính.

QAppshots đóng vai trò gì trong hệ sinh thái Codex?

AAppshots không phải là một cách để Codex điều khiển máy tính. Nó là công cụ giúp người dùng cung cấp ngữ cảnh từ màn hình máy tính cho Codex (bằng cách chụp cửa sổ đang hoạt động), để Codex hiểu và xử lý. Nó giải quyết vấn đề đầu vào ngữ cảnh, trong khi Browser, Chrome và Computer Use giải quyết vấn đề hành động.

Nội dung Liên quan

Đếm ngược GPT-5.6: Từ bỏ ảo tưởng API đơn nhất, tốc độ lặp lại sức mạnh tính toán nhanh đến mấy cũng không chống nổi một tờ quy định tuân thủ

Giữa tháng 6, ba sự kiện – Fable 5 bị giới hạn tuân thủ, GLM-5.2 được mã nguồn mở và thời điểm ra mắt GPT-5.6 bị rò rỉ – đánh dấu bước ngoặt cho ngành AI toàn cầu. Các logic vận hành cơ bản đang được định hình lại: 1. **"Khả năng sử dụng" quan trọng hơn "tính tiên tiến":** Chuỗi cung ứng mô hình lớn bước vào giai đoạn "hai luồng" với mã nguồn đóng được kiểm soát và mã nguồn mở triển khai cục bộ cùng tồn tại. 2. **Rào cản cạnh tranh thay đổi:** Các gã khổng lồ mã nguồn đóng chuyển trọng tâm từ "trí tuệ ngôn ngữ" sang "trí tuệ không gian (mô hình thế giới)" đòi hỏi lượng lớn sức mạnh tính toán. 3. **Thiết kế "phi mô hình" là yêu cầu sống còn:** Để đối phó rủi ro tuân thủ xuyên quốc gia, các nhà phát triển ứng dụng phải đảm bảo tính liên tục kinh doanh bằng cách tách biệt logic nghiệp vụ khỏi một mô hình cụ thể. Sự kiện Fable 5 của Anthropic bị hạn chế truy cập chỉ sau 72 giờ đối với người dùng không phải công dân Mỹ cho thấy rủi ro tuân thủ có thể vô hiệu hóa bất kỳ lợi thế công nghệ nào. Trong bối cảnh đó, các mô hình mã nguồn mở như GLM-5.2 của Trí Phổ AI trở thành lựa chọn dự phòng chiến lược, nhờ hiệu suất được cải thiện, chi phí thấp hơn đáng kể và khả năng triển khai cục bộ. Để tái khẳng định giá trị, các hãng mã nguồn đóng như OpenAI đang định vị lại. GPT-5.6 (dự kiến ra mắt) chuyển trọng tâm sang "trí tuệ không gian", nhằm tạo khoảng cách thế hệ mới trong các lĩnh vực như mô phỏng công nghiệp và robot – nơi đòi hỏi sức mạnh tính toán khổng lồ. Bài học rõ ràng: Trong môi trường hiện nay, việc đánh giá cơ sở hạ tầng AI không thể chỉ dựa trên hiệu suất kỹ thuật. Khả năng truy cập ổn định và tuân thủ quy định đã trở thành các yếu tố tiên quyết ngang bằng. Đối với các doanh nghiệp, việc phụ thuộc hoàn toàn vào API của một nhà cung cấp duy nhất là rủi ro cao. Thiết kế kiến trúc "phi mô hình" để có thể chuyển đổi linh hoạt giữa các giải pháp là điều tối cần thiết để đảm bảo tính liên tục trong kinh doanh.

marsbit24 phút trước

Đếm ngược GPT-5.6: Từ bỏ ảo tưởng API đơn nhất, tốc độ lặp lại sức mạnh tính toán nhanh đến mấy cũng không chống nổi một tờ quy định tuân thủ

marsbit24 phút trước

Cuộc Chiến 'Trợ Cấp Token' của Những Gã Khổng Lồ AI Sắp Kết Thúc Chưa?

Cuộc chiến trợ cấp Token giữa các gã khổng lồ AI như OpenAI, Anthropic và Google đang diễn ra quyết liệt. Hiện tại, người dùng đang được hưởng mức giá "bẻ gãy" khi các công ty này bù lỗ nặng để thu hút và giữ chân người dùng, đặc biệt là các gói cao cấp. Tuy nhiên, khác với các cuộc chiến trợ cấp thời internet, token AI hầu như không tạo ra hiệu ứng "khóa" người dùng do việc chuyển đổi giữa các nền tảng là quá dễ dàng. Bill Maris, người sáng lập Google Ventures, dự đoán 100% rằng Google - với lợi thế từ cỗ máy in tiền quảng cáo khổng lồ - có thể hạ giá token thêm 80%, gây áp lực khủng khiếp lên các đối thủ phụ thuộc vào vốn đầu tư như OpenAI và Anthropic. Điều này đặt ra câu hỏi về tính bền vững của mô hình kinh doanh khi họ phải công khai báo cáo tài chính sau IPO. Bài viết phân tích hai kịch bản có thể xảy ra: 1) Mô hình "dịch vụ internet" với một vài công ty thống trị rồi tăng giá, hoặc 2) Token trở thành cơ sở hạ tầng tiêu chuẩn như "điện, nước", nơi cạnh tranh đẩy giá xuống sát chi phí và lợi nhuận trở nên rất thấp. Do thiếu hiệu ứng khóa chân người dùng, kịch bản thứ hai có vẻ thực tế hơn. Cuộc chiến này có thể không có kẻ chiến thắng rõ ràng, mà là một cuộc chạy đua tiêu hao kéo dài nhằm giữ vị trí trên "bàn chơi", thúc đẩy AI trở thành một tiện ích cơ sở hạ tầng công cộng mà không công ty nào có thể độc chiếm. Đối với người dùng, điều này có nghĩa là họ có thể tiếp tục được hưởng lợi từ các giao dịch "hời" trong một thời gian dài hơn.

marsbit40 phút trước

Cuộc Chiến 'Trợ Cấp Token' của Những Gã Khổng Lồ AI Sắp Kết Thúc Chưa?

marsbit40 phút trước

Ngoài sân cỏ: Trò chơi đầu cơ xoay quanh World Cup

Bên cạnh sân cỏ, World Cup 2026 đã tạo ra một mạng lưới đầu cơ đa dạng, biến sự kiện thể thao thành một thí nghiệm đầu tư toàn cầu kéo dài hàng tháng. Thị trường dự đoán (như Polymarket, Kalshi) nổi lên như một kịch bản đầu cơ mới, thu hút khối lượng giao dịch khổng lồ, thậm chí lấn át sự phát triển của các nền tảng cá cược truyền thống vốn vẫn là thị trường cơ bản lớn nhất. Các cổ phiếu khái niệm liên quan đến World Cup, như cổ phiếu "gà rán" của Hàn Quốc hay cổ phiếu liên quan đến đội tuyển Nhật Bản, biến động mạnh theo kết quả thi đấu và tâm lý người hâm mộ. Thị trường vé xem trở thành sân chơi đầu cơ phức tạp, với việc bán lại vé, giao dịch quyền mua vé (RTB) và cả hành vi "bán khống" vé trên các sàn thứ cấp. Các mặt hàng sưu tầm như sticker Panini hay áo đấu phiên bản giới hạn cũng được săn đón và định giá lại trên thị trường thứ cấp. Lĩnh vực tiền điện tử chứng kiến sự bùng nổ của các meme coin lợi dụng chủ đề World Cup, mang lại lợi nhuận siêu tốc cho một số ít nhưng cũng tiềm ẩn rủi ro sụp đổ lớn. Cuối cùng, một lớp dịch vụ khác thu lợi bằng cách cung cấp công cụ theo dõi giá vé, thông tin hoặc lời khuyên cá cược cho chính những người tham gia vào cuộc chơi đầu cơ này. Tóm lại, World Cup không chỉ là lễ hội bóng đá mà còn là một cửa sổ toàn cầu hiếm có, nơi sự chú ý, cảm xúc và nguồn lực được nén lại, tạo ra một hệ sinh thái đầu cơ đa tầng phức tạp xoay quanh nó.

marsbit1 giờ trước

Ngoài sân cỏ: Trò chơi đầu cơ xoay quanh World Cup

marsbit1 giờ trước

Tuyên Bố ETF Hyperliquid Thu Hút Sự Chú Ý Khi Câu Chuyện HYPE Phát Triển Trên X

Tuyên bố từ AlphaOnChain trên X (trước đây là Twitter) ngày 20 tháng 6 cho biết ba quỹ ETF Hyperliquid (HYPE) được ra mắt vào tháng 5 năm 2026 đã tích lũy tổng cộng 158 triệu USD tài sản. Trong đó, ETF Bitwise HYPE được cho là có 88 triệu USD và ETF 21Shares HYPE có 66 triệu USD. Thông tin này đã thu hút sự chú ý vào cuối tuần, củng cố cho nhận định rằng HYPE đang trở thành một trong những đồng altcoin được theo dõi sát sao, khi các nhà giao dịch tìm kiếm cơ hội vượt trội ngoài Bitcoin và Ethereum. Tuy nhiên, bài viết nhấn mạnh một cảnh báo quan trọng: các con số này đến từ một bài đăng trên mạng xã hội, chưa được xác minh bởi dữ liệu chính thức từ nhà phát hành quỹ, hồ sơ trao đổi hoặc trang thông tin quỹ. Do đó, chúng nên được coi là một tín hiệu cho thấy sự quan tâm ngày càng tăng xung quanh đồng tiền HYPE, chứ không phải là bằng chứng cuối cùng về dòng tiền thực tế. Hyperliquid thu hút cộng đồng nhờ hệ sinh thái tập trung vào giao dịch perpetual trên chuỗi và cơ sở hạ tầng sàn giao dịch. Nếu các sản phẩm ETF liên quan đến HYPE thực sự thu hút được lượng tài sản đáng kể, điều này có thể cho thấy nhu cầu từ cả tổ chức và nhà đầu tư cá nhân đang bắt đầu mở rộng sang các tài sản crypto có rủi ro cao hơn. Đối với các nhà giao dịch, dù sự quan tâm trên mạng xã hội có thể tác động ngắn hạn đến thị trường, nhưng sự tăng trưởng bền vững thường cần đến nhu cầu đã được xác nhận, thanh khoản và sự phát triển liên tục của hệ sinh thái.

bitcoinist2 giờ trước

Tuyên Bố ETF Hyperliquid Thu Hút Sự Chú Ý Khi Câu Chuyện HYPE Phát Triển Trên X

bitcoinist2 giờ trước

Quy tắc sắt của thiết bị bán dẫn đang bị phá vỡ

Quy tắc bất thành văn lâu nay trong ngành thiết bị bán dẫn, nơi các nhà sản xuất chip thường ép giảm giá (khoảng 10%) cho các đơn hàng lặp lại, đang bị phá vỡ. Gần đây, một số nhà cung cấp thiết bị chính của SK Hynix đã đề nghị tăng giá 3-4%, phản ánh sự thay đổi quyền lực thị trường. Nguyên nhân chính là cơn sốt mở rộng sản xuất để đáp ứng nhu cầu AI, dẫn đến tình trạng thiếu hụt thiết bị nghiêm trọng. Cụ thể, thiết bị TCB (Thermal Compression Bonding) đang "bán chạy" nhờ làn sóng đặt hàng cho sản xuất HBM4, chiplet AI và CPU. Các nhà sản xuất chính như Hanmi Semiconductor, Hanwha Semitech và ASMPT nhận được nhiều đơn hàng lớn. Trong khi đó, công nghệ Hybrid Bonding tiên tiến hơn sẽ được áp dụng rộng rãi hơn từ HBM5, còn ở giai đoạn hiện tại, TCB vẫn là giải pháp thực tế. Không chỉ vậy, sự thiếu hụt còn lan sang chính chuỗi cung ứng thiết bị. Các linh kiện quan trọng để sản xuất thiết bị kiểm tra bán dẫn như FPGA, CPU, Driver IC cũng khan hiếm do bị ưu tiên cung cấp cho các trung tâm dữ liệu AI, làm chậm tiến độ giao hàng thiết bị kiểm tra. Các báo cáo từ SEMI và Counterpoint dự báo một chu kỳ tăng trưởng mạnh mẽ cho ngành thiết bị bán dẫn, thúc đẩy bởi ba xu hướng: mở rộng công nghệ logic tiên tiến (TSMC, Intel, Samsung), bùng nổ sản xuất HBM (SK Hynix, Micron) và đầu tư lớn vào đóng gói tiên tiến (CoWoS, C2S). Tóm lại, các nhà cung cấp thiết bị then chốt nắm giữ công nghệ không thể thay thế trong các lĩnh vực này đang nắm giữ chìa khóa cho năng lực sản xuất trong kỷ nguyên AI, từ đó định hình lại cán cân quyền lực và định giá trong toàn ngành.

marsbit3 giờ trước

Quy tắc sắt của thiết bị bán dẫn đang bị phá vỡ

marsbit3 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片