Cách đúng đắn để mở khóa Skill: 5 bài học từ phương pháp nội bộ được Anthropic công bố

marsbitXuất bản vào 2026-06-08Cập nhật gần nhất vào 2026-06-08

Tóm tắt

Bài viết này chia sẻ 5 bài học chính từ bài viết "Lessons from building Claude Code: How we use skills" của Anthropic về cách thiết kế và sử dụng Skill hiệu quả: 1. **Tránh lời thừa, tập trung vào "Gotchas"**: Skill nhằm lưu trữ kiến thức ẩn (kinh nghiệm "lão làng") như các lỗi hay gặp hoặc thông tin đặc thù hệ thống, thay vì lặp lại kiến thức chung đã có. 2. **Skill là "Context Engineering"**: Cấu trúc Skill nên là một thư mục với các file riêng biệt (hướng dẫn, tài liệu tham khảo, script, ví dụ). Cách tiếp cận "tiết lộ dần" này giúp quản lý ngữ cảnh tốt hơn, tránh làm quá tải mô hình bằng thông tin không cần thiết trong mọi lần gọi. 3. **Ưu tiên sử dụng Script**: Những công việc lặp lại, có quy trình cố định nên được đóng gói thành script. Điều này giúp tiết kiệm token, tăng độ chính xác và cho phép mô hình tập trung vào suy luận thay vì thực thi các bước cơ bản. 4. **Mô tả Skill phải như một quy tắc định tuyến**: Phần mô tả nên nêu rõ *khi nào* thì Skill nên được kích hoạt (dựa trên ý định của người dùng), thay vì chỉ liệt kê chức năng của nó. Điều này giúp mô hình định tuyến và lựa chọn Skill chính xác. 5. **Quản lý và phân phối Skill linh hoạt**: Khi số lượng Skill tăng lên, nên có cơ chế quản lý nhẹ nhàng. Anthropic khuyến khích để Skill mới được thử nghiệm và lan truyền tự nhiên trong nhóm nhỏ trước. Những Skill nào thực sự hữu ích và được nhiều người dùng sẽ được đưa vào kho chung (Marketplace) một cách tự nhiên.

Tác giả: AI Sản phẩm A Dĩnh

Tôi vừa đọc một bài blog của team Anthropic có tiêu đề "Bài học từ việc xây dựng Claude Code: Cách chúng tôi sử dụng Skill". Đây có lẽ là bài tổng kết thực tiễn sâu sắc nhất về Skill mà tôi từng thấy đến nay.

Skill thực ra không phức tạp, nhưng thực sự muốn làm tốt Skill, tôi nghĩ cũng không dễ dàng.

Tôi nhớ lúc Skill mới nổi, mọi người đặc biệt thích làm các Skill về phong cách viết, Skill viết lách. Hình như chỉ cần nhét phong cách viết của mình vào, mô hình sẽ có thể xuất kết quả ổn định theo phong cách đó.

Nhưng sau đó tôi tự mình thử một vòng, phát hiện nhiều lúc hoàn toàn không khả thi.

Bởi vì một Skill về phong cách viết có thể chứa vài nghìn thậm chí hàng chục nghìn chữ. Khi Skill được tải, ngữ cảnh đã chiếm mất một phần lớn. Ngữ cảnh một khi nặng, khả năng tư duy của mô hình lại dễ bị giảm xuống.

Cuối cùng thường xuất hiện một tình huống: phong cách thì học được, nhưng nội dung trở nên hời hợt, khả năng phân tích cũng yếu đi.

Lại còn một tình huống phổ biến khác.

Nhiều người khi viết Skill, thích nhét đủ loại hướng dẫn thao tác vào. Bước đầu tiên làm gì, bước hai làm gì, bước ba làm gì. Kết quả chạy thử sẽ phát hiện, việc thực thi của mô hình không ổn định.

Sau này tôi mới dần hiểu ra, rất nhiều công việc lặp đi lặp lại như vậy, thực ra phù hợp hơn khi kết tủa thành Script, chứ không phải viết thành Instructions dài dòng.

Sau khi đọc xong bài viết này của Anthropic, cảm nhận lớn nhất của tôi là, rất nhiều người thực ra đang dùng Skill, nhưng chưa chắc đã thực sự hiểu Skill.

Về bản chất, Skill đang làm Context Engineering (Kỹ thuật Ngữ cảnh). Khi nào nên đưa kiến thức vào Skill, khi nào nên tách thành References, khi nào nên viết thành Script, khi nào nên dùng Gotchas để ràng buộc mô hình, bên trong đó thực ra có rất nhiều kinh nghiệm.

Sau khi hiểu nguyên lý vận hành của Skill, nhìn lại những Skill xuất sắc đó, sẽ phát hiện chúng giải quyết không bao giờ là vấn đề của prompt (lời nhắc), mà là đang giải quyết vấn đề về ngữ cảnh, kết tủa kinh nghiệm và tái sử dụng năng lực.

Nếu mọi người muốn nghiên cứu sâu về Skill, đặc biệt đề xuất đọc hai bài viết:

https://claude.com/blog/lessons-from-building-claude-code-how-we-use-skills

https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

#01 Đừng viết những câu vô nghĩa

Về bản chất, Skill đang kết tủa "kiến thức ngầm" trong tổ chức. Vì vậy, trong Skill đừng lặp lại những kiến thức thông thường mà nó đã biết. Giá trị thực sự thực ra là những thông tin mà mô hình hoàn toàn không biết.

Nội bộ Anthropic thường nhấn mạnh, thứ thực sự cần viết trong Skill là Gotchas, tức là những cái bẫy thường gặp.

Ví dụ:

1. Bảng này không thể sắp xếp theo created_at

2. Staging trả về 200 không đại diện cho thành công

3. request_id và trace_id là một thứ

Bởi vì những thông tin này thường tồn tại trong kinh nghiệm của nhân viên. Vì vậy nhất định phải nhớ bản chất của Skill là gì.

Skill = Viết ra kinh nghiệm của người thợ lành nghề.

Thông qua Skill, kết tủa những kinh nghiệm vốn nằm rải rác trong đầu óc của những người khác nhau.

#02 Skill thực ra là Context Engineering

Đây có lẽ là một trong những quan điểm sâu sắc nhất của Anthropic.

Skill không phải là một file markdown, mà là một thư mục. Với người đã dùng Skill, câu này nghe giống như chuyện thừa.

Nhưng mấy ngày nay tôi suy đi nghĩ lại, dần nhận ra: họ chính là muốn dùng hình thức thư mục này để diễn đạt quan niệm về Context Engineering.

Chúng ta hãy xem lại cấu trúc Skill điển hình một lần nữa:

skill/ ├── SKILL.md ├── references/ chứa giải thích chi tiết, tham chiếu API, điều kiện biên ├── scripts/ chứa script có thể thực thi ├── examples/ chứa ví dụ ├── assets/ chứa template, hình ảnh, tài liệu cố định

Khi gọi một Skill nào đó, mô hình đầu tiên đọc là SKILL.md. Nếu chúng ta nhét tất cả thông tin vào file này, ngữ cảnh sẽ nhanh chóng bùng nổ.

Giả sử đây là một Skill xử lý sự cố thanh toán, bên trong có cả giải thích mã lỗi Stripe, cũng có các trường hợp sự cố lịch sử, còn có script kiểm tra và template báo cáo cuối cùng.

Nếu toàn bộ nội dung này chất đống vào SKILL.md, mỗi lần gọi Skill, Claude đều phải đọc lại từ đầu.

Cho dù người dùng chỉ muốn xác nhận ý nghĩa của một mã lỗi, cho dù chỉ muốn xem tại sao một trạng thái thanh toán nào đó không được cập nhật. Một lượng lớn thông tin hoàn toàn không dùng đến, cũng sẽ bị nhét chung vào ngữ cảnh.

Còn tư duy của Anthropic hoàn toàn khác.

SKILL.md giống một trang điều hướng hơn. Nhiệm vụ của nó là nói cho mô hình biết, khi gặp lỗi Stripe, hãy vào references tìm giải thích tương ứng.

Cần tham khảo trường hợp lịch sử, vào examples tra vấn đề tương tự, cần thực sự thực hiện thao tác kiểm tra, chạy script trong scripts, cuối cùng khi tạo báo cáo xử lý sự cố, lại sử dụng template trong assets.

Toàn bộ quá trình là sự tiếp xúc từ từ.

Bức hình dưới đây, mạnh mẽ đề nghị mọi người lưu lại.

#03 Cố gắng dùng script

Đừng để mô hình lãng phí ngữ cảnh và khả năng suy luận có hạn vào lao động lặp đi lặp lại. Hãy giao những việc này cho script.

Lấy ví dụ. Nhiều người khi viết Skill, sẽ viết như thế này:

1. Truy vấn dữ liệu đăng ký; 2. Truy vấn dữ liệu trả phí; 3. Tính tỷ lệ chuyển đổi; 4. Phân tích nguyên nhân bất thường.

Cách viết này tất nhiên không vấn đề gì. Mô hình cũng có thể hoàn thành. Nhưng mỗi lần thực thi, nó đều phải đi lại toàn bộ quy trình phân tích từ đầu.

Truy vấn dữ liệu, tổ chức dữ liệu, xử lý các tình huống biên giới khác nhau, những công việc này thực ra đều lặp lại.

Đã những khả năng này được kiểm chứng vô số lần. Tại sao lại để mô hình phát minh lại một lần nữa? Chi bằng cung cấp trực tiếp script cụ thể.

Hơn nữa thông qua cách thức script, việc thực thi Skill cũng sẽ chính xác hơn, cũng tiết kiệm Token hơn.

Từ góc độ này, Scripts trong Skill thực ra đang kết tủa năng lực tổ chức. Phía sau mỗi script, thường là phương pháp thực tiễn tốt nhất mà team đã tổng kết sau khi vấp vô số hố.

Sau khi cố định hóa những năng lực này lại. Mỗi lần Claude đều có thể đứng trên những kinh nghiệm này làm việc, thay vì từ con số không bắt đầu hết lần này đến lần khác.

Vì vậy tôi càng ngày càng cảm thấy, trong Skill, Instructions và Scripts giải quyết là vấn đề ở hai tầng khác nhau.

Instructions cung cấp là kinh nghiệm và phán đoán, Scripts cung cấp là năng lực và thực thi.

Lấy ví dụ, trong Skill xử lý sự cố thanh toán có thể có câu như vậy:

Nếu Stripe trả về 200, đừng trực tiếp cho rằng thanh toán thành công, cần kiểm tra thêm bảng payment_events.

Điều này thuộc về Instructions. Bởi vì đây là kinh nghiệm, còn check_payment_events() thuộc về Script, bởi vì đây là năng lực thực thi.

Nếu chỉ có Script, mô hình biết cách tra, nhưng chưa chắc biết tại sao tra.

Nếu chỉ có Instructions, mô hình biết nên tra. Nhưng mỗi lần đều phải thực hiện lại. Hai thứ thiếu một không được.

#04 Description giống một quy tắc định tuyến hơn

Cách nhiều người viết Skill Description bẩm sinh đã sai.

Bởi vì mọi người quen viết thành giới thiệu chức năng. Ví dụ: PR Management Skill giúp người dùng giám sát trạng thái PR, xử lý vấn đề CI, tự động hoàn thành Merge.

Nhưng vấn đề ở chỗ, mô hình không phải thông qua chức năng để tìm Skill, Claude Code khi khởi động, sẽ quét trước tên và Description của tất cả Skill.

Sau đó căn cứ vào vấn đề hiện tại của người dùng, phán đoán nên tải Skill nào.

Vì vậy thông tin quan trọng nhất trong Description, không phải là Skill này có thể làm gì, mà là trong tình huống nào nên tải nó.

Description thực ra đảm nhiệm công việc định tuyến của toàn bộ Skill.

Trong thế giới thực, rất ít người nói giúp tôi gọi một công cụ quản lý PR. Mọi người có khả năng hơn nói: giúp tôi để ý PR này, CI lại sập rồi đại loại.

Vì vậy một Description tốt, nên cố gắng miêu tả ý định của người dùng, chứ không phải liệt kê chức năng.

Tôi thậm chí cảm thấy có thể dùng một phương pháp đặc biệt đơn giản để kiểm tra.

Sau khi viết xong Description, xóa toàn bộ Skill, chỉ giữ lại dòng Description này. Sau đó tự hỏi: sau khi mô hình thấy vấn đề của người dùng, có biết khi nào nên tải Skill này không.

Nếu không làm được, khả năng lớn vẫn phải tiếp tục sửa.

#05 Quản lý và phân phối Skill

Còn một điều nữa là về quản lý Skill.

Một người dùng Skill, việc này thực ra rất đơn giản. Tự viết mấy Skill, tự bảo trì, tự nâng cấp là xong. Nhưng tôi tin đa số team sau này đều sẽ gặp phải cùng một vấn đề.

Khi Skill từ vài cái biến thành mấy chục, thậm chí mấy trăm cái, những Skill này nên quản lý thế nào? Nâng cấp thế nào? Phân phối cho thành viên team thế nào?

Kinh nghiệm của Anthropic ở phương diện này, tôi cảm thấy khá đáng tham khảo.

Khi quy mô team tương đối nhỏ, Skill đi trực tiếp theo kho mã. Đặt trong thư mục .claude/skills trong dự án là được. Mọi người chia sẻ cùng một bộ Skill, cũng chia sẻ cùng một phương pháp làm việc.

Nhưng cùng với số lượng Skill ngày càng nhiều, một vấn đề mới xuất hiện.

Claude Code khi khởi động, sẽ quét tên và Description của tất cả Skill, sau đó phán đoán nhiệm vụ hiện tại nên gọi Skill nào. Skill càng nhiều, chi phí định tuyến càng cao.

Đây cũng là lý do tại sao Anthropic sau này bắt đầu làm Marketplace. Nhưng thú vị hơn là, cách thức họ quản lý Marketplace.

Nhiều công ty gặp vấn đề kiểu này, phản ứng đầu tiên thường là thiết lập một quy trình phê duyệt. Ai viết Skill, trước tiên nộp đơn; sau khi thông qua kiểm duyệt, mới vào kho Skill chính thức. Nội bộ chúng tôi trước đây cũng làm vậy, nhưng rất nặng nề. Vì quản lý mà quản lý

Tôi phát hiện cách tổ chức của Anthropic rất nhẹ nhàng.

Để Skill mới trước tiên lan truyền trong phạm vi nhỏ, để đồng nghiệp tự cài đặt, tự thử dùng.

Nếu ngày càng nhiều người bắt đầu sử dụng, chứng tỏ Skill này thực sự giải quyết một vấn đề thực tế nào đó. Đến giai đoạn này, tác giả mới nộp lên Marketplace chính thức.

Vì vậy họ không bàn trước Skill có giá trị không, mà để nó tiếp nhận kiểm nghiệm của tình huống sử dụng thực tế trước, người dùng nhiều, tự nhiên sẽ vào hệ thống chính thức. Những Skill còn lại như vậy, cơ bản đều là Skill mà team thực sự cần.

Câu hỏi Liên quan

QSkill là gì và tại sao việc hiểu đúng về nó quan trọng?

ASkill (Kỹ năng) về bản chất là một hình thức Context Engineering (Kỹ thuật ngữ cảnh), nhằm chuyển hóa những kiến thức ngầm (kinh nghiệm, cách giải quyết vấn đề) trong tổ chức thành một tài nguyên có thể tái sử dụng được bởi AI. Hiểu đúng về Skill quan trọng vì nó giúp chúng ta không chỉ đơn thuần đưa dữ liệu vào mà còn biết cách tổ chức ngữ cảnh một cách thông minh (ví dụ: tách biệt hướng dẫn, tài liệu tham khảo, script) để tối ưu hiệu suất và khả năng suy luận của mô hình, tránh làm quá tải ngữ cảnh dẫn đến đầu ra kém chất lượng.

QTheo Anthropic, điều gì là giá trị nhất cần đưa vào một Skill và tại sao?

ATheo Anthropic, điều giá trị nhất cần đưa vào một Skill là các 'Gotchas' - những lỗi thường gặp, những điểm dễ nhầm lẫn hoặc các sự thật ngầm mà chỉ những người có kinh nghiệm (như các 'chuyên gia lão làng') mới biết. Ví dụ: 'Bảng này không thể sắp xếp theo created_at' hay 'Staging trả về 200 không có nghĩa là thành công'. Đây là những thông tin mô hình không tự biết, và việc ghi lại chúng giúp AI tránh được các lỗi lặp lại, từ đó nâng cao chất lượng và độ tin cậy của công việc.

QCấu trúc thư mục của một Skill (với SKILL.md, references, scripts...) phản ánh triết lý gì trong Context Engineering?

ACấu trúc thư mục của một Skill phản ánh triết lý 'tiếp xúc có chọn lọc' (gradual exposure) trong Context Engineering. Thay vì nhồi nhét mọi thứ (hướng dẫn, tài liệu tham khảo, script, mẫu) vào một file SKILL.md duy nhất gây quá tải ngữ cảnh, cấu trúc này cho phép mô hình chỉ tải thông tin cần thiết khi cần. SKILL.md đóng vai trò như một trang chỉ mục hoặc bản đồ, hướng dẫn mô hình đến đúng tài nguyên (references, scripts, examples) tùy theo nhiệm vụ cụ thể. Cách tiếp cận này tối ưu hóa việc sử dụng token và duy trì khả năng suy luận của mô hình.

QTại sao nên sử dụng Scripts (kịch bản) trong Skill thay vì chỉ mô tả từng bước trong Instructions?

ANên sử dụng Scripts trong Skill vì chúng đóng gói và tự động hóa các công việc lặp đi lặp lại, có logic cố định (như truy vấn dữ liệu, tính toán, kiểm tra trạng thái). Điều này mang lại nhiều lợi ích: 1) Tiết kiệm token và năng lực xử lý của mô hình, dành chúng cho các nhiệm vụ đòi hỏi suy luận hơn. 2) Đảm bảo độ chính xác và nhất quán cao hơn so với việc để mô hình 'tái phát minh' các bước mỗi lần. 3) Scripts là sự kết tinh của 'năng lực tổ chức' và các phương pháp hay nhất đã được kiểm chứng, cho phép AI làm việc dựa trên nền tảng kinh nghiệm sẵn có thay vì bắt đầu từ số không.

QMục đích chính của mô tả (Description) một Skill là gì, và làm thế nào để viết nó một cách hiệu quả?

AMục đích chính của mô tả (Description) một Skill là đóng vai trò như một quy tắc định tuyến (routing rule), giúp mô hình AI (như Claude) quyết định *khi nào* thì nên kích hoạt Skill đó dựa trên vấn đề hoặc ý định của người dùng. Mô tả hiệu quả nên tập trung vào việc mô tả 'ý định của người dùng' hoặc 'tình huống cụ thể' (ví dụ: 'khi CI/CD thất bại', 'khi cần kiểm tra trạng thái thanh toán'), thay vì chỉ liệt kê các chức năng mà Skill có thể làm. Một cách kiểm tra đơn giản là: Nếu chỉ đọc mô tả đó mà không có nội dung Skill, mô hình có thể hiểu được chính xác thời điểm cần tải Skill lên hay không.

Nội dung Liên quan

Chỉ số Nasdaq giảm 4,2% trong một ngày, 'Ngày Thứ Sáu Đen Tối' làm vỡ bong bóng thị trường chứng khoán Mỹ?

Ngày 5 tháng 6, thị trường chứng khoán Mỹ chứng kiến đợt điều chỉnh mạnh nhất trong năm 2026. Chỉ số Nasdaq Composite sụt giảm 4.18%, trong khi chỉ số S&P 500 giảm 2.64%, chấm dứt chuỗi tăng 9 tuần liên tiếp. Lĩnh vực bán dẫn, đặc biệt là các cổ phiếu AI cốt lõi như NVIDIA, AMD, bị ảnh hưởng nặng nề. Nguyên nhân trực tiếp được cho là báo cáo việc làm phi nông nghiệp (Non-Farm Payrolls) tháng 5 mạnh mẽ bất ngờ, làm dấy lên lo ngại về lạm phát và khiến kỳ vọng về việc Cục Dự trữ Liên bang (Fed) cắt giảm lãi suất bị đẩy lùi. Lợi suất trái phiếu kho bạc tăng vọt, gây áp lực lên các cổ phiếu công nghệ có định giá cao vốn nhạy cảm với lãi suất. Sự điều chỉnh này diễn ra trong bối cảnh định giá thị trường chung đang ở mức cao lịch sử, được đo lường bởi các chỉ số như CAPE hay "Chỉ số Buffett". Cùng lúc đó, tâm lý đầu tư vào chủ đề AI - động lực chính của thị trường trong 18 tháng qua - bắt đầu xuất hiện vết nứt. Có những dấu hiệu cho thấy tốc độ tăng trưởng doanh thu có thể chậm lại và việc triển khai ứng dụng AI trong doanh nghiệp không nhanh như kỳ vọng trước đây. Giới phân tích chia thành hai luồng quan điểm: Một bên cảnh báo đây có thể là khởi đầu cho đợt điều chỉnh lớn hơn sau khi bong bóng AI đạt đỉnh, trong khi bên kia xem đây là đợt điều chỉnh lành mạnh, cần thiết trong một thị trường tăng giá, với nền tảng là tăng trưởng lợi nhuận doanh nghiệp vẫn ổn định. Tương lai ngắn hạn của thị trường sẽ phụ thuộc nhiều vào dữ liệu lạm phát CPI tháng 5 sắp được công bố và cuộc họp sắp tới của Fed. Những sự kiện này sẽ làm rõ lộ trình chính sách tiền tệ và kiểm chứng lại niềm tin vào câu chuyện tăng trưởng AI. Thời kỳ tăng giá một chiều có thể đã kết thúc, và thị trường đang bước vào giai đoạn nhạy cảm, nơi các yếu tố cơ bản và dữ liệu vĩ mô sẽ được xem xét khắt khe hơn.

Odaily星球日报9 phút trước

Chỉ số Nasdaq giảm 4,2% trong một ngày, 'Ngày Thứ Sáu Đen Tối' làm vỡ bong bóng thị trường chứng khoán Mỹ?

Odaily星球日报9 phút trước

Vụ Án Đầu Tiên Về Tác Nhân Thông Minh, Phán Quyết Gì?

Vào ngày 30 tháng 4, Tòa án Internet Quảng Châu (Trung Quốc) đã đưa ra phán quyết sơ bộ đầu tiên trong lĩnh vực trợ lý AI, yêu cầu một phần mềm trợ lý AI mã nguồn mở ngừng cung cấp tải xuống và xóa dữ liệu vì đã vượt qua các biện pháp quản lý kỹ thuật của nền tảng để thao tác tự động. Trước đó không lâu, tòa án liên bang Mỹ cũng ra lệnh cấm sơ bộ chống lại Perplexity với lý do tương tự trong vụ kiện của Amazon. Hai phán quyết song song này thiết lập một "ranh giới pháp lý" rõ ràng cho thời đại trợ lý AI: hành vi bỏ qua sự cho phép của nền tảng để truy cập và thao tác là bất hợp pháp. Cốt lõi vấn đề nằm ở khái niệm "ủy quyền kép": trợ lý AI không chỉ cần sự đồng ý của người dùng mà còn phải có sự cho phép rõ ràng từ nền tảng mục tiêu. Việc sử dụng các quyền như "dịch vụ trợ năng" của hệ điều hành để vượt qua các quy tắc của ứng dụng có thể làm mất hiệu lực các cơ chế bảo mật, quyền riêng tư và kiểm duyệt nội dung của nền tảng, gây ra vấn đề về trách nhiệm. Trường hợp của "Điện thoại Doubao" là một ví dụ điển hình về sự điều chỉnh chiến lược. Phiên bản 1.0 ban đầu cố gắng thao tác các ứng dụng khác thông qua quyền hệ thống, nhưng sau đó đã chuyển hướng. Phiên bản 2.0 sắp tới được cho là sẽ đàm phán hợp tác và mở API với các nền tảng lớn như Alibaba, minh chứng cho xu hướng chuyển từ "vượt rào" sang "hợp tác". Những vụ kiện này đánh dấu sự kết thúc của thời kỳ phát triển bùng nổ không kiểm soát của trợ lý AI và bắt đầu một kỷ nguyên cạnh tranh tuân thủ. Chi phí tuân thủ và ủy quýền kép dần trở thành tiêu chuẩn ngành, mang lại lợi ích cho người dùng. Các công ty trợ lý AI có quy mô lớn với nguồn lực để đàm phán sẽ có lợi thế hơn, trong khi các công ty nhỏ hơn có thể phải điều chỉnh mô hình. Ngay cả phần mềm mã nguồn mở cũng không được miễn trừ trách nhiệm. Việc xử lý các công ty tiên phong và cực đoan nhất cho thấy sự khôn ngoan trong quản lý, định hình lại các quy tắc trò chơi cho toàn ngành công nghiệp trợ lý AI.

marsbit14 phút trước

Vụ Án Đầu Tiên Về Tác Nhân Thông Minh, Phán Quyết Gì?

marsbit14 phút trước

Bị Google 'sa thải' vì một bài báo 14 trang, hơn 4000 người lên tiếng ủng hộ, 6 năm sau nhìn lại: Khi ấy bà ấy gần như đã dự đoán toàn bộ kỷ nguyên AI

Năm 2020, Timnit Gebru, trưởng nhóm AI đạo đức tại Google, đã bị sa thải sau một cuộc tranh cãi về bài báo học thuật “On the Dangers of Stochastic Parrots” do bà đồng tác giả. Bài báo cảnh báo về những rủi ro của mô hình ngôn ngữ lớn (LLM) vào thời điểm GPT-3 vừa ra mắt, và giờ đây nhiều cảnh báo đó đã thành hiện thực. Bài báo dài 14 trang đã dự báo chính xác hàng loạt vấn đề mà ngành AI hiện đang đối mặt: “Ảo giác” (Hallucination) khi mô hình tạo ra thông tin sai lệch; việc khuếch đại thành kiến xã hội có sẵn trong dữ liệu huấn luyện; tác động môi trường lớn từ việc tiêu thụ năng lượng; sự thiếu minh bạch về nội dung trong dữ liệu huấn luyện; và nguy cơ “sụp đổ mô hình” (Model Collapse) khi nội dung do AI tạo ra tràn ngập internet và lại trở thành dữ liệu đầu vào cho thế hệ AI tiếp theo. Vụ việc dẫn đến làn sóng phản đối từ hơn 4000 nhân viên và chuyên gia. Sau khi rời Google, Gebru thành lập Viện Nghiên cứu AI Phân tán (DAIR) để tiếp tục điều tra các vấn đề về công bằng, đạo đức và quyền lực tập trung trong AI. Sáu năm sau, bài báo từng gây tranh cãi của bà được ghi nhận vì đã tiên tri chính xác những thách thức cốt lõi của kỷ nguyên AI ngày nay.

marsbit15 phút trước

Bị Google 'sa thải' vì một bài báo 14 trang, hơn 4000 người lên tiếng ủng hộ, 6 năm sau nhìn lại: Khi ấy bà ấy gần như đã dự đoán toàn bộ kỷ nguyên AI

marsbit15 phút trước

Từ Hunyuan đến WeChat AI, Tốc độ chậm của Tencent đã đến giai đoạn chuyển giao

Ngày 8/6/2026, nền tảng phát triển WeChat thông báo AI WeChat bước vào giai đoạn thử nghiệm nội bộ. Trợ lý AI tích hợp này hỗ trợ người dùng gọi, truy cập và vận hành tiểu trình (mini-program) thông qua đối thoại ngôn ngữ tự nhiên. Nền tảng mở cung cấp hai chế độ tích hợp: Chế độ tự động cho phép đọc mã nguồn tiểu trình để AI trực tiếp thao tác; Chế độ phát triển cho phép nhà phát triển tự xây dựng kỹ năng. Đây là lần đầu tiên WeChat mở cửa hệ sinh thái tiểu trình ở lớp đối thoại, đánh dấu bước tiến mới nhất của Tencent từ dự trữ công nghệ, xác thực sản phẩm độc lập đến việc triển khai trên siêu ứng dụng. AI WeChat cần một nền tảng Agent có thể hiểu cấu trúc trang và thực thi lệnh chính xác, chính là mô hình lớn Hunyuan của Tencent. Hunyuan xếp hạng nhất về năng lực ứng dụng tại Trung Quốc trong báo cáo SuperCLUE, phù hợp với nhu cầu của AI WeChat. Dù tốc độ cập nhật mô hình chậm hơn đối thủ, Tencent tập trung vào ổn định và độ trễ thấp, phù hợp với các thao tác nhạy cảm như thanh toán. Ứng dụng độc lập Yuanbao đã đạt hơn 100 triệu MAU nhờ chiến dịch lì xì Tết Nguyên đán 2026, chứng minh khả năng tiếp cận người dùng quy mô lớn thông qua mạng xã hội WeChat. Tuy nhiên, DAU thường nhật sau Tết giảm mạnh, cho thấy thách thức về tỷ lệ giữ chân người dùng. Điều này giải thích lý do Tencent chọn tích hợp nguyên bản AI vào siêu ứng dụng WeChat để giữ chân người dùng thông qua kịch bản sử dụng. Tầm nhìn của Chủ tịch Ma Hóa Đằng là mọi tiểu trình đều có thể trở thành "Agent tôm hùm" thông minh, tự động hoàn thành nhiệm vụ. Tuy nhiên, ông cũng thừa nhận mâu thuẫn tiềm ẩn: điều phối tập trung hiệu quả có thể làm suy yếu chủ quyền lưu lượng truy cập và khả năng hiển thị thương hiệu của nhà cung cấp dịch vụ. Cân bằng giữa hiệu quả trung tâm và bảo vệ lưu lượng truy cập phi tập trung là thách thức cốt lõi chưa có lời giải rõ ràng. Ba tuyến Hunyuan, Yuanbao và AI WeChat đã sẵn sàng, tạo thành một lộ trình logic: Hunyuan cung cấp nền tảng ổn định, Yuanbao xác thực thói quen người dùng, AI WeChat giao trải nghiệm cuối cùng. Thành công phụ thuộc vào việc giải quyết các vấn đề về niềm tin mã nguồn từ nhà phát triển, cân bằng lợi ích hệ sinh thái với nhà cung cấp dịch vụ, và đảm bảo độ chính xác thao tác để người dùng tin tưởng. Cuộc đua AI của Tencent mới chỉ ở một cột mốc giữa đường, còn nhiều thử thách phía trước.

marsbit21 phút trước

Từ Hunyuan đến WeChat AI, Tốc độ chậm của Tencent đã đến giai đoạn chuyển giao

marsbit21 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片