# Bài viết Liên quan Tối ưu hóa

Trung tâm Tin tức HTX cung cấp những bài viết mới nhất và phân tích chuyên sâu về "Tối ưu hóa", bao gồm xu hướng thị trường, cập nhật dự án, phát triển công nghệ và chính sách quản lý trong ngành tiền kỹ thuật số.

Đột phá quan trọng về AI cộng tác! Stanford và Nvidia cùng nhau loại bỏ hao phí giao tiếp trong AI, tốc độ suy luận tăng mạnh 2.4 lần

Tưởng tượng một nhóm trợ lý AI hợp tác giải một bài toán. Cách làm truyền thống buộc chúng phải liên tục "viết" và "đọc" suy nghĩ dưới dạng văn bản, gây lãng phí thời gian, token và làm thất thoát thông tin – vấn đề được gọi là **"Language Tax" (Thuế ngôn ngữ)**. Mới đây, nghiên cứu hợp tác giữa UIUC, Stanford, NVIDIA và MIT đã đề xuất **RecursiveMAS**, một phương pháp đột phá cho phép các agent AI giao tiếp trực tiếp thông qua **"tư duy"** trong không gian tiềm ẩn (latent space), thay vì phải mã hóa và giải mã thành văn bản. Hệ thống này hoạt động như một vòng lặp đệ quy, nơi các agent chuyển tiếp biểu diễn vector ẩn cho nhau cho đến khi hoàn thành nhiệm vụ, chỉ giải mã thành văn bản ở bước cuối cùng. **Lợi ích chính:** - **Tốc độ:** Tăng tốc suy luận từ **1.2 đến 2.4 lần**, hiệu quả tăng theo số vòng lặp đệ quy. - **Chi phí:** Giảm tiêu thụ token **tới 75.6%**. - **Độ chính xác:** Cải thiện trung bình **8.3%** trên nhiều tác vụ chuẩn (toán học, lập trình, hỏi đáp), do giảm thiểu tổn thất thông tin khi "nén" tư duy thành chữ. - **Hiệu quả huấn luyện:** Chỉ cần huấn luyện một mô-đun kết nối nhẹ **RecursiveLink** (0.31% tham số), trong khi đóng băng trọng số mô hình gốc, giảm đáng kể chi phí tính toán. **Ý nghĩa & Hạn chế:** RecursiveMAS mở ra hướng tiếp cận mới để mở rộng hệ thống đa tác nhân: thay vì tăng số lượng agent, có thể **tăng độ sâu đệ quy**. Tuy nhiên, nghiên cứu vẫn cần được kiểm chứng độc lập, đồng thời đối mặt với thách thức về khả năng giải thích (vì quá trình hợp tác diễn ra trong "hộp đen") và khả năng tương thích giữa các kiến trúc model khác nhau. Tóm lại, đây là một bước tiến quan trọng hướng tới việc loại bỏ "nút thắt ngôn ngữ", giúp sự hợp tác giữa các AI trở nên trực tiếp và hiệu quả hơn, giống như **"thần giao cách cảm"**.

marsbit2 ngày trước 00:14

Đột phá quan trọng về AI cộng tác! Stanford và Nvidia cùng nhau loại bỏ hao phí giao tiếp trong AI, tốc độ suy luận tăng mạnh 2.4 lần

marsbit2 ngày trước 00:14

Làm thế nào để trở thành người dùng Claude cao cấp trong 30 ngày?

Bản tóm tắt: Bài viết này hướng dẫn lộ trình 30 ngày để chuyển từ người dùng Claude thông thường thành người dùng cao cấp, tập trung vào việc xây dựng một hệ thống làm việc bền vững thay vì chỉ hỏi đáp ngẫu nhiên. **Tuần 1: Nắm vững nền tảng** - **Ngày 1-2:** Học viết Prompt có cấu trúc gồm Vai trò, Bối cảnh, Nhiệm vụ, Định dạng và Điều kiện ràng buộc. - **Ngày 3-4:** Hiểu về cửa sổ ngữ cảnh, ưu tiên đặt thông tin quan trọng ở đầu và cuối cuộc trò chuyện. - **Ngày 5-7:** Thiết lập 3 Projects chính (công việc, nghiên cứu, viết lách) và kích hoạt Memory để Claude ghi nhớ thông tin cá nhân hóa. **Tuần 2: Xây dựng quy trình làm việc (Workflow)** - **Ngày 8-9:** Tạo workflow nghiên cứu có thể tái sử dụng. - **Ngày 10-11:** Tạo workflow viết hai bước (lập dàn ý rồi viết chi tiết). - **Ngày 12-14:** Tạo workflow hỗ trợ ra quyết định bằng cách phân tích ưu/khuyết điểm. **Tuần 3: Để Claude làm việc tự chủ** - **Ngày 15-17:** Sử dụng Claude Cowork để Claude tự động xử lý tệp và nhiệm vụ trên máy tính. - **Ngày 18-19:** Kết nối Claude với các công cụ như Google Drive, Slack, Gmail. - **Ngày 20-21:** Thiết lập nhiệm vụ tự động hóa, ví dụ tóm tắt email hàng ngày. **Tuần 4: Tối ưu hóa và tích lũy** - **Ngày 22-24:** Đánh giá và tối ưu tất cả workflow dựa trên chất lượng đầu ra. - **Ngày 25-26:** Xây dựng cơ sở kiến thức cá nhân từ các đầu ra chất lượng của Claude. - **Ngày 27-28:** Dạy lại cho người khác để củng cố kiến thức. - **Ngày 29-30:** Thiết kế "hệ điều hành" Claude lý tưởng cho riêng bạn, lập kế hoạch sử dụng hàng tuần. **Kết quả:** Sau 30 ngày, Claude sẽ trở thành trợ lý hiểu bạn, có thể xử lý nhiều tác vụ tự động và nhất quán, giúp bạn tập trung vào công việc sáng tạo và chiến lược. Sự khác biệt nằm ở việc xây dựng một hệ thống có thể lặp lại và cải tiến, không phải những câu lệnh đơn lẻ.

marsbit05/20 08:09

Làm thế nào để trở thành người dùng Claude cao cấp trong 30 ngày?

marsbit05/20 08:09

Tại sao việc xây dựng SocialFi lại bắt nguồn từ việc đọc sai về phương tiện truyền thông của chính nó

SocialFi đã thất bại vì nó hiểu sai bản chất của phương tiện truyền thông xã hội. Bài viết sử dụng lý thuyết "phương tiện nóng/lạnh" của Marshall McLuhan để phân tích. Mạng xã hội truyền thống (như Twitter cũ) là một "phương tiện lạnh": ý nghĩa được tạo ra từ những tín hiệu mơ hồ, mảnh ghép (như tweet) và cần sự tương tác, tham gia của cộng đồng để hoàn thiện. SocialFi (ví dụ Friend.tech) đã cố gắng gắn tài chính trực tiếp vào từng hành vi xã hội (theo dõi, bài đăng) với giá cả giao dịch theo thời gian thực. Điều này biến tín hiệu thành "nóng" - rõ ràng, hoàn chỉnh, không cần diễn giải. Kết quả, người dùng chuyển từ "tham gia" sang "giao dịch". Khi động lực tài chính (lợi nhuận đầu cơ) biến mất, không còn nền tảng xã hội "lạnh" nào để dựa vào, và toàn bộ nền tảng sụp đổ. Bài học là: Vốn (tính thanh khoản) chính là "nhiệt". Đổ nó vào một phương tiện "lạnh" sẽ thay đổi bản chất phương tiện đó. Các nền tảng thành công lâu dài (như Substack, Patreon, Bandcamp) biết cách để vốn "ngưng tụ" ở những điểm cụ thể (ví dụ: gói đăng ký, đợt gây quỹ) mà không làm nóng toàn bộ trải nghiệm tham gia. Chúng giữ cho phần lớn nền tảng ở trạng thái "lạnh", mở và phụ thuộc vào tương tác. NFT cũng minh họa rõ ràng cho quá trình này: từ một hoạt động sưu tầm "lạnh" đầy văn hóa, nó đã bị làm "nóng" nhanh chóng bởi các công cụ định giá, biểu đồ thời gian thực và giao dịch tự động, biến người sưu tầm thành nhà giao dịch và làm mất đi ý nghĩa cộng đồng vốn có. Thất bại chung cho thấy việc thiết kế nền tảng cần tôn trọng và bảo vệ bản chất "lạnh" của phương tiện tương tác xã hội nếu muốn nó tồn tại lâu dài.

marsbit05/14 09:46

Tại sao việc xây dựng SocialFi lại bắt nguồn từ việc đọc sai về phương tiện truyền thông của chính nó

marsbit05/14 09:46

Cách Tự Động Hóa Mọi Quy Trình Làm Việc Với Claude Skills (Hướng Dẫn Đầy Đủ)

**Claude Skills là gì và tại sao chúng bị đánh giá thấp?** Claude Skills không chỉ là prompt lưu sẵn, mà là "nhân viên" được đào tạo chuyên biệt để xử lý một loại công việc cụ thể. Nó cung cấp chất lượng đầu ra ổn định, chuẩn hóa với quy trình, tiêu chuẩn và định dạng nhất quán mỗi lần, khác hẳn với kết quả thay đổi khi dùng prompt thông thường. **Hướng dẫn 4 giai đoạn thực hành:** **Giai đoạn 1: Cài đặt Skill đầu tiên (5 phút)** - Skills là các thư mục chứa file `SKILL.md` trên máy tính bạn. - Tìm Skill phù hợp trên skillsmp.com hoặc GitHub của Anthropic, cài đặt và thử nghiệm ngay với một công việc thực tế. **Giai đoạn 2: Xây dựng Skill tùy chỉnh đầu tiên** Trả lời 3 câu hỏi trước khi viết: 1. **Nhiệm vụ:** Xác định công việc cực kỳ cụ thể. 2. **Kích hoạt:** Liệt kê ít nhất 5 cụm từ bạn sẽ dùng để gọi Skill. 3. **Đầu ra mẫu:** Cung cấp một ví dụ đầu ra hoàn hảo thực tế. Sau đó, viết file `SKILL.md` với hai phần: - **Phần YAML frontmatter:** Ghi tên và mô tả kích hoạt rõ ràng. - **Phần hướng dẫn:** Trình bày quy trình công việc từng bước bằng ngôn ngữ tự nhiên, bao gồm ví dụ và cách xử lý các tình huống đặc biệt. **Giai đoạn 3: Kiểm thử & Tối ưu hóa để đạt cấp độ sản xuất** Kiểm tra Skill qua 3 kịch bản: 1. **Tình huống thông thường** (80% công việc). 2. **Tình huống biên/bất thường** (thiếu dữ liệu, xung đột...). 3. **Kiểm tra áp lực** (phiên bản phức tạp, hỗn độn nhất). Skill đạt chuẩn khi xử lý tốt cả 3. Tối ưu hóa liên tục dựa trên các lỗi phát hiện được. **Giai đoạn 4: Xây dựng thư viện Skill cho ngành của bạn** - Biến mọi nhiệm vụ lặp lại thành một Skill chuyên biệt. - Ví dụ theo ngành: - **Bất động sản:** Viết mô tả BĐS, phân tích thị trường, soạn email theo dõi. - **Marketing:** Tạo brief sự kiện, viết quảng cáo, phân tích A/B. - **Tài chính:** Xử lý báo cáo, phân tích hóa đơn, kiểm tra tuân thủ. - Một Skill tiết kiệm 30 phút/tuần, mười Skill sẽ trả lại cho bạn 260 giờ/năm. Bài viết cung cấp lộ trình thực tế để tự động hóa mọi quy trình công việc bằng cách xây dựng và quản lý một đội ngũ "nhân viên AI" ổn định thông qua Claude Skills.

marsbit05/12 09:55

Cách Tự Động Hóa Mọi Quy Trình Làm Việc Với Claude Skills (Hướng Dẫn Đầy Đủ)

marsbit05/12 09:55

Claude của bạn sẽ mơ đêm nay, đừng làm phiền nó

Bài viết thảo luận về cách các công ty AI như Anthropic sử dụng các thuật ngữ mang tính con người như "mơ" (dreaming), "ghi nhớ" (memory) và "suy nghĩ" (thinking) để mô tả các chức năng kỹ thuật của AI Agent, qua đó làm mờ đi ranh giới giữa máy móc và con người. Cụ thể, tính năng "mơ" của Claude thực chất là một quá trình xử lý tự động ngoại tuyến, nơi Agent phân tích lại nhật ký hoạt động từ các tác vụ trước đó để tìm ra mẫu hành vi và tối ưu hóa hiệu suất trong tương lai, tương tự cơ chế củng cố ký ức khi ngủ của con người. Các nền tảng AI khác như Hermes Agent và OpenClaw cũng có cơ chế tự học tương tự. Bài viết chỉ ra rằng việc sử dụng ngôn ngữ nhân cách hóa này không chỉ là một chiến lược tiếp thị, nhằm tạo cảm giác AI là một thực thể sống có nội tâm, mà còn ảnh hưởng đến cách chúng ta phân bổ trách nhiệm khi có sự cố xảy ra, từ công cụ chuyển sang "chủ thể" hành vi. Đồng thời, nó đề cập đến thách thức kỹ thuật về bộ nhớ dài hạn (context window) của AI và nhu cầu về các cơ chế như "mơ" để lọc và lưu giữ thông tin quan trọng, trong bối cảnh các công ty như Subquadratic đang phát triển mô hình với ngữ cảnh cực dài lên đến 12 triệu token. Cuối cùng, tác giả dự đoán sự xuất hiện của các tính năng như "mơ giữa ban ngày" (daydreaming) để AI lên kế hoạch cho các tác vụ trong tương lai, và nhấn mạnh rằng việc thừa nhận bản chất máy móc của AI khó khăn hơn chúng ta tưởng khi ngôn ngữ đang liên tục được định hình lại.

marsbit05/11 00:19

Claude của bạn sẽ mơ đêm nay, đừng làm phiền nó

marsbit05/11 00:19

Nhà đạt giải Turing Sutton và tác phẩm mới: Sử dụng một công thức từ năm 1967 để giải quyết một khuyết điểm lớn trong học tăng cường dạng luồng

Vào cuối năm 2024, một nhóm nghiên cứu tại Đại học Alberta đã chỉ ra một nghịch lý: học tăng cường (RL) vốn được thiết kế để học “trên đường chạy” (streaming), lại gần như không thể hoạt động trong môi trường deep learning nếu không có bộ đệm dữ liệu (replay buffer) hoặc batch size lớn. Hiện tượng này được gọi là “stream barrier”. Một năm rưỡi sau, nghiên cứu mới với sự tham gia của Richard Sutton (Giải Turing 2024) đã đưa ra giải pháp cốt lõi: nguyên nhân không phải do thiếu dữ liệu, mà do **đơn vị của learning rate (bước học) đã bị chọn sai**. Các phương pháp truyền thống quy định tham số thay đổi bao nhiêu, dẫn đến đầu ra hàm mục tiêu thay đổi không kiểm soát, gây ra hiện tượng dao động mạnh và sụp đổ khi học online (batch size=1). Nghiên cứu đề xuất **“Cập nhật Có Chủ Đích” (Intentional Updates)**, lấy ý tưởng từ thuật toán NLMS năm 1967. Thay vì định trước kích thước bước cho tham số, họ xác định trước **lượng thay đổi mong muốn ở đầu ra** (ví dụ: giảm 5% sai số dự đoán giá trị), rồi tính ngược ra learning rate phù hợp. Cách tiếp cận này đảm bảo mỗi bước cập nhật tác động một cách nhất quán lên hàm mục tiêu. Phương pháp được áp dụng cho học giá trị (Intentional TD) và học chính sách (Intentional Policy Gradient), kết hợp với RMSProp và eligibility traces. Kết quả thử nghiệm trên các nhiệm vụ MuJoCo và Atari cho thấy, trong chế độ streaming, các thuật toán mới đạt hiệu suất ngang bằng với các phương pháp tiêu chuẩn như SAC hay DQN (vốn dùng replay buffer lớn), trong khi yêu cầu tính toán ít hơn đáng kể (chỉ khoảng 1/140 so với SAC). Ưu điểm chính là tính ổn định và độc lập với nhiều kỹ thuật ổn định hóa phức tạp. Tuy nhiên, nghiên cứu cũng chỉ ra một hạn chế tiềm ẩn: trong học chính sách, learning rate phụ thuộc vào hành động được lấy mẫu, có thể gây ra sai lệch nhỏ trong hướng kỳ vọng của gradient. Tóm lại, “Cập nhật Có Chủ Đích” đưa học tăng cường dòng chảy tiến gần hơn tới mục tiêu học liên tục, thích ứng và hiệu quả như cách sinh vật học, mở ra tiềm năng cho các ứng dụng robot hoặc thiết bị biên cần hoạt động trực tuyến lâu dài với tài nguyên hạn chế.

marsbit05/10 06:37

Nhà đạt giải Turing Sutton và tác phẩm mới: Sử dụng một công thức từ năm 1967 để giải quyết một khuyết điểm lớn trong học tăng cường dạng luồng

marsbit05/10 06:37

活动图片