Văn | Cộng đồng Alpha
Một công ty khởi nghiệp AI được thành lập vào cuối năm 2025 và chưa công bố sản phẩm chính thức đã huy động được 700 triệu USD trong vòng tài trợ Series A, định giá lên tới 6 tỷ USD. Vòng này do Parkway Venture Capital dẫn đầu, với sự tham gia của các tổ chức bao gồm NVIDIA, AMD Ventures, Intel Capital, Qualcomm Ventures, Salesforce Ventures.
Có thể thấy, công ty này đã nhận được nguồn vốn khổng lồ trong thời gian ngắn, và được các gã khổng lồ công nghệ phần cứng, phần mềm hàng đầu ngành hậu thuẫn.
Công ty có tên Hark này có một góc tiếp cận rất rõ ràng: họ muốn sử dụng bộ sản phẩm “mô hình cơ bản tự phát triển + phần cứng tùy chỉnh” để tạo ra giao diện tương tác người-máy phổ quát thế hệ tiếp theo.
Về bản chất, đây là một loại giao diện trí tuệ nhân tạo mới, với hình thái là phần cứng gốc AI. Phân tách ra, đó là một loạt các thiết bị phần cứng gốc được tùy chỉnh, cùng các thiết bị tính toán có khả năng tác nhân thông minh, được trang bị mô hình giọng nói đầu-cuối và khả năng ghi nhớ cá nhân hóa cao. Tất cả các hệ thống AI này đều là đa phương thức, có thể hiểu và tương tác theo cách tự nhiên.
Khi thấy Hark định giá 6 tỷ USD để hoàn thành vòng gọi vốn, với sự tham gia đồng thời của NVIDIA và Qualcomm, chúng tôi không ngạc nhiên. Từ năm 2024, Cộng đồng Alpha đã bắt đầu bố trí đầu tư theo hướng “AI chủ động” – công ty Looki mà chúng tôi đầu tư giai đoạn đầu đã bán thiết bị đeo đa phương thức AI đến tay người dùng toàn cầu, trở thành thiết bị thông minh phổ quát đeo được đa phương thức có sản lượng xuất xưởng lớn nhất toàn cầu; còn công ty Quang Phàm Technology thì tự phát triển hệ điều hành AI gốc cho phần cứng thông minh, và mở ra phân khúc tai nghe AI có khả năng cảm thụ thị giác.
Lượng vốn huy động khổng lồ của Hark một lần nữa xác nhận một xu hướng ngày càng rõ rệt: Thập kỷ tới của AI, không chỉ nằm trong màn hình, mà còn nằm trong thế giới thực.
AI thông minh hơn, nhưng vẫn dùng vỏ bọc và cách tương tác cũ
Hark được thành lập bởi Brett Adcock vào cuối năm 2025, ban đầu do ông ấy tự bỏ ra 100 triệu USD. Brett Adcock trước đây từng thành lập các công ty như Archer, Figure và Vettery.
Trong đó, Archer gia nhập thị trường máy bay cất hạ cánh thẳng đứng chạy điện và đã niêm yết thành công. Figure là công ty robot hình người, năm 2024, Figure huy động được 675 triệu USD, đến tháng 9/2025, Figure hoàn thành vòng C trị giá hơn 1 tỷ USD, định giá đạt 39 tỷ USD, các nhà đầu tư của nó bao gồm Jeff Bezos, NVIDIA, Microsoft, OpenAI, v.v.
Tại sao Brett Adcock lại muốn khởi nghiệp theo hướng phần cứng gốc AI “chủ động”? Bởi vì con đường của Figure bản thân nó đã là một hệ thống công trình của “AI + phần cứng + tương tác thế giới thực”, về bản chất, điều này khá giống với chồng công nghệ cơ bản của phần cứng gốc AI, ông ấy biết những khó khăn ở đâu. Và gần đây, Figure đã phát trực tiếp minh họa robot thực hiện nhiệm vụ phân loại bưu kiện trong thời gian dài, chứng tỏ họ đã giải quyết được một số vấn đề.
Ngoài Brett Adcock, Abidur Chowdhury đã gia nhập Hark giữ chức Trưởng phòng Thiết kế. Ông từng là giám đốc điều hành thiết kế sản phẩm tại Apple, tham gia thiết kế các sản phẩm như iPhone Air. Hark cũng thu hút các kỹ sư từ Apple, Meta, Google, Tesla và các phòng thí nghiệm AI hàng đầu gia nhập, bao phủ nghiên cứu AI, kỹ thuật phần cứng và thiết kế.
Nhìn lại lịch sử phát triển của các thiết bị đầu cuối phần cứng cá nhân, thực chất là lịch sử luân phiên thay đổi giữa hình thái phần cứng, phương thức tương tác và ứng dụng: hình thái phần cứng và phương thức tương tác tiến hóa, sinh ra ứng dụng mới, mở khóa khả năng mới, lan tỏa đến nhóm người dùng rộng hơn.
Ví dụ, khi hình thái PC được xác định và kích thước đủ nhỏ, cộng với sự trưởng thành của các giao diện tương tác như chuột và GUI, khiến nó dễ sử dụng hơn với người bình thường, và khi Internet phổ cập, khiến nó từ nhóm người dùng là chuyên gia kinh doanh và sáng tạo, bước vào nhóm đại chúng.
Đột phá tiếp theo xuất hiện ở iPhone, đột phá này không chỉ ở chỗ tích hợp khả năng của máy tính và điện thoại trong một thể tích rất nhỏ, mà còn ở phương thức tương tác đa điểm chạm, rào cản tương tác tiếp tục giảm, khiến quy mô người dùng điện thoại thông minh (bao gồm máy tính bảng) cao hơn một cấp so với PC.
Hơn nữa, hệ sinh thái App Store của nó trực tiếp trở thành tiêu chuẩn phần mềm của thời đại Internet di động, năm 2024, hệ sinh thái App Store toàn cầu đã thúc đẩy doanh thu và doanh số bán hàng của nhà phát triển khoảng 1,3 nghìn tỷ USD.
Hiện tại, vấn đề của AI là nó có trí thông minh, khả năng phần mềm rất mạnh, nhưng hiện chủ yếu chạy và tương tác thông qua giao diện trò chuyện và các thiết bị không phải gốc AI như máy tính/điện thoại, thiếu sự ghi nhớ liên tục về danh tính người dùng, cũng thiếu phần cứng được thiết kế chuyên biệt cho tương tác thông minh.
Một sự đồng thuận ban đầu trong ngành là, giai đoạn tiếp theo cần một hệ thống tác nhân thông minh có thể tương tác tự nhiên với con người và thế giới thực. Loại hệ thống này cần có khả năng dự đoán nhu cầu, giảm bớt gánh nặng nhận thức, và vận hành như một đối tác hợp tác, chứ không phải như phần mềm truyền thống chờ đợi mệnh lệnh.
Hiện tại, AI ở tầng phần mềm, đã thúc đẩy sự ra đời của các siêu công ty khởi nghiệp như OpenAI và Anthropic với định giá gần ngàn tỷ, một khi phần cứng gốc AI phát triển hơn nữa, tác động của nó đối với ngành công nghệ rất có thể là ở cấp độ iPhone.
Tuy nhiên, việc phần cứng gốc AI “chủ động” muốn trưởng thành là một công trình phức tạp. Ví dụ, Hark phải xây dựng toàn bộ hệ thống này từ các tầng mô hình, phần cứng AI, tương tác, ghi nhớ, v.v.
Đầu tiên, mô hình của họ sẽ có khả năng tác nhân thông minh, khả năng đa phương thức và khả năng ghi nhớ, có thể ghi nhớ người dùng là ai, đã nói gì, và làm việc xuyên suốt các sản phẩm và dịch vụ mà người dùng đã sử dụng.
Họ sẽ thiết kế phần cứng gốc AI, và tích hợp với mô hình cơ bản của Hark. Và từ việc họ tuyển dụng vị trí cơ sở hạ tầng giọng nói thời gian thực, có thể thấy giao diện tương tác của họ, rất có thể sẽ bắt đầu từ giọng nói.
Phát triển “AI chủ động”, công ty khởi nghiệp Trung Quốc có lợi thế hơn
AI hiện có, dù là ChatBot hay Agent, tạm thời chúng chỉ là công cụ, bởi vì chúng bị mắc kẹt trong màn hình, chỉ khi con người cần chúng, mới ra lệnh cho chúng, sau đó nhận kết quả.
So với những AI “thụ động” này, tại sao “AI chủ động” lại quan trọng? Bởi vì nó biến AI từ công cụ thành cộng tác viên. AI ở một mức độ nào đó có thể độc lập ngoài con người, để giúp con người suy nghĩ, giúp con người hành động, hoàn thành công việc.
Để tạo ra một hệ thống “AI chủ động”, cần một phần cứng gốc AI kết hợp phần mềm và phần cứng, nó cần có khả năng cảm thụ, ghi nhớ, cần có trí thông minh, cần có tương tác mới, rào cản thấp hơn, và cần luôn ở bên cạnh con người (always on).
Trong thời kỳ thăm dò trước của phần cứng AI (ví dụ như loa thông minh, v.v.), nó có cảm thụ, nhưng chỉ có thể lưu trữ, trí thông minh không đủ, tương tác cứng nhắc.
Trong giai đoạn bùng nổ AI mới hiện nay, khả năng cảm thụ tiếp tục được nâng cao, trí nhớ và trí thông minh của AI tiến bộ vượt bậc, tương tác vẫn đang được thăm dò, nhưng con đường thăm dò đã được xác định sơ bộ.
“AI chủ động” thực sự, đã tiến lên phía trước một bước lớn.
Mà để “AI chủ động” ngày càng trưởng thành, không phải là cuộc đua đột phá đơn điểm, nó cần sự phát triển và tiến bộ chung của mô hình cơ bản, hệ điều hành tác nhân thông minh, ghi nhớ cá nhân hóa, thiết bị đầu cuối phần cứng. Cạnh tranh phần cứng gốc AI là một cuộc cạnh tranh toàn diện.
Đổi mới và thăm dò trong lĩnh vực này, các công ty khởi nghiệp Trung Quốc có cơ hội thành công hơn, họ có ba lợi thế độc đáo: Thứ nhất là lợi thế hệ sinh thái sản xuất, các nơi như Thâm Quyến có nền tảng chuỗi cung ứng hoàn chỉnh nhất toàn cầu; Thứ hai là lợi thế quy mô thị trường, Trung Quốc vừa là nước sản xuất lớn nhất, cũng là thị trường ứng dụng lớn nhất; Thứ ba là lợi thế hỗ trợ chính sách, nhà nước liệt kê AI là trọng điểm chiến lược, cung cấp tính xác định cho đầu tư dài hạn.







