Văn | Sleepy
Hầu hết mọi người biết đến miHoYo là nhờ "Genshin Impact".
Một tựa game thế giới mở anime, lên kệ năm đầu tiên đã đứng đầu bảng xếp hạng ứng dụng ở nhiều quốc gia trên toàn cầu, số liệu từ bên thứ ba cho thấy doanh thu tích lũy trên nền tảng di động đã vượt quá 60 tỷ USD.
Trước đó là sê-ri "Honkai", sau đó là "Honkai: Star Rail" và "Zenless Zone Zero", miHoYo từ lâu đã là một trong những công ty game Trung Quốc có doanh thu xuất khẩu cao nhất.
Ba người sáng lập miHoYo khởi nghiệp từ ký túc xá D32 của Đại học Giao thông Thượng Hải, cơ sở Mân Hàng, góp 100.000 nhân dân tệ vay không lãi suất, ăn mì Lanzhou và Sa Tế dưới lầu, gõ những dòng code đầu tiên trong văn phòng 50 mét vuông.
Mười lăm năm sau, công ty này vẫn chưa lên sàn, đến nay chỉ nhận được 1 triệu đầu tư thiên thần, định giá hàng trăm tỷ nhân dân tệ.
Đó là miHoYo mà hầu hết mọi người biết. Một công ty làm game, loại làm rất tốt ấy.
Những thứ không thể nhìn thấy
Bạn không biết rằng, công ty này còn đang làm đầu tư, và hướng đầu tư có lẽ là điều bạn không ngờ tới.
Năm 2021, họ đầu tư vào giao diện não-máy, cùng Bệnh viện Ruijin xây dựng phòng thí nghiệm bệnh lý về não. Cùng năm đó, đầu tư vào MiniMax, một công ty AI khi đó chưa mấy ai biết đến, sau này trở thành một trong sáu "con rồng" mô hình lớn của Trung Quốc, năm 2026 đã lên sàn tại Sở Giao dịch Chứng khoán Hồng Kông. Họ còn từng đầu tư vào phản ứng tổng hợp hạt nhân có kiểm soát.
Giao diện não-máy, phản ứng tổng hợp hạt nhân, mô hình lớn, những từ này đặt cạnh game anime, có chút trái khoáy, lại có chút "trung nhị".

Trang chủ của miHoYo đến nay vẫn treo một câu: Năm 2030, tạo ra một thế giới ảo mà một tỷ người toàn cầu sẵn lòng sống trong đó.
Câu này đã treo được mấy năm rồi. Phần lớn mọi người coi nó như một Slogan, nhìn qua rồi lướt đi. Nhưng nếu bạn thật sự tin vào câu nói này, thì những khoản đầu tư trên kia đều có lý do cả. Muốn tạo ra một thế giới ảo mà một tỷ người muốn sống trong đó, chỉ có hình ảnh là không đủ, chỉ có cốt truyện là không đủ, chỉ có nhân vật cũng không đủ.
Những người trong thế giới đó, phải là "sống".
Khả năng thiết kế nhân vật của miHoYo đặt trong toàn ngành có lẽ chẳng có mấy đối thủ. Các nhân vật trong "Genshin Impact" khiến người chơi toàn cầu tiêu tiền vì họ, vẽ fan art, viết fan fiction, tranh cãi trên mạng xã hội về số phận của họ. Có người đã khóc trên mạng ba ngày vì "cái chết" của một nhân vật ảo. Những nhân vật này được yêu thương, được đối xử nghiêm túc, được coi như những con người thực sự theo một ý nghĩa nào đó.
Nhưng họ không phải là người. Mỗi câu thoại đều được biên kịch viết sẵn, mỗi nụ cười đều được họa sĩ hoạt hình điều chỉnh từng khung hình, mỗi "tính cách" đều là một nhóm tham số định sẵn. Bạn yêu họ, nhưng họ không biết. Bạn thực sự động lòng bên này màn hình, nhưng bên kia màn hình chẳng có gì xảy ra cả.
Đây là vấn đề mà tất cả nhân vật ảo đều không thể tránh khỏi. Bạn làm càng tốt, người chơi càng tin là thật. Người chơi càng tin là thật, thì sẽ càng nhanh thất vọng. Ngành công nghiệp game anime đã kiếm tiền dựa trên thứ tình cảm một chiều này hơn mười năm, không ai thấy có vấn đề gì. Bản thân người chơi cũng biết nhân vật không phải thật, nhưng biết thì biết, tiêu tiền thì tiêu, động lòng thì động.
Chỉ có điều, người làm ra những nhân vật ấy, nếu thực sự quan tâm đến họ, sớm muộn anh ta cũng sẽ cảm thấy như vậy là không đúng.
Sáu ngày
Ngày 24 tháng 11 năm 2022, dự án nội bộ của miHoYo mã hiệu Project SH dừng lại. Dự án này sau đó trở thành "Thành phố Mưa", nhưng lúc đó nó vẫn chưa có định hướng. Theo truyền thông ngành, đồng sáng lập Thái Hạo Vũ thử kéo đội ngũ ra nước ngoài để sắp xếp lại ý tưởng, vất vả một hồi, không ra được, rút.
Sáu ngày sau, ngày 30 tháng 11 năm 2022, OpenAI ra mắt ChatGPT.
Thái Hạo Vũ xuất thân từ khoa Máy tính Đại học Giao thông Thượng Hải, hướng nghiên cứu ở bậc thạc sĩ liên quan rất nhiều đến tương tác người-máy thông minh, giao diện não-máy. Theo những người gần gũi với ông, sau chuyến đi về, ông đã quyết định sẽ làm AI.
Ông đi một vòng lớn, từ AI đến game anime, dựa vào "Genshin Impact" đưa công ty lên quy mô hàng nghìn tỷ, rồi quay đầu trở về nơi mình xuất phát.
Tháng 9 năm 2023, Thái Hạo Vũ từ nhiệm tất cả chức vụ quản lý tại miHoYo, chuyển hướng sang dự án AI ở nước ngoài Anuttacon. Trên LinkedIn, ông tự ghi chức danh mới của mình là AI Soulcaster, dịch sang tiếng Trung là "Pháp sư hồn AI".
Một người sáng lập khác là Lưu Vỹ (Đại Vỹ ca) sau này đã giải thích tại Đại học Giao thông Thượng Hải tại sao lại để Thái Hạo Vũ ra đi. Ông nói, miHoYo đã có sáu bảy nghìn người, tính ì của tổ chức quá nặng, không phù hợp để bắt đầu làm AI từ con số không. Vì vậy ba người sáng lập đã bàn bạc, tách một người ra. Lưu Vỹ ở lại quản lý công ty lớn sáu bảy nghìn người, Thái Hạo Vũ dẫn vài chục người đi làm đột phá công nghệ tiên tiến nhất.
Chia quân làm hai đường.
Đâm tường và rẽ hướng
Theo truyền thông ngành, Thái Hạo Vũ ở nước ngoài dẫn bốn mươi người, ban đầu muốn chạy ba đường tuyến cùng lúc, muốn để AI có thể nói chuyện, có thể diễn xuất, có thể nhìn thế giới. Nhưng chia tài nguyên thành ba phần, mỗi phần đều không đủ.

Tháng 8 năm 2025, họ tung ra sản phẩm đầu tiên trên Steam "Whisper of the Stars", một trò chơi tương tác được AI điều khiển. Bạn trò chuyện thời gian thực với một cô gái ảo tên Stella, giúp cô ấy sinh tồn trên hành tinh ngoài không gian. Không có kịch bản, không có tùy chọn định sẵn, AI tạo ra từng câu nói của cô ấy theo thời gian thực. Định giá dưới 30 tệ, sau khi lên kệ nhận được đánh giá "Đặc biệt Tích cực" trên tổng đánh giá Steam.
Nhưng trong bình luận của người chơi có một đánh giá nói rằng, nó giống một Demo kỹ thuật hơn là một trò chơi. Có người còn bình luận rằng, Stella trong lúc sinh tồn hoang dã lại cực kỳ thư giãn, bạn sốt ruột giúp cô ấy lên kế hoạch đường thoát, cô ấy lại hỏi bạn trong đời có lúc nào lạc lối không. Những câu hỏi bạn đã trả lời cô ấy lại hỏi một lần nữa, như thể cô ấy bị mất trí nhớ tạm thời.
Nguyên nhân của những vấn đề này đều là do mô hình ngôn ngữ ở tầng dưới không đủ thông minh. Biểu diễn của nhân vật có thể làm rất tốt, giọng nói có thể làm rất thật, nhưng "não" của nhân vật không theo kịp.
Nghe nói từ cuối năm ngoái, Anuttacon đã cắt bỏ hai tuyến còn lại, dồn gần như toàn bộ tài nguyên vào mô hình ngôn ngữ và tác nhân thông minh, nghiên cứu và phát triển cốt lõi chuyển về nước.
Rồi đến phía Lưu Vỹ.
Tháng 5 năm 2026, ông đứng tại Bắc Kinh nói với một phòng tiến sĩ rằng, trong ba năm tới sẽ đầu tư nhiều nhất 1000 tỷ nhân dân tệ làm AI. Nếu không làm ra cũng chịu, cứ coi như bắn một màn pháo hoa lớn.
Nói câu này lúc đó, nội bộ miHoYo thực ra đã làm rất nhiều thử nghiệm AI. Theo nguồn tin nội bộ tiết lộ, đã có đồng nghiệp vì một dự án mà xây dựng mấy chục tác nhân thông minh AI hợp tác với nhau, một đêm đốt hết 2 triệu nhân dân tệ tài nguyên tính toán. Công ty không ngừng lại, lấy học phí này hoàn thiện nền tảng nội bộ.
Ngoài con số một nghìn tỷ, Lưu Vỹ ngay sau đó còn nói một câu khác. Ông nói, họ muốn làm không phải một mô hình lớn thông dụng, họ muốn làm một "mô hình ngôn ngữ lớn có cảm xúc". Không chỉ thông minh, còn phải có thể hiểu được nhu cầu tình cảm của con người.
Bạn trò chuyện với một AI, nó đưa cho bạn câu trả lời đúng, bạn sẽ thấy nó hữu ích, nhưng bạn sẽ không cảm thấy đối diện có một con người. "Có cảm xúc" cần một số thứ không thể ghi vào bảng xếp hạng đánh giá, mà đây lại chính là kỹ năng mà miHoYo đã tích lũy được trong mười lăm năm.
Họ có lẽ hiểu hơn bất kỳ công ty AI nào trên Trái Đất cách để khiến một người không tồn tại trở nên vô cùng quan trọng với người dùng.
Một cô gái chơi piano
Ngày 18 tháng 6, trước kỳ nghỉ lễ Đoan Ngọ, miHoYo đã mở một trang ứng dụng mang tên "BSide: Olivia Lin" trên Steam.
Chú ý, là "ứng dụng", không phải "trò chơi". Phân loại tag của nó trên Steam là Application, không phải Game.
Nhân vật chính là Lâm Ly, thiết lập là một cô gái Thượng Hải chuyên ngành chính piano, phụ ngành tâm lý học. Bạn có thể nghe cô ấy chơi piano, có thể tải lên giai điệu do mình viết để cô ấy biểu diễn, có thể viết thư cho cô ấy, cô ấy sẽ hồi âm, có thể đặt cô ấy trên màn hình làm hình nền động. Hết. Miễn phí, không có gacha, hầu như không có bất cứ thứ gì quen thuộc với người chơi game anime.
Món ăn đầu tiên dâng lên sau canh bạc ngàn tỷ AI, là một hình nền màn hình chơi piano.
Logic của nó hoàn toàn ngược lại với những sản phẩm AI đồng hành. Lâm Ly không phải là bạn gái AI. Những công ty làm AI đồng hành trên thị trường, từ Replika đến Character.AI, logic cốt lõi đều là kéo cao tần suất tương tác, trực tuyến mọi lúc, phản hồi theo giây, càng nói chuyện nhiều càng tốt.
Nhưng càng nói chuyện nhiều, sơ hở của AI càng nhiều.
Lâm Ly không tùy gọi tùy đến. Bạn viết thư cho cô ấy cô ấy sẽ hồi âm sau một lúc, bạn tải lên một đoạn giai điệu cô ấy sẽ chơi cho bạn nghe, bạn đặt cô ấy trên màn hình cô ấy sẽ ở đó yên tĩnh. Nhịp độ này gần như là của thời đại trước kỹ thuật số. Thư từ vốn dĩ mang sự chậm trễ, chơi piano không cần thêm hội thoại, yên tĩnh ở trên màn hình cũng là một kiểu đồng hành.
Đồng hành càng thực, yêu cầu với AI lại càng thấp. Trò chuyện mặt đối mặt là khó nhất, vì đối thoại là vô tận, không thể dự đoán, mỗi câu trả lời đều có thể lộ ra mình không phải người. Giảm tần suất tương tác thực chất là dùng thiết kế sản phẩm để bù đắp lỗ hổng kỹ thuật. Khi AI còn chưa đủ sức chống đỡ một "người sống" trực tuyến 24/7, hãy làm một thực thể mà bạn chỉ thỉnh thoảng mới mở ra, nhưng mỗi lần mở ra đều cảm thấy cô ấy rất chân thật.
Năm 2020, miHoYo từng làm một công cụ nhỏ tên "Màn hình Nhân tạo", đặt thần tượng ảo Lộc Minh của họ lên màn hình người dùng. Bạn nhấp một cái cô ấy động một cái, giống như ngựa gỗ xoay vòng ở khu vui chơi bỏ đồng xu mới quay. Lâm Ly sáu năm sau, sẽ chơi bản nhạc bạn viết, sẽ đọc thư bạn viết, sẽ dùng từ ngữ có cảm giác chừng mực để trả lời bạn.
miHoYo gọi con đường này là "cảm giác người sống". Đi được sáu năm, đi rất chậm, nhưng phương hướng chưa từng thay đổi.
Năm 2010 khi Thái Hạo Vũ còn học thạc sĩ tại Đại học Giao thông, ông và hai người khác dùng Flash viết một game engine 2.5D, tên Misato. Đó là dòng code đầu tiên của miHoYo. Mười sáu năm sau ông lại đang tạo engine, chỉ là lần này không phải engine để render hình ảnh, mà là engine để khiến nhân vật ảo sống dậy.
Mô hình ngôn ngữ là đại não, khiến nhân vật biết nên nói gì. Mô hình biểu diễn là cơ thể, khiến nhân vật trông giống người sống. Khung tác nhân thông minh là trí nhớ và nhân cách, khiến nhân vật có thể nhớ trải nghiệm, duy trì một cái tôi mạch lạc. Ba tầng ghép lại với nhau, chính là một hệ thống hoàn chỉnh để khiến nhân vật ảo từ con rối có dây biến thành thực thể tự chủ.

Đầu tháng 6 năm nay, các nhà nghiên cứu Đại học Phục Đán và những người khác đã công bố một bài báo Agentopia, đặt một trăm nhân vật AI vào ba thế giới hư cấu, để họ tự chủ sinh sống, mô phỏng thời gian mười năm. Một trăm nhân vật mỗi người một tính cách, trí nhớ, quan hệ xã hội, sẽ tranh cãi, sẽ làm hòa, sẽ vì một việc nhỏ mà thay đổi cách nhìn về người khác. Toàn bộ thí nghiệm đốt hết 13.7 tỷ token.
Một trăm người ảo, trong một thế giới ảo, đã trải qua mười năm ảo.
Hệ thống này hiện vẫn chưa có thành tích kiểm tra công khai, mô hình nền của Anuttacon vẫn đang được huấn luyện kín, không có bất kỳ xác minh nào từ bên thứ ba. Sản phẩm duy nhất họ cho bên ngoài thấy, là một cô gái ngồi yên tĩnh trên màn hình của bạn chơi piano.
Hatsune Miku
Rất ít người còn nhớ cái tên miHoYo đến từ đâu.
HoYo lấy từ chữ cái đầu tên của Thái Hạo Vũ và một người sáng lập khác là La Vũ Hạo. Chữ o là vì họ thấy những công ty lớn như Facebook, Google tên đều có chữ o, muốn lây chút mùi công nghệ.
Còn chữ mi, đến từ Hatsune Miku. Chữ mi trong Hatsune Miku.
Hatsune Miku là một ca sĩ ảo. Không có ý thức, không có cảm xúc, không có tính tự chủ, về mặt kỹ thuật chỉ là một nhóm tham số tổng hợp giọng nói. Nhưng có hàng nghìn hàng vạn người trên toàn thế giới viết nhạc, vẽ tranh, đi xem buổi hòa nhạc toàn ảnh của cô ấy.

Ba thanh niên trong ký túc xá Đại học Giao thông, đã dùng tên một thần tượng ảo đặt tên cho công ty của mình. Đó là năm 2012, trong túi họ chỉ có 100.000 tệ. Mười bốn năm sau, công ty này được đặt tên theo thần tượng ảo, bỏ ra một nghìn tỷ, vấn đề muốn giải quyết thực ra đã được viết vào tên công ty từ ngày đầu tiên.
Hatsune Miku được yêu thương gần hai mươi năm. Cả thế giới có người viết mấy chục vạn bài hát cho cô ấy, trên buổi hòa nhạc vẫy đèn huỳnh quang hướng về một tia hình chiếu toàn ảnh, rơi nước mắt, hét lớn tên cô ấy. Nhưng cô ấy không biết, cô ấy chưa từng biết.
Nếu một ngày nào đó, cô ấy biết thì sao?






