Tác giả| Hoa Lâm Vũ Vương
Biên tập| Tĩnh Vũ
Nếu vài năm trước có người nói với tôi, một trong những người đồng sáng lập OpenAI sẽ chạy sang Anthropic để giúp đối thủ nghiên cứu tiền huấn luyện, tôi chắc sẽ nghĩ người này đang kể chuyện viễn tưởng.
Nhưng chuyện đó, hôm nay đã thực sự xảy ra.
Andrej Karpathy, cái tên này hầu như không cần giới thiệu trong giới AI. Diễn giả chính của khóa học Stanford CS231n, người truyền bá kiến thức sâu rộng được yêu thích nhất trong lĩnh vực học sâu, đồng sáng lập OpenAI, cựu người đứng đầu đội lái xe tự động của Tesla. Một bài đăng trên X của anh ấy có thể khiến một hướng công nghệ nào đó bùng nổ nhiệt độ, anh ấy đăng một video giảng về Transformer trên YouTube, lượt xem dễ dàng vượt triệu.
Một người như vậy, hôm nay tuyên bố gia nhập Anthropic.
Karpathy thông báo chính thức trên X| Nguồn ảnh: X
Lần này gia nhập Anthropic, Karpathy sẽ tập trung vào nghiên cứu tiền huấn luyện, và lãnh đạo một đội ngũ mới, nhiệm vụ cốt lõi là sử dụng Claude để tăng tốc khám phá hướng tiền huấn luyện.
Tiền huấn luyện, là nền móng cho năng lực của mô hình lớn. Ai có đột phá ở tầng này, người đó sẽ nắm được tay trên trong cuộc cạnh tranh vài năm tới. Anthropic đặt Karpathy ở đây, ý đồ quá rõ ràng.
Nhưng nếu chỉ hiểu việc này là "một người giỏi đổi việc", thì đã quá coi thường nó rồi.
Trên người Karpathy gắn liền một thứ cực kỳ khan hiếm trong giới AI – sự kết hợp đôi của độ tin cậy công nghệ và ảnh hưởng đại chúng. Anh ấy không chỉ là một nhà nghiên cứu viết mã tốt, công bố bài báo hay, anh ấy là kiểu người có thể khiến những nhà nghiên cứu đỉnh cao khác sẵn lòng đi theo.
Trong ngành có cách nói, sự gia nhập của một nhà nghiên cứu có uy tín, thường sẽ thúc đẩy một nhóm người đánh giá lại lựa chọn nghề nghiệp của mình. Sự xuất hiện của Karpathy, có thể là tín hiệu cho thấy Anthropic sắp đón một làn sóng nhân tài đổ về.
Đáng suy ngẫm hơn là động cơ của anh ấy. Năm 2015, anh là một trong những người đồng sáng lập OpenAI, trải qua toàn bộ quá trình biến đổi của công ty này từ lý tưởng phi lợi nhuận. Sau đó anh đến Tesla, rồi trở lại OpenAI một thời gian ngắn, sau đó lại rời đi tự khởi nghiệp.
Lần này lựa chọn Anthropic, ít nhiều mang theo ý vị "bày tỏ thái độ" nào đó.
01 Anthropic - Luôn Chiến Thắng
Nhìn riêng biệt việc Karpathy gia nhập, sẽ bỏ sót một ngữ cảnh quan trọng, Anthropic thời gian gần đây, đang ở trong một xu thế tăng hiếm thấy.
Hai tuần trước, một dữ liệu từ Ramp AI Index, đã lặng lẽ tràn ngập các vòng tròn truyền thông công nghệ.
Dữ liệu cho thấy, tỷ lệ áp dụng ở phía doanh nghiệp của Anthropic trong tháng 4 đã tăng 3,8 điểm phần trăm, đạt 34,4%, trong khi OpenAI cùng kỳ giảm 2,9 điểm phần trăm, tụt xuống 32,3%. Đây là lần đầu tiên trong lịch sử Anthropic vượt qua OpenAI về tỷ lệ áp dụng doanh nghiệp, mặc dù khoảng cách chưa phải là lớn, nhưng ý nghĩa định hướng cực kỳ mạnh mẽ.
Cùng tuần đó, Anthropic đã ra mắt phiên bản Claude dành cho doanh nghiệp nhỏ, tích hợp một loạt công cụ mà doanh nghiệp vừa và nhỏ hàng ngày phụ thuộc như QuickBooks, PayPal, HubSpot, Canva, DocuSign, nhúng trực tiếp năng lực AI vào quy trình làm việc của người dùng. Đây là một tín hiệu chìm xuống rõ ràng, Anthropic không chỉ nhìn vào khách hàng doanh nghiệp lớn, nó đang đi vào thị trường rộng hơn.
Trước đó một ngày, Anthropic thông báo thiết lập quan hệ đối tác với Quỹ Gates, cam kết đầu tư 200 triệu USD trong bốn năm, hạn mức sử dụng Claude và hỗ trợ kỹ thuật, bao phủ các lĩnh vực như sức khỏe toàn cầu, giáo dục và phát triển kinh tế. Số tiền hợp tác này không phải là sáng nhất, nhưng giá trị tạo nên câu chuyện của nó rất cao, một công ty vốn chủ trương "AI an toàn", đang đội chiếc mũ "AI có trách nhiệm" ngày càng chắc.
Tại thời điểm định giá huy động vốn tiến gần nghìn tỷ USD, tỷ lệ áp dụng doanh nghiệp vừa hoàn thành vượt mặt, sự gia nhập của Karpathy, là phần kết sáng chói của tất cả những điều này.
Tựa đề bình luận của tạp chí Fortune rất trực tiếp, "Anthropic dường như không thể ngừng chiến thắng".
02 Tại sao không trở lại OpenAI?
Có người thắng, tất nhiên có người chịu áp lực.
Karpathy không phải là người đầu tiên rời khỏi hệ thống OpenAI, để đi về phía Anthropic.
Bản thân đội ngũ sáng lập Anthropic, Dario Amodei, Daniela Amodei, cùng một nhóm nhà nghiên cứu cốt lõi lúc đó, chính là những người đã tập thể rời đi từ OpenAI để thành lập công ty này vào năm 2021. Ở mức độ nào đó, Anthropic từ ngày đầu ra đời, đã là sản phẩm của một sự phân kỳ đường lối bên trong OpenAI.
Những năm sau đó, khi OpenAI càng đi càng nhanh trên con đường thương mại hóa và sản phẩm hóa, tăng tốc phát hành, đuổi theo doanh thu, dần nghiêng về Microsoft, một bộ phận nhà nghiên cứu coi trọng "nghiên cứu thuần túy" hoặc "an toàn là trên hết", bắt đầu bỏ phiếu bằng chân.
Lần này Karpathy lựa chọn Anthropic, lại vừa khớp vào một thời điểm nhạy cảm. OpenAI gần đây trong việc tạo dựng câu chuyện đối ngoại khá dày đặc, loạt GPT, loạt o, Sora, Operator các tuyến đồng thời tiến lên, nhịp độ nội bộ nhanh, trong ngành có người mô tả riêng tư "như đang chạy ba cuộc marathon cùng lúc". Dưới sự mở rộng tốc độ cao, làm thế nào giữ chân những người thực sự quan tâm đến chiều sâu nghiên cứu, không chỉ muốn định giá, là một bài toán khó giải.
Tất nhiên, OpenAI vẫn sở hữu mật độ nhân tài cực mạnh và quy mô tài nguyên, một lần nghỉ việc sẽ không lung lay nền tảng của nó. Nhưng nếu dòng chảy này hình thành xu hướng, thì điều thực sự đáng cảnh giác, là sự thay đổi kỳ vọng ngành mà nó truyền tải.
Một nhà phân tích công nghệ nói rất thẳng thắn, "Phát triển AI không còn chỉ là cuộc đua công nghệ, mà là cuộc chiến về quyền lãnh đạo tri thức. Sự dịch chuyển của một nhà nghiên cứu có ảnh hưởng, có thể định hình lại toàn bộ thứ tự ưu tiên nghiên cứu của ngành."
Ảnh hưởng của bản thân Karpathy trong cộng đồng học sâu, vừa khớp với phán đoán này. Bài giảng Stanford và video YouTube của anh, là tài liệu nhập môn của nhiều nhà nghiên cứu hiện đang làm việc tại phòng thí nghiệm AI đỉnh cao. Anh ấy đi đâu, ít nhiều mang theo sự "ủng hộ" rằng "hướng này đáng đặt cược".
03 Tiền huấn luyện, đánh tương lai
Trở lại với hướng cụ thể của lần Karpathy gia nhập Anthropic này, tiền huấn luyện.
Hai năm qua, sự chú ý của ngành tập trung nhiều vào các hướng tương đối "gần tầng ứng dụng" như suy luận, đa phương thức, Agent, RAG. Đột phá năng lực mô hình cơ bản, bị một số người coi là đã bước vào giai đoạn "tinh chỉnh và tối ưu hóa", chứ không phải là sự nhảy vọt căn bản.
Anthropic rõ ràng không nghĩ vậy. Giao cho Karpathy thành lập đội ngũ chuyên khám phá "sử dụng Claude tăng tốc nghiên cứu tiền huấn luyện", là đang đặt cược vào một hướng cơ bản hơn, chu kỳ dài hơn, nhưng tiềm năng đền đáp cũng lớn hơn.
Trong này ẩn chứa một logic thú vị, sử dụng mô hình lớn hiện có để hỗ trợ tiền huấn luyện thế hệ mô hình lớn tiếp theo, là một tư duy "AI giúp AI tiến hóa". Con đường này bây giờ còn rất mới, chưa có lộ trình chín muồi, nhưng nếu có thể đi thông, có nghĩa là hiệu suất huấn luyện và ranh giới năng lực đều có thể xuất hiện nâng cao phi tuyến tính.
Giao việc này cho Karpathy làm, là một lần Anthropic đặt cược mạnh bạo trên hướng công nghệ.
Cuộc chiến nhân tài ngành AI, đánh đến hôm nay, đã không phải là cường độ có thể mô tả bằng việc moi vài kỹ sư nữa. Nó giống một cuộc tranh giành về "quyền tạo dựng câu chuyện" hơn, ai thu hút được người có thể định nghĩa hướng nghiên cứu, người đó đang truyền tải cho toàn ngành một tín hiệu, chúng tôi là nhân vật chính tương lai của trò chơi này.
Lựa chọn của Karpathy, có lẽ chính là một tín hiệu như vậy.







