Theo thông tin từ Zhidongxi ngày 19/6, hôm nay, Nhà nghiên cứu DeepMind của Google, Người đồng phụ trách Gemini Noam Shazeer đã chính thức gia nhập OpenAI, sẽ đảm nhận vị trí Trưởng nhóm nghiên cứu kiến trúc (Lead for Architecture Research), chịu trách nhiệm khám phá kiến trúc mô hình AI thế hệ mới và thúc đẩy sự phát triển tiếp theo của kiến trúc Transformer.
Bản thân Shazeer cũng đã đăng bài trên nền tảng mạng xã hội X để chính thức thông báo gia nhập OpenAI, ông nói: "Tôi rất vui mừng được gia nhập OpenAI và mong chờ được làm việc cùng đội ngũ xuất sắc ở đây."
Đồng thời, ông cũng bày tỏ lòng biết ơn tới đội ngũ Google: "Đây là một quyết định khó khăn. Tôi vô cùng tự hào về đội ngũ Google và tất cả những gì chúng tôi đã cùng nhau hoàn thành. Được làm việc cùng các bạn là một vinh dự." Phát ngôn viên của Google đã phản hồi với Reuters rằng công ty cảm ơn những đóng góp quan trọng của Shazeer trong nhiều năm qua và chúc ông mọi điều thuận lợi trong tương lai.
Noam Shazeer là một trong những nhân vật huyền thoại trong lĩnh vực AI. Ông là một trong những tác giả chính của bài báo kinh điển năm 2017 "Attention Is All You Need", bài báo này lần đầu tiên đề xuất kiến trúc Transformer, trực tiếp đặt nền tảng kỹ thuật cho các mô hình lớn hiện đại như GPT series, Gemini, Claude.
《Attention Is All You Need》
Trước khi gia nhập OpenAI, Shazeer từng rời Google vào năm 2021 để thành lập Character.AI. Danh tính được biết đến rộng rãi nhất của Shazeer thực ra là Đồng sáng lập kiêm CEO của Character.AI.
Công ty này đã đặt cược vào thị trường "AI đồng hành" sớm hơn một bước so với sự bùng nổ của ChatGPT, cho phép người dùng trò chuyện lâu dài với các nhân vật AI khác nhau, từng trở thành một trong những ứng dụng AI cấp người dùng phát triển nhanh nhất toàn cầu. Đến năm 2023, định giá của Character.AI đã vượt qua 10 tỷ USD (tương đương khoảng 67,65 tỷ nhân dân tệ).
Năm 2024, Google đã đạt được một thỏa thuận cấp phép công nghệ trị giá khoảng 2,7 tỷ USD (tương đương khoảng 18,266 tỷ nhân dân tệ) với Character.AI, thu hút lại Noam Shazeer cùng một phần đội ngũ cốt lõi vào DeepMind, và bổ nhiệm Noam Shazeer làm Người đồng phụ trách Gemini, tham gia vào công việc nghiên cứu và phát triển huấn luyện trước cho thế hệ mô hình Gemini mới.
Đối với OpenAI, đang cạnh tranh khốc liệt với Anthropic, đây được coi là một trong những lần tuyển dụng nhân tài hàng đầu quan trọng nhất trong những năm gần đây. Sau khi tin tức được công bố, lãnh đạo cấp cao của OpenAI và nhiều nhà nghiên cứu nổi tiếng đã lập tức để lại lời chào mừng trên X.
Giám đốc Nghiên cứu của OpenAI, Mark Chen, đã đăng bài: "Rất vui mừng chào đón Noam Shazeer gia nhập OpenAI, đảm nhận vị trí Trưởng nhóm nghiên cứu kiến trúc. Công việc của ông trong lĩnh vực Transformer, MoE và giải mã hiệu quả đã định hình nên AI hiện đại."
Sau đó, nhiều nhà nghiên cứu AI cũng gửi lời chúc mừng trong phần bình luận, bao gồm Nhà nghiên cứu DeepMind của Google, thành viên người Hoa trong đội Gemini Thinking và Coding, Yuchen Zhuang; Nhà nghiên cứu OpenAI, người đóng góp cốt lõi cho mô hình suy luận o series, Noam Brown; cùng cựu Phó chủ tịch AI của Microsoft, hiện là Nhà nghiên cứu OpenAI, Sebastien Bubeck, v.v.
Nhà nghiên cứu người Hoa của Google DeepMind, Yuchen Zhuang
Người đóng góp cốt lõi cho mô hình suy luận o series của OpenAI, Noam Brown
Nhà nghiên cứu OpenAI, Sebastien Bubeck
Đồng thời, cũng có cư dân mạng cảm thán: "Việc mất đi một tác giả của Transformer và Người đồng phụ trách Gemini chắc chắn là một đòn giáng mạnh vào Google."
01. Tác giả Transformer nổi tiếng, làm việc tại Google gần 18 năm
Nhìn từ lịch sử phát triển của AI tạo sinh, Noam Shazeer hầu như đã tham gia vào từng mốc quan trọng. Ông gia nhập Google vào năm 2000, lần lượt đảm nhận các vị trí Kỹ sư phần mềm và Kỹ sư phần mềm chính, tích lũy hơn 18 năm làm việc.
Kinh nghiệm làm việc và học vấn của Noam Shazeer (Nguồn: LinkedIn)
Năm 2017, ông cùng 8 nhà nghiên cứu Google khác như Ashish Vaswani, Jakob Uszkoreit đã cùng công bố bài báo kinh điển "Attention Is All You Need", đề xuất kiến trúc Transformer. So với các mô hình RNN và LSTM chủ đạo trước đó, Transformer có thể xử lý văn bản dài hiệu quả hơn và có khả năng mở rộng mạnh hơn.
Trong vài năm qua, cho dù là series GPT của OpenAI, Gemini của Google, Anthropic Claude, hay các mô hình như DeepSeek, Llama, phần lớn đều được xây dựng trên nền tảng kiến trúc Transformer. Nói cách khác, làn sóng mô hình lớn đang cuốn theo toàn cầu ngày nay, phần lớn đều dựa trên nền tảng kỹ thuật do bài báo này đặt ra.
Tuy nhiên, Transformer chỉ là một trong nhiều tác phẩm tiêu biểu của Noam Shazeer.
Trong thời gian làm việc tại Google, ông còn tham gia thúc đẩy nhiều công nghệ mô hình lớn có ảnh hưởng sâu rộng. Năm 2017, ông với tư cách là tác giả đầu tiên đề xuất kiến trúc Chuyên gia hỗn hợp cổng thưa (MoE), cung cấp ý tưởng kỹ thuật quan trọng cho các mô hình sau này như GPT-4, Gemini, DeepSeek-V3; năm 2018, ông lại tham gia phát triển Mesh TensorFlow, cung cấp công cụ cơ bản cho việc huấn luyện Transformer quy mô siêu lớn; sau đó, ông còn tham gia nghiên cứu và phát triển mô hình T5 cùng mô hình đối thoại LaMDA của Google và nhiều dự án then chốt khác.
02. Rời Google khởi nghiệp, lại được mua lại với giá 182 tỷ
Năm 2021, Shazeer rời Google, cùng Daniel De Freitas đồng sáng lập Character.AI.
Lúc đó, mô hình ngôn ngữ lớn vẫn chưa đón thời điểm ChatGPT, nhưng Character.AI đã tiên phong thử nghiệm đưa sản phẩm chatbot ra thị trường đại chúng và nhanh chóng tích lũy được lượng người dùng lớn.
Năm 2024, Google thông qua một giao dịch hợp tác trị giá khoảng 2,7 tỷ USD (tương đương khoảng 18,266 tỷ nhân dân tệ) đã đưa Shazeer cùng đội ngũ cốt lõi của ông trở lại hệ thống DeepMind. Sau đó, ông trở thành một trong những người phụ trách quan trọng của dự án Gemini, và tham gia vào công việc huấn luyện trước cho thế hệ mô hình Gemini mới.
Thời điểm Shazeer trở về trùng với lúc bộ phận AI của Google đang chịu áp lực lớn. Lúc đó ChatGPT đang bùng nổ, Gemini vẫn đang trong giai đoạn đuổi theo. Sau khi trở lại DeepMind, Shazeer tham gia nghiên cứu và phát triển mô hình, và cuối cùng đảm nhận vị trí Người đồng phụ trách Gemini, trở thành một trong những nhân vật lãnh đạo công nghệ AI của Google.
Sau đó, series mô hình Gemini 3 đã lọt vào hàng đầu ngành trong nhiều bài kiểm tra chuẩn như lập trình, suy luận, trở thành một trong những lá bài quan trọng để Google cạnh tranh với OpenAI và Anthropic.
Từ nhà nghiên cứu Google, đến doanh nhân khởi nghiệp, rồi đến Người đồng phụ trách Gemini, Shazeer hầu như đã chứng kiến từng bước ngoặt quan trọng trong phát triển AI của Google trong gần mười năm qua. Do đó, việc rời Google để gia nhập OpenAI lần này cũng được nhiều chuyên gia trong ngành coi là một trong những sự kiện chảy máu chất xám quan trọng nhất của Google trong những năm gần đây.
03. Cuộc chiến giành nhân tài của OpenAI vẫn đang leo thang
Bối cảnh Shazeer gia nhập, là cuộc cạnh tranh nhân tài ngày càng gay gắt trong ngành AI.
Trong một năm qua, cuộc cạnh tranh giữa OpenAI và Anthropic tiếp tục gia tăng. Hai bên không chỉ so kè về năng lực mô hình, mà còn không ngừng tranh giành các nhà nghiên cứu hàng đầu và kỹ sư cốt lõi.
Tờ Financial Times của Anh đưa tin, Nội bộ OpenAI coi việc Shazeer gia nhập là một lần bổ sung quan trọng. Trong tương lai, ông sẽ tập trung nghiên cứu hướng kiến trúc mới sau Transformer, cũng như cách nâng cao hơn nữa năng lực mô hình.
Điều đáng chú ý là Transformer đã thống trị lĩnh vực AI gần mười năm. Với sự phát triển của mô hình suy luận, hệ thống đa tác nhân và mô hình thế giới, ngày càng nhiều nhà nghiên cứu bắt đầu suy nghĩ: Liệu Transformer có đón một lần nâng cấp kiến trúc lớn tiếp theo không?
Và Shazeer chính là một trong những người có đủ tư cách nhất để trả lời câu hỏi này.
Đối với Google, điều này có nghĩa là mất đi một tác giả của Transformer, Người đồng phụ trách Gemini và một trong những nhà thiết kế kiến trúc AI kỳ cựu nhất. Còn đối với OpenAI, phòng thí nghiệm của họ đón nhận một người đã từng tự tay định hình nên chồng công nghệ AI hiện đại.
04. Kết luận: Dòng chảy nhân tài quan trọng trong thời đại Transformer
Khi công nghệ dần tiệm cận tiên phong, bản thân các nhà nghiên cứu hàng đầu cũng trở thành một trong những nguồn lực khan hiếm nhất. Quỹ đạo nghề nghiệp của Noam Shazeer hầu như đã kết nối bốn mốc quan trọng: Transformer, Character.AI, Gemini và OpenAI.
Ngày nay, việc tác giả của Transformer rời Google, gia nhập OpenAI, vừa là một dòng chảy nhân tài, vừa phản ánh tình thế cạnh tranh ngày càng khốc liệt giữa các gã khổng lồ AI hiện nay.
Đặc biệt là trong bối cảnh OpenAI và Anthropic đang cạnh tranh khốc liệt xung quanh mô hình thế hệ tiếp theo, thị trường doanh nghiệp và nhân tài nghiên cứu hàng đầu, Google cũng đang không ngừng đuổi theo thông qua Gemini. Lúc này mất đi một người đặt nền móng cho Transformer và Người đồng phụ trách Gemini, đối với Google mà nói chắc chắn là một tổn thất không nhỏ.
Đối với toàn ngành, vấn đề đáng quan tâm tiếp theo có lẽ là: Khi tác giả của Transformer tự mình nghiên cứu "kiến trúc sau Transformer", mô hình AI thế hệ tiếp theo sẽ đi về đâu.
Bài viết này đến từ tài khoản WeChat công khai "Zhidongxi" (ID: zhidxcom), tác giả: Jiang Yu, biên tập: Li Shuiqing













