Biên tập viên chú ý: Khi năng lực của mô hình lớn tiếp tục được nâng cao, tầng ứng dụng AI đang đối mặt với một loại lo lắng phổ biến: Nếu các công ty mô hình như OpenAI, Anthropic vừa nắm giữ mô hình cơ sở, vừa có kênh phân phối và lợi thế thương hiệu, thì các công ty khởi nghiệp còn có thể làm gì ở tầng ứng dụng?
Đây chính là vấn đề mà Joe Schmidt, đối tác của a16z, cố gắng trả lời trong bài viết này. Ông mượn phép ẩn dụ "Con đường gạch vàng" trong "Phù thủy xứ Oz" để phân chia cơ hội ứng dụng AI thành hai loại: Một loại là con đường chính mà các công ty mô hình lớn đang tự mình tiến vào, chẳng hạn như sinh mã, viết văn, tạo hình ảnh, tác nhân tổng quát và trợ lý văn phòng ngang hàng; Loại còn lại là "những nơi khác ở xứ Oz", tức là những kịch bản dọc chuyên sâu vào quy trình ngành, phụ thuộc vào luồng công việc phức tạp, tích lũy dữ liệu, khả năng quản trị tuân thủ và tích hợp hệ thống.
Theo quan điểm của ông, cơ hội thực sự của các công ty khởi nghiệp nằm ở loại thứ hai.
Từ bán hàng đến bảo hiểm, Joe Schmidt nhấn mạnh đi nhấm lại một logic: Điều mà doanh nghiệp thực sự sẵn lòng trả tiền không phải là một cửa sổ chat thông minh hơn, mà là một hệ thống có thể chịu trách nhiệm về kết quả kinh doanh. Nó cần hiểu được trạng thái hỗn loạn của dữ liệu khách hàng, xử lý các trường hợp phê duyệt đa người và các trường hợp biên, đảm nhận trách nhiệm tuân thủ và kiểm toán, đồng thời cũng phải thay mặt khách hàng thực hiện việc di chuyển, định tuyến và tối ưu hóa chi phí khi mô hình liên tục được nâng cấp.
Đây cũng là phán đoán cốt lõi của bài viết này đối với phần mềm doanh nghiệp thế hệ tiếp theo: Mô hình cơ sở sẽ ngày càng mạnh mẽ, và cũng sẽ trở nên ngày càng có thể thay thế; nhưng thứ thực sự không thể thay thế, là dữ liệu, quy trình, năng lực quản trị và ký ức vận hành được tích lũy xung quanh ngành cụ thể và luồng công việc cụ thể. Cơ hội của công ty ứng dụng AI không nằm ở việc tranh giành "Con đường gạch vàng" với công ty mô hình, mà nằm ở việc tiến vào những nơi phức tạp hơn, "bẩn" hơn, chậm hơn, nhưng cũng gần hơn với giá trị thương mại thực tế.
Dưới đây là bản gốc:
Gần đây, tôi liên tục nghe thấy từ các nhà sáng lập và những người lao động tiềm năng cùng một câu hỏi: Tầng ứng dụng AI còn có thể làm gì nữa không? Hay là cuối cùng OpenAI và Anthropic sẽ giết chết tất cả?
Đằng sau câu hỏi này có một loại lo lắng điển hình kiểu AI. Một số người đã đi đến kết luận: Nếu không muốn trở thành tầng cơ sở vĩnh viễn, vị trí duy nhất có giá trị lâu dài, hoặc là ở bên trong phòng thí nghiệm mô hình lớn, hoặc là khởi nghiệp ở các lĩnh vực như robot, công nghệ cứng hoặc tương tự — về lý thuyết, tức là làm những thứ mà "phòng thí nghiệm không chạm tới". Bởi vì nếu mọi loại phần mềm đều sẽ bị nuốt chửng, hoặc bị Codex hay Claude trực tiếp hấp thụ công việc tương ứng, hoặc bị một mô hình nào đó trong tương lai làm cho không còn cần thiết, thì lựa chọn tốt nhất dường như là: Chạy nhanh lên!
Tôi thừa nhận, bản thân tôi gần như cũng là một người theo chủ nghĩa cực đoan AI, và tôi nghĩ họ nói đúng một nửa. Các phòng thí nghiệm mô hình lớn thực sự đang tiến vào những vùng rộng lớn của tầng ứng dụng. Nhưng "tầng ứng dụng" không phải là một tập hợp cơ hội đồng nhất. Tiêu chuẩn phán đoán thực sự quan trọng là: Bạn đang đi trên "Con đường gạch vàng", hay đang ở những nơi khác của xứ Oz.
Cái gọi là "Con đường gạch vàng", là con đường mà chúng tôi dùng để hình dung các phòng thí nghiệm mô hình lớn đang đi và đổ vào nguồn lực khổng lồ. Những vấn đề như sinh mã, viết văn, sáng tạo hình ảnh tự nhiên thích hợp để phòng thí nghiệm làm, bởi vì chúng sẽ trở nên tốt hơn khi năng lực nguyên thủy của mô hình được nâng cao: Mỗi đô-la đầu tư vào huấn luyện trước và huấn luyện sau, đều trực tiếp cải thiện chất lượng sản phẩm.
Nhưng ở những nơi khác của xứ Oz, tồn tại những vấn đề phức tạp hơn, thường cũng chuyên sâu hơn. Chúng không đơn giản là cung cấp cho một người dùng doanh nghiệp một công cụ ngang hàng, để nó kết nối với các khả năng công cụ và thao tác máy tính tiêu chuẩn là có thể giải quyết. Giá trị ở đây, phần lớn đến từ các giàn giáo xung quanh mô hình: Những giàn giáo này làm cho đầu ra trở nên đáng tin cậy, tuân thủ trong ngành cụ thể, và thực sự có thể đi vào quy trình nghiệp vụ. Năng lực nguyên thủy của mô hình cơ sở tất nhiên vẫn quan trọng, nhưng đã không còn là tất cả.
Chúng ta đang chứng kiến điều này trong thời gian thực. OpenAI và Anthropic thực tế đang thừa nhận với thị trường: Chúng không thể dùng một AI đồng nghiệp phổ quát để giải quyết mọi vấn đề. Chúng đã công bố đầu tư vào các dự án liên doanh quy mô lớn kiểu triển khai tiền tuyến, xây dựng các công ty hoàn chỉnh xung quanh việc cấu hình và tùy chỉnh mô hình cho doanh nghiệp. Nếu chúng thực sự nghĩ rằng lần phát hành mô hình tiếp theo sẽ giải quyết những vấn đề này, chúng sẽ không đầu tư hàng chục tỷ đô-la vào các dự án kiểu này.
Vì vậy, nếu bạn muốn kiếm tiền bằng cách làm ứng dụng AI, đừng đi trên Con đường gạch vàng, mà hãy đến những nơi khác của xứ Oz để xây dựng. Dưới đây là những kinh nghiệm mà chúng tôi cũng như một số nhà sáng lập trong danh mục đầu tư của chúng tôi, đã học được trong thực tiễn.
Con đường gạch vàng
Nếu bạn muốn thành lập một công ty, Con đường gạch vàng là con đường dễ thấy nhất, nhưng cũng là con đường nguy hiểm nhất. Lấy một mô hình hiệu năng cao, kết nối với một số bộ kết nối có sẵn, như Google Drive, Slack, Salesforce, Notion, GitHub, sau đó xây một lớp điều phối tác nhân lên trên. Trông giống như ma thuật vậy.
Vấn đề là, đây chính xác là điều mà các phòng thí nghiệm mô hình lớn đang làm thông qua Cowork và Codex. Rõ ràng, chúng sở hữu mô hình, điều này có nghĩa là chúng có tỷ suất lợi nhuận tốt hơn, khả năng kiểm soát mạnh hơn, cũng có thể áp đặt quyền định giá lên tất cả những người tham gia xuôi dòng. Nhưng có lẽ quan trọng hơn, chúng còn nắm giữ lựa chọn kiến trúc quyết định sản phẩm phù hợp giải quyết vấn đề gì. Cho đến nay, chúng vẫn rất có chủ ý áp dụng mô hình "mô hình + gọi công cụ", và đây chính xác là mô hình mà những công việc ngang hàng, số bước thấp trên Con đường gạch vàng cần đến. Ngay cả khi một công ty khởi nghiệp bằng cách nào đó có thể vượt qua Codex hay Claude Code, các phòng thí nghiệm mô hình lớn vẫn sở hữu năng lực phân phối khổng lồ, cũng như ánh hào quang thương hiệu mạnh nhất trong lĩnh vực AI.
Nếu bạn là một công ty ứng dụng AI, áp dụng chiến thuật cùng một bộ: Kết nối vào các bộ kết nối giống nhau, không có tác nhân con cấp dưới hay cấu hình, cũng không có kênh phân phối, thì rất có thể bạn đang đi trên một con đường dẫn đến hư vô.
Những nơi khác của xứ Oz
Đối với các công ty khởi nghiệp, tình hình không hoàn toàn là bi quan. Bên ngoài Con đường gạch vàng, vẫn tồn tại cơ hội khổng lồ. Các công ty khởi nghiệp có thể có khách hàng ở những nơi này, và giải quyết các vấn đề phức tạp.
Những công ty này đang xây dựng trải nghiệm tác nhân: Mô hình được dệt vào mạng lưới phức tạp của công cụ, tự động hóa và tích hợp — nói cách khác, chính là phần mềm. Điều này cũng khiến hầu hết các công ty kiểu này tự nhiên là chuyên sâu theo chiều dọc. Chúng có thể tập trung vào luồng công việc nhiều bước, nhiều người tham gia, thiết kế tác nhân con cho các vai trò và kịch bản dọc khác nhau, xử lý các vấn đề mà nền tảng ngang hàng của Anthropic và OpenAI khó chạm tới: Thu thập ngữ cảnh xuyên hệ thống, sau đó định tuyến nhiệm vụ cho nhiều người cần phê duyệt ở các giai đoạn khác nhau.
Loại công việc này thường liên quan đến một hoặc nhiều hệ thống kế thừa, thường cần kết quả xác định, bởi vì tính mơ hồ là không thể chấp nhận, và đôi khi còn trực tiếp liên kết với một kết quả kinh doanh quan trọng. Các phòng thí nghiệm mô hình lớn tất nhiên biết những vấn đề này có giá trị thế nào: Đây là lý do tại sao chúng đang xây dựng đội ngũ cấu hình kiểu thuê ngoài của riêng mình, cũng là lý do tại sao toàn bộ nhóm các công ty dịch vụ học tăng cường hướng đến khách hàng lớn đang xuất hiện.
Tại sao những nơi khác của xứ Oz sẽ không bị "Phù thủy" chiếm hoàn toàn
Một phản bác đối với quan điểm trên là: Cho đến nay, đặt cược rằng mô hình hoặc phòng thí nghiệm sẽ không tiếp tục tiến bộ, luôn là một giao dịch rất tệ. Rất có thể chúng sẽ tiếp tục mạnh lên, và cuối cùng ăn sạch thị trường mà các công ty tầng ứng dụng này đang phục vụ.
Các phòng thí nghiệm mô hình lớn tất nhiên sẽ tiếp tục tiến bộ. Nhưng tôi cho rằng, các công ty ở những nơi khác của xứ Oz, về lâu dài vẫn có vài cách phòng thủ.
Dữ liệu và vòng xoáy học tập
Rất nhiều thứ bạn thực sự nội hóa trong nghiệp vụ, không tồn tại trong bất kỳ tập huấn luyện nào: Các quy ước ngành không thành văn, tiêu chuẩn không có tài liệu ghi lại, tri thức bộ lạc tồn tại trong đầu những người thực hành. Tất cả đều không có trên internet công khai. Dù đầu tư bao nhiêu năng lực tính toán huấn luyện, cũng không thể thay thế việc thực sự đi vào bên trong luồng công việc nơi tri thức này tồn tại.
Ở đây chồng lên hai vòng xoáy: Một là vòng xoáy xuyên khách hàng, tức là khi bạn nhìn thấy nhiều biến thể hơn của cùng một loại vấn đề, mẫu hình sẽ liên tục sinh lãi kép; Hai là vòng xoáy nội bộ khách hàng, tức là lý do đằng sau quyết định cụ thể, những ngoại lệ không được nói ra, quy tắc kinh nghiệm của chính công ty, chỉ nổi lên khi người dùng tương tác thực tế với hệ thống.
Ngay cả khi dữ liệu khách hàng không thể sử dụng xuyên khách hàng, công ty ứng dụng vẫn có thể tận dụng việc nhận diện mẫu hình đối với các loại vấn đề của khách hàng khác nhau, và dùng nó để hướng dẫn thiết kế kiến trúc cho vấn đề trong tương lai. Một công ty đã để tác nhân của mình xử lý một trăm lần sửa đổi điều khoản pháp lý, một nghìn chu kỳ định phí bảo hiểm, hoặc một vạn hoạt động phát triển bán hàng SDR, sự hiểu biết của nó về hình thái vấn đề, đã không phải là thứ mà một người đến sau khởi động tác nhân mới lần đầu có thể sao chép được.
Về lý thuyết, một tác nhân ngang hàng cũng có thể xây dựng cơ sở hạ tầng học tập tương tự. Nhưng lý do nó không làm vậy, ngoài việc không đủ tập trung, quan trọng hơn là trải nghiệm người dùng. Việc nắm bắt tri thức này, hoàn toàn phụ thuộc vào giao diện luồng công việc bạn cung cấp cho người dùng. Người chơi chuyên sâu có thể thiết kế các giao diện này xoay quanh thông tin thực sự cần phơi bày mà luồng công việc cụ thể cần, công cụ ngang hàng không làm được. Tập đánh giá, gán nhãn đầu ra, hệ thống phân loại trường hợp biên, đều có thể kết hợp thành một vòng xoáy dữ liệu lĩnh vực chuyên sâu, và tiếp tục hỗ trợ tinh chỉnh. Người đến sau nếu không có mức độ phơi nhiễm môi trường sản xuất tương đương, rất khó tạo ra loại vòng xoáy này. Nó có khả thi hay không, phụ thuộc vào quyền dữ liệu, lượng sử dụng sản xuất tích lũy và cấu trúc hợp đồng khách hàng, nhưng bản thân việc nhận diện mẫu hình vẫn sẽ liên tục tích lũy.
Quản lý biến động và phức tạp của mô hình
Bên trong các phòng thí nghiệm mô hình lớn đã đang làm định tuyến: Gọi các loại mô hình khác nhau cho các yêu cầu khác nhau, sử dụng tập hợp mô hình ở cơ sở. Nhưng điều chúng không làm được là định tuyến xuyên nhà cung cấp, cũng rất khó để đánh giá mô hình của đối thủ cạnh tranh cho một nhiệm vụ con cụ thể, hoặc sử dụng mô hình tinh chỉnh mã nguồn mở thực sự phù hợp nhất ở một khâu hẹp nào đó.
Các công ty ở những nơi khác của xứ Oz, sẽ chọn mô hình phù hợp nhất cho mỗi nhiệm vụ con trong toàn bộ thị trường mô hình, chứ không chỉ sử dụng mô hình do một phòng thí nghiệm mẹ nào đó phát hành. Chúng cũng sẽ đảm nhận những công việc không ai muốn làm: Chạy lại đánh giá mỗi khi mô hình mới phát hành, hiệu chỉnh lại lời nhắc cho các trường hợp biên của khách hàng, hoàn thành việc đưa vào sử dụng mà không phá vỡ môi trường sản xuất. Các phòng thí nghiệm mô hình lớn sẽ không làm những việc này thay khách hàng. Chúng bán mô hình mới cho bạn, sau đó bảo bạn đi di chuyển. Các công ty ở những nơi khác của xứ Oz thì hấp thụ chi phí di chuyển. Khách hàng nhận được là năng lực thông minh tốt nhất trên toàn thị trường, cùng với tính liên tục trong mỗi quá trình nâng cấp.
Tối ưu hóa chi phí
Ném mỗi truy vấn cho Opus 4.7, là con đường nhanh nhất để biến tỷ suất lợi nhuận gộp thành âm. Những công ty tốt nhất ở xứ Oz sẽ thực hiện định tuyến giữa các mô hình cấp độ khác nhau: Nhiệm vụ khó nhất giao cho mô hình tiên phong, hầu hết nhiệm vụ giao cho mô hình trung bình, sử dụng mô hình tùy chỉnh hoặc tinh chỉnh nhỏ hơn ở những nơi đã chứng minh khả thi.
Một số công ty trong số này hiện nay đã thực hiện huấn luyện sau của riêng mình trên cơ sở này, tối ưu hóa mô hình đến đoạn công việc nhỏ mà khách hàng thực sự quan tâm, và cung cấp dịch vụ với chi phí thấp hơn nhiều so với việc gọi API tiên phong. Các phòng thí nghiệm mô hình lớn định giá "giá sàn": Mức thông minh thấp nhất có thể mua được với X đô-la. Các công ty xứ Oz bán thứ ngược lại: Đạt được chi phí đô-la thấp nhất, ở mức độ thông minh thực sự cần thiết của luồng công việp cụ thể. Chỉ khi bạn rất rõ ràng mỗi nhiệm vụ con thực sự cần cấp độ thông minh nào, điều này mới có thể làm được. Và các phòng thí nghiệm mô hình lớn về cấu trúc không thể hiểu mọi nhiệm vụ trong mỗi ngành dọc. Cuối cùng, điều này sẽ trực tiếp chuyển hóa thành định giá kết quả thấp hơn, kiểm soát được hơn.
Quản trị
Trở thành mặt phẳng điều khiển cho AI mà khách hàng chạy trong một lĩnh vực chuyên sâu, sẽ tạo ra giá trị khá lớn. Mặt phẳng điều khiển này, là nơi quyền hạn, kiểm toán, tác nhân được phép làm gì, tác nhân thực sự đã làm gì hội tụ lại với nhau.
Mặt phẳng điều khiển này được xây dựng trên các lan can bảo vệ của trường hợp sử dụng cụ thể, và lan can bảo vệ trong các ngành, các loại vị trí công việc khác nhau hoàn toàn khác nhau. Bởi vì các công ty này sở hữu đầu cuối các công cụ, luồng công việc và dữ liệu mà tác nhân tiếp xúc, chúng có thể cung cấp kết quả xác định theo cách mà công cụ ngang hàng khó đạt được. Chúng cũng sẽ thay người mua cuối cùng hấp thụ sự phức tạp về quy định: Các quy tắc tố tụng dân sự liên bang và quy tắc hành nghề luật sư Hoa Kỳ trong lĩnh vực pháp lý, HIPAA trong lĩnh vực y tế, các quy tắc SEC và FINRA trong lĩnh vực tài chính, quy định bảo hiểm cấp bang, v.v. Người chơi ngang hàng nếu không biến mình thành một trăm ngành dọc khác nhau, sẽ không thể làm điều này một cách thuyết phục. CIO cần là một đối tác có thể cam kết rõ ràng trong hợp đồng: Nó sẽ chịu trách nhiệm xử lý tuân thủ cho tác nhân được cung cấp.
Tất cả những điều này cuối cùng đều quay về một việc: Tập trung.
Sự tập trung này có thể là một ngành dọc, như bảo hiểm, pháp lý, kế toán; cũng có thể là một chức năng được làm đủ sâu, như bán hàng, dịch vụ khách hàng, tài chính. Dù là loại nào, công việc này cần một đội ngũ lâu dài đâm sâu vào cùng một nhóm khách hàng, hiểu luồng công việc, trường hợp biên và yêu cầu quy định của nó. Các phòng thí nghiệm mô hình lớn không được xây dựng cho việc này. Chúng phải phục vụ tất cả mọi người, bao phủ mọi nơi, đây cũng là lý do ban đầu chúng xây Con đường gạch vàng. Sự đánh đổi tương tự, cũng sẽ khiến chúng khó tiến vào những nơi khác của xứ Oz: Bạn có thể cùng lúc ở mọi nơi, hoặc làm một việc đến mức xuất sắc, nhưng không thể vừa cả hai.
Lấy bán hàng làm ví dụ: Lời khuyên thực tiễn từ CEO 11x
Trong thực tiễn, nên hiểu việc này thế nào? Dưới đây là một số lời khuyên thực tiễn do Prabhav Jain, CEO của 11x, đưa ra.
Tập trung vào kết quả
Xây dựng một công ty có thể chống chịu được sự tấn công của phòng thí nghiệm mô hình lớn, một con đường chiến thuật khả thi, là xuất phát từ kết quả cụ thể mà khách hàng thực sự quan tâm. Đối với chúng tôi, kết quả này chính là giúp doanh nghiệp tạo ra nhiều đầu mối và đường ống bán hàng hơn.
Từ đây bắt đầu, vấn đề sẽ trở nên rất cụ thể: Những hoạt động nào là chúng tôi muốn sở hữu đầu cuối, và thực sự có thể thúc đẩy tăng trưởng đường ống bán hàng? Phân giải mỗi hoạt động thành nhiệm vụ. Nhiệm vụ nào phù hợp với tác nhân, nhiệm vụ nào không? Nhiệm vụ nào cần thấu hiểu lĩnh vực phức tạp, nhiệm vụ nào không? Các phòng thí nghiệm mô hình lớn cũng sẽ đưa ra luồng công việc, nhưng khi một bước luồng công việc có nhiều bước, đầu vào hỗn loạn, trạng thái khó giải thích, hoặc tồn tại ràng buộc thế giới thực, chỉ có một mô hình tốt hơn không thể hoàn thành công việc. Lúc này, công việc lại trở về với kỹ thuật phần mềm truyền thống, và ở tầng này, phòng thí nghiệm mô hình lớn so với một công ty ứng dụng tập trung không có ưu thế.
Ví dụ, một số nhiệm vụ chúng tôi xử lý bao gồm: Khai thác khách hàng tiềm năng dựa trên tín hiệu tùy chỉnh, bổ sung thông tin khách hàng tiềm năng, nghiên cứu tài khoản sâu, lấy ngữ cảnh từ CRM, viết thông điệp cho các kênh khác nhau, tác nhân đánh giá tiềm năng khách hàng, và hệ thống phân phối email. Trong đó có một số là nhiệm vụ tác nhân, một số không. Những nhiệm vụ này không phải là một lời nhắc có thể hoàn thành, mà cần năng lực kỹ thuật sâu.
Thấu hiểu then chốt trong phép loại suy xứ Oz này là: Trong bất kỳ luồng công việc thực tế nào, nhìn sơ qua có một nửa là nhiệm vụ không phải tác nhân, và một nửa này không mang lại ưu thế phòng thí nghiệm. Dưới tầng mô hình, năng lực viết phần mềm xác định của chúng không mạnh hơn bạn. Còn một nửa nhiệm vụ tác nhân còn lại, vẫn yêu cầu bạn điều chỉnh, huấn luyện và ràng buộc mô hình xung quanh kết quả thực sự mong muốn.
Tri thức lĩnh vực thường không nằm trong dữ liệu huấn luyện phổ quát. Những năng lực này phải được xây dựng từ dưới lên từ ngành dọc hoặc chức năng cụ thể, và cung cấp cho mô hình tại thời điểm thích hợp trong luồng công việc. Khi tác nhân của chúng tôi đánh giá một đầu mối đến có đủ tiềm năng hay không thông qua điện thoại, nó phải được huấn luyện để hiểu: Đối với ngành cụ thể, chân dung người dùng cụ thể, thế nào mới là một cuộc trò chuyện bán hàng tốt. Đây là công việc của công ty ứng dụng, và năng lực này sẽ sinh lãi kép.
Quan trọng hơn, những năng lực này sẽ liên tục lỗi thời, bởi vì bản thân doanh nghiệp cũng đang tiến hóa. Vì vậy, năng lực liên tục tiến hóa luồng công việc và ngữ cảnh của bạn, tự nó sẽ trở thành lợi thế cạnh tranh. Ví dụ, khi chúng tôi mới bắt đầu làm sản phẩm email tiếp cận mở rộng quy mô, "email do AI viết" mới chỉ bắt đầu xuất hiện. Tiến nhanh đến hôm nay, mọi người đã hình thành cảm giác tinh tế, có thể phân biệt những email nào do AI viết, những email nào giống người viết hơn, và điều then chốt là, sự phán đoán này cứ vài tháng lại thay đổi. Tác nhân của chúng tôi phải liên tục điều chỉnh theo động thái thị trường, nhưng hào thành cũng chính được xây dựng ở đây. Thực tế, mặc dù tồn tại sự thay đổi động thái này, tỷ lệ phản hồi tích cực của chúng tôi trong vài tháng qua đã tăng gấp 4 lần, và tạo ra hàng trăm triệu đô-la đường ống bán hàng cho khách hàng.
Làm vấn đề độ phức tạp cao
Vấn đề phức tạp mới là nơi thực sự giải phóng giá trị thương mại. Nếu không, bạn rất dễ thấy mình chỉ đang làm một lớp bao bọc mỏng.
Phân giải bất kỳ vấn đề thương mại đủ phức tạp nào, rất nhanh sẽ thấy sự hỗn loạn xuất hiện. Đây là một ví dụ nghe rất đơn giản từ lĩnh vực GTM: Nếu một công ty nào đó đã là khách hàng của bạn, bạn không nên liên hệ một liên hệ nào đó trong công ty này nữa. Nhưng việc này không hề đơn giản.
Có thể trong CRM của bạn có tên miền tương ứng của công ty này. Vậy thì, những công ty có hàng chục công ty con thì sao? Nếu bản ghi CRM là tên miền của công ty mẹ thì sao? Nếu một trường khớp lỗi thời trong Salesforce, khiến bạn gửi email bán hàng lạnh đến Giám đốc Doanh thu chính của khách hàng hiện tại thì sao? Dữ liệu thế giới thực là hỗn loạn. Con người xử lý còn vất vả, mô hình cũng không thể vượt qua ngưỡng này một cách thần kỳ. Để thiết lập trật tự từ sự hỗn loạn này, cần thiết kế tác nhân chuyên dụng xung quanh hình thái cụ thể của vấn đề, chứ không phải chỉ cần hướng một phó lái phổ quát vào CRM là xong. Thực tế, dựa trên dữ liệu chúng tôi nắm giữ, chúng tôi phát hiện chất lượng và độ tươi mới dữ liệu của mình đã cao hơn bản thân khách hàng, do đó mặc định, chúng tôi sẽ lấy dữ liệu của mình làm mốc.
Lan can bảo vệ không chỉ để ngăn chặn điều xấu xảy ra. Khách hàng trả tiền mua chính là việc này
Lan can bảo vệ bị đánh giá thấp nghiêm trọng. Ngay cả trong cùng một sản phẩm, mỗi trường hợp sử dụng cũng cần lan can bảo vệ riêng. Đối với chúng tôi, một khách hàng tiềm năng dịch vụ tài chính được quản lý, với một khách hàng SaaS cỡ vừa yêu cầu đảm bảo hoàn toàn khác nhau. Và những đảm bảo này sẽ truyền dẫn tầng tầng lớp lớp đến cách tác nhân viết, có thể liên hệ ai, có thể tiếp xúc dữ liệu nào, có thể nói gì trên điện thoại, và mỗi quyết định được ghi lại thế nào.
Một hệ thống "một kích thước phù hợp với tất cả" sẽ sụp đổ trước sự khác biệt này. Lan can bảo vệ phải được xây dựng theo trường hợp sử dụng, cấu hình theo khách hàng, và liên tục kiểm toán, và những công việc này hoàn toàn đặt lên vai công ty ứng dụng. Đây cũng là lý do tại sao chúng tôi cần kỹ sư triển khai tiền tuyến và chuyên gia chiến lược triển khai kỹ thuật, điều chỉnh cho phù hợp với yêu cầu của mỗi khách hàng.
Ví dụ, chúng tôi từng hợp tác với một tổ chức Fortune 1000, thông qua giọng nói thực hiện cuộc gọi ra được đồng ý với khách hàng SMB khổng lồ của họ. Trong mấy vòng thử đầu tiên, tỷ lệ nghe máy rất thấp. Chúng tôi phải lặp lại nhanh, học cách khiến đối tượng cụ thể này tương tác trong vòng 10 giây đầu cuộc gọi. Cách hành xử của chủ doanh nghiệp SMB hoàn toàn khác với người mua B2B lớn hay người tiêu dùng. Hiện nay, số cơ hội bán hàng chúng tôi tạo ra cho họ trong một ngày, đã vượt quá số lượng toàn bộ đội ngũ bán hàng của họ có thể tạo ra trong phân khúc thị trường này trong một tháng.
Lấy bảo hiểm làm ví dụ: Lời khuyên thực tiễn từ CEO FurtherAI
Bán hàng chỉ là một ví dụ. Bảo hiểm là một ví dụ khác, nó nói lên cùng một việc từ góc độ khác. Dưới đây là cách hiểu của Aman Gour, CEO của FurtherAI, về "xây dựng rời xa Con đường gạch vàng".
Khi chúng tôi bắt đầu triển khai AI vào hoạt động bảo hiểm thực tế, liên tục nghe một giả định: Mô hình mới là thông minh, luồng công việc chỉ là giàn giáo xây xung quanh mô hình.
Nhưng chúng tôi càng hợp tác với nhiều công ty bảo hiểm, càng tin chắc việc này hoàn toàn ngược lại.
Trong ngành bảo hiểm, rất nhiều sự thông minh tự nó đã tồn tại trong luồng công việc. Hai công ty bảo hiểm có thể để một hồ sơ nộp đi qua con đường trông giống nhau: Nộp, xét duyệt, báo giá, nhận bảo hiểm. Bản thân con đường là dễ dàng. Thứ thực sự phân biệt hai công ty bảo hiểm, là tất cả những thứ bên trong con đường: Những rủi ro nào cần nâng cấp, những tín hiệu tổn thất nào quan trọng, khi hai quy tắc sở thích nhận bảo hiểm xung đột thì quy tắc nào ưu tiên, khi nào bắt buộc phải có chữ ký xác nhận của con người, cần lấy dữ liệu bên ngoài nào, và cuối cùng quyết định được ghi lại thế nào.
Những logic này không tồn tại trong một động cơ quy tắc sạch sẽ. Chúng phân tán trong quy trình vận hành tiêu chuẩn, xét duyệt của quản lý, triết lý nhận bảo hiểm, sở thích rủi ro cụ thể của công ty bảo hiểm, và kinh nghiệm vận hành nhiều năm. Rất nhiều trong số đó không được viết ra dưới dạng mô hình có thể đọc trực tiếp.
Đây là lý do tại sao chúng tôi không tin vào loại tác nhân thuần túy mỗi lần đều lý luận từ con số không, cũng không tin vào loại luồng công việc cứng nhắc gặp tính phức tạp thực tế sẽ sụp đổ. Thay vào đó, chúng tôi luôn xây dựng luồng công việc tác nhân. Luồng công việc mang lại tính lặp lại, khả năng kiểm toán và kiểm soát chi phí; tác nhân xử lý tính biến động, và khôi phục quy trình khi con đường lý tưởng bị gián đoạn; con người thì giữ trong vòng lặp ở những nơi liên quan đến phán đoán và trách nhiệm giải trình.
Ngày thứ nhất, hệ thống này tự động hóa công việc thủ công. Nhưng theo thời gian, mỗi lần nâng cấp sẽ trở thành một tín hiệu, mỗi ngoại lệ là một phản hồi, mỗi sửa chữa của con người đều nói cho bạn biết sổ tay hướng dẫn vận hành ban đầu không đầy đủ ở đâu. Lâu dần, luồng công việc không còn chỉ là một kịch bản, mà sẽ trở thành ký ức vận hành của công ty bảo hiểm.
Đây chính là phần mà các phòng thí nghiệm mô hình lớn khó chạm tới. Chúng sẽ tiếp tục phát hành mô hình tốt hơn và tác nhân phổ quát tốt hơn, và chúng nên làm vậy. Nhưng chúng sẽ không ở lâu trong luồng công việc sản xuất của một công ty bảo hiểm, để học tại sao một tài khoản được nâng cấp, tại sao một rủi ro bị từ chối, hoặc tại sao một người nhận bảo hiểm lật đổ hướng dẫn sở thích rủi ro, và thực tế chứng minh anh ta đúng.
Sự hiểu biết này, chỉ có thể đến từ việc chạy cùng một luồng công việc hàng nghìn hàng vạn lần trong môi trường sản xuất. Luồng công việc bạn giao ngày thứ nhất không phải là hào thành. Vòng lặp hình thành theo thời gian từ việc sử dụng sản xuất, mới là hào thành.
Đối với chúng tôi, đây chính là ý nghĩa của "xây dựng rời xa Con đường gạch vàng".
Làm thế nào để phán đoán mình đang ở những nơi khác của xứ Oz, hay vẫn đang đi trên Con đường gạch vàng?
Kiểm tra công cụ và bước
Công việc này cần bao nhiêu bước? Để hỗ trợ nó, công cụ bạn cần xây dựng phức tạp đến mức nào?
Lấy một AI ngang hàng tìm kiếm trong Google Drive để so sánh: Nó là một thao tác một bước đối với một công cụ, tỷ lệ dung sai kết quả cũng cao. Người dùng đọc tóm tắt, nếu sai, hỏi lại lần nữa là được.
Nhìn vào một nhiệm vụ sửa đổi điều khoản pháp lý nhiều bước dựa trên tiền lệ ba năm qua của công ty luật: Nó có thể liên quan đến hàng chục bước, nhiều công cụ, đầu ra phải thông qua xét duyệt của đối tác, thậm chí có thể cần được biện luận trước tòa án. Cả hai trông đều giống "một tác nhân đang làm việc", nhưng chỉ có loại thứ hai cần loại phần mềm sâu được xây dựng bởi đội ngũ tập trung mất nhiều năm.
Kiểm tra hệ thống
Bạn đang xây dựng một hệ thống để khách hàng chạy công việc, hay đang thêm một công cụ lên trên hệ thống sẵn có của khách hàng?
Hệ thống sở hữu luồng công việc đầu cuối: Nắm bắt dữ liệu, quản trị, ghi chép hoàn thành công việc. Khách hàng khi mô tả công việc thực tế diễn ra thế nào, sẽ chỉ vào hệ thống này. Công cụ thì chỉ tăng thêm một lớp thông minh lên luồng công việc mà khách hàng đã đang chạy.
Sản phẩm kiểu công cụ cũng có thể tạo ra doanh thu thực tế, nhưng phòng thí nghiệm mô hình lớn dễ dàng lấy nó đi hơn, bởi vì khách hàng không phụ thuộc vào bạn như lớp điều phối. ACV cao thường là tín hiệu của sản phẩm kiểu hệ thống, bởi vì hệ thống thay thế nhân lực thực tế, và do đó có thể được trả phí tương ứng. Nhưng điều này không phải là đảm bảo tuyệt đối. Bạn cần tự hỏi: Nếu một phòng thí nghiệm mô hình lớn nào đó đưa ra sản phẩm trông cạnh tranh trực tiếp với bạn, khách hàng có còn cần công cụ của bạn không? Nếu câu trả lời là cần, bạn đang xây dựng hệ thống. Nếu câu trả lời là không cần, bạn là một công cụ — ngay cả khi ACV của bạn cao.
Kiểm tra quỹ phòng hộ / báo cáo lãi lỗ
Biểu hiện của phòng thí nghiệm mô hình lớn, được đánh giá bằng điểm chuẩn; biểu hiện của các công ty ở những nơi khác của xứ Oz, thì được đánh giá bằng báo cáo lãi lỗ của khách hàng.
Khách hàng không quan tâm mô hình của bạn đạt bao nhiêu điểm trên SWE-Bench hay MMLU. Họ quan tâm: Tác nhân của bạn có ký được đơn hàng không, có sửa đúng điều khoản pháp lý không, có nhận bảo hiểm đúng hợp đồng không. Nếu khách hàng tập trung vào kết quả luồng công việc cụ thể, chứ không phải điểm số năng lực phổ quát, thì bạn đang ở những nơi khác của xứ Oz. Nếu khách hàng trả tiền mua năng lực phổ quát, thì bạn đang bán thứ mà họ có thể có được thông qua chỗ ngồi Claude hay Codex.
Các công ty tác nhân tốt nhất cần thực thi như quỹ phòng hộ: Họ thắng ở alpha, và alpha được đo lường trong báo cáo lãi lỗ của khách hàng, không phải trong điểm số chuẩn đo.
Cả hai đều có thể thắng, và đều sẽ thắng
Chúng ta sẽ đồng thời thấy những người chiến thắng khổng lồ trên Con đường gạch vàng và bên ngoài Con đường gạch vàng. Mô hình sẽ tiếp tục thắng, bởi vì chúng sở hữu mô hình, cũng sở hữu năng lực phân phối được thiết kế tốt cho công cụ ngang hàng.
Những nơi khác của xứ Oz cũng có thể thắng, với điều kiện chúng sở hữu hệ thống công việc: Tức là giao diện thực tế doanh nghiệp thực thi công việc, và dữ liệu lưu chuyển và được nắm bắt từ đó. Những công ty này sở hữu nắm bắt dữ liệu, hệ thống hành động luồng công việc và quản trị. Khi luồng công việc phức tạp trong một lĩnh vực chuyên sâu dần trưởng thành, chúng sẽ kết hợp thành một trải nghiệm cốt lõi mà khách hàng không thể rời xa. Khi người chơi hiện tại và người mới tham gia liên tục phát hành thế hệ mô hình mới, công ty này sẽ trở thành lớp tích hợp và giao những mô hình này cho khách hàng. Mô hình cơ sở là có thể thay thế, nhưng hệ thống công việc thì không.
Phần mềm doanh nghiệp thế hệ tiếp theo, sẽ được xây dựng bên ngoài Con đường gạch vàng.






