Đại Đồng, Sơn Tây, thành phố từng dựa vào than đá để chống đỡ một nửa bầu trời, giờ đây rũ bỏ lớp bụi than, cầm lấy một chiếc cuốc sắc bén, giáng mạnh xuống một mỏ vô hình khác.
Trong tòa nhà văn phòng tại Trung tâm Thương mại Quốc tế Kim Mao, khu Bình Thành, không còn giếng thang máy, không còn xe chở than. Thay vào đó là hàng nghìn chiếc máy tính xếp sát nhau. Căn cứ Dịch vụ Dữ liệu lớn Thung lũng Âm thanh Vân Trung của Thượng Hải Nhuấn Tấn chiếm vài tầng, hàng nghìn nhân viên trẻ đeo tai nghe đang nhìn chằm chằm vào màn hình, nhấp chuột, kéo thả, khoanh vùng.
Theo dữ liệu chính thức, tính đến tháng 11 năm 2025, thành phố Đại Đồng đã đưa vào vận hành 745.000 máy chủ, thu hút 69 doanh nghiệp gọi và gán nhãn dữ liệu, tạo việc làm tại chỗ cho hơn 30.000 lượt người, doanh thu 750 triệu nhân dân tệ. Trong mỏ số này, 94% người lao động có hộ khẩu địa phương.
Không chỉ Đại Đồng. Trong số các căn cứ gán nhãn dữ liệu đầu tiên do Cục Quản lý Dữ liệu Nhà nước xác định, các huyện thị trung tây như Vĩnh Hòa (Sơn Tây), Bích Tiết (Quý Châu), Mông Tự (Vân Nam) đều có tên. Tại căn cứ gán nhãn dữ liệu huyện Vĩnh Hòa, 80% là nhân viên nữ. Họ chủ yếu là các bà mẹ trẻ nông thôn, hoặc thanh niên trở về quê không tìm được việc làm phù hợp.
Một trăm năm trước, các nhà máy dệt Manchester ở Anh chật ních nông dân mất đất. Còn ngày nay, trước màn hình máy tính ở những thị trấn xa xôi này, ngồi đầy những thanh niên không tìm được vị trí trong nền kinh tế thực.
Họ đang làm một công việc tính lương theo sản phẩm vừa mang tính tương lai, vừa cực kỳ nguyên thủy, sản xuất thức ăn dữ liệu cần thiết cho các gã khổng lồ trí tuệ nhân tạo ở Bắc Kinh, Thâm Quyến và Thung lũng Silicon.
Không ai thấy có vấn đề gì.
Dây chuyền sản xuất mới trên cao nguyên Hoàng Thổ
Bản chất của gán nhãn dữ liệu là dạy máy móc nhận biết thế giới.
Xe tự lái cần nhận ra đèn giao thông và người đi bộ, mô hình lớn cần phân biệt mèo và chó. Bản thân máy móc không có kiến thức thông thường, con người phải vẽ một khung trên ảnh trước, nói với nó "đây là người đi bộ", sau khi nuốt chửng hàng triệu bức ảnh, nó mới có thể tự học cách nhận diện.
Công việc này không yêu cầu học vấn cao, chỉ cần sự kiên nhẫn và một ngón trỏ có thể nhấp chuột liên tục.
Vào thời hoàng kim năm 2017, một khung 2D đơn giản có giá hơn một hào, thậm chí có công ty trả giá cao tới 5 hào. Người gán nhãn nhanh tay, làm việc hơn mười giờ một ngày, có thể kiếm được năm sáu trăm tệ. Ở huyện thị, đây chắc chắn là một công việc lương cao, thể diện.
Nhưng khi mô hình lớn tiến hóa, mặt tàn khốc của dây chuyền này bắt đầu lộ ra.
Đến năm 2023, đơn giá gán nhãn hình ảnh đơn giản đã giảm xuống còn 3 đến 4 phân, giảm hơn 90%. Ngay cả những bức ảnh đám mây điểm 3D khó hơn, những hình ảnh được tạo thành từ các điểm dày đặc, cần phóng to vô số lần mới thấy rõ đường viền, người gán nhãn cũng phải kéo một khung lập thể chứa chiều dài, chiều rộng, chiều cao và góc lệch trong không gian ba chiều, để bao bọc kín xe cộ hoặc người đi bộ, và một khung 3D phức tạp như vậy cũng chỉ có 5 phân.
Hậu quả trực tiếp của việc giá đơn vị giảm mạnh là cường độ lao động tăng mạnh. Để giữ chặt mức lương cơ bản hai ba nghìn tệ mỗi tháng, những người gán nhãn phải liên tục, không ngừng nâng cao tốc độ tay của mình.
Đây không phải là công việc nhẹ nhàng của dân văn phòng. Ở nhiều căn cứ gán nhãn, quản lý khắc nghiệt đến nghẹt thở, không được nghe điện thoại khi làm việc, điện thoại phải khóa trong ngăn tủ. Hệ thống sẽ ghi chính xác đường di chuột và thời gian dừng của mỗi nhân viên, nếu dừng quá ba phút, cảnh báo từ hậu trường sẽ quất tới như roi.
Điều khiến người ta sụp đổ hơn là tỷ lệ dung sai. Đường đạt chuẩn của ngành thường trên 95%, có công ty thậm chí yêu cầu 98%-99%. Điều này có nghĩa là, bạn kéo 100 khung, chỉ cần 2 cái sai, toàn bộ bức ảnh sẽ bị trả về sửa lại.
Ảnh động là các khung hình liên tiếp, xe chuyển làn bị che khuất, người gán nhãn phải dựa vào liên tưởng để tìm ra từng cái; trong ảnh đám mây điểm 3D, vật thể nào vượt quá 10 điểm đều phải vẽ khung. Một dự án chỗ đỗ xe phức tạp, đường kẻ dài, bỏ sót nhãn, khi kiểm tra chất lượng luôn tìm ra lỗi. Một bức ảnh sửa lại bốn năm lần là chuyện thường. Tính ra cuối cùng, bỏ ra một giờ đồng hồ, kiếm được chỉ vài hào.
Một người gán nhãn ở Hồ Nam đã đăng hóa đơn thanh toán của mình lên mạng xã hội, sau một ngày làm việc, cô ấy kéo hơn 700 khung, đơn giá 4 phân, tổng thu nhập 30,2 tệ.
Đây là một cảnh tượng cực kỳ chia cắt.
Một bên là các ông lớn công nghệ hào nhoáng trong họp báo, nói về việc AGI sẽ giải phóng con người như thế nào; bên kia, là ở các huyện thị trên cao nguyên Hoàng Thổ và núi lớn Tây Nam, những người trẻ tuổi mỗi ngày nhìn chằm chằm vào màn hình tám đến mười tiếng, máy móc kéo khung, hàng nghìn, hàng vạn cái, thậm chí ban đêm mơ, ngón tay vẫn vẽ đường làn giữa không trung.
Có người từng nói, vẻ ngoài của trí tuệ nhân tạo là một chiếc xe sang phóng qua, nhưng mở cửa xe ra bạn sẽ thấy, bên trong có một trăm người đang đạp xe đạp, cắn răng đạp hết sức.
Không ai thấy có vấn đề gì.
Thợ tính lương dạy máy móc "cách yêu thương"
Khi nút thắt nhận dạng hình ảnh bị phá vỡ, mô hình lớn đón nhận sự tiến hóa sâu hơn, nó cần học cách suy nghĩ, trò chuyện như con người, thậm chí thể hiện "sự đồng cảm".
Điều này đã thúc đẩy khâu cốt lõi và đắt đỏ nhất trong huấn luyện mô hình lớn - RLHF (Học tăng cường dựa trên phản hồi của con người).
Nói đơn giản, là để người thật chấm điểm câu trả lời do AI tạo ra, nói với nó câu trả lời nào tốt hơn, phù hợp hơn với giá trị và sở thích tình cảm của con người.
ChatGPT trông "giống người" là vì đằng sau có vô số người gán nhãn RLHF đang dạy nó.
Trên các nền tảng crowdsourcing, nhiệm vụ gán nhãn loại này thường được định giá rõ ràng: phí đơn件 từ 3 đến 7 tệ. Người gán nhãn cần chấm điểm cảm xúc cực kỳ chủ quan cho câu trả lời của AI, để đánh giá câu trả lời đó có "ấm áp" không, có "đồng cảm" không, có "chăm sóc cảm xúc người dùng" không.
Một người lao động đáy với mức lương hai ba nghìn mỗi tháng, mệt mỏi chạy theo vũng bùn hiện thực, thậm chí không có thời gian chăm sóc cảm xúc của chính mình, lại phải đóng vai trò là người hướng dẫn tình cảm và trọng tài giá trị cho AI trong hệ thống.
Họ cần phải nghiền nát những cảm xúc phức tạp, tinh tế của con người như sự ấm áp, đồng cảm, ép thành những điểm số lạnh lùng từ 1 đến 5. Nếu điểm số của họ không khớp với đáp án tiêu chuẩn do hệ thống đặt ra, họ sẽ bị đánh giá là không đạt tỷ lệ chính xác, từ đó khấu trừ tiền lương tính lương vốn đã ít ỏi.
Đây là một sự rút rỗng nhận thức. Những tình cảm, đạo đức và lòng trắc ẩn phức tạp, sâu kín của con người, đang bị kéo mạnh vào phễu của thuật toán. Trong thang đo định lượng và tiêu chuẩn hóa lạnh lùng, chúng bị vắt kiệt chút hơi ấm cuối cùng. Khi bạn kinh ngạc trước con quái vật cyber trong màn hình đã học được cách làm thơ soạn nhạc, hỏi han ấm áp, thậm chí khoác lên lớp da đa sầu đa cảm; thì bên ngoài màn hình, đám đông con người vốn sinh động kia, lại trong quá trình phán đoán máy móc ngày qua ngày, thoái hóa thành cỗ máy chấm điểm không có cảm xúc.
Đây là mặt kín đáo nhất của toàn bộ chuỗi công nghiệp, không bao giờ xuất hiện trong bất kỳ tin tức gọi vốn hay sách trắng kỹ thuật nào.
Không ai thấy có vấn đề gì.
Thạc sĩ 985 và thanh niên thị trấn nhỏ
Công việc kéo khung đáy đang bị xích của AI nghiền nát, dây chuyền cyber này bắt đầu lan lên cao, bắt đầu nuốt chửng lao động trí óc cao cấp hơn.
Khẩu vị của mô hình lớn thay đổi. Nó không còn hài lòng với việc nhai nát kiến thức thông thường đơn giản, nó cần nuốt chửng kiến thức chuyên môn và logic cao cấp của con người.
Trên các nền tảng tuyển dụng lớn bắt đầu nhấp nháy thường xuyên một loại công việc bán thời gian đặc biệt, như "Gán nhãn suy luận logic mô hình lớn", "Huấn luyện viên nhân văn AI". Công việc bán thời gian này có ngưỡng cửa cực cao, thường yêu cầu "học vị thạc sĩ trường 985/211 trở lên", liên quan đến các lĩnh vực chuyên môn như luật, y học, triết học, văn học.
Nhiều nghiên cứu sinh trường danh tiếng bị thu hút, ùa vào các nhóm outsourcing của đại công ty. Nhưng họ nhanh chóng phát hiện, đây không phải là bài thể dục trí óc nhẹ nhàng, mà là một sự tra tấn tinh thần.
Trước khi nhận việc chính thức, họ phải đọc tài liệu tiêu chí chấm điểm và đánh giá dài hàng chục trang, thực hiện hai đến ba vòng thử gán nhãn. Sau khi đạt chuẩn, trong quá trình gán nhãn chính thức, nếu tỷ lệ chính xác thấp hơn mức trung bình, sẽ mất tư cách, bị đá khỏi nhóm.
Điều ngạt thở nhất là, những tiêu chuẩn này hoàn toàn không cố định. Đối với câu hỏi và câu trả lời tương tự, dùng cách suy nghĩ giống nhau để chấm điểm, kết quả có thể hoàn toàn trái ngược. Giống như làm một bài thi không bao giờ làm xong, và hoàn toàn không có đáp án chuẩn. Không thể thông qua nỗ lực tự thân hoặc học tập để nâng cao tỷ lệ chính xác, chỉ có thể xoay vòng tại chỗ, tiêu hao trí lực và thể lực.
Đây là sự bóc lột kiểu mới thời đại mô hình lớn - gấp khúc tầng lớp.
Tri thức, cái thang vàng từng được coi là phá vỡ rào cản, leo lên cao, giờ đây trở thành cỏ khô sống phức tạp hơn để nhai cho thuật toán. Trước quyền lực tuyệt đối của thuật toán và hệ thống, thạc sĩ 985 trong tháp ngà và thanh niên thị trấn nhỏ trên cao nguyên Hoàng Thổ đón nhận sự trùng hợp kỳ lạ nhất.
Họ cùng rơi vào mỏ cyber không đáy này, bị tước bỏ hào quang, xóa nhòa khác biệt, tất cả biến thành bánh răng rẻ mạt và có thể thay thế bất cứ lúc nào trên xích.
Ở nước ngoài cũng vậy. Năm 2024, Apple trực tiếp cắt bỏ một đội gán nhãn giọng nói AI 121 người ở San Diego. Những nhân viên này chịu trách nhiệm cải thiện khả năng xử lý đa ngôn ngữ của Siri, họ từng nghĩ mình đứng ở rìa nghiệp vụ cốt lõi của đại công ty, nhưng ngay lập tức rơi vào vực thất nghiệp.
Trong mắt các gã khổng lồ công nghệ, dù là dân kéo khung ở huyện thị, hay huấn luyện viên logic tốt nghiệp trường danh tiếng, về bản chất đều là "vật tư tiêu hao" có thể thay thế bất cứ lúc nào.
Không ai thấy có vấn đề gì.
Tháp Babel nghìn tỷ, xây đầy mồ hôi vài phân
Theo dữ liệu do Viện Thông tin và Truyền thông Trung Quốc công bố, năm 2023 quy mô thị trường gán nhãn dữ liệu Trung Quốc đạt 6,08 tỷ nhân dân tệ, năm 2025 dự kiến 20~30 tỷ, theo dự báo, đến năm 2030, doanh số thị trường dịch vụ và gán nhãn dữ liệu toàn cầu sẽ tăng vọt lên 117,1 tỷ nhân dân tệ.
Đằng sau những con số này, là cơn cuồng hoan định giá hàng nghìn tỷ, hàng nghìn tỷ USD của các gã khổng lồ công nghệ như OpenAI, Microsoft, ByteDance.
Nhưng của cải đổ xuống như trời giáng này, không chảy về những người thực sự "nuôi" AI.
Ngành gán nhãn dữ liệu Trung Quốc, thể hiện cấu trúc outsourcing hình tháp ngược điển hình. Tầng trên cùng, là các gã khổng lồ công nghệ nắm chặt thuật toán cốt lõi; tầng thứ hai, là nhà cung cấp dịch vụ dữ liệu lớn; tầng thứ ba, là các căn cứ gán nhãn dữ liệu và công ty outsourcing vừa và nhỏ khắp nơi; tầng dưới cùng, mới là những người gán nhãn tính lương theo sản phẩm.
Mỗi tầng outsourcing, đều gạt một lớp dầu mỡ. Khi đơn giá do đại công ty đưa ra là 5 hào, sau nhiều tầng bóc lột, rơi vào tay người gán nhãn huyện thị, có thể không đến 5 phân.
Bộ trưởng Tài chính cũ Hy Lạp Yanis Varoufakis trong tác phẩm "Chủ nghĩa phong kiến công nghệ" của mình, đưa ra một quan điểm xuyên thấu: Các gã khổng lồ công nghệ ngày nay, không còn là nhà tư bản theo nghĩa truyền thống, mà là "Lãnh chúa mây" (Cloudalists).
Họ sở hữu không phải nhà máy và máy móc, mà là thuật toán, nền tảng, sức tính toán, đây là lãnh thổ số thời cyber. Trong hệ thống phong kiến mới này, người dùng không phải là người tiêu dùng, mà là tá điền số, mỗi lần chúng ta like, bình luận, xem trên mạng xã hội, đều đang cống nạp dữ liệu miễn phí cho lãnh chúa mây.
Còn những người gán nhãn dữ liệu phân bố ở thị trường chìm, là nông nô số dưới đáy nhất trong hệ thống này. Họ không chỉ sản xuất dữ liệu, mà còn phải làm sạch, phân loại, chấm điểm dữ liệu thô khổng lồ, chuyển hóa thành thức ăn chất lượng cao mà mô hình lớn có thể tiêu hóa.
Đây là một cuộc vây chiếm nhận thức kín đáo. Giống như cuộc vây đất ở Anh thế kỷ 19 đuổi nông dân vào nhà máy dệt, làn sóng AI ngày nay, đuổi những thanh niên không tìm được vị trí trong nền kinh tế thực, đến trước màn hình.
AI không xóa nhòa hố ngăn cách tầng lớp, ngược lại thiết lập một "băng chuyền dữ liệu và mồ hôi" từ các huyện thị trung tây Trung Quốc, thông thẳng đến trụ sở chính của các gã khổng lồ công nghệ Bắc Thượng Quảng Thâm. Tường thuật cách mạng công nghệ luôn hoành tráng lộng lẫy, nhưng màu nền của nó, luôn là sự tiêu hao quy mô lớn của lực lượng lao động giá rẻ.
Không ai thấy có vấn đề gì.
Ngày mai không còn cần con người
Kết cục tàn khốc nhất sắp đến, ngày càng nhanh.
Khi năng lực mô hình lớn nhảy vọt, những nhiệm vụ gán nhãn từng cần con người làm việc ngày đêm mới hoàn thành, đang được chính AI tiếp quản.
Tháng 4 năm 2023, người sáng lập Lixiang Auto Lý Tưởng tiết lộ trên diễn đàn, trước đây mỗi năm Lixiang phải làm khoảng 10 triệu khung hình ảnh lái tự động gán nhãn thủ công, chi phí outsourcing gần một tỷ. Nhưng khi họ sử dụng mô hình lớn để gán nhãn tự động, việc từng cần một năm để làm, về cơ bản 3 tiếng có thể hoàn thành.
Hiệu suất gấp 1000 lần người, và đó là từ năm 2023. Tháng 3 vừa qua, Lixiang còn phát hành động cơ gán nhãn tự động MindVLA-o1 thế hệ mới.
Trong ngành lưu truyền một câu tự chế vô cùng chân thực: "Bao nhiêu trí tuệ, bấy nhiêu nhân công." Nhưng giờ đây, đầu tư của đại công ty vào outsourcing gán nhãn dữ liệu, đã xuất hiện sự sụt giảm vực thẳm 40%-50%.
Những thanh niên thị trấn đã ngồi cạnh máy tính vô số ngày đêm, mắt đỏ ngầu vì mệt mỏi, đã tự tay nuôi lớn một con thú khổng lồ. Và giờ đây, con thú khổng lồ này đang quay đầu lại, đập vỡ bát cơm của họ.
Đêm xuống, tòa nhà văn phòng khu Bình Thành, Đại Đồng vẫn trắng xóa như ban ngày. Những người trẻ giao ca im lặng trao đổi thân thể mệt mỏi trong thang máy. Trong không gian gấp khúc bị giam cầm bởi vô số khung đa giác này, không ai quan tâm kiến trúc Transformer bên kia đại dương lại đón nhận bước nhảy vọt sử thi như thế nào, cũng không ai nghe được tiếng gầm của sức tính toán đằng sau tham số nghìn tỷ.
Tầm nhìn của họ, chỉ bị hàn chặt vào thanh tiến trình xanh đỏ đại diện cho "đường đạt chuẩn" trong hậu trường, tính toán xem mấy phân, mấy hào tính lương có thể ghép thành cuộc sống thể diện vào cuối tháng.
Một bên, là tiếng chuông Nasdaq và bài viết dài trên truyền thông công nghệ, các gã khổng lồ đang nâng cốc chúc mừng sự giáng lâm của AGI; còn bên kia, những nông nô số bằng xương bằng thịt đã từng miệng nuôi lớn AI, chỉ có thể trong giấc ngủ đau nhức, run rẩy chờ đợi con thú khổng lồ do chính tay mình nuôi, vào một buổi sáng tưởng như bình thường, bất cẩn đá văng bát cơm của họ.
Không ai thấy có vấn đề gì.








