Không ai thực sự dạy bạn cách làm nghiên cứu. Bạn có được một chiếc bàn làm việc, một vấn đề do người khác chọn, và một chỉ dẫn mơ hồ là 'tạo ra cái gì đó mới'.
Vì vậy, hầu hết mọi người đều phân tích ngược lại công việc này thông qua những gì họ có thể nhìn thấy (như các bài báo, bài đăng và thông báo), và cuối cùng họ chỉ học được cách 'trông giống' một nhà nghiên cứu, chứ không phải cách 'trở thành' một nhà nghiên cứu. Khả năng nghiên cứu thực sự là sự chồng chất của một loạt các kỹ năng nhỏ, và hầu như mọi kỹ năng đều có thể được rèn luyện thông qua luyện tập chủ động.
Chọn Vấn Đề Của Riêng Bạn
Richard Hamming ở Phòng thí nghiệm Bell có một thói quen khiến ông không được ưa vào giờ ăn trưa. Ông sẽ hỏi người ngồi bên cạnh về những vấn đề quan trọng trong lĩnh vực của họ, sau đó hỏi tại sao họ không nghiên cứu những vấn đề đó. Và thế là mọi người lần lượt đổi bàn.
Câu hỏi này khá chói tai, bởi vì hầu hết chúng ta không thể đưa ra câu trả lời tốt. Chúng ta không chọn vấn đề, mà đang hấp thụ vấn đề — hấp thụ từ người hướng dẫn, từ thông báo của một phòng thí nghiệm lớn quý trước, từ bài báo mà mọi người đang chia sẻ và trích dẫn trong tuần này.
Cái khó của vấn đề được hấp thụ là bạn chỉ nắm giữ kết luận, mà không biết logic lý luận đằng sau nó. Bạn biết một phòng thí nghiệm nổi tiếng quan tâm đến một hướng nào đó, nhưng bạn không biết tại sao, không biết họ hy vọng sẽ phát hiện ra điều gì, cũng như không biết tình huống nào sẽ khiến họ từ bỏ hướng này.
Khi họ chuyển hướng, bạn sẽ mất một năm sau mới nhận ra. Và trong một vấn đề đã trở nên phổ biến, bạn đang chạy đua với 1.000 người bắt đầu trước bạn và có nhiều năng lực tính toán hơn bạn.
Hướng dẫn nghiên cứu học máy của John Schulman chia công việc này thành hai chế độ. Thứ nhất, bạn đọc tài liệu và tìm kiếm những điểm có thể cải thiện. Thứ hai, bạn chọn một kết quả mà bạn thực sự mong muốn đạt được, sau đó suy ngược lại để thiết kế thí nghiệm.
Ông ủng hộ cách thứ hai, lý do ngầm hiểu là vì nó tạo ra tính độc đáo. Một mục tiêu mà bạn thực sự quan tâm sẽ kéo bạn vào những lãnh địa mà không bài báo tổng quan nào từng đề cập đến.
Còn về 'khiếu thẩm mỹ' (taste), người ta thường bàn về nó như một tài năng thiên bẩm. Nhưng nó thể hiện giống như một cơ bắp hơn.
Trước khi chạy mỗi thí nghiệm, hãy dự đoán kết quả của nó; che phần kết quả của một bài báo, chỉ dựa vào phương pháp của nó để đoán dữ liệu; ghi lại những thành tựu nào được công bố trong tháng này mà hai năm sau vẫn còn quan trọng, rồi quay lại sau đó để kiểm tra tỷ lệ chính xác của bạn. Một lần dự đoán cộng với một lần sửa chữa, lặp lại hàng trăm lần — mỗi mô hình tốt đều được huấn luyện như vậy, kể cả cái trong đầu bạn.
Nâng Cấp Đầu Vào Của Bạn
Danh sách đọc chung tạo ra ý tưởng chung. Nếu chế độ thông tin của bạn chỉ là bảng xếp hạng phổ biến của arXiv cộng với những thứ còn sót lại sau khi được nhóm chat lọc, bạn chắc chắn sẽ đồng thời đi đến cùng một kết luận với mọi người, và điều này khiến những kết luận đó gần như vô giá trị.
Tài liệu cũ bị đánh giá thấp một cách nghiêm trọng. Lĩnh vực này luôn tái diễn quá khứ của chính nó với một độ trễ: mô hình hỗn hợp chuyên gia (MoE) có thể truy nguyên về năm 1991, LSTM về năm 1997, lan truyền ngược đã trở thành xu hướng chính vào năm 1986.
Richard Sutton năm 2019 chỉ dùng hơn một nghìn từ để viết 'Bài Học Cay Đắng' (The Bitter Lesson), nhưng nó đã dự đoán quỹ đạo phát triển của lĩnh vực này chính xác hơn cả những bài tổng quan dài gấp mười lần nó. Claude Shannon đã có một bài nói chuyện về tư duy sáng tạo vào năm 1952, chiêu đầu tiên của ông là thu nhỏ vấn đề xuống mức gần như không đáng kể, giải quyết phiên bản thu nhỏ này, sau đó từ từ tăng độ khó trở lại.
Chỉ riêng chiêu này, đã có thể giúp bạn phá vỡ nhiều bức tường hơn bất kỳ lời khuyên về năng suất hiện đại nào.
Bề rộng cũng quan trọng như chiều sâu. Nghiên cứu khả năng giải thích đã vay mượn từ khoa học thần kinh mà không hề che giấu; thiết kế đánh giá (Eval) chỉ là thiết kế cơ chế khoác áo trắng; chỉ cần có kiến thức thực tế về cách GPU thực sự di chuyển bộ nhớ, bạn có thể phán đoán những bài báo về kiến trúc nào sẽ thất bại ngay cả trước khi kết quả benchmark được công bố; và thống kê học trung thực có lẽ đã là kỹ năng khan hiếm nhất trong lĩnh vực học máy, nơi mà nhiều 'sự chặt chẽ' được công bố công khai chỉ là 'cảm giác' có kèm theo thanh sai số.
Còn một điều nữa. Hãy đọc chính bài báo, chứ không phải những bài đăng tóm tắt nó. Phần phụ lục mới là nơi chôn giấu bí mật, và phần 'Hạn chế' thường là đoạn trung thực nhất trong toàn bộ tài liệu.
Viết Mọi Thứ Ra
Paul Graham chỉ ra rằng, một ý tưởng luôn cảm thấy đã rất hoàn thiện trước khi bạn cố gắng biến nó thành chữ viết. Nhưng chữ viết đen trên giấy trắng sẽ phơi bày những lỗ hổng mà bộ não bạn đã tô vẽ: những giả định bạn chưa từng kiểm tra, các bước thực ra không liền mạch, hai luận điểm mâu thuẫn ngầm với nhau.
Nguyên tắc của Feynman là, người đầu tiên bạn phải tránh lừa dối chính là bản thân mình, vì bạn là mục tiêu dễ bị lừa nhất. Viết lách là cơ chế phòng thủ rẻ nhất từng được phát minh.
Darwin đi xa hơn, ông đã lập trình hóa nó: bất kỳ sự thật nào mâu thuẫn với lý thuyết của ông đều sẽ được viết ra ngay lập tức, bởi vì ông phát hiện ra trí nhớ của mình xóa bằng chứng bất lợi nhanh hơn nhiều so với việc xóa bằng chứng có lợi. Trí nhớ của bạn với hồ sơ các lần chạy thất bại cũng vậy.
Duy trì thói quen ghi nhật ký: giả định, cài đặt, dự đoán, kết quả, nhận thức đã cập nhật. Đọc lại ghi chép của tháng trước sẽ khiến bạn cảm thấy cực kỳ khiêm tốn, không nhà phản biện nào có thể mang lại hiệu ứng này.







