Tôi nằm trong top 2% người dùng trên StackOverflow

Tôi nằm trong top 2% người dùng trên StackOverflow. Nội dung của tôi đã được hơn 1,7 triệu người xem. Và có vẻ như tôi sẽ không bao giờ viết bất cứ điều gì ở đó nữa.

@peternixey – Mar 26, 2023

Điều này có thể là một vấn đề lớn hơn nhiều so với vẻ bề ngoài. Bởi vì nó có thể là dấu hiệu cảnh báo cho kho tàng kiến thức chung của chúng ta.

Một dấu hiệu báo hiệu sự thay đổi trong luồng kiến thức: từ con người với con người thông qua máy móc, sang chỉ còn con người và máy. Không cần giao tiếp với con người, không cần thu thập 200 điểm ảo trên internet trên đường đi.

StackOverflow là kho lưu trữ câu hỏi và trả lời về lập trình. Nó có 100 triệu người dùng và tiết kiệm hàng năm trời thời gian và hàng đóng tóc bạc mỗi ngày (lời người dịch: ý là suy nghĩ nhiều đến bạc cả tóc)

Nó được thúc đẩy bởi những người như tôi, những người đặt câu hỏi mà các nhà phát triển khác trả lời. Hoặc ngược lại. Hơn 10 năm qua, tôi đã hỏi 217 câu hỏi và trả lời 77 câu. Những câu hỏi đó đã được hàng triệu nhà phát triển đọc và có hàng chục triệu lượt xem.

Nhưng kể từ khi có GPT4, có vẻ như điều đó sẽ ngày càng ít xảy ra; ít nhất là đối với tôi. Điều này sẽ không tốt cho StackOverflow. Nhưng nếu tôi là đại diện cho những người làm việc tri thức khác, thì nó đặt ra một vấn đề lớn hơn và đáng báo động hơn cho chúng ta với tư cách là con người.

Điều gì sẽ xảy ra khi chúng ta ngừng chia sẻ kiến thức của mình với nhau và thay vào đó hỏi thẳng máy móc? Thư viện của chúng ta sẽ ở đâu? Làm thế nào chúng ta có thể tránh được sự phụ thuộc hoàn toàn vào máy móc? Chúng ta thậm chí còn cung cấp nội dung gì cho phiên bản tiếp theo của máy móc để huấn luyện?

Khi đến lúc huấn luyện GPTx, nó có nguy cơ uống nước từ lòng sông cạn khô (lời người dịch: ý là không còn câu hỏi và câu trả lời nào trên StackOverflow nữa, tương tự như sông cạn nước). Bởi vì các lập trình viên sẽ không hỏi nhiều câu hỏi trên StackOverflow nữa. GPT4 sẽ trả lời họ một cách riêng tư. Vì vậy, trong khi GPT4 được đào tạo dựa trên tất cả các câu hỏi được hỏi trước năm 2021 thì GPT6 sẽ đào tạo dựa trên cái gì?

Điều này đặt ra một câu hỏi sâu sắc hơn. Nếu mô hình này lặp lại ở những nơi khác và hướng kiến thức chung của chúng ta thay đổi từ hướng ra bên ngoài nhân loại sang hướng vào bên trong cỗ máy, thì chúng ta sẽ phụ thuộc vào nó theo cách vượt qua tất cả các phụ thuộc vào máy móc trước đây của chúng ta.

Cho dù nó có “muốn” tiếp quản hay không, thì sự thay đổi về bản chất nơi thông tin được chuyển đến sẽ đồng nghĩa với việc nó tiếp quản theo mặc định.

Giống như một biến thể Covid phát triển nhanh, AI sẽ trở thành nguồn kiến thức thống trị chỉ đơn giản nhờ vào sự phát triển. Nếu chúng ta lấy ví dụ về StackOverflow, kho tàng kiến thức của con người từng thuộc về chúng ta – có thể bị giảm xuống chỉ còn là một trọng số nhỏ bên trong bộ biến đổi.

Hoặc, có lẽ thậm chí còn đáng báo động hơn, nếu chúng ta tin rằng GPT hiện tại không học hỏi từ đầu vào của nó (lời người dịch: đầu vào có ý là dữ liệu đầu vào để training cho các model như GPT4), thì nó có thể bị mất hoàn toàn. Bởi vì nếu nó không nhờ những gì chúng ta nói và chúng ta không chia sẻ nó thì kiến thức đó sẽ đi về đâu?

Chúng ta đã có một sự phụ thuộc không thể đảo ngược vào máy móc để lưu trữ kiến thức của mình. Nhưng ít nhất chúng ta kiểm soát được nó. Chúng ta có thể trích xuất nó, sao chép nó, đi và lưu trữ nó trong một hầm chứa ở Bắc Cực (như Github đã làm).

Vậy điều gì sẽ xảy ra tiếp theo? Tôi không biết, tôi chỉ có những câu hỏi.

Không có câu hỏi nào trong số đó bạn sẽ tìm thấy trên StackOverflow.

Bài gốc: https://x.com/peternixey/status/1640002493630369792