"ChatGPT khiến bạn trở nên ngu ngốc", "Trí tuệ nhân tạo gây hại cho não bộ", "Nghiên cứu của MIT: Trí tuệ nhân tạo gây suy giảm nhận thức". Trong những tháng gần đây, những tiêu đề gây hoang mang như vậy đã tràn ngập các phương tiện truyền thông chính thống, làm dấy lên những nỗi sợ hãi vô căn cứ về việc sử dụng trí tuệ nhân tạo trong giáo dục và nơi làm việc. Nhưng khoa học thực sự nói gì? Một phân tích kỹ lưỡng các tài liệu nghiên cứu cho thấy một thực tế phức tạp hơn nhiều và trên hết, lạc quan hơn.
Nghiên cứu "Your Brain on ChatGPT" của MIT Media Lab đã gây ra làn sóng đưa tin gây hoang mang trên truyền thông, thường dựa trên những cách hiểu sai lệch về kết quả. Được công bố dưới dạng bản thảo (và do đó chưa được bình duyệt ), nghiên cứu chỉ có 54 người tham gia từ khu vực Boston, trong đó chỉ có 18 người hoàn thành phiên quan trọng .
Kích thước mẫu không đủ : Với tổng cộng 54 người tham gia, nghiên cứu thiếu sức mạnh thống kê cần thiết để đưa ra kết luận có thể khái quát hóa. Như chính các nhà nghiên cứu thừa nhận, "mẫu nhỏ" và "đồng nhất: những người sống gần MIT chắc chắn không phản ánh sự phân bố dân cư trên toàn thế giới."
Thiết kế thí nghiệm có vấn đề : Người tham gia được yêu cầu viết bài luận SAT chỉ trong 20 phút—một ràng buộc nhân tạo tự nhiên dẫn đến việc sao chép-dán hơn là sự tích hợp có tính phản tư. Thiết kế này "mô phỏng tốt các ràng buộc thực tế tự nhiên" như "hạn chót là ngày mai" hoặc "tôi muốn chơi trò chơi điện tử", nhưng nó không thể hiện việc sử dụng AI một cách có hiểu biết về mặt sư phạm.
Làm sai lệch hiệu ứng làm quen : Nhóm "chỉ sử dụng não bộ" cho thấy sự tiến bộ dần dần trong ba phiên đầu tiên đơn giản chỉ bằng cách làm quen hơn với nhiệm vụ. Khi nhóm AI phải viết mà không có sự hỗ trợ trong phiên thứ tư, họ đã thực hiện nhiệm vụ này lần đầu tiên mà không có lợi thế của việc luyện tập.
Trong khi giới truyền thông tập trung vào những phát hiện gây lo ngại của MIT, nhiều nghiên cứu nghiêm túc hơn đã cho ra những kết quả hoàn toàn khác biệt.
Nghiên cứu được thực hiện tại Đại học Khoa học và Công nghệ Kwame Nkrumah đã theo dõi 125 sinh viên đại học trong một thử nghiệm đối chứng ngẫu nhiên kéo dài suốt một học kỳ . Kết quả hoàn toàn trái ngược với phát hiện của MIT:
Tư duy phản biện : Điểm số của sinh viên sử dụng ChatGPT đã cải thiện từ 28,4 lên 39,2 điểm (+38%), vượt trội hơn hẳn so với nhóm đối chứng (từ 24,9 lên 30,6, +23%).
Tư duy sáng tạo : Mức tăng thậm chí còn ấn tượng hơn, từ 57,2 lên 92,0 điểm (+61%) đối với nhóm ChatGPT, với sự cải thiện ở cả sáu khía cạnh được đo lường: lòng can đảm, nghiên cứu đổi mới, sự tò mò, tính tự kỷ luật, sự nghi ngờ và tính linh hoạt.
Tư duy phản biện : Cải thiện đáng kể từ 35,1 lên 56,6 điểm (+61%), cho thấy khả năng tự phản biện và siêu nhận thức tốt hơn.
Những điểm khác biệt quan trọng về phương pháp luận : Nghiên cứu ở Ghana đã sử dụng các thang đo đã được kiểm định (hệ số Cronbach α > 0,89), phân tích nhân tố khẳng định, kiểm soát ANCOVA đối với điểm số trước thử nghiệm, và – điều quan trọng nhất – tích hợp ChatGPT vào bối cảnh giáo dục thực tế với sự hỗ trợ sư phạm phù hợp.
Nghiên cứu nghiêm ngặt nhất hiện có liên quan đến 758 chuyên gia tư vấn của Boston Consulting Group trong một thí nghiệm có kiểm soát và được đăng ký trước . Kết quả rất rõ ràng:
Như Ethan Mollick, đồng tác giả của nghiên cứu, đã chỉ ra: "Các chuyên gia tư vấn sử dụng ChatGPT đạt hiệu quả vượt trội hơn hẳn so với những người không sử dụng. Trên mọi phương diện. Theo mọi cách chúng tôi đo lường hiệu quả."
Một đánh giá có hệ thống về nghiên cứu trí tuệ nhân tạo trong giáo dục đại học đã xác định được những lợi ích đáng kể:
Một nghiên cứu đa quốc gia với 401 sinh viên đại học Trung Quốc sử dụng mô hình phương trình cấu trúc đã khẳng định rằng "cả trí tuệ nhân tạo và mạng xã hội đều có tác động tích cực đến kết quả học tập và sức khỏe tinh thần."
Việc truyền thông đưa tin về nghiên cứu của MIT là một ví dụ điển hình về cách mà sự giật gân có thể làm sai lệch sự hiểu biết của công chúng về khoa học.
Tiêu đề điển hình : "Nghiên cứu của MIT cho thấy ChatGPT khiến bạn trở nên ngu ngốc"
Thực tế : Một nghiên cứu sơ bộ, chưa được bình duyệt với 54 người tham gia, đã phát hiện ra sự khác biệt về kết nối thần kinh trong các nhiệm vụ nhân tạo.
Tiêu đề thường thấy : "Trí tuệ nhân tạo đang gây hại cho não bộ"
Thực tế : Điện não đồ (EEG) cho thấy các mô hình hoạt động khác nhau, có thể được hiểu là hiệu quả hoạt động thần kinh chứ không phải là tổn thương.
Tiêu đề thường thấy : "ChatGPT gây suy giảm nhận thức"
Thực tế : Một nghiên cứu có những hạn chế nghiêm trọng về phương pháp luận, trái ngược với các nghiên cứu chặt chẽ hơn.
Trưởng nhóm nghiên cứu của MIT, Nataliya Kosmyna, thừa nhận đã cài cắm "bẫy" vào bài báo để ngăn chặn các phần mềm tóm tắt ngôn ngữ (LLM) tóm tắt chính xác nội dung. Trớ trêu thay, nhiều người dùng mạng xã hội sau đó đã sử dụng LLM để tóm tắt và chia sẻ nghiên cứu, vô tình chứng minh tính hữu ích thực tiễn của các công cụ này.
Các nghiên cứu nghiêm túc về trí tuệ nhân tạo trong giáo dục không phủ nhận sự tồn tại của những thách thức, nhưng chúng được trình bày một cách tinh tế hơn. Khái niệm "ranh giới công nghệ có khía cạnh" trong nghiên cứu của Harvard minh họa rằng trí tuệ nhân tạo vượt trội trong một số nhiệm vụ trong khi lại gặp khó khăn trong những nhiệm vụ khác, dù thoạt nhìn có vẻ tương tự nhau.
Thời điểm giới thiệu : Bằng chứng cho thấy việc phát triển các kỹ năng cơ bản trước khi giới thiệu AI có thể tối đa hóa lợi ích. Như chính nghiên cứu của MIT đã chỉ ra, những người tham gia "thể hiện khả năng nhớ lại thông tin từ não bộ đến trí nhớ LLM vượt trội và kích hoạt các vùng chẩm-đỉnh và tiền trán."
Thiết kế sư phạm : Nghiên cứu tại Ghana chứng minh tầm quan trọng của việc tích hợp trí tuệ nhân tạo (AI) với cấu trúc hỗ trợ giảng dạy phù hợp, các gợi ý được thiết kế tốt và mục tiêu học tập rõ ràng.
Bối cảnh quan trọng : Việc sử dụng trí tuệ nhân tạo trong môi trường giáo dục thực tế, thay vì các nhiệm vụ nhân tạo, sẽ mang lại kết quả khác biệt đáng kể.

Việc đưa tin thiên vị của giới truyền thông không chỉ là vấn đề học thuật mà còn có những hậu quả thực tế đối với việc ứng dụng các công nghệ tiềm năng mang lại lợi ích.
Như chính Kosmyna thừa nhận: "Điều thúc đẩy tôi xuất bản nó ngay bây giờ trước khi chờ đợi đánh giá đầy đủ từ các chuyên gia là vì tôi sợ rằng trong 6-8 tháng nữa, một nhà hoạch định chính sách nào đó sẽ quyết định 'hãy thành lập một trường mẫu giáo GPT'. Tôi nghĩ điều đó sẽ hoàn toàn tiêu cực và có hại."
Tuyên bố này cho thấy động cơ vận động chính trị, điều đáng báo động về tính trung lập khoa học của nghiên cứu.
Một cuộc khảo sát 28.698 kỹ sư phần mềm cho thấy chỉ có 41% đã thử các công cụ AI, tỷ lệ áp dụng thậm chí còn thấp hơn ở phụ nữ (31%) và các kỹ sư trên 40 tuổi (39%). Những tiêu đề giật gân góp phần tạo nên những định kiến này, có khả năng tước đoạt của nhiều người lao động những lợi ích đã được chứng minh của AI.
Các công ty AI cần cân bằng giữa sự nhiệt tình đối với công nghệ và việc truyền đạt trung thực về những hạn chế của nó. Kết quả của các nghiên cứu nghiêm túc cho thấy những lợi ích thực sự khi AI được triển khai một cách thận trọng, nhưng cũng chỉ ra sự cần thiết phải:
Thay vì phản ứng một cách phòng thủ trước những tiêu đề tiêu cực, ngành công nghiệp AI nên:
Lịch sử của nghiên cứu tại MIT và sự đưa tin của giới truyền thông về nó mang đến những bài học quan trọng cho tất cả các bên liên quan trong hệ sinh thái trí tuệ nhân tạo.
Áp lực phải công bố các kết quả "đáng chú ý" không được làm ảnh hưởng đến tính nghiêm ngặt về phương pháp luận. Các bản thảo sơ bộ có thể hữu ích cho các cuộc tranh luận khoa học, nhưng cần phải truyền đạt cẩn thận những hạn chế của chúng.
Công chúng xứng đáng được đưa tin chính xác, phân biệt rõ giữa:
Tương lai của trí tuệ nhân tạo trong giáo dục phụ thuộc vào việc triển khai một cách thận trọng dựa trên bằng chứng vững chắc, chứ không phải phản ứng trước những tin tức giật gân mới nhất.
Trong khi cuộc tranh luận vẫn đang diễn ra sôi nổi trên các mặt báo, những nghiên cứu nghiêm túc đang hé lộ tiềm năng thực sự của trí tuệ nhân tạo (AI) trong việc dân chủ hóa quyền tiếp cận các trải nghiệm học tập chất lượng cao. Nghiên cứu tại Ghana cho thấy rằng khi được triển khai đúng cách, AI có thể:
Câu hỏi không phải là liệu trí tuệ nhân tạo có làm thay đổi giáo dục hay không, mà là làm thế nào chúng ta có thể dẫn dắt sự thay đổi này một cách có trách nhiệm. Câu trả lời nằm ở khoa học chính xác, chứ không phải những tiêu đề giật gân.
Nguồn và tài liệu tham khảo:
Để cập nhật những nghiên cứu khoa học nghiêm túc về trí tuệ nhân tạo (mà không mang tính giật gân), hãy theo dõi blog của công ty chúng tôi và đăng ký nhận bản tin. newsletter .