Newsletter

Tại sao Toán học lại khó (Ngay cả khi bạn là AI)

Các mô hình ngôn ngữ không thể nhân—chúng ghi nhớ kết quả giống như chúng ta ghi nhớ số pi, nhưng điều đó không làm cho chúng có năng lực toán học. Vấn đề nằm ở cấu trúc: chúng học thông qua sự tương đồng về mặt thống kê, chứ không phải sự hiểu biết về thuật toán. Ngay cả những "mô hình suy luận" mới như o1 cũng thất bại trong các nhiệm vụ tầm thường: nó đếm đúng chữ 'r' trong "strawberry" sau vài giây xử lý, nhưng lại thất bại khi phải viết một đoạn văn mà chữ cái thứ hai của mỗi câu lại viết thành một từ. Phiên bản cao cấp 200 đô la một tháng mất bốn phút để giải quyết những gì một đứa trẻ có thể làm ngay lập tức. DeepSeek và Mistral vẫn đếm sai chữ cái vào năm 2025. Giải pháp mới nổi? Một phương pháp tiếp cận kết hợp—các mô hình thông minh nhất đã tìm ra thời điểm cần gọi một máy tính thực sự thay vì tự mình thực hiện phép tính. Chuyển đổi mô hình: AI không cần phải biết cách làm mọi thứ, nhưng phải sắp xếp các công cụ phù hợp. Nghịch lý cuối cùng: GPT-4 có thể giải thích lý thuyết giới hạn một cách xuất sắc, nhưng lại thất bại trong các bài toán nhân mà máy tính bỏ túi luôn giải đúng. Chúng rất tuyệt vời cho việc học toán - chúng giải thích với sự kiên nhẫn vô hạn, đưa ra ví dụ và phân tích lập luận phức tạp. Để tính toán chính xác? Hãy tin vào máy tính, chứ không phải trí tuệ nhân tạo.

Nhiều người cũng dựa vào LLM để thực hiện các phép toán. Cách tiếp cận này không hiệu quả.

Vấn đề thực ra rất đơn giản: các mô hình ngôn ngữ lớn (LLM) không thực sự biết cách nhân. Đôi khi chúng có thể cho kết quả đúng, giống như tôi có thể thuộc lòng giá trị của số pi. Nhưng điều đó không có nghĩa là tôi là một nhà toán học, hay các LLM thực sự biết cách làm toán.

Ví dụ thực tế

Ví dụ: 49858 *5994949 = 298896167242 Kết quả này luôn giống nhau; không có điểm trung gian. Kết quả chỉ có đúng hoặc sai.

Ngay cả khi được đào tạo chuyên sâu về toán học, những mô hình tốt nhất cũng chỉ có thể giải quyết chính xác một phần nhỏ các phép tính. Mặt khác, một chiếc máy tính bỏ túi đơn giản luôn cho kết quả chính xác 100%. Và số càng lớn, hiệu suất của chương trình Thạc sĩ Luật (LLM) càng kém.

Có thể giải quyết được vấn đề này không?

Vấn đề cơ bản là các mô hình này học bằng sự tương đồng chứ không phải bằng sự hiểu biết. Chúng hoạt động tốt nhất với những vấn đề tương tự như những vấn đề chúng được đào tạo, nhưng chúng không bao giờ phát triển được sự hiểu biết thực sự về những gì chúng đang nói.

Đối với những ai muốn tìm hiểu thêm, tôi đề xuất bài viết này về “ cách thức hoạt động của LLM ”.

Ngược lại, máy tính sử dụng thuật toán chính xác được lập trình để thực hiện phép tính.

Đây là lý do tại sao chúng ta không bao giờ nên hoàn toàn dựa vào LLM cho các phép tính toán học: ngay cả trong điều kiện tốt nhất, với lượng dữ liệu đào tạo chuyên biệt khổng lồ, chúng vẫn không đảm bảo độ tin cậy ngay cả trong những phép toán cơ bản nhất. Một phương pháp kết hợp có thể hiệu quả, nhưng chỉ riêng LLM là không đủ. Có lẽ phương pháp này sẽ được sử dụng để giải quyết cái gọi là "bài toán dâu tây ".

Ứng dụng của LLM trong nghiên cứu toán học

Trong bối cảnh giáo dục, LLM có thể đóng vai trò như những người hướng dẫn cá nhân, có khả năng điều chỉnh cách giải thích cho phù hợp với trình độ hiểu biết của sinh viên. Ví dụ, khi sinh viên gặp bài toán vi phân, LLM có thể chia nhỏ lý luận thành các bước đơn giản hơn, cung cấp giải thích chi tiết cho từng bước giải. Phương pháp này giúp xây dựng nền tảng vững chắc về các khái niệm cơ bản.

Một khía cạnh đặc biệt thú vị là khả năng tạo ra các ví dụ liên quan và đa dạng của chương trình Thạc sĩ Luật (LLM). Nếu sinh viên đang cố gắng hiểu khái niệm giới hạn, LLM có thể trình bày các tình huống toán học khác nhau, bắt đầu từ những trường hợp đơn giản đến những tình huống phức tạp hơn, từ đó giúp sinh viên dần dần hiểu được khái niệm này.

Một ứng dụng đầy hứa hẹn là việc sử dụng LLM để chuyển đổi các khái niệm toán học phức tạp sang ngôn ngữ tự nhiên dễ hiểu hơn. Điều này tạo điều kiện thuận lợi cho việc truyền đạt toán học đến nhiều đối tượng hơn và có thể giúp vượt qua rào cản truyền thống để tiếp cận ngành học này.

Thạc sĩ Luật (LLM) cũng có thể hỗ trợ việc biên soạn tài liệu giảng dạy, tạo ra các bài tập với độ khó khác nhau và cung cấp phản hồi chi tiết về các giải pháp do sinh viên đề xuất. Điều này cho phép giáo viên cá nhân hóa tốt hơn quá trình học tập của sinh viên.

Lợi thế thực sự

Nói chung, điều quan trọng là phải cân nhắc đến "sự kiên nhẫn" cực độ cần thiết để giúp ngay cả những học sinh kém nhất học tập: trong trường hợp này, việc không biểu lộ cảm xúc lại có ích. Tuy nhiên, ngay cả AI đôi khi cũng "mất kiên nhẫn". Xem ví dụ "hài hước" này.

Bản cập nhật năm 2025: Mô hình lý luận và phương pháp tiếp cận kết hợp

Giai đoạn 2024-2025 đã chứng kiến ​​những bước phát triển đáng kể với sự ra đời của cái gọi là "mô hình suy luận" như OpenAI o1 và deepseek R1. Các mô hình này đã đạt được kết quả ấn tượng trên các chuẩn toán học: o1 đã giải đúng 83% bài toán Olympic Toán học Quốc tế, so với 13% của GPT-4o. Tuy nhiên, hãy cẩn thận: chúng không giải quyết được vấn đề cơ bản được mô tả ở trên.

Bài toán "dâu tây" - đếm chữ "r" trong "dâu tây" - minh họa hoàn hảo cho hạn chế dai dẳng này. o1 giải đúng bài toán sau vài giây "suy luận", nhưng nếu bạn yêu cầu nó viết một đoạn văn mà chữ cái thứ hai của mỗi câu viết thành từ "CODE", nó sẽ thất bại. o1-pro, phiên bản 200 đô la mỗi tháng, giải được bài toán này... sau 4 phút xử lý. DeepSeek R1 và các mô hình gần đây khác vẫn còn sai số đếm cơ bản. Tính đến tháng 2 năm 2025, Mistral vẫn báo cho bạn biết chỉ có hai chữ "r" trong "dâu tây".

Thủ thuật mới xuất hiện là một phương pháp lai: khi cần nhân 49858 với 5994949, các mô hình tiên tiến nhất không còn cố gắng "đoán" kết quả dựa trên sự tương đồng với các phép tính được thấy trong quá trình huấn luyện. Thay vào đó, chúng gọi một máy tính hoặc chạy mã Python - giống như một con người thông minh biết rõ giới hạn của mình.

Việc "sử dụng công cụ" này đại diện cho một sự thay đổi mô hình: AI không nhất thiết phải có khả năng tự làm mọi thứ, mà phải có khả năng phối hợp các công cụ phù hợp. Các mô hình suy luận kết hợp khả năng ngôn ngữ để hiểu vấn đề, lập luận từng bước để lên kế hoạch giải pháp, và phân quyền cho các công cụ chuyên dụng (máy tính, trình thông dịch Python, cơ sở dữ liệu) để thực hiện chính xác.

Bài học rút ra là gì? Các chương trình Thạc sĩ Luật (LLM) năm 2025 hữu ích hơn trong toán học không phải họ đã "học" được phép nhân - họ vẫn chưa thực sự làm được điều đó - mà bởi vì một số người trong số họ đã bắt đầu hiểu được khi nào nên giao phó phép nhân cho những người thực sự biết cách thực hiện. Vấn đề cơ bản vẫn còn đó: chúng hoạt động dựa trên sự tương đồng về mặt thống kê, chứ không phải dựa trên sự hiểu biết về thuật toán. Một chiếc máy tính bỏ túi năm euro vẫn đáng tin cậy hơn vô cùng cho những phép tính chính xác.

Tài nguyên cho sự phát triển kinh doanh

Ngày 9 tháng 11 năm 2025

Xu hướng AI 2025: 6 giải pháp chiến lược cho việc triển khai AI suôn sẻ

87% công ty thừa nhận AI là một yếu tố cạnh tranh cần thiết, nhưng nhiều công ty lại không tích hợp được nó—vấn đề không nằm ở công nghệ, mà là ở cách tiếp cận. 73% giám đốc điều hành cho rằng tính minh bạch (AI có thể giải thích được) là yếu tố then chốt để nhận được sự đồng thuận của các bên liên quan, trong khi việc triển khai thành công tuân theo chiến lược "bắt đầu nhỏ, nghĩ lớn": các dự án thí điểm có mục tiêu, giá trị cao thay vì chuyển đổi kinh doanh toàn diện. Trường hợp thực tế: Một công ty sản xuất triển khai bảo trì dự đoán AI trên một dây chuyền sản xuất duy nhất, đạt được mức giảm 67% thời gian ngừng hoạt động trong 60 ngày, thúc đẩy việc áp dụng trên toàn doanh nghiệp. Các phương pháp hay nhất đã được kiểm chứng: ưu tiên tích hợp API/phần mềm trung gian hơn là thay thế hoàn toàn để giảm đường cong học tập; dành 30% nguồn lực cho quản lý thay đổi với đào tạo theo vai trò cụ thể giúp tăng 40% tốc độ áp dụng và tăng 65% mức độ hài lòng của người dùng; triển khai song song để xác thực kết quả AI so với các phương pháp hiện có; giảm dần hiệu suất với các hệ thống dự phòng; chu kỳ đánh giá hàng tuần trong 90 ngày đầu tiên, theo dõi hiệu suất kỹ thuật, tác động kinh doanh, tỷ lệ áp dụng và ROI. Thành công đòi hỏi phải cân bằng giữa các yếu tố kỹ thuật và con người: những người tiên phong về AI nội bộ, tập trung vào lợi ích thực tế và tính linh hoạt trong quá trình phát triển.
Ngày 9 tháng 11 năm 2025

Các nhà phát triển và AI trong trang web: Thách thức, công cụ và phương pháp hay nhất: Góc nhìn quốc tế

Ý đang kẹt ở mức 8,2% ứng dụng AI (so với mức trung bình 13,5% của EU), trong khi trên toàn cầu, 40% công ty đã sử dụng AI trong vận hành—và những con số này cho thấy lý do tại sao khoảng cách này lại nghiêm trọng: chatbot của Amtrak tạo ra ROI 800%, GrandStay tiết kiệm 2,1 triệu đô la/năm bằng cách xử lý 72% yêu cầu một cách tự động, và Telenor tăng doanh thu 15%. Báo cáo này khám phá việc triển khai AI trên các trang web với các trường hợp thực tế (Lutech Brain cho đấu thầu, Netflix cho đề xuất, L'Oréal Beauty Gifter với mức tương tác gấp 27 lần so với email) và giải quyết các thách thức kỹ thuật trong thế giới thực: chất lượng dữ liệu, sai lệch thuật toán, tích hợp với các hệ thống cũ và xử lý thời gian thực. Từ các giải pháp—điện toán biên để giảm độ trễ, kiến ​​trúc mô-đun, chiến lược chống thiên vị—đến các vấn đề đạo đức (quyền riêng tư, bong bóng lọc, khả năng truy cập cho người dùng khuyết tật) cho đến các trường hợp của chính phủ (Helsinki với bản dịch AI đa ngôn ngữ), hãy khám phá cách các nhà phát triển web đang chuyển đổi từ lập trình viên sang chiến lược gia trải nghiệm người dùng và lý do tại sao những người điều hướng sự phát triển này ngày nay sẽ thống trị web trong tương lai.
Ngày 9 tháng 11 năm 2025

Hệ thống hỗ trợ quyết định AI: Sự trỗi dậy của "Cố vấn" trong lãnh đạo doanh nghiệp

77% công ty sử dụng AI, nhưng chỉ 1% có các triển khai "hoàn thiện"—vấn đề không nằm ở công nghệ, mà là ở cách tiếp cận: tự động hóa hoàn toàn so với cộng tác thông minh. Goldman Sachs, sử dụng cố vấn AI trên 10.000 nhân viên, đã tăng 30% hiệu quả tiếp cận và tăng 12% doanh số bán chéo trong khi vẫn duy trì quyết định của con người; Kaiser Permanente ngăn ngừa 500 ca tử vong mỗi năm bằng cách phân tích 100 mục mỗi giờ trước 12 giờ, nhưng lại để bác sĩ chẩn đoán. Mô hình cố vấn giải quyết khoảng cách niềm tin (chỉ 44% tin tưởng AI doanh nghiệp) thông qua ba trụ cột: AI có thể giải thích được với lập luận minh bạch, điểm số tin cậy được hiệu chỉnh và phản hồi liên tục để cải thiện. Các con số: Tác động 22,3 nghìn tỷ đô la vào năm 2030, các cộng tác viên AI chiến lược sẽ đạt ROI gấp 4 lần vào năm 2026. Lộ trình ba giai đoạn thiết thực—đánh giá kỹ năng và quản trị, thí điểm với các chỉ số tin cậy, mở rộng dần dần với đào tạo liên tục—áp dụng cho tài chính (đánh giá rủi ro có giám sát), chăm sóc sức khỏe (hỗ trợ chẩn đoán) và sản xuất (bảo trì dự đoán). Tương lai không phải là AI thay thế con người mà là sự phối hợp hiệu quả giữa con người và máy móc.