Việc kinh doanh

Hệ thống làm mát AI của Google DeepMind: Trí tuệ nhân tạo cách mạng hóa hiệu quả năng lượng của trung tâm dữ liệu như thế nào

Google DeepMind đạt được mức tiết kiệm năng lượng làm mát trung tâm dữ liệu là -40% (nhưng chỉ -4% tổng mức tiêu thụ, vì làm mát chiếm 10% tổng mức tiêu thụ)—độ chính xác 99,6% với lỗi 0,4% trên PUE 1.1 bằng cách sử dụng học sâu 5 lớp, 50 nút, 19 biến đầu vào trên 184.435 mẫu đào tạo (2 năm dữ liệu). Đã xác nhận tại 3 cơ sở: Singapore (triển khai lần đầu năm 2016), Eemshaven, Council Bluffs (đầu tư 5 tỷ đô la). PUE trên toàn đội xe của Google là 1,09 so với mức trung bình của ngành là 1,56-1,58. Kiểm soát dự đoán mô hình dự đoán nhiệt độ/áp suất cho giờ tiếp theo đồng thời quản lý tải CNTT, thời tiết và trạng thái thiết bị. Bảo mật được đảm bảo: xác minh hai cấp, người vận hành luôn có thể vô hiệu hóa AI. Hạn chế quan trọng: không có xác minh độc lập từ các công ty kiểm toán/phòng thí nghiệm quốc gia, mỗi trung tâm dữ liệu yêu cầu một mô hình tùy chỉnh (8 năm, không bao giờ được thương mại hóa). Triển khai: 6-18 tháng, yêu cầu một nhóm đa ngành (khoa học dữ liệu, HVAC, quản lý cơ sở). Áp dụng ngoài các trung tâm dữ liệu: nhà máy công nghiệp, bệnh viện, trung tâm mua sắm, văn phòng công ty. 2024-2025: Google chuyển sang làm mát bằng chất lỏng trực tiếp cho TPU v5p, cho thấy những hạn chế thực tế của việc tối ưu hóa AI.

Trí tuệ nhân tạo được áp dụng vào việc làm mát trung tâm dữ liệu là một trong những cải tiến quan trọng nhất trong việc tối ưu hóa năng lượng công nghiệp.

Hệ thống tự động do Google DeepMind phát triển, hoạt động từ năm 2018, đã chứng minh AI có thể chuyển đổi cách quản lý nhiệt của cơ sở hạ tầng quan trọng, đạt được kết quả cụ thể về hiệu quả hoạt động.

Đổi mới chuyển đổi trung tâm dữ liệu

Vấn đề hiệu quả năng lượng

Theo Jonathan Koomey, chuyên gia toàn cầu về hiệu quả năng lượng, các trung tâm dữ liệu hiện đại tiêu thụ rất nhiều năng lượng, trong đó hệ thống làm mát chiếm khoảng 10% tổng mức tiêu thụ điện. Cứ mỗi năm phút, hệ thống AI dựa trên đám mây của Google lại chụp ảnh nhanh hệ thống làm mát từ hàng nghìn cảm biến, phân tích độ phức tạp vận hành, thách thức các phương pháp kiểm soát truyền thống.

Hệ thống làm mát bằng AI của Google sử dụng mạng nơ-ron sâu để dự đoán tác động của các tổ hợp hành động khác nhau lên mức tiêu thụ năng lượng trong tương lai, xác định hành động nào sẽ giảm thiểu mức tiêu thụ năng lượng đồng thời đáp ứng các ràng buộc an toàn nghiêm ngặt . DeepMind AI giúp giảm 40% chi phí làm mát trung tâm dữ liệu của Google - Google DeepMind .

Kết quả cụ thể và có thể đo lường được

Kết quả đạt được trong việc tối ưu hóa hệ thống làm mát rất đáng kể: hệ thống liên tục đạt được mức giảm 40% năng lượng sử dụng cho hệ thống làm mát . Tuy nhiên, xét đến việc hệ thống làm mát chỉ chiếm khoảng 10% tổng mức tiêu thụ, con số này tương đương với mức tiết kiệm năng lượng tổng thể cho trung tâm dữ liệu khoảng 4%.

Theo bài báo kỹ thuật gốc của Jim Gao , mạng nơ-ron đạt được sai số tuyệt đối trung bình là 0,004 và độ lệch chuẩn là 0,005, tương đương với sai số 0,4% đối với PUE là 1,1.

Nơi hoạt động: Trung tâm dữ liệu đã được xác nhận

Triển khai đã được xác minh

Việc triển khai hệ thống AI đã được chính thức xác nhận tại ba trung tâm dữ liệu cụ thể :

Singapore : Triển khai đáng kể đầu tiên vào năm 2016, nơi trung tâm dữ liệu sử dụng nước tái chế để làm mát và chứng minh khả năng giảm 40% năng lượng làm mát.

Eemshaven, Hà Lan : Trung tâm dữ liệu sử dụng nước đạt chuẩn công nghiệp và tiêu thụ 232 triệu gallon nước vào năm 2023. Marco Ynema, người quản lý cơ sở này , giám sát hoạt động tại cơ sở tiên tiến này.

Council Bluffs, Iowa : Tạp chí MIT Technology Review đã đặc biệt giới thiệu trung tâm dữ liệu Council Bluffs trong cuộc thảo luận về hệ thống AI. Google đã đầu tư 5 tỷ đô la vào hai cơ sở của mình tại Council Bluffs, dự kiến ​​sẽ tiêu thụ 980,1 triệu gallon nước vào năm 2023.

Hệ thống điều khiển AI dựa trên nền tảng đám mây hiện đang hoạt động và cung cấp khả năng tiết kiệm năng lượng tại nhiều trung tâm dữ liệu của Google, nhưng công ty vẫn chưa công bố danh sách đầy đủ các cơ sở sử dụng công nghệ này.

Kiến trúc kỹ thuật: Cách thức hoạt động

Mạng nơ-ron sâu và học máy

Theo bằng sáng chế US20180204116A1 , hệ thống sử dụng kiến ​​trúc học sâu với các đặc điểm kỹ thuật chính xác:

  • 5 lớp ẩn với 50 nút trên mỗi lớp
  • 19 biến đầu vào được chuẩn hóa bao gồm tải nhiệt, điều kiện thời tiết, trạng thái thiết bị
  • 184.435 mẫu đào tạo với độ phân giải 5 phút (khoảng 2 năm dữ liệu hoạt động)
  • Tham số chính quy hóa : 0,001 để ngăn ngừa hiện tượng quá khớp

Kiến trúc này sử dụng Kiểm soát Dự đoán Mô hình (Model Predictive Control) với các mô hình ARX tuyến tính được tích hợp với mạng nơ-ron sâu. Mạng nơ-ron không yêu cầu người dùng phải xác định trước các tương tác giữa các biến trong mô hình. Thay vào đó, mạng nơ-ron tìm kiếm các mẫu và tương tác giữa các đặc trưng để tự động tạo ra một mô hình tối ưu.

Hiệu quả sử dụng điện năng (PUE): Chỉ số quan trọng

PUE thể hiện hiệu quả năng lượng cơ bản của các trung tâm dữ liệu:

PUE = Tổng năng lượng trung tâm dữ liệu / Năng lượng thiết bị CNTT

  • PUE trên toàn đội xe của Google : 1,09 vào năm 2024 (theo báo cáo về môi trường của Google)
  • Điểm trung bình của ngành : 1,56-1,58
  • PUE lý tưởng : 1.0 (về mặt lý thuyết là không thể)

Google được chứng nhận ISO 50001 về quản lý năng lượng, đảm bảo các tiêu chuẩn vận hành nghiêm ngặt nhưng không xác nhận cụ thể hiệu suất của hệ thống AI.

Kiểm soát dự đoán mô hình (MPC)

Cốt lõi của sự đổi mới này là khả năng kiểm soát dự đoán , dự báo nhiệt độ và áp suất của trung tâm dữ liệu trong tương lai trong giờ tiếp theo, mô phỏng các hành động được đề xuất để đảm bảo không vượt quá các ràng buộc vận hành.

Lợi ích vận hành của AI trong làm mát

Độ chính xác dự đoán vượt trội

Sau khi thử nghiệm và sai sót, các mô hình hiện có độ chính xác 99,6% trong việc dự đoán PUE . Độ chính xác này cho phép tối ưu hóa những điều không thể thực hiện được bằng các phương pháp truyền thống, đồng thời quản lý các tương tác phi tuyến tính phức tạp giữa các hệ thống cơ học, điện và môi trường.

Học tập và thích ứng liên tục

Một khía cạnh quan trọng là khả năng học hỏi theo tiến hóa . Trong suốt chín tháng, hiệu suất của hệ thống đã tăng từ mức cải thiện 12% khi mới ra mắt lên khoảng 30%.

Nhà điều hành Google Dan Fuenffinger nhận xét: "Thật đáng kinh ngạc khi thấy AI học cách tận dụng điều kiện mùa đông và tạo ra nước lạnh hơn bình thường. Các quy tắc không được cải thiện theo thời gian, nhưng AI thì có."

Tối ưu hóa đa biến

Hệ thống quản lý đồng thời 19 thông số vận hành quan trọng :

  • Tổng tải CNTT của máy chủ và mạng
  • Điều kiện thời tiết (nhiệt độ, độ ẩm, nhiệt enthalpy)
  • Trạng thái thiết bị (máy làm lạnh, tháp giải nhiệt, máy bơm)
  • Điểm đặt và điều khiển hoạt động
  • Tốc độ quạt và hệ thống VFD

Bảo mật và Kiểm soát: Đảm bảo an toàn tuyệt đối

Xác minh đa cấp

An toàn vận hành được đảm bảo thông qua các cơ chế dự phòng . Các hành động tối ưu do AI tính toán được kiểm tra dựa trên danh sách các ràng buộc an toàn nội bộ do người vận hành xác định. Sau khi được gửi đến trung tâm dữ liệu vật lý, hệ thống điều khiển cục bộ sẽ kiểm tra lại các lệnh. DeepMind AI giảm 40% năng lượng tiêu thụ để làm mát các trung tâm dữ liệu của Google .

Người vận hành luôn nắm quyền kiểm soát và có thể thoát khỏi chế độ AI bất cứ lúc nào, chuyển đổi liền mạch sang các quy tắc truyền thống.

Những hạn chế và cân nhắc về phương pháp luận

Chỉ số PUE và những hạn chế của nó

Ngành công nghiệp nhận ra những hạn chế của Hiệu quả Sử dụng Điện năng như một thước đo. Một khảo sát của Viện Uptime năm 2014 cho thấy 75% người tham gia tin rằng ngành công nghiệp cần một thước đo hiệu quả mới. Các vấn đề bao gồm sai lệch khí hậu (không thể so sánh các điều kiện khí hậu khác nhau), thao túng thời gian (đo lường trong điều kiện tối ưu) và loại trừ linh kiện.

Độ phức tạp khi triển khai

Mỗi trung tâm dữ liệu đều có kiến ​​trúc và môi trường riêng. Một mô hình tùy chỉnh cho một hệ thống có thể không áp dụng được cho hệ thống khác, đòi hỏi một khuôn khổ thông minh chung.

Chất lượng dữ liệu và xác minh

Độ chính xác của mô hình phụ thuộc vào chất lượng và số lượng dữ liệu đầu vào . Lỗi mô hình thường tăng đối với các giá trị PUE trên 1,14 do thiếu dữ liệu huấn luyện tương ứng.

Không có xác minh độc lập nào từ các công ty kiểm toán lớn hoặc phòng thí nghiệm quốc gia được tìm thấy, trong khi Google "không theo đuổi xác minh của bên thứ ba" ngoài các yêu cầu tối thiểu của liên bang.

Tương lai: Tiến hóa theo hướng làm mát bằng chất lỏng

Chuyển đổi công nghệ

Trong giai đoạn 2024-2025, Google đã chuyển trọng tâm đáng kể sang:

  • Hệ thống nguồn +/-400 VDC cho giá đỡ 1MW
  • Các đơn vị phân phối làm mát "Dự án Deschutes"
  • Làm mát bằng chất lỏng trực tiếp cho TPU v5p với "thời gian hoạt động 99,999%"

Sự thay đổi này cho thấy việc tối ưu hóa AI đã đạt đến giới hạn thực tế đối với tải nhiệt của các ứng dụng AI hiện đại .

Xu hướng mới nổi

  • Tích hợp điện toán biên : AI phân tán để giảm độ trễ
  • Bản sao kỹ thuật số : Bản sao kỹ thuật số cho mô phỏng nâng cao
  • Tập trung vào tính bền vững : Tối ưu hóa cho năng lượng tái tạo
  • Làm mát kết hợp : Kết hợp chất lỏng/không khí được tối ưu hóa bằng AI

Ứng dụng và Cơ hội cho Doanh nghiệp

Các lĩnh vực ứng dụng

Tối ưu hóa AI để làm mát có ứng dụng rộng rãi ngoài các trung tâm dữ liệu:

  • Nhà máy công nghiệp : Tối ưu hóa hệ thống HVAC sản xuất
  • Trung tâm mua sắm : Quản lý điều hòa thông minh
  • Bệnh viện : Kiểm soát môi trường trong phòng phẫu thuật và khu vực quan trọng
  • Văn phòng công ty : Quản lý tòa nhà và cơ sở thông minh

ROI và lợi ích kinh tế

Tiết kiệm năng lượng trong hệ thống làm mát được thể hiện qua:

  • Giảm chi phí vận hành hệ thống làm mát
  • Cải thiện tính bền vững của môi trường
  • Kéo dài tuổi thọ thiết bị
  • Độ tin cậy hoạt động cao hơn

Triển khai chiến lược cho các công ty

Lộ trình áp dụng

Giai đoạn 1 - Đánh giá : Kiểm toán năng lượng và lập bản đồ các hệ thống hiện có Giai đoạn 2 - Thí điểm : Thử nghiệm trong môi trường được kiểm soát trên một phần giới hạn Giai đoạn 3 - Triển khai : Triển khai dần dần với giám sát chuyên sâu Giai đoạn 4 - Tối ưu hóa : Điều chỉnh liên tục và mở rộng công suất

Những cân nhắc về mặt kỹ thuật

  • Cơ sở hạ tầng cảm biến : Mạng lưới giám sát hoàn chỉnh
  • Kỹ năng làm việc nhóm : Khoa học dữ liệu, quản lý cơ sở vật chất, an ninh mạng
  • Tích hợp : Khả năng tương thích với các hệ thống cũ
  • Tuân thủ : quy định về an toàn và môi trường

FAQ - Những câu hỏi thường gặp

1. Hệ thống AI thực sự đang hoạt động tại trung tâm dữ liệu nào của Google?

Ba trung tâm dữ liệu đã chính thức được xác nhận: Singapore (triển khai lần đầu năm 2016), Eemshaven ở Hà Lan và Council Bluffs ở Iowa. Hệ thống này hiện đang hoạt động tại nhiều trung tâm dữ liệu của Google, nhưng danh sách đầy đủ chưa bao giờ được công bố rộng rãi.

2. Thực tế nó tiết kiệm được bao nhiêu năng lượng trên tổng mức tiêu thụ?

Hệ thống đạt mức giảm 40% năng lượng tiêu thụ cho việc làm mát. Xét đến việc làm mát chiếm khoảng 10% tổng mức tiêu thụ, tổng mức tiết kiệm năng lượng đạt khoảng 4% tổng mức tiêu thụ của trung tâm dữ liệu.

3. Hệ thống dự báo có chính xác không?

Hệ thống đạt độ chính xác 99,6% trong dự đoán PUE với sai số tuyệt đối trung bình là 0,004 ± 0,005, tương đương với sai số 0,4% đối với PUE là 1,1 . Nếu PUE thực tế là 1,1, AI sẽ dự đoán trong khoảng từ 1,096 đến 1,104.

4. Làm thế nào để đảm bảo an toàn vận hành?

Hệ thống sử dụng xác minh hai cấp độ: đầu tiên, AI kiểm tra các ràng buộc an toàn do người vận hành thiết lập, sau đó hệ thống cục bộ xác minh lại các hướng dẫn. Người vận hành luôn có thể tắt kiểm tra AI và quay lại hệ thống truyền thống.

5. Phải mất bao lâu để triển khai một hệ thống như thế này?

Việc triển khai thường mất 6-18 tháng: 3-6 tháng để thu thập dữ liệu và đào tạo mô hình, 2-4 tháng để thử nghiệm thí điểm và 3-8 tháng để triển khai theo từng giai đoạn. Độ phức tạp thay đổi đáng kể tùy thuộc vào cơ sở hạ tầng hiện có.

6. Cần có những kỹ năng kỹ thuật nào?

Cần một đội ngũ đa ngành có chuyên môn về khoa học dữ liệu/AI, kỹ thuật HVAC, quản lý cơ sở vật chất, an ninh mạng và tích hợp hệ thống. Nhiều công ty lựa chọn hợp tác với các nhà cung cấp chuyên biệt.

7. Hệ thống có thể thích ứng với những thay đổi theo mùa không?

Có, AI tự động học cách khai thác các điều kiện theo mùa, chẳng hạn như tạo ra nước lạnh hơn vào mùa đông để giảm năng lượng làm mát. Hệ thống liên tục được cải thiện bằng cách nhận dạng các mô hình thời gian và khí hậu .

8. Tại sao Google không thương mại hóa công nghệ này?

Mỗi trung tâm dữ liệu có kiến ​​trúc và môi trường riêng biệt, đòi hỏi khả năng tùy chỉnh đáng kể. Tính phức tạp của việc triển khai, nhu cầu dữ liệu cụ thể và chuyên môn cần thiết khiến tiếp thị trực tiếp trở nên khó khăn. Sau tám năm, công nghệ này vẫn chỉ được Google sử dụng nội bộ.

9. Có kiểm toán hiệu suất độc lập không?

Không tìm thấy xác minh độc lập nào từ các công ty kiểm toán lớn (Deloitte, PwC, KPMG) hoặc các phòng thí nghiệm quốc gia. Google được chứng nhận ISO 50001 nhưng "không thực hiện xác minh của bên thứ ba" vượt quá các yêu cầu tối thiểu của liên bang.

10. Nó có áp dụng cho các ngành công nghiệp khác ngoài trung tâm dữ liệu không?

Hoàn toàn chính xác. Tối ưu hóa AI cho hệ thống làm mát có thể được áp dụng cho các nhà máy công nghiệp, trung tâm mua sắm, bệnh viện, văn phòng công ty và bất kỳ cơ sở nào có hệ thống HVAC phức tạp. Các nguyên tắc tối ưu hóa đa biến và điều khiển dự đoán có thể áp dụng rộng rãi.

Hệ thống làm mát AI DeepMind của Google là một bước đột phá về mặt kỹ thuật, mang lại những cải tiến gia tăng trong một lĩnh vực cụ thể. Đối với các công ty vận hành cơ sở hạ tầng tiêu thụ nhiều năng lượng, công nghệ này mang đến những cơ hội cụ thể để tối ưu hóa hệ thống làm mát, bất chấp những hạn chế về quy mô đã nêu ở trên.

Nguồn chính: Jim Gao Google Research Paper , DeepMind Official Blog , MIT Technology Review , Patent US20180204116A1

Tài nguyên cho sự phát triển kinh doanh

Ngày 9 tháng 11 năm 2025

Quy định về AI cho các ứng dụng tiêu dùng: Cách chuẩn bị cho các quy định mới năm 2025

Năm 2025 đánh dấu sự kết thúc của kỷ nguyên "Miền Tây Hoang dã" của AI: Đạo luật AI của EU có hiệu lực vào tháng 8 năm 2024, với các yêu cầu về kiến ​​thức AI từ ngày 2 tháng 2 năm 2025, và quản trị cùng GPAI từ ngày 2 tháng 8. California dẫn đầu với SB 243 (ra đời sau vụ tự tử của Sewell Setzer, một cậu bé 14 tuổi đã phát triển mối quan hệ tình cảm với chatbot), trong đó áp đặt lệnh cấm các hệ thống khen thưởng cưỡng chế, phát hiện ý định tự tử, nhắc nhở "Tôi không phải là người" ba giờ một lần, kiểm toán công khai độc lập và phạt 1.000 đô la cho mỗi vi phạm. SB 420 yêu cầu đánh giá tác động đối với "các quyết định tự động có rủi ro cao" với quyền kháng cáo lên cơ quan chức năng. Thực thi thực tế: Noom bị kiện vào năm 2022 vì bot đóng giả làm huấn luyện viên con người, một khoản bồi thường trị giá 56 triệu đô la. Xu hướng quốc gia: Alabama, Hawaii, Illinois, Maine và Massachusetts phân loại việc không thông báo cho chatbot AI là vi phạm UDAP. Phương pháp tiếp cận rủi ro ba cấp độ—các hệ thống quan trọng (y tế/giao thông/năng lượng), chứng nhận trước khi triển khai, công bố thông tin minh bạch hướng đến người tiêu dùng, đăng ký mục đích chung và kiểm tra bảo mật. Quy định chắp vá mà không có quyền ưu tiên của liên bang: các công ty đa quốc gia phải điều chỉnh các yêu cầu thay đổi. EU từ tháng 8 năm 2026: thông báo cho người dùng về tương tác AI trừ khi nội dung rõ ràng do AI tạo ra được gắn nhãn là có thể đọc được bằng máy.
Ngày 9 tháng 11 năm 2025

Quản lý những thứ không được tạo ra: Liệu châu Âu có nguy cơ mất đi sự liên quan về mặt công nghệ không?

Châu Âu chỉ thu hút được một phần mười đầu tư toàn cầu vào AI, nhưng lại tuyên bố áp đặt các quy tắc toàn cầu. Đây chính là "Hiệu ứng Brussels" - áp đặt các quy định toàn cầu thông qua sức mạnh thị trường mà không thúc đẩy đổi mới. Đạo luật AI có hiệu lực theo lịch trình so le cho đến năm 2027, nhưng các tập đoàn công nghệ đa quốc gia đang phản ứng bằng các chiến lược né tránh sáng tạo: viện dẫn bí mật thương mại để tránh tiết lộ dữ liệu đào tạo, đưa ra các bản tóm tắt tuân thủ kỹ thuật nhưng khó hiểu, sử dụng phương pháp tự đánh giá để hạ cấp hệ thống từ "rủi ro cao" xuống "rủi ro tối thiểu" và tham gia vào việc mua bán diễn đàn bằng cách chọn các quốc gia thành viên có quy định kiểm soát ít nghiêm ngặt hơn. Nghịch lý về bản quyền ngoài lãnh thổ: EU yêu cầu OpenAI tuân thủ luật pháp châu Âu ngay cả đối với việc đào tạo bên ngoài châu Âu - một nguyên tắc chưa từng thấy trong luật pháp quốc tế. "Mô hình kép" xuất hiện: các phiên bản giới hạn của châu Âu so với các phiên bản toàn cầu tiên tiến của cùng một sản phẩm AI. Rủi ro thực sự: Châu Âu trở thành một "pháo đài kỹ thuật số" bị cô lập khỏi đổi mới toàn cầu, với công dân châu Âu tiếp cận các công nghệ kém hơn. Tòa án Công lý đã bác bỏ lời biện hộ "bí mật thương mại" trong vụ kiện chấm điểm tín dụng, nhưng sự không chắc chắn trong diễn giải vẫn còn rất lớn—chính xác thì "tóm tắt chi tiết đầy đủ" nghĩa là gì? Không ai biết. Câu hỏi cuối cùng chưa được trả lời: EU đang tạo ra một con đường thứ ba đạo đức giữa chủ nghĩa tư bản Hoa Kỳ và sự kiểm soát của nhà nước Trung Quốc, hay chỉ đơn giản là xuất khẩu bộ máy quan liêu sang một lĩnh vực mà nó không cạnh tranh? Hiện tại: một quốc gia dẫn đầu thế giới về quy định AI, nhưng đang trong giai đoạn phát triển. Một chương trình khổng lồ.
Ngày 9 tháng 11 năm 2025

Ngoại lệ: Nơi khoa học dữ liệu gặp gỡ những câu chuyện thành công

Khoa học dữ liệu đã đảo ngược mô hình: các giá trị ngoại lệ không còn là "lỗi cần loại bỏ" mà là thông tin giá trị cần được hiểu. Một giá trị ngoại lệ đơn lẻ có thể làm biến dạng hoàn toàn mô hình hồi quy tuyến tính - thay đổi độ dốc từ 2 thành 10 - nhưng việc loại bỏ nó có thể đồng nghĩa với việc mất đi tín hiệu quan trọng nhất trong tập dữ liệu. Học máy giới thiệu các công cụ tinh vi: Rừng Cô lập cô lập các giá trị ngoại lệ bằng cách xây dựng cây quyết định ngẫu nhiên, Hệ số Ngoại lệ Cục bộ phân tích mật độ cục bộ, và Bộ mã hóa Tự động tái tạo dữ liệu bình thường và đánh dấu những gì chúng không thể tái tạo. Có các giá trị ngoại lệ toàn cầu (nhiệt độ -10°C ở vùng nhiệt đới), các giá trị ngoại lệ theo ngữ cảnh (chi 1.000 euro ở một khu dân cư nghèo) và các giá trị tập thể (lưu lượng mạng đạt đỉnh đồng bộ cho thấy có tấn công). Một điểm tương đồng với Gladwell: "quy tắc 10.000 giờ" đang bị tranh cãi - Paul McCartney đã nói, "Nhiều ban nhạc đã biểu diễn 10.000 giờ ở Hamburg mà không thành công; lý thuyết này không phải là hoàn hảo." Thành công toán học châu Á không phải do di truyền mà do văn hóa: Hệ thống số trực quan hơn của Trung Quốc, canh tác lúa đòi hỏi sự cải tiến liên tục so với sự bành trướng lãnh thổ của nền nông nghiệp phương Tây. Ứng dụng thực tế: Các ngân hàng Anh thu hồi 18% tổn thất tiềm ẩn thông qua phát hiện bất thường theo thời gian thực, sản xuất phát hiện các lỗi vi mô mà kiểm tra thủ công có thể bỏ sót, chăm sóc sức khỏe xác thực dữ liệu thử nghiệm lâm sàng với độ nhạy phát hiện bất thường trên 85%. Bài học cuối cùng: Khi khoa học dữ liệu chuyển từ loại bỏ các giá trị ngoại lai sang hiểu rõ chúng, chúng ta phải xem những nghề nghiệp phi truyền thống không phải là những bất thường cần được khắc phục mà là những quỹ đạo giá trị cần được nghiên cứu.