Việc kinh doanh

Hệ thống làm mát AI của Google DeepMind: Trí tuệ nhân tạo cách mạng hóa hiệu quả năng lượng của trung tâm dữ liệu như thế nào

Google DeepMind đạt được mức tiết kiệm năng lượng làm mát trung tâm dữ liệu là -40% (nhưng chỉ -4% tổng mức tiêu thụ, vì làm mát chiếm 10% tổng mức tiêu thụ)—độ chính xác 99,6% với lỗi 0,4% trên PUE 1.1 bằng cách sử dụng học sâu 5 lớp, 50 nút, 19 biến đầu vào trên 184.435 mẫu đào tạo (2 năm dữ liệu). Đã xác nhận tại 3 cơ sở: Singapore (triển khai lần đầu năm 2016), Eemshaven, Council Bluffs (đầu tư 5 tỷ đô la). PUE trên toàn đội xe của Google là 1,09 so với mức trung bình của ngành là 1,56-1,58. Kiểm soát dự đoán mô hình dự đoán nhiệt độ/áp suất cho giờ tiếp theo đồng thời quản lý tải CNTT, thời tiết và trạng thái thiết bị. Bảo mật được đảm bảo: xác minh hai cấp, người vận hành luôn có thể vô hiệu hóa AI. Hạn chế quan trọng: không có xác minh độc lập từ các công ty kiểm toán/phòng thí nghiệm quốc gia, mỗi trung tâm dữ liệu yêu cầu một mô hình tùy chỉnh (8 năm, không bao giờ được thương mại hóa). Triển khai: 6-18 tháng, yêu cầu một nhóm đa ngành (khoa học dữ liệu, HVAC, quản lý cơ sở). Áp dụng ngoài các trung tâm dữ liệu: nhà máy công nghiệp, bệnh viện, trung tâm mua sắm, văn phòng công ty. 2024-2025: Google chuyển sang làm mát bằng chất lỏng trực tiếp cho TPU v5p, cho thấy những hạn chế thực tế của việc tối ưu hóa AI.

Trí tuệ nhân tạo được áp dụng vào việc làm mát trung tâm dữ liệu là một trong những cải tiến quan trọng nhất trong việc tối ưu hóa năng lượng công nghiệp.

Hệ thống tự động do Google DeepMind phát triển, hoạt động từ năm 2018, đã chứng minh AI có thể chuyển đổi cách quản lý nhiệt của cơ sở hạ tầng quan trọng, đạt được kết quả cụ thể về hiệu quả hoạt động.

Đổi mới chuyển đổi trung tâm dữ liệu

Vấn đề hiệu quả năng lượng

Theo Jonathan Koomey, chuyên gia toàn cầu về hiệu quả năng lượng, các trung tâm dữ liệu hiện đại tiêu thụ rất nhiều năng lượng, trong đó hệ thống làm mát chiếm khoảng 10% tổng mức tiêu thụ điện. Cứ mỗi năm phút, hệ thống AI dựa trên đám mây của Google lại chụp ảnh nhanh hệ thống làm mát từ hàng nghìn cảm biến, phân tích độ phức tạp vận hành, thách thức các phương pháp kiểm soát truyền thống.

Hệ thống làm mát bằng AI của Google sử dụng mạng nơ-ron sâu để dự đoán tác động của các tổ hợp hành động khác nhau lên mức tiêu thụ năng lượng trong tương lai, xác định hành động nào sẽ giảm thiểu mức tiêu thụ năng lượng đồng thời đáp ứng các ràng buộc an toàn nghiêm ngặt . DeepMind AI giúp giảm 40% chi phí làm mát trung tâm dữ liệu của Google - Google DeepMind .

Kết quả cụ thể và có thể đo lường được

Kết quả đạt được trong việc tối ưu hóa hệ thống làm mát rất đáng kể: hệ thống liên tục đạt được mức giảm 40% năng lượng sử dụng cho hệ thống làm mát . Tuy nhiên, xét đến việc hệ thống làm mát chỉ chiếm khoảng 10% tổng mức tiêu thụ, con số này tương đương với mức tiết kiệm năng lượng tổng thể cho trung tâm dữ liệu khoảng 4%.

Theo bài báo kỹ thuật gốc của Jim Gao , mạng nơ-ron đạt được sai số tuyệt đối trung bình là 0,004 và độ lệch chuẩn là 0,005, tương đương với sai số 0,4% đối với PUE là 1,1.

Nơi hoạt động: Trung tâm dữ liệu đã được xác nhận

Triển khai đã được xác minh

Việc triển khai hệ thống AI đã được chính thức xác nhận tại ba trung tâm dữ liệu cụ thể :

Singapore : Triển khai đáng kể đầu tiên vào năm 2016, nơi trung tâm dữ liệu sử dụng nước tái chế để làm mát và chứng minh khả năng giảm 40% năng lượng làm mát.

Eemshaven, Hà Lan : Trung tâm dữ liệu sử dụng nước đạt chuẩn công nghiệp và tiêu thụ 232 triệu gallon nước vào năm 2023. Marco Ynema, người quản lý cơ sở này , giám sát hoạt động tại cơ sở tiên tiến này.

Council Bluffs, Iowa : Tạp chí MIT Technology Review đã đặc biệt giới thiệu trung tâm dữ liệu Council Bluffs trong cuộc thảo luận về hệ thống AI. Google đã đầu tư 5 tỷ đô la vào hai cơ sở của mình tại Council Bluffs, dự kiến ​​sẽ tiêu thụ 980,1 triệu gallon nước vào năm 2023.

Hệ thống điều khiển AI dựa trên nền tảng đám mây hiện đang hoạt động và cung cấp khả năng tiết kiệm năng lượng tại nhiều trung tâm dữ liệu của Google, nhưng công ty vẫn chưa công bố danh sách đầy đủ các cơ sở sử dụng công nghệ này.

Kiến trúc kỹ thuật: Cách thức hoạt động

Mạng nơ-ron sâu và học máy

Theo bằng sáng chế US20180204116A1 , hệ thống sử dụng kiến ​​trúc học sâu với các đặc điểm kỹ thuật chính xác:

  • 5 lớp ẩn với 50 nút trên mỗi lớp
  • 19 biến đầu vào được chuẩn hóa bao gồm tải nhiệt, điều kiện thời tiết, trạng thái thiết bị
  • 184.435 mẫu đào tạo với độ phân giải 5 phút (khoảng 2 năm dữ liệu hoạt động)
  • Tham số chính quy hóa : 0,001 để ngăn ngừa hiện tượng quá khớp

Kiến trúc này sử dụng Kiểm soát Dự đoán Mô hình (Model Predictive Control) với các mô hình ARX tuyến tính được tích hợp với mạng nơ-ron sâu. Mạng nơ-ron không yêu cầu người dùng phải xác định trước các tương tác giữa các biến trong mô hình. Thay vào đó, mạng nơ-ron tìm kiếm các mẫu và tương tác giữa các đặc trưng để tự động tạo ra một mô hình tối ưu.

Hiệu quả sử dụng điện năng (PUE): Chỉ số quan trọng

PUE thể hiện hiệu quả năng lượng cơ bản của các trung tâm dữ liệu:

PUE = Tổng năng lượng trung tâm dữ liệu / Năng lượng thiết bị CNTT

  • PUE trên toàn đội xe của Google : 1,09 vào năm 2024 (theo báo cáo về môi trường của Google)
  • Điểm trung bình của ngành : 1,56-1,58
  • PUE lý tưởng : 1.0 (về mặt lý thuyết là không thể)

Google được chứng nhận ISO 50001 về quản lý năng lượng, đảm bảo các tiêu chuẩn vận hành nghiêm ngặt nhưng không xác nhận cụ thể hiệu suất của hệ thống AI.

Kiểm soát dự đoán mô hình (MPC)

Cốt lõi của sự đổi mới này là khả năng kiểm soát dự đoán , dự báo nhiệt độ và áp suất của trung tâm dữ liệu trong tương lai trong giờ tiếp theo, mô phỏng các hành động được đề xuất để đảm bảo không vượt quá các ràng buộc vận hành.

Lợi ích vận hành của AI trong làm mát

Độ chính xác dự đoán vượt trội

Sau khi thử nghiệm và sai sót, các mô hình hiện có độ chính xác 99,6% trong việc dự đoán PUE . Độ chính xác này cho phép tối ưu hóa những điều không thể thực hiện được bằng các phương pháp truyền thống, đồng thời quản lý các tương tác phi tuyến tính phức tạp giữa các hệ thống cơ học, điện và môi trường.

Học tập và thích ứng liên tục

Một khía cạnh quan trọng là khả năng học hỏi theo tiến hóa . Trong suốt chín tháng, hiệu suất của hệ thống đã tăng từ mức cải thiện 12% khi mới ra mắt lên khoảng 30%.

Nhà điều hành Google Dan Fuenffinger nhận xét: "Thật đáng kinh ngạc khi thấy AI học cách tận dụng điều kiện mùa đông và tạo ra nước lạnh hơn bình thường. Các quy tắc không được cải thiện theo thời gian, nhưng AI thì có."

Tối ưu hóa đa biến

Hệ thống quản lý đồng thời 19 thông số vận hành quan trọng :

  • Tổng tải CNTT của máy chủ và mạng
  • Điều kiện thời tiết (nhiệt độ, độ ẩm, nhiệt enthalpy)
  • Trạng thái thiết bị (máy làm lạnh, tháp giải nhiệt, máy bơm)
  • Điểm đặt và điều khiển hoạt động
  • Tốc độ quạt và hệ thống VFD

Bảo mật và Kiểm soát: Đảm bảo an toàn tuyệt đối

Xác minh đa cấp

An toàn vận hành được đảm bảo thông qua các cơ chế dự phòng . Các hành động tối ưu do AI tính toán được kiểm tra dựa trên danh sách các ràng buộc an toàn nội bộ do người vận hành xác định. Sau khi được gửi đến trung tâm dữ liệu vật lý, hệ thống điều khiển cục bộ sẽ kiểm tra lại các lệnh. DeepMind AI giảm 40% năng lượng tiêu thụ để làm mát các trung tâm dữ liệu của Google .

Người vận hành luôn nắm quyền kiểm soát và có thể thoát khỏi chế độ AI bất cứ lúc nào, chuyển đổi liền mạch sang các quy tắc truyền thống.

Những hạn chế và cân nhắc về phương pháp luận

Chỉ số PUE và những hạn chế của nó

Ngành công nghiệp nhận ra những hạn chế của Hiệu quả Sử dụng Điện năng như một thước đo. Một khảo sát của Viện Uptime năm 2014 cho thấy 75% người tham gia tin rằng ngành công nghiệp cần một thước đo hiệu quả mới. Các vấn đề bao gồm sai lệch khí hậu (không thể so sánh các điều kiện khí hậu khác nhau), thao túng thời gian (đo lường trong điều kiện tối ưu) và loại trừ linh kiện.

Độ phức tạp khi triển khai

Mỗi trung tâm dữ liệu đều có kiến ​​trúc và môi trường riêng. Một mô hình tùy chỉnh cho một hệ thống có thể không áp dụng được cho hệ thống khác, đòi hỏi một khuôn khổ thông minh chung.

Chất lượng dữ liệu và xác minh

Độ chính xác của mô hình phụ thuộc vào chất lượng và số lượng dữ liệu đầu vào . Lỗi mô hình thường tăng đối với các giá trị PUE trên 1,14 do thiếu dữ liệu huấn luyện tương ứng.

Không có xác minh độc lập nào từ các công ty kiểm toán lớn hoặc phòng thí nghiệm quốc gia được tìm thấy, trong khi Google "không theo đuổi xác minh của bên thứ ba" ngoài các yêu cầu tối thiểu của liên bang.

Tương lai: Tiến hóa theo hướng làm mát bằng chất lỏng

Chuyển đổi công nghệ

Trong giai đoạn 2024-2025, Google đã chuyển trọng tâm đáng kể sang:

  • Hệ thống nguồn +/-400 VDC cho giá đỡ 1MW
  • Các đơn vị phân phối làm mát "Dự án Deschutes"
  • Làm mát bằng chất lỏng trực tiếp cho TPU v5p với "thời gian hoạt động 99,999%"

Sự thay đổi này cho thấy việc tối ưu hóa AI đã đạt đến giới hạn thực tế đối với tải nhiệt của các ứng dụng AI hiện đại .

Xu hướng mới nổi

  • Tích hợp điện toán biên : AI phân tán để giảm độ trễ
  • Bản sao kỹ thuật số : Bản sao kỹ thuật số cho mô phỏng nâng cao
  • Tập trung vào tính bền vững : Tối ưu hóa cho năng lượng tái tạo
  • Làm mát kết hợp : Kết hợp chất lỏng/không khí được tối ưu hóa bằng AI

Ứng dụng và Cơ hội cho Doanh nghiệp

Các lĩnh vực ứng dụng

Tối ưu hóa AI để làm mát có ứng dụng rộng rãi ngoài các trung tâm dữ liệu:

  • Nhà máy công nghiệp : Tối ưu hóa hệ thống HVAC sản xuất
  • Trung tâm mua sắm : Quản lý điều hòa thông minh
  • Bệnh viện : Kiểm soát môi trường trong phòng phẫu thuật và khu vực quan trọng
  • Văn phòng công ty : Quản lý tòa nhà và cơ sở thông minh

ROI và lợi ích kinh tế

Tiết kiệm năng lượng trong hệ thống làm mát được thể hiện qua:

  • Giảm chi phí vận hành hệ thống làm mát
  • Cải thiện tính bền vững của môi trường
  • Kéo dài tuổi thọ thiết bị
  • Độ tin cậy hoạt động cao hơn

Triển khai chiến lược cho các công ty

Lộ trình áp dụng

Giai đoạn 1 - Đánh giá : Kiểm toán năng lượng và lập bản đồ các hệ thống hiện có Giai đoạn 2 - Thí điểm : Thử nghiệm trong môi trường được kiểm soát trên một phần giới hạn Giai đoạn 3 - Triển khai : Triển khai dần dần với giám sát chuyên sâu Giai đoạn 4 - Tối ưu hóa : Điều chỉnh liên tục và mở rộng công suất

Những cân nhắc về mặt kỹ thuật

  • Cơ sở hạ tầng cảm biến : Mạng lưới giám sát hoàn chỉnh
  • Kỹ năng làm việc nhóm : Khoa học dữ liệu, quản lý cơ sở vật chất, an ninh mạng
  • Tích hợp : Khả năng tương thích với các hệ thống cũ
  • Tuân thủ : quy định về an toàn và môi trường

FAQ - Những câu hỏi thường gặp

1. Hệ thống AI thực sự đang hoạt động tại trung tâm dữ liệu nào của Google?

Ba trung tâm dữ liệu đã chính thức được xác nhận: Singapore (triển khai lần đầu năm 2016), Eemshaven ở Hà Lan và Council Bluffs ở Iowa. Hệ thống này hiện đang hoạt động tại nhiều trung tâm dữ liệu của Google, nhưng danh sách đầy đủ chưa bao giờ được công bố rộng rãi.

2. Thực tế nó tiết kiệm được bao nhiêu năng lượng trên tổng mức tiêu thụ?

Hệ thống đạt mức giảm 40% năng lượng tiêu thụ cho việc làm mát. Xét đến việc làm mát chiếm khoảng 10% tổng mức tiêu thụ, tổng mức tiết kiệm năng lượng đạt khoảng 4% tổng mức tiêu thụ của trung tâm dữ liệu.

3. Hệ thống dự báo có chính xác không?

Hệ thống đạt độ chính xác 99,6% trong dự đoán PUE với sai số tuyệt đối trung bình là 0,004 ± 0,005, tương đương với sai số 0,4% đối với PUE là 1,1 . Nếu PUE thực tế là 1,1, AI sẽ dự đoán trong khoảng từ 1,096 đến 1,104.

4. Làm thế nào để đảm bảo an toàn vận hành?

Hệ thống sử dụng xác minh hai cấp độ: đầu tiên, AI kiểm tra các ràng buộc an toàn do người vận hành thiết lập, sau đó hệ thống cục bộ xác minh lại các hướng dẫn. Người vận hành luôn có thể tắt kiểm tra AI và quay lại hệ thống truyền thống.

5. Phải mất bao lâu để triển khai một hệ thống như thế này?

Việc triển khai thường mất 6-18 tháng: 3-6 tháng để thu thập dữ liệu và đào tạo mô hình, 2-4 tháng để thử nghiệm thí điểm và 3-8 tháng để triển khai theo từng giai đoạn. Độ phức tạp thay đổi đáng kể tùy thuộc vào cơ sở hạ tầng hiện có.

6. Cần có những kỹ năng kỹ thuật nào?

Cần một đội ngũ đa ngành có chuyên môn về khoa học dữ liệu/AI, kỹ thuật HVAC, quản lý cơ sở vật chất, an ninh mạng và tích hợp hệ thống. Nhiều công ty lựa chọn hợp tác với các nhà cung cấp chuyên biệt.

7. Hệ thống có thể thích ứng với những thay đổi theo mùa không?

Có, AI tự động học cách khai thác các điều kiện theo mùa, chẳng hạn như tạo ra nước lạnh hơn vào mùa đông để giảm năng lượng làm mát. Hệ thống liên tục được cải thiện bằng cách nhận dạng các mô hình thời gian và khí hậu .

8. Tại sao Google không thương mại hóa công nghệ này?

Mỗi trung tâm dữ liệu có kiến ​​trúc và môi trường riêng biệt, đòi hỏi khả năng tùy chỉnh đáng kể. Tính phức tạp của việc triển khai, nhu cầu dữ liệu cụ thể và chuyên môn cần thiết khiến tiếp thị trực tiếp trở nên khó khăn. Sau tám năm, công nghệ này vẫn chỉ được Google sử dụng nội bộ.

9. Có kiểm toán hiệu suất độc lập không?

Không tìm thấy xác minh độc lập nào từ các công ty kiểm toán lớn (Deloitte, PwC, KPMG) hoặc các phòng thí nghiệm quốc gia. Google được chứng nhận ISO 50001 nhưng "không thực hiện xác minh của bên thứ ba" vượt quá các yêu cầu tối thiểu của liên bang.

10. Nó có áp dụng cho các ngành công nghiệp khác ngoài trung tâm dữ liệu không?

Hoàn toàn chính xác. Tối ưu hóa AI cho hệ thống làm mát có thể được áp dụng cho các nhà máy công nghiệp, trung tâm mua sắm, bệnh viện, văn phòng công ty và bất kỳ cơ sở nào có hệ thống HVAC phức tạp. Các nguyên tắc tối ưu hóa đa biến và điều khiển dự đoán có thể áp dụng rộng rãi.

Hệ thống làm mát AI DeepMind của Google là một bước đột phá về mặt kỹ thuật, mang lại những cải tiến gia tăng trong một lĩnh vực cụ thể. Đối với các công ty vận hành cơ sở hạ tầng tiêu thụ nhiều năng lượng, công nghệ này mang đến những cơ hội cụ thể để tối ưu hóa hệ thống làm mát, bất chấp những hạn chế về quy mô đã nêu ở trên.

Nguồn chính: Jim Gao Google Research Paper , DeepMind Official Blog , MIT Technology Review , Patent US20180204116A1

Tài nguyên cho sự phát triển kinh doanh

Ngày 9 tháng 11 năm 2025

Electe : Biến dữ liệu của bạn thành những dự đoán chính xác cho sự thành công trong kinh doanh

Các công ty dự đoán được xu hướng thị trường sẽ đánh bại đối thủ cạnh tranh, nhưng phần lớn vẫn quyết định dựa vào bản năng hơn là dữ liệu— Electe Nền tảng này giải quyết khoảng cách này bằng cách chuyển đổi dữ liệu lịch sử thành các dự đoán có thể thực hiện được bằng cách sử dụng máy học (ML) tiên tiến mà không yêu cầu chuyên môn kỹ thuật. Nền tảng này tự động hóa hoàn toàn quy trình dự đoán cho các trường hợp sử dụng quan trọng: dự báo xu hướng người tiêu dùng cho tiếp thị mục tiêu, tối ưu hóa quản lý hàng tồn kho bằng cách dự đoán nhu cầu, phân bổ nguồn lực một cách chiến lược và khám phá các cơ hội trước đối thủ cạnh tranh. Triển khai bốn bước không ma sát - tải dữ liệu lịch sử, chọn chỉ số để phân tích, thuật toán phát triển dự báo và sử dụng thông tin chi tiết cho các quyết định chiến lược - tích hợp liền mạch với các quy trình hiện có. ROI có thể đo lường được thông qua việc giảm chi phí thông qua lập kế hoạch chính xác, tăng tốc độ ra quyết định, giảm thiểu rủi ro hoạt động và xác định các cơ hội tăng trưởng mới. Sự phát triển từ phân tích mô tả (điều gì đã xảy ra) sang phân tích dự đoán (điều gì sẽ xảy ra) chuyển đổi các công ty từ bị động sang chủ động, định vị họ là những người dẫn đầu ngành nhờ lợi thế cạnh tranh dựa trên các dự báo chính xác.
Ngày 9 tháng 11 năm 2025

Nghịch lý AI tạo sinh: Các công ty đã lặp lại cùng một sai lầm trong 30 năm

78% công ty đã triển khai AI tạo sinh và 78% báo cáo không có tác động đến lợi nhuận—tại sao? Sai lầm tương tự như 30 năm qua: Đĩa CD-ROM cho danh mục giấy, trang web dưới dạng tài liệu quảng cáo, thiết bị di động = máy tính để bàn thu nhỏ, kỹ thuật số = giấy quét. 2025: Họ sử dụng ChatGPT để viết email nhanh hơn thay vì loại bỏ 70% email bằng cách suy nghĩ lại về giao tiếp. Số lượng thất bại: 92% sẽ tăng đầu tư vào AI nhưng chỉ có 1% có triển khai hoàn thiện, 90% thí điểm không đạt được sản xuất, 109,1 tỷ đô la được đầu tư vào Hoa Kỳ vào năm 2024. Nghiên cứu trường hợp thực tế (200 nhân viên): từ 2.100 email/ngày lên 630 trong 5 tháng bằng cách thay thế cập nhật trạng thái bằng bảng thông tin trực tiếp, phê duyệt bằng quy trình làm việc tự động, điều phối cuộc họp bằng lập lịch AI, chia sẻ thông tin bằng cơ sở kiến ​​thức thông minh—ROI trong 3 tháng. Các nhà lãnh đạo AI bắt đầu từ con số 0 đạt được mức tăng trưởng doanh thu gấp 1,5 lần, lợi nhuận cho cổ đông gấp 1,6 lần. Khung chống nghịch lý: kiểm toán tàn bạo ("Liệu điều này có tồn tại nếu tôi xây dựng lại từ đầu?"), loại bỏ triệt để, tái thiết AI trước. Câu hỏi sai: "Làm thế nào để chúng ta bổ sung AI?" Câu hỏi đúng: "Điều gì sẽ xảy ra nếu chúng ta tái tạo lại từ đầu ngay hôm nay?"