Trí tuệ nhân tạo được áp dụng vào việc làm mát trung tâm dữ liệu là một trong những cải tiến quan trọng nhất trong việc tối ưu hóa năng lượng công nghiệp.
Hệ thống tự động do Google DeepMind phát triển, hoạt động từ năm 2018, đã chứng minh AI có thể chuyển đổi cách quản lý nhiệt của cơ sở hạ tầng quan trọng, đạt được kết quả cụ thể về hiệu quả hoạt động.
Theo Jonathan Koomey, chuyên gia toàn cầu về hiệu quả năng lượng, các trung tâm dữ liệu hiện đại tiêu thụ rất nhiều năng lượng, trong đó hệ thống làm mát chiếm khoảng 10% tổng mức tiêu thụ điện. Cứ mỗi năm phút, hệ thống AI dựa trên đám mây của Google lại chụp ảnh nhanh hệ thống làm mát từ hàng nghìn cảm biến, phân tích độ phức tạp vận hành, thách thức các phương pháp kiểm soát truyền thống.
Hệ thống làm mát bằng AI của Google sử dụng mạng nơ-ron sâu để dự đoán tác động của các tổ hợp hành động khác nhau lên mức tiêu thụ năng lượng trong tương lai, xác định hành động nào sẽ giảm thiểu mức tiêu thụ năng lượng đồng thời đáp ứng các ràng buộc an toàn nghiêm ngặt . DeepMind AI giúp giảm 40% chi phí làm mát trung tâm dữ liệu của Google - Google DeepMind .
Kết quả đạt được trong việc tối ưu hóa hệ thống làm mát rất đáng kể: hệ thống liên tục đạt được mức giảm 40% năng lượng sử dụng cho hệ thống làm mát . Tuy nhiên, xét đến việc hệ thống làm mát chỉ chiếm khoảng 10% tổng mức tiêu thụ, con số này tương đương với mức tiết kiệm năng lượng tổng thể cho trung tâm dữ liệu khoảng 4%.
Theo bài báo kỹ thuật gốc của Jim Gao , mạng nơ-ron đạt được sai số tuyệt đối trung bình là 0,004 và độ lệch chuẩn là 0,005, tương đương với sai số 0,4% đối với PUE là 1,1.
Việc triển khai hệ thống AI đã được chính thức xác nhận tại ba trung tâm dữ liệu cụ thể :
Singapore : Triển khai đáng kể đầu tiên vào năm 2016, nơi trung tâm dữ liệu sử dụng nước tái chế để làm mát và chứng minh khả năng giảm 40% năng lượng làm mát.
Eemshaven, Hà Lan : Trung tâm dữ liệu sử dụng nước đạt chuẩn công nghiệp và tiêu thụ 232 triệu gallon nước vào năm 2023. Marco Ynema, người quản lý cơ sở này , giám sát hoạt động tại cơ sở tiên tiến này.
Council Bluffs, Iowa : Tạp chí MIT Technology Review đã đặc biệt giới thiệu trung tâm dữ liệu Council Bluffs trong cuộc thảo luận về hệ thống AI. Google đã đầu tư 5 tỷ đô la vào hai cơ sở của mình tại Council Bluffs, dự kiến sẽ tiêu thụ 980,1 triệu gallon nước vào năm 2023.
Hệ thống điều khiển AI dựa trên nền tảng đám mây hiện đang hoạt động và cung cấp khả năng tiết kiệm năng lượng tại nhiều trung tâm dữ liệu của Google, nhưng công ty vẫn chưa công bố danh sách đầy đủ các cơ sở sử dụng công nghệ này.
Theo bằng sáng chế US20180204116A1 , hệ thống sử dụng kiến trúc học sâu với các đặc điểm kỹ thuật chính xác:
Kiến trúc này sử dụng Kiểm soát Dự đoán Mô hình (Model Predictive Control) với các mô hình ARX tuyến tính được tích hợp với mạng nơ-ron sâu. Mạng nơ-ron không yêu cầu người dùng phải xác định trước các tương tác giữa các biến trong mô hình. Thay vào đó, mạng nơ-ron tìm kiếm các mẫu và tương tác giữa các đặc trưng để tự động tạo ra một mô hình tối ưu.
PUE thể hiện hiệu quả năng lượng cơ bản của các trung tâm dữ liệu:
PUE = Tổng năng lượng trung tâm dữ liệu / Năng lượng thiết bị CNTT
Google được chứng nhận ISO 50001 về quản lý năng lượng, đảm bảo các tiêu chuẩn vận hành nghiêm ngặt nhưng không xác nhận cụ thể hiệu suất của hệ thống AI.
Cốt lõi của sự đổi mới này là khả năng kiểm soát dự đoán , dự báo nhiệt độ và áp suất của trung tâm dữ liệu trong tương lai trong giờ tiếp theo, mô phỏng các hành động được đề xuất để đảm bảo không vượt quá các ràng buộc vận hành.
Sau khi thử nghiệm và sai sót, các mô hình hiện có độ chính xác 99,6% trong việc dự đoán PUE . Độ chính xác này cho phép tối ưu hóa những điều không thể thực hiện được bằng các phương pháp truyền thống, đồng thời quản lý các tương tác phi tuyến tính phức tạp giữa các hệ thống cơ học, điện và môi trường.
Một khía cạnh quan trọng là khả năng học hỏi theo tiến hóa . Trong suốt chín tháng, hiệu suất của hệ thống đã tăng từ mức cải thiện 12% khi mới ra mắt lên khoảng 30%.
Nhà điều hành Google Dan Fuenffinger nhận xét: "Thật đáng kinh ngạc khi thấy AI học cách tận dụng điều kiện mùa đông và tạo ra nước lạnh hơn bình thường. Các quy tắc không được cải thiện theo thời gian, nhưng AI thì có."
Hệ thống quản lý đồng thời 19 thông số vận hành quan trọng :
An toàn vận hành được đảm bảo thông qua các cơ chế dự phòng . Các hành động tối ưu do AI tính toán được kiểm tra dựa trên danh sách các ràng buộc an toàn nội bộ do người vận hành xác định. Sau khi được gửi đến trung tâm dữ liệu vật lý, hệ thống điều khiển cục bộ sẽ kiểm tra lại các lệnh. DeepMind AI giảm 40% năng lượng tiêu thụ để làm mát các trung tâm dữ liệu của Google .
Người vận hành luôn nắm quyền kiểm soát và có thể thoát khỏi chế độ AI bất cứ lúc nào, chuyển đổi liền mạch sang các quy tắc truyền thống.
Ngành công nghiệp nhận ra những hạn chế của Hiệu quả Sử dụng Điện năng như một thước đo. Một khảo sát của Viện Uptime năm 2014 cho thấy 75% người tham gia tin rằng ngành công nghiệp cần một thước đo hiệu quả mới. Các vấn đề bao gồm sai lệch khí hậu (không thể so sánh các điều kiện khí hậu khác nhau), thao túng thời gian (đo lường trong điều kiện tối ưu) và loại trừ linh kiện.
Mỗi trung tâm dữ liệu đều có kiến trúc và môi trường riêng. Một mô hình tùy chỉnh cho một hệ thống có thể không áp dụng được cho hệ thống khác, đòi hỏi một khuôn khổ thông minh chung.
Độ chính xác của mô hình phụ thuộc vào chất lượng và số lượng dữ liệu đầu vào . Lỗi mô hình thường tăng đối với các giá trị PUE trên 1,14 do thiếu dữ liệu huấn luyện tương ứng.
Không có xác minh độc lập nào từ các công ty kiểm toán lớn hoặc phòng thí nghiệm quốc gia được tìm thấy, trong khi Google "không theo đuổi xác minh của bên thứ ba" ngoài các yêu cầu tối thiểu của liên bang.
Trong giai đoạn 2024-2025, Google đã chuyển trọng tâm đáng kể sang:
Sự thay đổi này cho thấy việc tối ưu hóa AI đã đạt đến giới hạn thực tế đối với tải nhiệt của các ứng dụng AI hiện đại .
Tối ưu hóa AI để làm mát có ứng dụng rộng rãi ngoài các trung tâm dữ liệu:
Tiết kiệm năng lượng trong hệ thống làm mát được thể hiện qua:
Giai đoạn 1 - Đánh giá : Kiểm toán năng lượng và lập bản đồ các hệ thống hiện có Giai đoạn 2 - Thí điểm : Thử nghiệm trong môi trường được kiểm soát trên một phần giới hạn Giai đoạn 3 - Triển khai : Triển khai dần dần với giám sát chuyên sâu Giai đoạn 4 - Tối ưu hóa : Điều chỉnh liên tục và mở rộng công suất
Ba trung tâm dữ liệu đã chính thức được xác nhận: Singapore (triển khai lần đầu năm 2016), Eemshaven ở Hà Lan và Council Bluffs ở Iowa. Hệ thống này hiện đang hoạt động tại nhiều trung tâm dữ liệu của Google, nhưng danh sách đầy đủ chưa bao giờ được công bố rộng rãi.
Hệ thống đạt mức giảm 40% năng lượng tiêu thụ cho việc làm mát. Xét đến việc làm mát chiếm khoảng 10% tổng mức tiêu thụ, tổng mức tiết kiệm năng lượng đạt khoảng 4% tổng mức tiêu thụ của trung tâm dữ liệu.
Hệ thống đạt độ chính xác 99,6% trong dự đoán PUE với sai số tuyệt đối trung bình là 0,004 ± 0,005, tương đương với sai số 0,4% đối với PUE là 1,1 . Nếu PUE thực tế là 1,1, AI sẽ dự đoán trong khoảng từ 1,096 đến 1,104.
Hệ thống sử dụng xác minh hai cấp độ: đầu tiên, AI kiểm tra các ràng buộc an toàn do người vận hành thiết lập, sau đó hệ thống cục bộ xác minh lại các hướng dẫn. Người vận hành luôn có thể tắt kiểm tra AI và quay lại hệ thống truyền thống.
Việc triển khai thường mất 6-18 tháng: 3-6 tháng để thu thập dữ liệu và đào tạo mô hình, 2-4 tháng để thử nghiệm thí điểm và 3-8 tháng để triển khai theo từng giai đoạn. Độ phức tạp thay đổi đáng kể tùy thuộc vào cơ sở hạ tầng hiện có.
Cần một đội ngũ đa ngành có chuyên môn về khoa học dữ liệu/AI, kỹ thuật HVAC, quản lý cơ sở vật chất, an ninh mạng và tích hợp hệ thống. Nhiều công ty lựa chọn hợp tác với các nhà cung cấp chuyên biệt.
Có, AI tự động học cách khai thác các điều kiện theo mùa, chẳng hạn như tạo ra nước lạnh hơn vào mùa đông để giảm năng lượng làm mát. Hệ thống liên tục được cải thiện bằng cách nhận dạng các mô hình thời gian và khí hậu .
Mỗi trung tâm dữ liệu có kiến trúc và môi trường riêng biệt, đòi hỏi khả năng tùy chỉnh đáng kể. Tính phức tạp của việc triển khai, nhu cầu dữ liệu cụ thể và chuyên môn cần thiết khiến tiếp thị trực tiếp trở nên khó khăn. Sau tám năm, công nghệ này vẫn chỉ được Google sử dụng nội bộ.
Không tìm thấy xác minh độc lập nào từ các công ty kiểm toán lớn (Deloitte, PwC, KPMG) hoặc các phòng thí nghiệm quốc gia. Google được chứng nhận ISO 50001 nhưng "không thực hiện xác minh của bên thứ ba" vượt quá các yêu cầu tối thiểu của liên bang.
Hoàn toàn chính xác. Tối ưu hóa AI cho hệ thống làm mát có thể được áp dụng cho các nhà máy công nghiệp, trung tâm mua sắm, bệnh viện, văn phòng công ty và bất kỳ cơ sở nào có hệ thống HVAC phức tạp. Các nguyên tắc tối ưu hóa đa biến và điều khiển dự đoán có thể áp dụng rộng rãi.
Hệ thống làm mát AI DeepMind của Google là một bước đột phá về mặt kỹ thuật, mang lại những cải tiến gia tăng trong một lĩnh vực cụ thể. Đối với các công ty vận hành cơ sở hạ tầng tiêu thụ nhiều năng lượng, công nghệ này mang đến những cơ hội cụ thể để tối ưu hóa hệ thống làm mát, bất chấp những hạn chế về quy mô đã nêu ở trên.
Nguồn chính: Jim Gao Google Research Paper , DeepMind Official Blog , MIT Technology Review , Patent US20180204116A1