close Đăng nhập

DeepSeek tạo bước ngoặt cho ngành AI tiết kiệm năng lượng?

DeepSeek tuyên bố sử dụng ít năng lượng hơn nhiều so với các đối thủ cạnh tranh, nhưng vẫn còn nhiều câu hỏi lớn về tác động của ứng dụng này đối với môi trường.

DeepSeek tạo bước ngoặt cho ngành AI tiết kiệm năng lượng?

Chi phí đào tạo rẻ và tiết kiệm năng lượng

Tháng trước, DeepSeek đã khiến mọi người kinh ngạc khi tuyên bố rằng mô hình AI của họ chỉ sử dụng khoảng một phần mười lượng công suất tính toán so với mô hình Llama 3.1 của Meta, làm đảo lộn toàn bộ quan điểm của thế giới về năng lượng và tài nguyên cần thiết để phát triển AI.

Tuyên bố của DeepSeek khiến mọi người phải đánh giá lại tác động của AI lên môi trường. Các gã khổng lồ công nghệ vốn đang xây dựng các trung tâm dữ liệu AI khổng lồ, với kế hoạch sử dụng nhiều điện như các thành phố nhỏ. Việc tạo ra nhiều điện như vậy sẽ chiếm dụng tài nguyên năng lượng, làm trầm trọng thêm biến đổi khí hậu và làm chất lượng không khí xấu đi.

Giảm lượng năng lượng cần thiết để đào tạo và chạy các mô hình AI tạo sinh có thể làm giảm bớt phần lớn nguy cơ tác động xấu đến môi trường.

Sự ồn ào xung quanh DeepSeek bắt đầu với việc phát hành mô hình V3 vào tháng 12, chỉ tốn 5,6 triệu USD cho chi phí đào tạo AI và 2,78 triệu giờ GPU để đào tạo trên các chip H800 cũ hơn của NVIDIA, theo báo cáo kỹ thuật từ công ty.

Để so sánh, ứng dụng Llama 3.1 405B của Meta mặc dù sử dụng chip H100 mới hơn, hiệu quả hơn nhưng mất khoảng 30,8 triệu giờ GPU để đào tạo. Ước tính chi phí đào tạo cho Llama 3.1 405B là khoảng 60 triệu USD và từ 100 triệu đến 1 tỷ USD cho các mô hình tương đương.

deepseek gia co phieu.jpg
DeepSeek khiến giá cổ phiếu của các công ty công nghệ AI bốc hơi nhanh chóng

DeepSeek cho biết họ có thể cắt giảm lượng điện tiêu thụ bằng cách sử dụng các phương pháp đào tạo hiệu quả hơn. Về mặt kỹ thuật, họ sử dụng chiến lược chọn lọc các phần của mô hình được đào tạo - không phải đào tạo toàn bộ mô hình cùng một lúc.

Mô hình cũng tiết kiệm năng lượng khi thực hiện suy luận. Phương pháp suy luận của DeepSeek tương tự như tham chiếu các thẻ chỉ mục với các phần tóm tắt chi tiết các chương của cuốn sách, thay vì phải đọc toàn bộ cuốn sách đã được tóm tắt, Madalsa Singh, nghiên cứu viên sau tiến sĩ tại Đại học California, Santa Barbara, người nghiên cứu về hệ thống năng lượng giải thích.

Các mô hình của DeepSeek chủ yếu là mã nguồn mở, trừ dữ liệu đào tạo. Với cách tiếp cận này, các nhà nghiên cứu có thể học hỏi lẫn nhau nhanh hơn và mở ra cánh cửa cho những người chơi nhỏ hơn tham gia vào ngành AI.

Vẫn còn những hoài nghi về hiệu quả của DeepSeek

"Chúng tôi đã đào sâu vào DeepSeek, nhưng rất khó để tìm thấy bất kỳ thông tin cụ thể nào về mức tiêu thụ năng lượng của chương trình", Carlos Torres Diaz, giám đốc nghiên cứu năng lượng tại Rystad Energy nói.

Nếu những gì DeepSeek tuyên bố về mức sử dụng năng lượng của mình là đúng, điều đó có thể cắt giảm tổng mức tiêu thụ năng lượng của một trung tâm dữ liệu, ông Torres Diaz viết.

Hiện nay, các công ty công nghệ lớn đã ký một loạt các thỏa thuận để mua năng lượng tái tạo. Nhu cầu điện tăng cao từ các trung tâm dữ liệu có nguy cơ hút cạn các nguồn năng lượng điện mặt trời và điện gió từ lưới điện.

trung tam du lieu.jpg
Các trung tâm dữ liệu là nơi tiêu thụ rất nhiều năng lượng điện và nước

Theo ông Torres Diaz, việc giảm mức tiêu thụ điện của AI sẽ giúp nhiều năng lượng tái tạo hơn có sẵn cho các lĩnh vực khác, giúp thay thế nhanh hơn việc sử dụng nhiên liệu hóa thạch.

Trung Quốc hiện đang lấy hơn 60% điện từ than đá và 3% khác đến từ khí đốt. Mỹ cũng lấy khoảng 60% điện từ nhiên liệu hóa thạch, nhưng phần lớn trong số đó đến từ khí đốt - loại nhiên liệu tạo ra ít ô nhiễm carbon dioxide hơn so với than đá.

Điều đáng ngại là các công ty năng lượng đang trì hoãn việc ngừng hoạt động của các nhà máy điện nhiên liệu hóa thạch tại Mỹ để đáp ứng nhu cầu tăng vọt từ các trung tâm dữ liệu. Một số thậm chí còn có kế hoạch xây dựng các nhà máy khí đốt mới.

Các trung tâm dữ liệu cũng ngốn rất nhiều nước để giữ cho phần cứng không bị quá nhiệt, điều này có thể dẫn đến nguy cơ hạn hán ở các khu vực ít nguồn nước.

Theo báo cáo tháng 12 từ Phòng thí nghiệm Lawrence Berkeley, các trung tâm dữ liệu đã tiêu thụ hơn 4% điện năng ở Mỹ vào năm 2023 và con số đó có thể tăng gần gấp ba lần lên khoảng 12% vào năm 2028.

Theo Theverge

The Verge

Chuyển đổi số

VNeID trở thành “cổng bầu cử bỏ túi”

VNeID trở thành “cổng bầu cử bỏ túi”

Tra cứu nơi bỏ phiếu, tìm hiểu thông tin ứng cử viên, đổi địa điểm bầu cử chỉ bằng vài thao tác trên điện thoại, VNeID đang trở thành “cổng bầu cử số” đối với cử tri có định danh mức độ 2.

Ứng dụng Tuyên giáo và Dân vận giúp người dân nắm bắt thông tin và tương tác, phản ánh trực tiếp với cơ quan chức năng.

Lá chắn trước ma trận tin tức lề trái

Giữa ma trận tin tức lề trái về vấn đề Gaza, ứng dụng Tuyên giáo và Dân vận giúp người dân kiểm chứng thông tin, củng cố niềm tin vào chủ trương, chính sách của Đảng và Nhà nước.

Sáng kiến khoa học và ứng dụng (AI) vào khám sàng lọc ở Thái Nguyên (ảnh minh họa)

300 sáng kiến khoa học công nghệ được tài trợ kinh phí

Trong hơn 1.000 sáng kiến từ các tổ chức, cá nhân, doanh nghiệp và chuyên gia trong và ngoài nước được tiếp nhận qua Cổng Sáng kiến Khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số, có hơn 300 sáng kiến đã được tài trợ kinh phí.

"Vũ khí" mới ngăn tội phạm tài sản số

"Vũ khí" mới ngăn tội phạm tài sản số

Giống như các loại tội phạm khác, tội phạm tài sản số không mất đi, nó sẽ phát triển ngày càng tinh vi. Để ngăn loại tội phạm này, cần những loại “vũ khí” mới…

Anh Lăng Trường Chinh, Phó Phòng Kinh tế Xã Vân Nham

Khi AI thành “đồng nghiệp” của cán bộ xã

AI đã bước vào phòng làm việc của cán bộ, công chức xã miền núi. Từ những thao tác nhỏ hằng ngày, công nghệ mở lối đổi mới cách làm việc ở chính quyền cơ sở, giúp công chức giảm áp lực hành chính, dành nhiều thời gian để gần dân và phục vụ dân.