close Đăng nhập

Dùng AI đắt hơn thuê người, các tập đoàn công nghệ lần lượt nhấn nút dừng

Các ông lớn công nghệ như Microsoft, Uber và Meta đối mặt với chi phí AI cao ngất, khiến họ phải cắt giảm quyền truy cập và điều chỉnh chiến lược sử dụng AI nội bộ.

Nhiều tập đoàn công nghệ lớn lặng lẽ "đạp phanh" việc khuyến khích sử dụng AI vì chi phí đắt đỏ hơn thuê người. Ảnh: Creaders.
Nhiều tập đoàn công nghệ lớn lặng lẽ "đạp phanh" việc khuyến khích sử dụng AI vì chi phí đắt đỏ hơn thuê người. Ảnh: Creaders.

Microsoft, Uber, Meta, Amazon - những gã khổng lồ công nghệ năm ngoái còn phất cao lá cờ AI - sẵn sàng chi đậm để mua GPU và đua năng lực tính toán. Ai có thể ngờ rằng chỉ một năm sau, họ lại âm thầm làm cùng một việc: cắt quyền sử dụng công cụ AI của kỹ sư nội bộ.

Tháng 5/2026, một bài viết của Fortune đã hé lộ phần nổi của tảng băng này. Microsoft đã hủy phần lớn quyền truy cập trực tiếp vào Claude Code, đưa các kỹ sư quay trở lại với GitHub Copilot - công cụ AI hỗ trợ lập trình do GitHub và Microsoft phát triển.

Điều đáng chú ý là Microsoft chính là một trong những nhà đầu tư lớn của Anthropic, với khoản đầu tư lên tới 5 tỷ USD. Nhưng ngay cả nhà đầu tư cũng không còn “chịu nổi” chi phí sử dụng công cụ AI mà mình đầu tư. Đằng sau điều đó là một sự thật đủ khiến cả Thung lũng Silicon mất ngủ: AI không những không giúp tiết kiệm tiền, mà còn đắt hơn thuê người.

microsoft-stop-claude.png
Microsoft đã hủy bỏ quyền truy cập Claude Code của các kỹ sư. Ảnh: Sohu.

Một cuộc “cắt khẩu phần” tập thể trong im lặng

Tháng 1/2026, Microsoft lần đầu mở quyền sử dụng Claude Code trong nội bộ, khuyến khích hàng nghìn lập trình viên, quản lý dự án và nhà thiết kế “dùng thử”. AI viết code quả thực rất tiện. Các kỹ sư Microsoft nhanh chóng nghiện công cụ này, lượng sử dụng tăng phi mã. Nhưng đến tháng 4, khi hóa đơn được gửi tới, tất cả đều im lặng.

Cũng trong tháng 4, Praveen Neppalli Naga, CTO (Giám đốc công nghệ) của Uber gửi một bản ghi nhớ nội bộ gây sốc: Ngân sách dành cho công cụ AI của cả năm 2026 đã bị tiêu sạch chỉ sau 4 tháng.

Đáng sợ hơn, chỉ riêng một buổi demo kéo dài hai giờ của CTO đã “đốt” tới 1.200 USD, còn các kỹ sư AI của công ty có chi phí gọi API dao động từ 500 đến 2.000 USD mỗi người mỗi tháng. Tin này khiến giới công nghệ chấn động.

Meta cũng không đứng ngoài cuộc. Một nhân viên thậm chí tạo bảng xếp hạng mang tên “Claudeonomics” để theo dõi ai đang tiêu tốn nhiều tài nguyên AI nhất.

Amazon còn sáng tạo ra thuật ngữ “Tokenmaxxing”, khuyến khích nhân viên tiêu thụ càng nhiều token AI càng tốt. Kết quả là không ai thoát khỏi “cú đấm hóa đơn token”.

Khi được hỏi về vấn đề này, Bryan Catanzaro, Phó chủ tịch phụ trách deep learning của Nvidia, thẳng thắn nói: “Trong đội của tôi, chi phí tính toán đã vượt xa chi phí nhân sự”.

Những báo cáo này như gáo nước lạnh dội vào “canh bạc AI” của các ông lớn công nghệ. Dù nhiều người vẫn bám vào lời hứa về một cuộc “phục hưng” hay “cách mạng AI”, chi phí triển khai đang trở thành nút thắt khó giải quyết. Điều này cũng cho thấy bài toán kinh tế của việc dùng AI để thay thế hoặc tăng cường lao động con người phức tạp hơn nhiều so với các dự đoán ban đầu.

quay-lai-voi-github.jpg
Các kỹ sư của Microsoft phải quay trở lại với GitHub Copilot - công cụ AI hỗ trợ lập trình do GitHub và Microsoft phát triển. Ảnh: Sohu.

Cội nguồn của bế tắc: “Nghịch lý Jevons” phiên bản AI

Từ thế kỷ 19, nhà kinh tế học Anh William Stanley Jevons nhận thấy rằng khi hiệu suất động cơ hơi nước tăng gấp đôi, lượng than tiêu thụ của Anh không giảm mà còn tăng mạnh gấp mười lần, đó là “Nghịch lý Jevons”: Khi công nghệ hiệu quả hơn, con người sẽ dùng nhiều hơn, khiến tổng tiêu thụ tăng vọt.

Trong thị trường AI năm 2026, quy luật này đang lặp lại hoàn hảo. Ai cũng biết giá token đang giảm. Một số mô hình lớn từng có chi phí token cực cao giờ đã rẻ đến mức người dùng bình thường gần như không cảm nhận được. Gartner thậm chí dự đoán chi phí suy luận của mô hình nghìn tỷ tham số đến năm 2030 sẽ giảm gần 90%.

Nhưng vấn đề là hành vi con người đã thay đổi. Trước đây AI chỉ là hệ thống hỏi – đáp: khi hỏi một câu, AI trả lời một câu, tiêu vài trăm token là xong.

Giờ AI là hệ thống thực thi: Ví dụ yêu cầu “Lên kế hoạch chuyến du lịch Nhật Bản 5 ngày cho tôi”. AI sẽ lập lộ trình, tìm vé máy bay, so sánh giá theo thời gian thực, lên bản đồ, tạo checklist…Toàn bộ quy trình có thể cần hàng trăm vòng suy luận, tiêu tốn hàng chục nghìn hoặc hàng trăm nghìn token.

JPMorgan Chase dự đoán lượng token AI suy luận tại Trung Quốc đến năm 2030 sẽ tăng khoảng 370 lần so với năm 2025. Goldman Sachs dự báo mức tăng toàn cầu là 24 lần. Giá token giảm, nhưng tốc độ tăng sử dụng còn nhanh hơn rất nhiều.

Nguy hiểm hơn, khi doanh nghiệp chuyển từ “mua GPU cố định” sang “trả phí theo mức dùng”, chi phí không còn cố định nữa mà tăng theo kiểu tuyết lở.

nsh-canh-bao.jpg
CEO Nvidia Jensen Huang là người tích cực quảng bá sử dụng AI. Ảnh: Getty.

Ngành chịu ảnh hưởng mạnh nhất

Lệnh “cấm dùng AI” của Microsoft và Uber không chỉ tác động đến kỹ sư nội bộ, mà còn đang làm lung lay nền tảng kinh doanh của toàn ngành phần mềm.

Tháng 5 năm nay, nhà phân tích Gabriela Borges của Goldman Sachs đưa ra một con số gây lo ngại: Kể từ tháng 9/2025, ngành SaaS (Software as a Service - mô hình cung cấp phần mềm qua Internet theo dạng thuê bao) và phần mềm doanh nghiệp toàn cầu đã bốc hơi hơn 1 nghìn tỷ USD vốn hóa.

Mô hình “thu phí theo số lượng tài khoản” từng thống trị suốt một thập kỷ đang bị một kẻ thù vô hình là AI Agent phá hủy.

Trước đây, doanh nghiệp phải mua ERP (phần mềm quản lý tổng thể doanh nghiệp), CRM (hệ thống quản lý quan hệ khách hàng),…Mỗi nhân viên là một tài khoản trả phí hàng tháng. Giờ đây, chỉ một AI Agent có thể viết tài liệu, làm bảng tính, tra cứu dữ liệu, sắp xếp lịch, xử lý CSKH, phân tích tài chính…không cần học giao diện phức tạp, chỉ cần giao tiếp bằng ngôn ngữ tự nhiên.

Nhưng nghịch lý nằm ở chỗ AI dường như đang “thay thế” phần mềm, nhưng bản thân AI lại là người dùng phần mềm lớn nhất. AI Agent không phải vị thần tự nhiên có mọi năng lực ngành nghề. Dù mạnh đến đâu, nó vẫn phải gọi các khả năng phần mềm phía sau.

CEO Nvidia Jensen Huang gần đây nói ông tin rằng trong tương lai, mỗi nhân viên sẽ có khoảng 100 AI agent làm việc cùng. Ông là một trong nhiều CEO đang quảng bá viễn cảnh “tương lai agent”, nơi các “nhân viên kỹ thuật số” sẽ hoạt động khắp doanh nghiệp.

Nhưng nếu tốc độ tiêu thụ token tăng nhanh hơn tốc độ giảm chi phí đơn vị, thì cái giá của tương lai đó có thể sẽ cao hơn rất nhiều so với dự tính của các lãnh đạo doanh nghiệp.

Theo Creaders, NetEase

Thế giới

Tổng thống Trump vẫy tay khi trở về Nhà Trắng vào ngày 25/5. Ảnh: AFP.

Ông Trump họp nội các khẩn tại Trại David

Tổng thống Donald Trump triệu tập toàn bộ nội các tới Trại David giữa lúc Mỹ không kích Iran, Tehran dọa đáp trả và các cuộc đàm phán hòa bình bước vào giai đoạn quyết định.