Nguy hiểm: Tin tặc đang sử dụng AI để tấn công AI

30/03/2025 13:08

Sự phát triển của trí tuệ nhân tạo (AI) đã mang lại nhiều lợi ích vượt trội, từ tối ưu hóa quy trình sản xuất đến hỗ trợ xử lý dữ liệu quy mô lớn. Tuy nhiên, cùng với đó, các mối đe dọa an ninh mạng cũng ngày càng gia tăng.

Hacker đang sử dụng những kỹ thuật mới để tấn công các mô hình AI. Ảnh: aigroup

Một trong những xu hướng đáng lo ngại hiện nay là tin tặc đang lợi dụng AI để tấn công chính các hệ thống AI, sử dụng các kỹ thuật như "tiêm lệnh" (prompt injection) để làm gián đoạn hoặc điều khiển các mô hình ngôn ngữ lớn (LLM).

Theo trang công nghệ BGR, gần đây, một nhóm nghiên cứu đã phát hiện thêm một phương pháp tấn công mới có tên "Fun-Tuning", giúp tin tặc dễ dàng khai thác lỗ hổng của các mô hình AI, đặc biệt là các mô hình đóng như Google Gemini.

Với tỷ lệ thành công lên tới 82%, Fun-Tuning đang đặt ra thách thức nghiêm trọng đối với an ninh mạng và buộc các nhà phát triển AI phải tìm ra biện pháp phòng thủ hiệu quả hơn.

Kỹ thuật "tiêm lệnh" và mối đe dọa đối với các mô hình ngôn ngữ lớn

"Tiêm lệnh" (prompt injection) là một kỹ thuật tấn công trong đó tin tặc đưa các chỉ thị độc hại vào đầu vào của mô hình ngôn ngữ lớn nhằm điều khiển hoặc khai thác hệ thống. Bằng cách cài cắm những đoạn văn bản đặc biệt, kẻ tấn công có thể khiến AI thực hiện những hành vi ngoài dự kiến, chẳng hạn như tiết lộ thông tin nhạy cảm, tạo nội dung sai lệch hoặc thậm chí làm rò rỉ dữ liệu của người dùng.

Kỹ thuật này đã xuất hiện từ lâu, nhưng thường bị hạn chế bởi tỷ lệ thành công thấp, đặc biệt là khi tấn công các mô hình ngôn ngữ mạnh như GPT-4 của OpenAI hay Gemini của Google. Tuy nhiên, với sự hỗ trợ của AI, tin tặc giờ đây có thể tăng hiệu suất của các cuộc tấn công này một cách đáng kể.

Một trong những ví dụ đáng chú ý của "tiêm lệnh" là việc lợi dụng AI để vượt qua các rào cản kiểm duyệt. Chẳng hạn, kẻ tấn công có thể yêu cầu AI "giả vờ là một nhân vật trong truyện tranh" và sau đó lồng ghép các lệnh độc hại vào cuộc trò chuyện. Điều này khiến mô hình khó phân biệt giữa yêu cầu hợp lệ và lệnh tấn công, dẫn đến việc AI vô tình cung cấp thông tin mà nó không nên tiết lộ.

Fun-Tuning: Công cụ tấn công AI mới đầy nguy hiểm

Fun-Tuning là một kỹ thuật mới được phát triển để nâng cao hiệu quả của các cuộc tấn công "tiêm lệnh". Điểm đặc biệt của phương pháp này là nó tận dụng chính API tinh chỉnh (fine-tuning) của Google để "huấn luyện" các câu lệnh tấn công sao cho hiệu quả hơn.

Cụ thể, Fun-Tuning sử dụng AI để tìm ra các "tiền tố" và "hậu tố" tối ưu, giúp tăng xác suất thành công của một lệnh độc hại. Kết quả thử nghiệm cho thấy, trong khi các phương pháp tiêm lệnh truyền thống chỉ có tỷ lệ thành công dưới 30%, thì Fun-Tuning có thể nâng tỷ lệ này lên 82%.

Ngoài ra, một điểm đáng lo ngại là các câu lệnh độc hại được tối ưu hóa thông qua Fun-Tuning có thể dễ dàng được chuyển đổi và áp dụng vào các phiên bản khác nhau của cùng một mô hình AI. Điều này có nghĩa là nếu một lệnh tấn công hoạt động hiệu quả trên một phiên bản Gemini, thì nó cũng có thể hoạt động trên các phiên bản Gemini khác mà không cần chỉnh sửa nhiều. Đây là một lợi thế lớn đối với tin tặc, giúp chúng triển khai các cuộc tấn công một cách nhanh chóng và dễ dàng hơn.

Hơn nữa, do Google cho phép các nhà phát triển sử dụng API tinh chỉnh để tùy chỉnh mô hình AI theo nhu cầu riêng, tin tặc có thể tận dụng điều này để đào tạo AI theo hướng phục vụ các mục đích xấu. Điều này đặt ra câu hỏi liệu các công ty AI có nên giới hạn khả năng tinh chỉnh của các mô hình AI hay không, để ngăn chặn việc chúng bị khai thác vào mục đích xấu.

Hệ quả và biện pháp đối phó

Sự xuất hiện của Fun-Tuning là một hồi chuông cảnh báo đối với lĩnh vực an ninh mạng. Nếu không có biện pháp đối phó phù hợp, các hệ thống AI có thể bị khai thác theo những cách không ngờ tới, gây thiệt hại lớn cho cả cá nhân lẫn tổ chức.

Hiện tại, Google đã thừa nhận vấn đề này nhưng chưa công bố giải pháp cụ thể để điều chỉnh các tính năng tinh chỉnh của mình. Một số chuyên gia cho rằng cách tốt nhất để ngăn chặn các cuộc tấn công kiểu này là thiết lập các bộ lọc thông minh hơn để phát hiện và vô hiệu hóa các câu lệnh độc hại trước khi chúng được xử lý bởi AI. Ngoài ra, một số biện pháp khác có thể được áp dụng bao gồm:

Hạn chế quyền tinh chỉnh: Các công ty AI có thể giới hạn mức độ tinh chỉnh mà người dùng có thể thực hiện trên mô hình, đặc biệt là đối với các hệ thống có thể bị lạm dụng.

Cải thiện bộ lọc đầu vào: Xây dựng các cơ chế kiểm tra và lọc dữ liệu đầu vào kỹ lưỡng hơn để phát hiện và loại bỏ các lệnh độc hại trước khi chúng ảnh hưởng đến mô hình AI.

Tăng cường giám sát: Các công ty AI nên triển khai các công cụ giám sát tự động để phát hiện các hành vi bất thường trong quá trình sử dụng API tinh chỉnh.

Nâng cao nhận thức: Người dùng AI, đặc biệt là các doanh nghiệp và tổ chức, cần được đào tạo để nhận diện và phòng tránh các cuộc tấn công dựa trên AI.

Mặc dù các biện pháp trên có thể giúp giảm thiểu nguy cơ, nhưng thực tế là tin tặc cũng đang ngày càng sáng tạo hơn trong việc khai thác AI để tìm ra lỗ hổng mới. Vì vậy, các chuyên gia bảo mật và AI cần phải tìm ra các giải pháp tiên tiến để theo kịp sự phát triển của các kỹ thuật tấn công.

Từ khóa:

#An ninh mạng #An toàn thông tin #AI #Trí tuệ nhân tạo

Nguy cơ điện toán lượng tử phá vỡ hệ thống mật mã hiện nay

Bà Tô Thị Thu Hương, Giám đốc Trung tâm Chứng thực điện tử quốc gia (NEAC), cho rằng những hệ thống vốn được coi là đáng tin cậy có thể bị phá vỡ trong tương lai nếu không có hành động kịp thời trước sự phát triển của điện toán lượng tử.

Thủ tướng yêu cầu tăng tốc giải ngân vốn cho khoa học, công nghệ và chuyển đổi số

Thủ tướng yêu cầu tăng tốc triển khai các nhiệm vụ KHCN, đổi mới sáng tạo và chuyển đổi số trong năm 2026, coi hiệu quả giải ngân là thước đo thực chất của đầu tư, đồng thời khẩn trương tháo gỡ các điểm nghẽn về cơ chế, chính sách.

Xóa tư duy "không quản được thì cấm" và các thủ tục biến tướng trong KHCN, viễn thông

Phó Chủ tịch Quốc hội Nguyễn Hồng Diên đề nghị quá trình sửa đổi 4 luật trong lĩnh vực khoa học công nghệ, viễn thông và giao dịch điện tử phải đẩy mạnh cắt giảm thủ tục hành chính, xóa bỏ tư duy "không quản được thì cấm".

Đề xuất hỗ trợ 50% lãi suất vay, thí điểm 20 doanh nghiệp đổi mới công nghệ

Bộ Khoa học và Công nghệ đề xuất hỗ trợ doanh nghiệp tới 50% lãi suất vay, tối đa 6%/năm trong 5 năm khi đầu tư đổi mới công nghệ. Chính sách sẽ thí điểm với 20 doanh nghiệp, kỳ vọng khơi thông vốn tín dụng và thúc đẩy đổi mới sáng tạo.

Dữ liệu phải là hạ tầng chiến lược của khu công nghiệp

TS Nguyễn Đức Hiển cho rằng khu công nghiệp thế hệ mới cần được quản trị trên nền tảng dữ liệu, trí tuệ nhân tạo và công nghệ số. Chuyển đổi số phải tạo ra phương thức quản trị minh bạch, thông minh, hiệu quả, coi dữ liệu là hạ tầng chiến lược.

Nghiên cứu AI, bán dẫn, robot, 5G-6G có thể nhận hỗ trợ tới 10 tỷ đồng từ NAFOSTED

Các nhiệm vụ nghiên cứu phát triển công nghệ thuộc lĩnh vực AI, bán dẫn, robot, 5G-6G, UAV cùng nhiều công nghệ chiến lược khác có cơ hội nhận hỗ trợ tối đa 10 tỷ đồng từ ngân sách nhà nước thông qua chương trình tài trợ năm 2026 của NAFOSTED.

Bên trong cuộc "đại tu" cơ chế phát triển công nghệ chiến lược

Danh mục công nghệ chiến lược được tinh gọn từ 11 xuống 10 nhóm. Tuy nhiên, điểm mới lớn nhất không nằm ở số lượng mà ở cách tiếp cận: Việt Nam chuyển từ tư duy lựa chọn công nghệ sang giải các bài toán lớn để xác định công nghệ ưu tiên đầu tư.

Cấm sử dụng AI giả mạo hình ảnh, video, giọng nói của người khác

Điểm nhấn quan trọng của Luật Chuyển đổi số có hiệu lực từ ngày 1/7 nằm ở nguyên tắc "khai báo một lần là mặc định", tăng cường kết nối, chia sẻ và sử dụng lại dữ liệu, giảm trùng lặp thủ tục, nâng cao hiệu quả quản lý và năng lực ra quyết định.

Nguy hiểm: Tin tặc đang sử dụng AI để tấn công AI

Kỹ thuật "tiêm lệnh" và mối đe dọa đối với các mô hình ngôn ngữ lớn

Fun-Tuning: Công cụ tấn công AI mới đầy nguy hiểm

Hệ quả và biện pháp đối phó

Từ khóa:

Đừng bỏ lỡ

Từ 1/9, khai thác tác phẩm báo chí phải trả bản quyền tối thiểu 20%

Thế khó của PNJ trong cơn khủng hoảng thanh khoản

"Hồ sơ Chứng tích Chiến tranh 2026": Những tư liệu có thể mở lối tìm liệt sĩ

Dòng tiền hàng nghìn tỷ đồng của Gelex Electric luân chuyển trong hệ sinh thái

Ông Zelensky sa thải Tổng tư lệnh Syrsky giữa biến động ở Kiev

Masan điều chỉnh kế hoạch kinh doanh, kỳ vọng lãi hơn 11.000 tỷ đồng

Messi hay Ronaldo là GOAT có thực sự quan trọng?

Chuyên gia cảnh báo "quả bom nổ chậm" từ dữ liệu bị đánh cắp trong kỷ nguyên lượng tử

Chuyển đổi số

Nguy cơ điện toán lượng tử phá vỡ hệ thống mật mã hiện nay

Đà Nẵng nâng cao năng lực kết nối, khai thác dữ liệu

Trung tướng Tào Đức Thắng: Một đồng vốn doanh nghiệp nhà nước phải dẫn dắt nhiều đồng vốn xã hội

Thủ tướng yêu cầu tăng tốc giải ngân vốn cho khoa học, công nghệ và chuyển đổi số

Xóa tư duy "không quản được thì cấm" và các thủ tục biến tướng trong KHCN, viễn thông

Vì sao 18.000 tỷ đồng cho khoa học và công nghệ chưa được phân bổ?

Đề xuất hỗ trợ 50% lãi suất vay, thí điểm 20 doanh nghiệp đổi mới công nghệ

Viettel chi gần 253 tỷ đồng sở hữu đầu số 095, gấp 100 lần giá khởi điểm

Dữ liệu phải là hạ tầng chiến lược của khu công nghiệp

Đà Nẵng làm gì để trở thành trung tâm AI của khu vực

Nghiên cứu AI, bán dẫn, robot, 5G-6G có thể nhận hỗ trợ tới 10 tỷ đồng từ NAFOSTED

Đề xuất tổng công trình sư về công nghệ chiến lược được hưởng lương 300 triệu đồng

Bên trong cuộc "đại tu" cơ chế phát triển công nghệ chiến lược

Công nghệ giúp hộ kinh doanh Việt Nam “lột xác” thành doanh nghiệp

CT Group đưa công nghệ UAV Make in Vietnam sang Mỹ

Đà Nẵng thúc đẩy phát triển công nghiệp bán dẫn qua hội thảo 2026

Cấm sử dụng AI giả mạo hình ảnh, video, giọng nói của người khác

Vì sao 3 giải pháp của FPT IS cùng chinh phục Vietnam Digital Awards?

Đồng hồ Pháp lam Việt Nam sắp tích hợp RFID và công nghệ định vị

Việt Nam - Lào thúc đẩy công nhận chéo chữ ký số, hướng tới cửa khẩu thông minh

Nguy hiểm: Tin tặc đang sử dụng AI để tấn công AI

Kỹ thuật "tiêm lệnh" và mối đe dọa đối với các mô hình ngôn ngữ lớn

Fun-Tuning: Công cụ tấn công AI mới đầy nguy hiểm

Hệ quả và biện pháp đối phó

Tin liên quan

Từ khóa:

Đừng bỏ lỡ