Meta mới đây đã phát hành một phần mềm AI có tên AudioCraft, cho phép người dùng tạo nhạc và âm thanh dựa trên một đoạn văn bản.

Theo đó, phần mềm này bao gồm ba mô hình AI, gồm MusicGen, AudioGen và EnCodec. MusicGen là AI do Meta phát triển từ năm ngoái với khả năng tạo âm nhạc từ văn bản đầu vào, trong khi AudioGen chuyên về về hiệu ứng âm thanh và cũng tạo âm thanh từ văn bản, chẳng hạn mô phỏng tiếng chó sủa, còi xe, bước chân trên sàn gỗ. EnCodec là bộ giải mã âm thanh dựa trên AI được giới thiệu tháng 10/2022, hỗ trợ nén và giải nén các tệp âm thanh mà không làm giảm chất lượng. AI này cũng cho phép tạo nhạc chất lượng cao mà không cần sử dụng lượng văn bản đầu vào lớn. Tất cả được gói gọn trong AudioCraft, giúp tạo âm thanh chất lượng cao và đặc biệt dễ sử dụng.

Công ty đã cho giới truyền thông nghe một số âm thanh mẫu được tạo bằng AudioCraft. Tiếng huýt sáo, còi báo động và tiếng vo ve được tạo ra nghe khá tự nhiên. Tuy nhiên, tiếng guitar trong các bài hát có cảm giác chưa thể chân thực như thông thường.

Meta là gã khổng lồ mới nhất công bố phần mềm tạo âm nhạc dựa trên AI. Trước đó, Google đã cho ra mắt MusicLM, một mô hình ngôn ngữ lớn tạo ra hàng phút âm thanh dựa trên lời nhắc văn bản, tuy nhiên chỉ các nhà nghiên cứu mới có thể sử dụng phần mềm này. Vào thời điểm đó, MusicLM đã tạo ra một bài hát "do AI tạo ra" có giọng hát giống Drake và The Weeknd, được cộng đồng đón nhận một cách nhanh chóng trước khi công ty quyết định gỡ xuống. Gần đây, một số nhạc sĩ như Grimes, đã khuyến khích mọi người sử dụng giọng hát của họ trong các bài hát do AI tạo ra.

Tất nhiên, các nhạc sĩ đã thử nghiệm âm thanh điện tử (EDM) trong một thời gian rất dài. Theo đó, thể loại âm nhạc này cũng thường điều chỉnh các âm thanh trên máy tính. Tuy nhiên, AudioCraft lại là một lĩnh vực hoàn toàn khác khi phần mềm này có thể tạo ra âm thanh chỉ từ văn bản và thư viện dữ liệu âm thanh khổng lồ của nhà phát triển.

Ở thời điểm hiện tại, AudioCraft có thể được sử dụng cho nhạc trong thang máy hoặc nhà hàng để tạo bầu không khí thoải mái, dễ chịu. Tuy nhiên, Meta tin rằng mô hình mới của họ trong tương lai sẽ là một làn sóng mới cho thị trường âm nhạc.

“Chúng tôi nghĩ MusicGen có thể biến thành một loại nhạc cụ mới — giống như các loại nhạc cụ điện tử khác khi chúng lần đầu tiên xuất hiện”, công ty cho biết.

“Chúng tôi nhận ra rằng các bộ dữ liệu được sử dụng để đào tạo các mô hình của chúng tôi thiếu tính đa dạng. Đặc biệt, bộ dữ liệu âm nhạc được sử dụng chứa phần lớn âm nhạc theo phong cách phương Tây và chỉ chứa các cặp vần, lời bài hát được viết bằng tiếng Anh”, Meta cho biết. “Bằng cách chia sẻ mã cho AudioCraft, chúng tôi hy vọng các nhà nghiên cứu khác có thể dễ dàng thử nghiệm các phương pháp mới hơn để sử dụng công cụ này”.

Theo The Verge