5 yếu tố ảnh hưởng kích thước tập tin audio

Khi hiểu rõ về những thông số dưới đây, bạn có thể điều chỉnh chúng để tăng hay giảm kích thước tập tin audio tùy theo nhu cầu của mình một cách dễ dàng.
5 yếu tố ảnh hưởng kích thước tập tin audio
5 yếu tố ảnh hưởng kích thước tập tin audio

Sample Rate

Âm thanh là sự dao động cơ học (biến đổi vị trí qua lại) của các phân tử, nguyên tử hay các hạt làm nên vật chất và lan truyền trong không khí giống như các cơn sóng, nên gọi là sóng âm. Khi con người nói hay các sự vật xung quanh tạo ra tiếng động, những gì bạn thực sự nghe thấy chính là sự thay đổi về áp lực được truyền trong không khí đến tai của bạn.

Tuy nhiên, làm sao để chúng ta ghi được âm thanh và chuyển đổi chúng thành dữ liệu kỹ thuật số? Thực tế, con người không thể ghi lại các sóng âm đầy đủ, mà thay vào đó phải “chụp ảnh nhanh” (Snapshot) âm thanh một cách định kỳ theo thời gian. Khi phát lại những âm thanh đó theo thứ tự, bạn sẽ có được sự tái tạo gần đúng của âm thanh gốc.

Tỷ lệ lấy mẫu càng ngắn thì chất lượng ghi âm càng chính xác.
Tỷ lệ lấy mẫu càng ngắn thì chất lượng ghi âm càng chính xác.

Mỗi “bức ảnh” Snapshot được gọi là một mẫu (Sample) và thời gian giữa mỗi Snapshot được gọi là tỷ lệ lấy mẫu (Sample Rate), hay đôi khi còn gọi là tần số lấy mẫu (Sample Frequency). Thời gian lấy mẫu càng ngắn thì tần số càng nhanh và cũng có nghĩa là bản ghi âm càng chính xác hơn. Nhưng điều đó cũng đòi hỏi mỗi giây âm thanh được ghi lại sẽ lưu trữ nhiều dữ liệu hơn, khiến dung lượng tập tin lớn hơn.

Nói một cách dễ hiểu hơn, Sample Rate chính là số lần lấy mẫu trên một giây, có đơn vị là Hz. Chẳng hạn, một bản nhạc có Sample Rate là 44.100Hz (tương đương 44,1kHz) thì mỗi giây nhạc sẽ được lấy mẫu 44.100 lần.Thông thường, âm thanh chất lượng CD sử dụng tần số mẫu 44,1kHz trong khi âm thanh chất lượng TV và DVD lấy mẫu ở tần số 48kHz. Với 10 phút ghi âm thanh mono không nén, tập tin âm thanh chất lượng CD có thể có dung lượng là 51,7MB, còn âm thanh DVD sẽ là 56,3MB.Khi ghi âm giọng nói, bạn có thể giảm Sample Rate bản ghi xuống còn 32kHz mà tập tin vẫn không bị suy giảm nhiều về chất lượng. Âm thanh radio AM nghe có vẻ gần gũi hơn nếu giảm xuống 22,05kHz.

Bitrate

 Tỷ lệ bit (Bitrate) chính là đơn vị cơ bản để đề cập đến mức dung lượng mà thiết bị lưu trữ cần có để xử lý một giây âm thanh (hay video). Bitrate được tính theo đơn vị là kbps (kilobit per second). Trong thực tế, một tập tin nhạc thường tổng hợp nhiều loại âm thanh khác nhau gồm tiếng đàn, tiếng trống, tiếng kèn … với nhiều cung bậc khác nhau nên cần có một dung lượng nhất định để lưu lại thông tin các loại âm thanh này mỗi giây. Dung lượng đó được tính bằng số Bitrate.

Bitrate không giống như Sample Rate và rất nhiều người thường nhầm lẫn hai khái niệm này. Nếu Sample Rate là thời gian để chụp các “bức ảnh” của âm thanh, thì Bitrate chính là dung lượng dữ liệu được ghi lại trong mỗi ảnh chụp. Với Bitrate, ta có thể xác định nhanh chóng dung lượng cũng như phần nào chất lượng của bản nhạc.

Một công cụ điển hình để xem Bitrate.
Một công cụ điển hình để xem Bitrate.

Để minh họa, hãy tưởng tượng một làn sóng âm thanh như một dòng suối nước và bạn đang cố gắng để nắm bắt (nghĩa là ghi lại) dòng nước đó với một cái xô. Sample Rate sẽ là mức độ thường xuyên mà bạn hứng xô vào dòng nước, trong khi Bitrate là kích thước của chiếc xô mà bạn đang sử dụng.

Bitrate càng cao sẽ ghi nhận càng đầy đủ các loại âm thanh, chất lượng tập tin nhạc cũng cao hơn và điều đó dẫn đến dung lượng tập tin sẽ lớn hơn. Ngược lại, Bitrate càng thấp thì âm thanh bị lược bỏ càng nhiều nên sẽ cho chất lượng thấp hơn, bù lại dung lượng tập tin nhỏ hơn. Tuy nhiên, nếu bạn giảm Bitrate quá nhiều thì dữ liệu âm thanh đôi khi có thể bị mất.

Tập tin nhạc thông thường có Bitrate là 128kbps, còn tập tin chất lượng cao có Bitrate 192kbps, 256kbps hay thậm chí có thể lên đến 320kbps. Một phút nhạc 128kbps có dung lượng khoảng 1MB. Trong đa số trường hợp, bạn có thể tính được Bitrate bằng cách nhân Sample Rate với Bit Depth (độ sâu bit). Chẳng hạn, đĩa CD nhạc có Sample Rate 44,1kHz và Bit Depth 16-bit thì sẽ có Bitrate không nén là 705,6kbps.

Stereo hay Mono

Trong lĩnh vực âm thanh, chúng ta thường rất hay nghe nói đến âm thanh Mono và Stereo. Để dễ hiểu nhất, có thể giải thích như sau: Mono chỉ tích hợp một kênh âm thanh (hay còn gọi là âm thanh đơn kênh), còn Stereo tích hợp hai kênh âm thanh độc lập với nhau. Hai kênh trong một tập tin âm thanh Stereo được xem như kênh “trái” và kênh “phải”, trong đó Bitrate cung cấp giữa hai kênh thay đổi phù hợp với lượng thông tin được chứa trong mỗi kênh.

Một trong những cách dễ nhất để nhận biết âm thanh Stereo là sử dụng tai nghe. Bạn có thể nghe thấy một kênh Stereo ở tai bên này và kênh âm thanh khác nổi lên ở tai còn lại. Chính vì vậy, Stereo còn được gọi là âm thanh nổi. Ngược lại, khi nghe một tập tin âm thanh Mono, bạn sẽ nghe thấy cùng một kênh như nhau ở cả hai tai.

Sự khác nhau giữa âm thanh Stereo và Mono.
Sự khác nhau giữa âm thanh Stereo và Mono.

Về mặt kỹ thuật, tập tin âm thanh Stereo cơ bản gồm hai tập tin âm thanh Mono ghép lại. Điều đó có nghĩa là tập tin âm thanh Stereo luôn có dung lượng gấp hai lần lớn như tập tin âm thanh Mono, giả sử rằng Sample Rate, Bitrate, nguồn âm thanh,… của cả hai đều giống nhau.

Vì vậy, cách dễ nhất để giảm dung lượng tập tin âm thanh còn một nửa là chuyển đổi từ dạng Stereo sang Mono. Đối với bản ghi âm giọng nói, Mono luôn được ưa thích vì lý do này. Mono mang lại cảm giác cho người nghe rằng âm thanh xuất phát từ một hướng. Người nghe khi nghe các dàn âm thanh Mono thường sẽ cảm nhận được âm thanh mình đang nghe được đều được phát ra từ một điểm trong không gian.

Trong khi đó, âm thanh Stereo thường được áp dụng cho nhạc 3D, mang đến trải nghiệm âm thanh nổi xung quanh hơn là dạng âm thanh Mono phẳng. Stereo là âm thanh phát ra từ nhiều nguồn âm khác nhau, được phân bổ theo một hướng nhất định như từ trái qua phải hoặc ngược lại, tùy theo sự điều chỉnh. Tuy nhiên, rất nhiều người vẫn không thể cảm nhận được sự khác biệt giữa Mono và Stereo.

Độ nén

Nếu bạn đang làm việc với định dạng âm thanh WAV, cách duy nhất để giảm kích thước tập tin là chỉnh sửa một trong các thông số kể trên (Sample Rate, Bitrate, hoặc số lượng các kênh). Tuy nhiên, đối với các định dạng tập tin âm thanh khác, nén là một yếu tố quan trọng nhất ảnh hưởng đến kích thước tập tin. Trong lĩnh vực âm thanh, có hai kiểu nén là nén không suy giảm chất lượng (Lossless Compression) và nén có suy giảm (Lossy Compression).Về cơ

bản, kiểu nén Lossless sẽ xử lý một tập tin âm thanh và cố gắng giảm kích thước nó xuống càng nhiều càng tốt bằng cách sử dụng các thuật toán toán học thích hợp. Tuy nhiên, những thông tin này phải được giải nén tại thời điểm phát lại do đó đòi hỏi quy trình phức tạp hơn, tức là phải có những chương trình xử lý mạnh mẽ hơn. Kiểu nén này sẽ không làm mất dữ liệu của tập tin gốc.

Kiểu nén Lossy sẽ loại bỏ những dữ liệu không cần thiết.
Kiểu nén Lossy sẽ loại bỏ những dữ liệu không cần thiết.

Trong khi đó, kiểu nén Lossy sẽ loại bỏ những dữ liệu “không cần thiết” trong tập tin âm thanh cần nén, chẳng hạn như những tiếng động vượt ra ngoài ngưỡng nghe được của hầu hết mọi người. Khi nén Lossy, những dữ liệu đã bỏ đi sẽ không thể phục hồi được.

Nếu so sánh, kết quả kiểu nén Lossless sẽ có chất lượng hầu như tương đương với âm thanh không nén. Về kích thước tập tin, ngay cả khi có kết quả tốt nhất, kiểu nén Lossless vẫn cung cấp kích thước tập tin lớn gấp hai lần so với kiểu nén Lossy. Do đó, để tối ưu kích thước tập tin âm thanh và không quá chú trọng đến chất lượng, tốt nhất là bạn nên chọn kiểu nén Lossy.

Định dạng tập tin

Một khi đã quyết định chọn kiểu nén Lossy, tiếp theo bạn phải chọn loại định dạng tập tin âm thanh tốt nhất cũng như phù hợp nhất cho mình. Ba tùy chọn phổ biến nhất là MP3, OGG và AAC. Có thể nói, MP3 là định dạng nhạc phổ biến nhất tính cho đến nay, chủ yếu bởi vì nó là chuẩn định dạng ra đời đầu tiên trong số ba định dạng kể trên.

Những chiếc máy nghe nhạc MP3 đã mở ra một kỷ nguyên nhạc số hoàn toàn mới.
Những chiếc máy nghe nhạc MP3 đã mở ra một kỷ nguyên nhạc số hoàn toàn mới.

Về mặt kỹ thuật, AAC tốt hơn so với MP3 nhưng không được sử dụng rộng rãi bằng. OGG cũng tốt nhưng không có nhiều thiết bị hỗ trợ. Xét về mặt tối ưu kích thước tập tin, một tập tin MP3 nén đến Bitrate 128kbps có thể bị mất khoảng 90% dữ liệu âm thanh gốc, trong khi tập tin MP3 nén đến 320kbps chỉ mất khoảng 60%.

Ngoài ra, nếu so sánh một tập tin MP3 và tập tin AAC được nén với cùng Bitrate, AAC sẽ cung cấp âm thanh tốt hơn bởi vì nó sử dụng thuật toán nén tiên tiến hơn. Điều này có nghĩa là bạn có thể nhận được nhiều “chất lượng âm thanh cho mỗi megabyte” hơn nếu chọn định dạng AAC thay vì MP3.

Theo PC World VN