Thứ Sáu, 18 tháng 3, 2011

So sánh các định dạng âm thanh

Dung lượng lưu trữ nhạc số không còn là vấn đề lớn cho nhu cầu sử dụng cá nhân và người nghe nhạc đòi hỏi một mức chất lượng âm thanh số cao nhất. Vậy đâu là định dạng âm thanh tốt nhất hiện nay, định dạng nén lẫn không nén? Bài viết tìm hiểu chi tiết về vấn đề này.
Bài viết này trình bày chi tiết cách thức và kết quả thử nghiệm cho bài "Âm thanh số: "hình ảnh" các định dạng" đã đăng trên TGVT 12/2010, trang 124.
Ta tiến hành phân tích quang phổ của các định dạng âm thanh phổ biến hiện nay gồm: FLAC, WAV (không nén, lossless) và MP3, OGG (nén) ở mức thiết lập trích xuất từ CD cao nhất.
Công cụ và cấu hình thử nghiệm:
1. Phần mềm trích xuất âm thanh Exact Audio Copy miễn phí, phiên bản mới nhất (V0.99 Prebeta 5).
2. CD nhạc Lê Minh Sơn - Một khúc sông Hồng, do phòng thu Kiên Quyết thực hiện.
3. Phần mềm xử lý âm thanh miễn phí Audacity.
4. Cấu hình máy tính: Windows XP SP3, Asus DVD-E616A3, CPU Intel Core 2 6300 1,86GHz, RAM DDR2 2GB.

Thực hiện:
Ta sử dụng Exact Audio Copy để trích xuất "track 02" của CD ra 4 định dạng: FLAC, WAV, MP3 và OGG. Với định dạng MP3, ta dùng codec Lame phổ biến hiện nay và với định dạng Ogg Vorbis, ta dùng codecoggenc2.87-1.3.2-generic. Track 2 của CD Một khúc sông Hồng là bài "Cò về phố" của Lê Minh Sơn, do Ngọc Khuê thể hiện. Lý do để chọn bài nhạc này là nhạc phần lớn đệm bằng guitar và sáo, ít nhạc cụ nên ta dễ dàng phân biệt được sự khác biệt về chất lượng hơn so với các bản nhạc nhiều nhạc cụ, nhiều chi tiết. Và thu gọn hơn nữa, ta chỉ phân tích vài điểm trong 10 giây đầu của track 2 này giữa các định dạng với nhau.
Kết quả:

Ta sử dụng công cụ miễn phí Media Info để kiểm tra lại các tập tin vừa trích xuất. Như các bạn thấy, 2 file không nén WAV và FLAC có thông tin giống với đặc tả kỹ thuật của CD nhạc, âm thanh 16-bit, lấy mẫu ở 44,1kHz. Trong khi MP3 và OGG lấy mẫu ở chất lượng cao nhất, MP3 ở 320Kbps và OGG ở 500Kbps. Còn xét về dung lượng, bạn cũng chú ý là thời lượng bài nhạc 4 phút 20 giây, ở định dạng MP3 chỉ mất 9,92MB, OGG mất 14,3MB, FLAC mất 29,5MB và WAV mất 43,7MB. Do đó, MP3 tiết kiệm được 77,3% dung lượng so với WAV, OGG tiết kiệm được 67,3% và FLAC 32,5%.

Và bây giờ, ta so sánh "kết quả phân tích" của 4 định dạng này.


Với kết quả trong hình quang phổ của 10 giây đầu bài "Cò về phố", dễ nhận thấy rằng có rất ít khác biệt giữa các định dạng trên.
Nhìn trên quang phổ, bạn chú ý đến những tầng trên (có những mảng xanh) để dễ phân biệt. Quang phổ hiển thị tần số từ 172Hz đến 7KHz. Trong đoạn nhạc 10 giây đầu này chỉ có tiếng guitar và sáo nên âm thanh khá "sạch". Ta chỉ chú ý đến tầng âm ở khoảng 5KHz đến 7KHz cho dễ phân biệt. Những sọc đỏ đậm là tiếng guitar và vết đỏ nhòe phía sau là tiếng vọng của guitar và sáo. Ngoài ra, những vệt đỏ cũng có thể là tạp âm hoặc bất kỳ âm thanh không mong muốn nào do tín hiệu sai lệnh và hiệu ứng gây ra trong quá trình nén, xử lý dữ liệu. Và âm thanh chất lượng tốt sẽ hiển thị nhiều mảng màu xanh dương hơn, ít bị "nhiễu" hơn.
 So sánh giữa WAV và FLAC:


Như bạn thấy, WAV và FLAC có ít khác biệt nhưng những ô đánh dấu trong hình là những khác biệt dễ nhận ra nhất (bạn dùng 2 phím mũi tên để duyệt tới-lui ảnh để dễ nhận biết hơn). Điều đáng nói là FLAC lại cho chất âm "sạch" hơn WAV và lại có mức dung lượng lưu trữ thấp hơn đến 32,5%.
 So sánh giữa MP3 và OGG:


Với 2 định dạng nén MP3 và OGG ở chất lượng cao nhất, ta dễ nhận thấy khác biệt hơn ở 2 định dạng này. MP3 bị "nhiễu" nhiều hơn OGG cho dù sự khác biệt này không thực sự nhiều. Quan sát kỹ, ở tần âm khoảng giữa quang phổ (3KHz-4KHz), OGG xử lý tín hiệu âm trung âm không trong trẻo như MP3 trong khi các tầng âm cao của MP3 lại không "sạch" bằng OGG. Ta vẫn chưa thể khẳng định chắc chắn được ở trung âm của OGG, đó có phải là âm vọng của nhạc cụ hoặc là tạp âm. Nhưng rõ ràng ở tầng âm cao, OGG chứng tỏ được độ "sạch" của âm thanh tốt hơn MP3.
Nhận xét:
MP3 vẫn hiệu quả về dung lượng nhưng chưa tạo được nhiều ấn tượng về mặt giữ được nguyên gốc bản ghi, trong khi OGG khá phù hợp nếu bạn muốn có được chất lượng âm thanh tốt với định dạng âm thanh nén. Trong khi với những ai thực sự quan tâm đến chất âm thì định dạng không nén FLAC là chọn lựa thích hợp hơn WAV vì FLAC vừa giữ được chất âm, vừa có dung lượng lưu trữ nhỏ hơn.
Ngoài ra, còn một vài định dạng âm thanh đáng chú ý khác hiện nay. Đối với định dạng không nén, Apple đưa ra Apple Lossless (alac), định dạng của Monkey Audio (.ape)... Với các định dạng nén, ngoài MP3 phổ biến và OGG trong bài, AAC cũng là định dạng đang dần phổ biến khi được dùng nhiều cho video.
Với việc số hóa bộ sưu tập CD của bạn, việc chọn lựa định dạng nào cho phù hợp tùy thuộc vào nhiều yếu tố như: thiết bị di động bạn dùng, khả năng lưu trữ, chất âm... Việc còn lại của bạn là chọn định dạng nào phù hợp với yêu cầu của mình.