Nén và mã hóa dữ liệu đa phương tiện
Multimedia data compression and coding
Mô tả học phần
Học phần giải thích mục đích và yêu cầu kỹ thuật đối với việc nén và mã hóa dữ liệu đa phương tiện. Người học được cung cấp kiến thức cơ sở toán học, vật lý và cảm thụ thính – thị giác đằng sau quá trình nén và mã hóa tín hiệu âm thanh, hình ảnh và video. Từ đó, học phần trình bày phương pháp loại bỏ những thành phần dư thừa về thời gian, tần số, không gian và thống kê để tiết giảm khối lượng dữ liệu. Các chuẩn mã hóa tiên tiến áp dụng cho dữ liệu âm thanh, hình ảnh, và video cũng sẽ được đề cập chi tiết, đi kèm với việc giải thích xu hướng sử dụng kỹ thuật học máy để nâng cao hiệu quả mã hóa. Song song, học phần nêu và giải thích các kỹ thuật và công cụ mã hóa nội dung đồ họa tĩnh và động. Cùng với đó, học phần giúp người học biết cách sử dụng các công cụ phần mềm nén và mã hóa dữ liệu đa phương tiện, đánh giá chất lượng cảm thụ nội dung thu được. Đồng thời, môn học cũng giúp sinh viên tăng cường kỹ năng làm việc nhóm, báo cáo, thuyết trình và phản biện khoa học.
English description
This course explains the objectives and technical requirements of multimedia data compression and coding. Students understand background of mathematics, physics, and audio–visual perception underlying the compression and encoding of audio, image, and video signals. Based on this foundation, the course presents methods for removing temporal, frequency-domain, spatial, and statistical redundancies in order to reduce data volume. Advanced coding standards for audio, image, and video data are discussed in detail, together with explanations of applying machine learning techniques to improve coding efficiency. In parallel, the course mentions techniques and tools for encoding static and dynamic graphics content. In addition, the course guides students through using software tools for multimedia data compression and coding, and evaluating perceptual quality. At the same time, the course helps students strengthen their teamwork, reporting, presentation, and scientific critique skills.
Chuẩn đầu ra học phần (CLO) 4
Bấm vào từng chuẩn đầu ra để xem bản tiếng Anh, liên kết PLO và mức độ đóng góp.
-
CLO1 Mô tả đặc tính vật lý tín hiệu âm thanh và hình ảnh, cách loại trừ dư thừa thông tin
Describe characteristics of audio and visual signals and how to remove data redundancies
PLO 01 I -
CLO2 Diễn giải các chuẩn nén và mã hóa tiên tiến áp dụng cho âm thanh, hình ảnh, video và đồ họa, và phương pháp mã hóa với sự trợ giúp của AI
Explain advanced audio, video coding standards, graphics encoding, and AI-assisted coding techniques
PLO 01 RPLO 08 R -
CLO3 Sử dụng thành thạo công cụ phần mềm nén và mã hóa dữ liệu đa phương tiện
Demonstrate proficiency in using software tools for multimedia data compression and encoding
PLO 05 MPLO 08 M -
CLO4 Đánh giá chất lượng cảm thụ nội dung đa phương tiện sau nén và mã hóa
Evaluate perceptual quality of compressed and encoded media contents
PLO 02 MPLO 09 R
Đánh giá học phần
| Thành phần | Tỉ trọng | Thời gian |
|---|---|---|
| Bài tập lớn số 1 và số 2 | 70.0% | Tuần 8 và Tuần 14 |
| Bài tập ngắn | 10.0% | Phân bố theo tất cả các chương |
| Bài tập trợ giáo | 18.0% | Phân bố theo tất cả các chương |
| Bài đọc | 2.0% | Tuần 16 |
Tài liệu học tập
Tham khảo
- [1] Filter Banks and Audio Coding: Compressing Audio Signals Using Python, Gerald Schuller, 2020, Springer International Publishing
- [2] Complexity-Aware High Efficiency Video Coding, Guilherme Correa, Pedro Assuncao, Luciano Agostini, Luis A. da Silva Cruz, 2016, Springer International Publishing
- [3] Synthesis Lectures on Engineering, Science, and Technology Versatile Video Coding (VVC). Machine Learning and Heuristics, Mário Saldanha, Gustavo Sanchez, César Marcon, Luciano Agostini, 2022, Springer
- [4] Digital Image Enhancement, Restoration and Compression. Digital Image Processing and Analysis, Scott E Umbaugh, 2023., CRC Press