EE4346 — Thị giác máy tính | Trường Điện

EE4346

Thị giác máy tính

Computer Vision

Khối lượng: 2 tín chỉ · 3.25 ECTS (LT 30 · BT 15 · TN 0 · Tự học 60 tiết)
Giảng viên phụ trách: Phạm Văn Tiến

Mô tả học phần

Thị giác máy tính là môn học liên quan đến việc phát triển các phương pháp, thuật toán để máy tính có thể hiểu hay phân tích được các thông tin từ hình ảnh và video đầu vào. Môn học này nhằm cung cấp cho sinh viên những kiến thức, kỹ thuật cơ sở và nâng cao của lĩnh vực Thị giác máy tính. Trong đó, các kiến thức, kỹ thuật cơ sở bao gồm các kỹ thuật xử lý ảnh ở mức thấp như trích chọn đặc trưng của ảnh, lọc và phát hiện đường biên; ở mức độ trung bình như phân vùng ảnh và phân nhóm ảnh; cũng như ở mức độ cấp cao như nhận dạng đối tượng, nhận dạng mẫu. Các kiến thức nâng cao bao gồm các kiến thức về học máy, học sâu, các mô hình mạng nơ-ron trong các bài toán phân vùng, phân loại ảnh, phát hiện và nhận dạng đối tượng. Song song với việc trang bị các kiến thức thuộc lĩnh vực thị giác máy tính và học máy, các công cụ hữu ích dùng trong nghiên cứu trí tuệ nhân tạo (AI) và các lĩnh vực liên quan khác cũng sẽ được đề cập, trang bị cho người học. Sau khi hoàn thành học phần này, người học có khả năng: Nắm được các khái niệm cơ bản liên quan đến ảnh số, cách tạo ra một bức ảnh Thực hiện được các phương pháp xử lý ảnh trong miền thời gian và trong miền tần số: xử lý điểm ảnh, xử lý lân cận, các phép biến đổi cường độ ảnh, lược đồ xám và các phương pháp xử lý trên lược đồ xám Thực hiện được các phương pháp khôi phục ảnh, biển đổi hình thái học của ảnh Thực hiện được các bài toán về phát hiện đường biên, phân vùng ảnh, phân loại đối tượng Nắm được các khái niệm cơ bản về mạng nơ ron Có khả năng đánh giá so sánh và phân tích được các điểm mạnh yếu của các phương pháp học máy Nghiệm chứng được các vấn đề lý thuyết thông qua hoạt động thực nghiệm và các bài toán thực tế Ngoài ra, môn học cũng cung cấp cho sinh viên các kỹ năng làm việc theo nhóm, thuyết trình, và thái độ trung thực trong công việc.

English description

Computer vision is a field that involves developing methods and algorithms for computers to understand or analyze information from image and video inputs. This subject aims to provide students with foundational and advanced knowledge and techniques in the field of computer vision. Foundational knowledge and techniques include low-level image processing techniques such as feature extraction, filtering, and edge detection; mid-level techniques like image segmentation and image clustering; and high-level techniques such as object recognition and pattern recognition. Advanced knowledge encompasses machine learning, deep learning, and neural network models for tasks like image segmentation, classification, object detection, and recognition. Aside the knowledge in computer vision and machine learning, useful tools for research in artificial intelligence (AI) and related fields will also be covered and provided. After completing this course, students will be able to: Understand basic concepts related to digital images and the way to create an image. Apply image processing methods in both the spatial and frequency domains: pixel processing, neighborhood processing, image intensity transformations, grayscale images, and methods for processing grayscale images. Implement image restoration methods and morphological transformations of images. Solve problems related to edge detection, image segmentation, and object classification. Understand fundamental concepts of neural networks. Evaluate, compare, and analyze the strengths and weaknesses of machine learning methods. Validate theoretical issues through experimental activities and real-world problems. In addition, the course will also provide to students teamwork skills, presentation abilities, as well as a professional attitude

Chuẩn đầu ra học phần (CLO) 4

Bấm vào từng chuẩn đầu ra để xem bản tiếng Anh, liên kết PLO và mức độ đóng góp.

CLO1 Trình bày được các khái niệm cơ bản, các bài toán liên quan đến thị giác máy tính và ảnh số.

Describe and analyze fundamental concepts and representative problems in computer vision and digital image processing.
CLO2 Trình bày và thi hành được các phương pháp, kỹ thuật chính sử dụng trong xử lý ảnh và thị giác máy tính.

Explain and implement the principal methods and techniques used in image processing and computer vision.
CLO3 Trình bày được các ứng dụng của mạng nơ-ron trong thị giác máy tính, khái niệm cơ bản, các cấu trúc chung, đặc điểm của mạng nơ ron, các phương pháp huấn luyện mạng

Explain the applications of neural networks in computer vision, including fundamental concepts, common architectures, key characteristics, and network training methods..
CLO4 Đánh giá so sánh, phân tích được và lựa chọn, áp dụng được phương pháp học máy và học sâu cũng như sử dụng được công cụ Google colab, PyTorch cho các bài toán trong Thị giác máy tính.

Evaluate, compare, and analyze machine learning and deep learning methods; select and apply appropriate approaches; and effectively use tools such as Google Colab and PyTorch to solve computer vision problems.

Đánh giá học phần

Thành phần	Tỉ trọng	Thời gian
Thi cuối kỳ (Final Examination)	70.0%
Thi giữa kỳ/Thuyết trình báo cáo giữa kỳ (Midterm Examination)	45.0%	Tuần 13 đến tuần 16
Tham dự trên lớp (Class Participation)	5.0%	Toàn bộ quá trình học

Tài liệu học tập

Bắt buộc

[1] Computer Vision: Algorithms and Applications, Rick Szeliski, 2010, Springer
[2] Deep learning, Ian Goodfellow, Yoshua Bengio, Aaron C. Courvillen, 2016, The MIT Press

Tham khảo

[1] Computer Vision: a Modern Approach, D.A. Forsyth and J. Ponce, 2012, Pearson
[2] Pattern Recognition and Machine Learning, C.M. Bishop, 2006, Springer
[3] Computer Vision, L.G. Shapiro and G. Stockman, 2001, Prentice-Hall

Tất cả học phần