Bỏ qua tới nội dung chính
AC3110E

Xử lý ngôn ngữ tự nhiên

Natural Language Processing

Khối lượng
2 tín chỉ · 3.25 ECTS (LT 30 · BT 15 · TN 0 · Tự học 60 tiết)
Vai trò
Bắt buộc (Mandatory course)
Học kỳ
5
Giảng viên phụ trách
Đào Trung Kiên

Mô tả học phần

Sinh viên được cung cấp kiến thức về xử lý ngôn ngữ tự nhiên, trong đó tập trung vào thành phần văn bản của một ngôn ngữ. Gồm cách biểu diễn và phân tích đặc trưng của văn bản: từ, hình thái từ, từ loại, ngữ pháp, ngữ nghĩa v.v. ; Tìm hiểu các phương pháp xử lý văn bản dựa trên luật, dựa trên thống kê dữ liệu, dựa trên mạng nơ ron ; Tìm hiểu một số bài toán cơ bản trong xử lý văn bản: phân đoạn, phân loại văn bản, gán nhãn từ loại, nhận dạng tên riêng, trích rút thông tin, dịch máy, v.v. Từ đó giúp sinh viên có nền tảng kiến thức cơ sở để xây dựng các ứng dụng thực tế trong xử lý văn bản của một ngôn ngữ. Sinh viên được tiếp cận và có kỹ năng sử dụng các công cụ phần mềm liên quan để xây dựng các ứng dụng thực tế. Đồng thời, môn học cũng giúp sinh viên tăng cường kỹ năng làm việc nhóm, báo cáo và thuyết trình.

English description

Students are provided with knowledge of natural language processing, which focuses on the text of a language. The course includes knowledge on representation and analysis of language's features: vocabulary, lexical morphology, word classes, grammar/syntax, semantics, etc. ; Learning the basic processing methods: rule-based, statistical-based, neural network-based; Learning basic problems in language processing: word/sentence segmentation, text classification, Part-of-Speech tagging, name entity recognition, information extraction, machine translation, etc. From there, it helps students to have basic knowledge to build practical applications in processing of a language. The course helps students acquire practice skills in using software tools for building real-world applications. Attendees are offered opportunities to further develop their team-working, technical documentation, and presentation capabilities

Chuẩn đầu ra học phần (CLO) 5

Bấm vào từng chuẩn đầu ra để xem bản tiếng Anh, liên kết PLO và mức độ đóng góp.

  • CLO1 Liệt kê và định nghĩa được những đặc điểm của một ngôn ngữ

    List and define the nature and characteristics of a language

    PLO 01 IPLO 02 I
  • CLO2 Mô tả được các mô hình biểu diễn cấu trúc văn bản ở các mức độ

    Describe the current presentation models of text at different levels

    PLO 01 R
  • CLO3 Giải thích được các kỹ thuật điển hình xử lý ngôn ngữ tự nhiên theo hướng học máy và hướng học sâu

    Explain typical machine learning and deep learning techniques for natural language processing

    PLO 02 RPLO 09 R
  • CLO4 Phát triển ứng dụng xử lý ngôn ngữ tự nhiên sử dụng các công cụ, phần mềm, thư viện hỗ trợ

    Develop NLP application using supported tools, software and libraries

    PLO 03 RPLO 04 RPLO 09 RPLO 12 I
  • CLO5 Trình bày và thảo luận về bài toán xử lý ngôn ngữ tự nhiên

    Present and discuss the issue of natural language processing problems

    PLO 10 R

Đánh giá học phần

Thành phầnTỉ trọngThời gian
Thực hiện và trình bày dự án/bài tập lớn (Perform and present one NLP project)70.0%Tuần 18-20/Week 18-20
Bài tập tuần và/hoặc bài kiểm tra trên lớp (Do assignment exercise and/or mini examination at class)30.0%Toàn bộ quá trình học/Throughout the course

Tài liệu học tập

Tham khảo

  • [1] Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Jurafsky, Daniel, and James H. Martin, 2009, Prentice Hall
  • [2] Multilingual speech processing, Schultz, Tanja, and Katrin Kirchhoff, 2006, Elsevier

Tất cả học phần