Xử lý ngôn ngữ tự nhiên
Natural Language Processing
Mô tả học phần
Sinh viên được cung cấp kiến thức về xử lý ngôn ngữ tự nhiên, trong đó tập trung vào thành phần văn bản của một ngôn ngữ. Gồm cách biểu diễn và phân tích đặc trưng của văn bản: từ, hình thái từ, từ loại, ngữ pháp, ngữ nghĩa v.v. ; Tìm hiểu các phương pháp xử lý văn bản dựa trên luật, dựa trên thống kê dữ liệu, dựa trên mạng nơ ron ; Tìm hiểu một số bài toán cơ bản trong xử lý văn bản: phân đoạn, phân loại văn bản, gán nhãn từ loại, nhận dạng tên riêng, trích rút thông tin, dịch máy, v.v. Từ đó giúp sinh viên có nền tảng kiến thức cơ sở để xây dựng các ứng dụng thực tế trong xử lý văn bản của một ngôn ngữ. Sinh viên được tiếp cận và có kỹ năng sử dụng các công cụ phần mềm liên quan để xây dựng các ứng dụng thực tế. Đồng thời, môn học cũng giúp sinh viên tăng cường kỹ năng làm việc nhóm, báo cáo và thuyết trình.
English description
Students are provided with knowledge of natural language processing, which focuses on the text of a language. The course includes knowledge on representation and analysis of language's features: vocabulary, lexical morphology, word classes, grammar/syntax, semantics, etc. ; Learning the basic processing methods: rule-based, statistical-based, neural network-based; Learning basic problems in language processing: word/sentence segmentation, text classification, Part-of-Speech tagging, name entity recognition, information extraction, machine translation, etc. From there, it helps students to have basic knowledge to build practical applications in processing of a language. The course helps students acquire practice skills in using software tools for building real-world applications. Attendees are offered opportunities to further develop their team-working, technical documentation, and presentation capabilities
Chuẩn đầu ra học phần (CLO) 5
Bấm vào từng chuẩn đầu ra để xem bản tiếng Anh, liên kết PLO và mức độ đóng góp.
-
CLO1 Liệt kê và định nghĩa được những đặc điểm của một ngôn ngữ
List and define the nature and characteristics of a language
PLO 01 IPLO 02 I -
CLO2 Mô tả được các mô hình biểu diễn cấu trúc văn bản ở các mức độ
Describe the current presentation models of text at different levels
PLO 01 R -
CLO3 Giải thích được các kỹ thuật điển hình xử lý ngôn ngữ tự nhiên theo hướng học máy và hướng học sâu
Explain typical machine learning and deep learning techniques for natural language processing
PLO 02 RPLO 09 R -
CLO4 Phát triển ứng dụng xử lý ngôn ngữ tự nhiên sử dụng các công cụ, phần mềm, thư viện hỗ trợ
Develop NLP application using supported tools, software and libraries
PLO 03 RPLO 04 RPLO 09 RPLO 12 I -
CLO5 Trình bày và thảo luận về bài toán xử lý ngôn ngữ tự nhiên
Present and discuss the issue of natural language processing problems
PLO 10 R
Đánh giá học phần
| Thành phần | Tỉ trọng | Thời gian |
|---|---|---|
| Thực hiện và trình bày dự án/bài tập lớn (Perform and present one NLP project) | 70.0% | Tuần 18-20/Week 18-20 |
| Bài tập tuần và/hoặc bài kiểm tra trên lớp (Do assignment exercise and/or mini examination at class) | 30.0% | Toàn bộ quá trình học/Throughout the course |
Tài liệu học tập
Tham khảo
- [1] Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Jurafsky, Daniel, and James H. Martin, 2009, Prentice Hall
- [2] Multilingual speech processing, Schultz, Tanja, and Katrin Kirchhoff, 2006, Elsevier