Xử lý ngôn ngữ tự nhiên hust

Đề cương môn học

Bài giảng

Bài tập lớn

ĐỀ CƯƠNG MÔN HỌC

file pdf

Mô tả môn học

Môn học này cung cấp các kiến thức cơ sở về các phương pháp xử lý ngôn ngữ tự nhiên thông qua máy tính như phân tích hình thái từ, phân tích từ loại, phân tích cú pháp, phân tích ngữ nghĩa. Đó là các kiến thức cơ bản, là phương tiện giúp học viên có thể xây dựng các ứng dụng thực tế hơn như kiểm tra tính chính xác của văn bản, hiểu và tóm tắt văn bản, phân loại văn bản, trích rút thông tin, dịch máy, sinh văn bản, chuyển các văn bản thành dữ liệu có cấu trúc, giao diện ngôn ngữ tự nhiên để truy vấn CSDL…

Nội dung môn học

Học phần cung cấp các kiến thức về:
• Các khái niệm cơ bản về xử lý ngôn ngữ tự nhiên
• Các phương pháp phân tích từ
• Các phương pháp phân tích từ loại
• Một số cách tiếp cận cơ bản trong phân tích cú pháp
• Phương pháp biểu diễn và phân tích ngữ nghĩa
• Một số hướng nghiên cứu mới, tiêu biểu trong xử lý ngôn ngữ

Đánh giá kết quả

• Điểm quá trình: 30%
• Thi cuối kỳ: 70%

Tài liệu tham khảo về lý thuyết

  1. Christopher Manning and Hinrich Schütze. 1999. Foundations of Statistical Natural Language Processing. The MIT Press.
  2. Dan Jurafsky and James Martin. 2000. Speech and Language Processing. PrenticeHall.
  3. James Allen. 1994. Natural Language Understanding. The Benajmins/Cummings Publishing Company Inc.
  4. Barton, E., Berwick, R., & Ristad, E.. 1987. Computational Complexity and Natural Language. The MIT Press. ISBN 0-26-02266-4.

Tài liệu tham khảo hỗ trợ lập trình

  1. Grant Ingersoll, Thomas Morton, Drew Farris. Taming Text : cho người lập trình bắt đầu học NLP và Search. Mỗi chương đều có ví dụ sử dụng các mã nguồn mở.
  2. Steven Bird, Ewan Klein, and Edward Loper .Natural Language Processing with Python : hướng dẫn sử dụng NLTK qua các công việc như phân loại văn bản, trích rút thông tin, …

Một số mã nguồn mở về Xử lý ngôn ngữ tự nhiên:

  1. Stanford's Core NLP Suite (viết bằng Java): http://stanfordnlp.github.io/CoreNLP/
  2. Natural Language Toolkit (viết bằng Python): http://www.nltk.org/
  3. Apache Lucene and Solr: http://lucene.apache.org/
  4. Apache OpenNLP (viết bằng Java): http://opennlp.apache.org/
  5. Apache UIMA: https://uima.apache.org/
  6. GATE (General architecture for text engineering, viết bằng Java): https://gate.ac.uk/

1.introduction.pdf

2.word segmentation_tách từ tiếng việt.pdf

3.pos_gán nhãn từ loại.pdf

4.syntactic parse_phân tích cú pháp_2.pdf

4_probabilistic parse_phân tích cú pháp xác suất.pdf

5.semantics_phân tích ngữ nghĩa_1.pdf

5.semantics_phân tích ngữ nghĩa_2.pdf

6.machine translation_dịch máy.pdf

7.textcat_phân loại văn bản.pdf

7_textcat_apriori_phân loại tin tự động cho báo điện tử.pdf

7_textcat_lexical chain_phân lớp văn bản tiếng việt theo hướng tiếp cận lexical chain.pdf

8.ir_phản hồi thông tin.pdf

btl.pdf

btl_bài tập lớn môn xử lý ngôn ngữ tự nhiên.pdf

các bạn tự tìm sách trên google theo gợi ý bên dưới nhé!

Co4021_Xulyngonngutunhien.Pdf

Natural Language Processing With Python.Pdf

Giới thiệu, nội dung môn học

Mục đích môn học -Hiểu các nguyên tắc cơ bản và các cách tiếp cận trong XLNNTN -Học các kỹ thuật và công cụ có thể dùng để phát triển các hệ thống hiểu văn bản hoặc nói chuyện với con người -Thu được một số ý tưởng về các vấn đề mở trong XLNN Tài liệu tham khảo -Christopher Manning and Hinrich Schütze. 1999. Foundations of Statistical Natural Language Processing. The MIT Press. -Dan Jurafsky and James Martin 2000 Speech and Language Processing. PrenticeHall. -James Allen. 1994. Natural Language Understanding. The Benjamins/Cummings Publishing Company Inc.

Mô tả môn học

Học phần này cung cấp các kiến thức cơ bản về các bài toán xử lý ngôn ngữ tự nhiên (XLNNTN) thông qua máy tính: phân tích hình thái từ, tách từ, gán nhãn từ loại, phân tích cú pháp, phân tích ngữ nghĩa. Ngoài ra, sinh viên cũng được giới thiệu một số ứng dụng quan trọng của XLNNTN: hệ thống hỏi đáp tự động, dịch máy, trích rút thông tin.

Thông qua nhiệm vụ của bài tập lớn, sinh viên sẽ có được kinh nghiệm xây dựng một ứng dụng thực tế có sử dụng các kỹ thuật XLNNTN đã được học. Ngoài ra môn học cũng cung cấp cho sinh viên các kỹ năng nghiên cứu, kỹ năng làm việc nhóm, thuyết trình và thái độ cần thiết để làm việc trong công ty sau này.

Điều kiện

Học phần tiên quyết:
Học phần học trước: -IT3160: Nhập môn Trí tuệ nhân tạo
Học phần song hành: Không

Giảng viên

Xử lý ngôn ngữ tự nhiên hust

Staff Member #1

Biography of instructor/staff member #1

Xử lý ngôn ngữ tự nhiên hust

Staff Member #2

Biography of instructor/staff member #2

Các câu hỏi thường gặp

SoICT viết tắt của cụm từ gì?

School of Information and Communication Technology

Xem website chính thức https://soict.hust.edu.vn để có thêm thông tin chi tiết.

Các ứng dụng nào trong thực tế có liên quan tới học phần này?

Học phần được ứng dụng trong nhiều mặt của đời sống xã hội và nghiên cứu.