
Thông tin luận án Tiến sĩ của nghiên cứu sinh Nguyễn Thị Thùy Anh
Tên đề tài luận án: Nghiên cứu phát triển các kỹ thuật học máy hoàn thiện đồ thị tri thức.
1. Họ và tên nghiên cứu sinh: Nguyễn Thị Thùy Anh 2. Giới tính: Nữ
3. Ngày sinh: 12/02/1984 4. Nơi sinh: Phường Trường Vinh, Tỉnh Nghệ An
5. Quyết định công nhận nghiên cứu sinh số 1200/QĐ – CTSV, ngày 29 tháng 12 năm 2020 của Hiệu trưởng Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội.
6. Các thay đổi trong quá trình đào tạo:
7. Tên đề tài luận án: Nghiên cứu phát triển các kỹ thuật học máy hoàn thiện đồ thị tri thức.
8. Ngành đào tạo: Hệ thống thông tin 9. Mã số: 9480104
10. Cán bộ hướng dẫn khoa học:
– Hướng dẫn chính: PGS. TS. Hà Quang Thụy
– Hướng dẫn phụ: PGS. TS. Phan Xuân Hiếu
Thông tin luận án Tiến sĩ của nghiên cứu sinh Nguyễn Thị Thùy Anh (tiếng Anh)
11. Tóm tắt các kết quả mới của luận án:
Đối tượng nghiên cứu của luận án là các mô hình hoàn thiện ĐTTT và các kỹ thuật được áp dụng trong các mô hình đó.
Phạm vi nghiên cứu của luận án tập trung tới các kỹ thuật và giải pháp cải tiến được áp dụng trong các mô hình hoàn thiện ĐTTT. Cụ thể là Kỹ thuật học chuyển giao trên miền dữ liệu ĐTTT mở OlpBench, ReVerb45K, ReVerb20K, FB15K237, WN18RR; Kỹ thuật học đối nghịch (adversarial training) trên tập dữ liệu đa phương thức DB15K, MKG-W, MKG-Y; Kỹ thuật nhúng lịch đại (diachronic embedding) trên các miền dữ liệu về thời gian ICEWS14, ICEWS05-15, GDELT.
Luận án sử dụng phương pháp nghiên cứu kết hợp định tính – định lượng bao gồm:
- Phương pháp nghiên cứu định tính: Luận án tiến hành việc phân tích định tính (theo tiếp cận đọc – suy nghĩ – giải thích) các khái niệm và mô hình từ hệ thống tài liệu liên quan, tập trung vào các tài liệu nghiên cứu tổng quan và các tài liệu nghiên cứu chuyên sâu phù hợp với các mục tiêu nghiên cứu của luận án, thông qua đó, đề xuất các kỹ thuật và mô hình hoàn thiện ĐTTT mới.
- Phương pháp nghiên cứu định lượng: Luận án tiến hành các nghiên cứu định lượng thông qua việc triển khai các hệ thống thực nghiệm tương ứng, tiến hành các kịch bản thực nghiệm để đánh giá hiệu năng của các kỹ thuật và mô hình đề xuất để kiểm chứng, đánh giá kết quả đối với các đề xuất của luận án.
Luận án có ba đóng góp chính sau đây:
- Đề xuất mô hình hoàn thiện ĐTTT qua học chuyển giao BERT/FastText-GRU-KGC được cải tiến từ mô hình GloVe-GRU-KGC do V. Kocijan và T. Lukasiewicz đề xuất năm 2021 theo ý tưởng khai thác tài nguyên nguồn từ mô hình ngôn ngữ BERT/FastText thay cho GloVe và cải tiến thành phần bộ mã hóa từ mô hình gốc GloVe-GRU-KGC. Triển khai thực nghiệm đánh giá hiệu năng của mô hình BERT/FastText-GRU-KGC cho thấy ý tưởng cải tiến là hợp lý khi đối sánh với mô hình GloVe-GRU-KGC gốc. Kết quả nghiên cứu này của luận án được công bố trong [AnhNTT1].
- Đề xuất hai mô hình hoàn thiện ĐTTT đa phương thức ViT-AdaMF-MAT và T5-ViT-AdaMF-MAT được cải tiến từ mô hình AdaMF-MAT được Y. Zhang và cộng sự đề xuất năm 2024, trong đó, ViT-AdaMF-MAT và T5-ViT-AdaMF-MAT sử dụng mô hình nhúng ảnh Vision Transformer (ViT) và mô hình nhúng văn bản T5. Triển khai thực nghiệm đánh giá hiệu năng của mô hình ViT-AdaMF-MAT và T5-ViT-AdaMF-MAT cho thấy ý tưởng cải tiến là hợp lý khi đối sánh với mô hình AdaMF-MAT gốc. Kết quả nghiên cứu này của luận án được công bố trong [AnhNTT4].
- Đề xuất hai mô hình hoàn thiện ĐTTT thời gian là DE-RotatE và DE-RotatE-sinc được cải tiến từ mô hình DE-SimplE do R. Goel và cộng sự đề xuất năm 2020 theo ý tưởng sử dụng phép quay chiếu thay vì sử dụng phép tịnh tiến chiếu trong DE-SimplE. Triển khai thực nghiệm đánh giá hiệu năng của mô hình DE-RotatE và DE-RotatE-sinc cho thấy ý tưởng cải tiến là hợp lý khi đối sánh với mô hình DE-SimplE gốc. Kết quả nghiên cứu này của luận án được công bố trong [AnhNTT2, AnhNTT3].
12. Khả năng ứng dụng trong thực tiễn: Hệ thống chatbots ( tiềm năng)
13. Những hướng nghiên cứu tiếp theo: (nếu có)
- Nghiên cứu các tác động của phương pháp học chuyển giao trong hoàn thiện ĐTTT nhằm hiểu sâu hơn những gì chúng thực sự học được, thay vì chỉ đo lường hiệu suất tổng thể.
- Phân tích khung hoàn thiện ĐTTT đa phương thức CMR (Contrastive learning, Memorization, and Retrieval) để đề xuất ý tưởng cải tiến để xây dựng một mô hình hoàn thiện ĐTTT đa phương thức mới.
- Kết nối các kết quả nghiên cứu của luận án trong các mô hình hoàn thiện ĐTTT thời gian DE-RotatE và DE-RotatE-sinc với giải pháp tận dụng nói tích chập hai-ba chiều trong nhúng lịch đại để nâng cấp, cải tiến các mô hình DE-RotatE và DE-RotatE-sinc.
- Tiến hành khảo sát phân tích lỗi để làm cơ sở đối với những nghiên cứu tiếp theo.
- Tích hợp thành phần hoàn thiện ĐTTT vào các hệ thống chatbots.
14. Các công trình đã công bố có liên quan đến luận án:
[AnhNTT1] Thuy-Anh Nguyen Thi, Thi-Hong Vuong, Thi-Hanh Le, Xuan-Hieu Phan, Thi-Thao Le, Quang-Thuy Ha. Knowledge Base Completion with transfer learning using BERT and fastText. KSE 2022: 1-6. Scopus, DBLP[1]. Công trình nghiên cứu này đã nhận được một tham chiếu trên Scopus từ các nhà khoa học khác.
[AnhNTT2] Thuy-Anh Nguyen Thi, Viet-Phuong Ta, Xuan Hieu Phan, Quang-Thuy Ha. An Improvement of Diachronic Embedding for Temporal Knowledge Graph Completion. ACIIDS (2) 2023[2]: 111-120. Scopus, DBLP. Công trình nghiên cứu này đã nhận được một tham chiếu trên Scopus từ các nhà khoa học nước ngoài.
[AnhNTT3] Thuy-Anh Nguyen Thi, Hieu Cong Nguyen, Xuan-Hieu Phan, Quang-Thuy Ha. Time Factor in Diachronic Embedding for Temporal Knowledge Graph Completion. Book of Abstracts, International Joint Conference on Rough Sets (IJCRS 2023), pp. 26-28.
[AnhNTT4] Thuy-Anh Nguyen Thi, Cong-Hoang Le, Viet-Phuong Ta, Xuan-Hieu Phan, Quang-Thuy Ha. The Impact of Embeddings on the Performance of Multi-modal Knowledge Graph Completion. KSE 2024. Scopus, DBLP.
[1] https://dblp.org/pid/334/3367.html
[2] International CORE Conference Rankings ( ICORE): Rank B. http://portal.core.edu.au/conf-ranks/2188/