Chúc mừng sinh viên ngành Khoa học Dữ liệu Đoàn Long An có bài báo chấp nhận đăng tại Hội nghị Quốc tế về Xử lý Ngôn ngữ Châu Á - 2022 International Conference on Asian Language Processing (IALP 2022). Bài báo “Improving Sentiment Analysis By Emotion Lexicon Approach on Vietnamese Texts” được thực hiện dưới sự hướng dẫn của giảng viên ThS. Lưu Thanh Sơn.
Tóm tắt bài báo:
Nhiệm vụ phân tích cảm xúc có nhiều ứng dụng khác nhau trong thực tế. Trong nhiệm vụ phân tích cảm xúc, việc các từ và cụm từ thể hiện cảm xúc tích cực và tiêu cực là rất quan trọng. Tìm ra các từ biểu thị cảm xúc từ văn bản có thể cải thiện hiệu suất của các mô hình phân loại cho nhiệm vụ phân tích cảm xúc. Trong bài báo này, chúng tôi đề xuất một phương pháp kết hợp từ điển cảm xúc với mô hình phân loại để nâng cao độ chính xác của mô hình. Kết quả thử nghiệm của chúng tôi cho thấy rằng từ vựng cảm xúc kết hợp với mô hình phân loại giúp cải thiện hiệu suất của các mô hình. Bên cạnh đó, chúng tôi cũng có những đóng góp bổ sung liên quan đến bài toán, chẳng hạn như việc triển khai các kỹ thuật tiền xử lý dữ liệu và cài đặt các mô hình để kết hợp cùng phương pháp được xây dựng một cách hiệu quả nhất, giúp cải thiện đáng kể khả năng phân tích cảm xúc ngôn ngữ tiếng Việt.
Em xin gửi lời cảm ơn đến Thầy Lưu Thanh Sơn – Giảng viên Khoa Khoa học và Kỹ thuật Thông tin và Anh Chị đi trước đã đồng hành cùng Em trong quá trình nghiên cứu và công bố bài báo khoa học quốc tế.
Hội nghị Quốc tế về Xử lý Ngôn ngữ Châu Á - 2022 International Conference on Asian Language Processing (IALP 2022) là hội nghị hàng đầu của Hiệp hội Xử lý Thông tin Ngôn ngữ Phương Đông và Trung Quốc (COLIPS). Đây là một loạt các hội nghị với trọng tâm duy nhất là Xử lý Ngôn ngữ Châu Á. Hội nghị nhằm mục đích thúc đẩy khoa học và công nghệ của tất cả các khía cạnh của Xử lý ngôn ngữ châu Á bằng cách cung cấp một diễn đàn cho các nhà nghiên cứu trong các lĩnh vực nghiên cứu ngôn ngữ khác nhau gặp gỡ.
Thông tin chi tiết:
Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin