Bài báo: "A Benchmark of Parsing Vietnamese Publications" do sinh viên Nguyễn Trọng Thuận, Nguyễn Trần Phúc An và Nguyễn Quang Thuận thực hiện dưới sự hướng dẫn của TS. Nguyễn Tấn Trần Minh Khang và PGS. TS. Nguyễn Văn Tâm. Bài báo đã được chấp nhận đăng tại Tạp chí IEEE Access.
Tóm tắt bài báo:
Trong thập kỷ gần đây, chuyển đổi kỹ thuật số đã nhận được sự quan tâm ngày càng lớn trên toàn thế giới và điều này đã thúc đẩy sự bùng nổ của số hóa tài liệu. Trong nghiên cứu này, chúng tôi đề cập đến vấn đề phân tích tài liệu kỹ thuật số, đặc biệt là các ấn phẩm tiếng Việt. Các ấn phẩm của Việt Nam được nhiều người biết đến với tính biến hóa cao, bố cục đa dạng, một số ký tự có ký hiệu trọng âm và ký tự phái sinh đặt ra nhiều thách thức cho bài toán. Để đạt được mục tiêu này, chúng tôi thu thập bộ dữ liệu tài xỉu online -DODV-Ext: một hình ảnh tài liệu tiếng Việt đầy thách thức bao gồm các bài báo khoa học và sách giáo khoa với 5.000 hình ảnh được chú thích đầy đủ. Bên cạnh đó, chúng tôi giới thiệu một framework chung để phân tích các ấn phẩm tiếng Việt gồm có hai thành phần: phát hiện các thành trên tài liệu và nhận diện chú thích. Cuối cùng, chúng tôi trình bày một trình phân tích kết hợp đạt được vị trí hàng đầu trên benchmark.
IEEE Access là tạp chí khoa học bình duyệt truy cập mở được xuất bản bởi Viện Kỹ sư điện và điện tử (Mỹ), được thành lập vào năm 2013. Tổng biên tập sáng lập là Michael Pecht và tổng biên tập hiện tại là Derek Abbott. Tạp chí đã giành được một Giải thưởng PROSE vào năm 2015 cho tạp chí mới hay nhất trong khoa học, công nghệ, kỹ thuật và toán học. Tạp chí IEEE Access thuộc xếp hạng cao nhất SCIE-Q1.
Thông tin chi tiết:
Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin