Bài báo: “Transformer-based End-to-End Object Detection in Aerial Images”
Link bài báo:
Sinh viên thực hiện:
Lê Duy Nguyên – KTPM2022.2 – Đồng tác giả
Lê Hữu Độ - KTPM2022.1 – Đồng tác giả
Ngô Hương Giang – KTPM2022.1 – Đồng tác giả
Đoàn Danh Dự - KTPM2022.1 – Đồng tác giả
Giảng viên hướng dẫn:
TS. Nguyễn Tấn Trần Minh Khang
ThS. Võ Duy Nguyên
Tóm tắt bài báo:
Trong một thập kỷ gần đây, các mô hình Transformer đã đạt được những bước tiến quan trọng trong lĩnh vực Trí Tuệ Nhân Tạo, chủ yếu trong lĩnh vực xử lý văn bản và ngôn ngữ tự nhiên. Ứng dụng của các mô hình này trong lĩnh vực xử lý ảnh, đặc biệt là trên dữ liệu không ảnh đang được nghiên cứu một cách tích cực. Bài nghiên cứu này tập trung vào việc thực nghiệm các mô hình dựa trên kiến trúc Transformer như DETR, DAB-DETR và DINO trên bộ dữ liệu Visdrone, một bộ dữ liệu quan trọng và đầy thách thức cho xử lý ảnh không ảnh. Kết quả của thử nghiệm cho thấy rằng các mô hình Transformer có tiềm năng lớn, đặc biệt trong việc phát hiện đối tượng trên dữ liệu không ảnh. Tuy nhiên, việc áp dụng cũng đối mặt với các thách thức như độ phân giải thấp, các đối tượng xuất hiện dày đặc và môi trường nhiễu. Nghiên cứu này cung cấp một cái nhìn sơ bộ về tiềm năng và hạn chế của các phương pháp Transformer trong lĩnh vực này, với hi vọng thúc đẩy sự phát triển và tối ưu hóa các ứng dụng thực tiễn như theo dõi giao thông, bảo vệ môi trường và nhiều ứng dụng khác.
"Chúng em xin chân thành gửi lời cảm ơn đến Khoa Công nghệ Phần mềm, PTN Truyền thông Đa phương tiện và nhóm nghiên cứu tài xỉu online -Together đã tạo điều kiện giúp chúng em có thể nghiên cứu và hoàn thành bài báo này."
IJACSA (International Journal of Advanced Computer Science and Applications) là một tạp chí khoa học máy tính uy tín đại diện cho những nghiên cứu hàng đầu. Các bài nghiên cứu, đánh giá và khảo sát do IJACSA xuất bản có đóng góp quan trọng trong ngành khoa học máy tính và thúc đẩy sự quan tâm của một lượng lớn độc giả. Phạm vi của tạp chí bao gồm tất cả các lĩnh vực chính của khoa học máy tính và các ứng dụng có liên quan. Tạp chí được đánh chỉ mục bởi Scopus, Scimagojr (Q3), Web of Science (ESCI).
Thông tin chi tiết:
Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin