Đó là bài viết về đề tài nghiên cứu "GAC3D: improving monocular 3D object detection with ground-guide model and adaptive convolution" của Bùi Việt Minh Quân và Ngô Đức Tuấn với sự hướng dẫn của hai giảng viên Nguyễn Đức Dũng và Phạm Hoàng Anh, cùng đồng hành và tiếp sức cho hai sinh viên trong quá trình nghiên cứu và công bố bài báo khoa học.
Chia sẻ về bài báo khoa học, Ngô Đức Tuấn cho biết nội dung bài báo tập trung giải quyết bài toán nhận diện vật thể trong không gian 3D dựa trên ảnh 2D. Theo đó, trong lĩnh vực xe tự lái và robotics, việc nhận diện vật thể trong không gian 3 chiều như vị trí, kích thước và hướng di chuyển của vật… là vô cùng cần thiết. Trước đây, các phương pháp cho bài toán này đòi hỏi phương tiện phải trang bị cảm biến Radar hoặc Lidar để có thể xác định được vị trí và khoảng cách của vật cản. Tuy nhiên, các cảm biến này có giá thành khá cao nên khó ứng dụng vào thực tế. Một giải pháp thay thế là sử dụng camera vì giá thành rẻ và hầu hết được trang bị trên các phương tiện hiện đại. Chính vì vậy, nhóm phát triển một hệ thống nhận diện vật thể trên không gian 3D dựa vào ảnh thu được từ camera, cụ thể là nhận diện các phương tiện tham gia giao thông phổ biến như ô tô, xe máy, người đi bộ.
Trong bài báo này, nhóm kết hợp sử dụng mô hình học sâu và các phép biến đổi về hình học từ ảnh sang không gian 3D để cải thiện độ chính xác của thuật toán. "Ngoài ra độ phức tạp của mô hình không quá lớn, nhóm đã triển khai hệ thống trên thiết bị nhúng (mạch Jetson) và có thể nhận diện trong thời gian thực, phù hợp ứng dụng trong lĩnh vực xe tự lái" - Đức Tuấn chia sẻ thêm về nội dung bài báo khoa học của nhóm.
PeerJ Computer Science là tạp chí khoa học bình duyệt, truy cập mở về chuyên ngành Khoa học máy tính do một nhóm các nhà khoa học hàng đầu thế giới từ IBM, UCLA, Google... lập ra. Tạp chí được xếp hạng SCIE-Q1 bởi SCImago từ năm 2017 đến nay.