Robot di động ngày càng được sử dụng rộng rãi trong nhiều lĩnh vực của nền công nghiệp 4.0. Ứng dụng robot di động có thể mang lại những hiệu quả về thời gian, tối ưu sản xuất, lợi ích kinh tế,... Tuy nhiên, để robot di động ổn định, linh hoạt trong môi trường thay đổi luôn là vấn đề được nhiều nhà khoa học quan tâm. Trong đó, bài toán điều hướng robot di động được xem là bài toán quan trọng trong lĩnh vực robot. Nhiều nghiên cứu và giải pháp kỹ thuật đã được đề xuất và thử nghiệm nhằm giải quyết vấn đề này, trong đó phương pháp học tăng cường (RL) đã thu hút được nhiều sự quan tâm vì những ưu điểm như giúp robot có khả năng tự học và ngày càng nâng cao khả năng của robot. Bài báo này đề xuất một giải pháp điều hướng cho robot di động dựa trên thuật toán Q-Learning và phương pháp tránh vật cản tự động. Bên cạnh đó, mối quan hệ và đặc điểm giữa các hành vi của robot và điều kiện môi trường cũng được phân tích. Kết quả của mô phỏng trên nền tảng Gazebo được so sánh với kết quả khi ứng dụng thuật toán SARSA để chứng minh tính hiệu quả của phương pháp đề xuất.