Robot của Google tự học đi trong môi trường thực

Rainbow Dash có thể đi bộ trên nhiều bề mặt như tấm nệm xốp hoặc thảm lau chân với nhiều điểm gấp khúc ngẫu nhiên. Lĩnh vực chế tạo robot đã ngày càng tiến bộ, trong đó có con robot mang lên Rainbow Dash với khả năng tự học cách đi bộ. Mẫu robot bốn chân này chỉ cần vài giờ để học cách đi lùi và tiến, rẽ phải và trái.

Các nhà nghiên cứu từ Google, UC Berkeley và Viện Công nghệ Georgia đã xuất bản một bài báo trên trang ArXiv mô tả một kỹ thuật AI thống kê được gọi là học tăng cường sâu mà họ đã sử dụng để tạo ra thành tựu robot thông minh thế hệ mới.

Hầu hết các kỹ thuật tự học thông minh trước đây đều diễn ra trong môi trường mô phỏng máy tính. Tuy nhiên, Rainbow Dash đã sử dụng công nghệ này để học cách đi bộ trong môi trường vật lý thực tế. Hơn nữa, nó có thể làm như vậy mà không cần một cơ chế giảng dạy chuyên dụng, chẳng hạn như người hướng dẫn hoặc dữ liệu lập trình sẵn. Rainbow Dash đã thành công khi đi bộ trên nhiều bề mặt, bao gồm nệm xốp mềm và thảm lau chân với nhiều điểm gấp khúc ngẫu nhiên.

Các kỹ thuật học sâu mà robot sử dụng bao gồm một loại học máy thử đúng và sai liên tục bằng cách tương tác nhiều lần với môi trường. Cách này tương tự như các trò chơi máy tính dùng phương pháp kỹ thuật số học cách chơi để giành chiến thắng. Hình thức học máy này khác biệt rõ rệt với học tập có giám sát hoặc không giám sát truyền thống, trong đó các mô hình học máy đòi hỏi dữ liệu đào tạo phải được phân định rõ ràng. Học tăng cường sâu kết hợp các phương pháp học tăng cường với học sâu , trong đó quy mô của học máy truyền thống được mở rộng đáng kể bằng sức mạnh của các phép tính toán khổng lồ.

Robot có thể tự học và hoạt động độc lập mà không cần người hướng dẫn hoặc dữ liệu lập trình sẵn. Ảnh: Techxplore

Mặc dù nhóm nghiên cứu cho rằng Rainbow Dash đã học cách tự đi lại, sự can thiệp của con người vẫn đóng một vai trò quan trọng trong việc đạt được mục tiêu đó. Các nhà nghiên cứu đã phải tạo ra các đường ranh giới, robot phải học cách đi bộ để giữ cho nó không rời khỏi khu vực. Họ cũng đã phải nghĩ ra các thuật toán cụ thể để ngăn robot rơi xuống, một trong số đó là tập trung vào việc kìm hãm chuyển động của robot. Để ngăn ngừa tai nạn và thiệt hại do rơi xuống, việc học tăng cường robot thường diễn ra trong môi trường kỹ thuật số trước khi các thuật toán được chuyển sang dạng vật lý để bảo vệ sự an toàn của robot.

Thành công của Rainbow Dash đạt được sau khoảng một năm các nhà nghiên cứu tìm ra cách cho robot học môi trường vật lý thực tế thay vì dạng ảo như trước đây. Chelsea Finn, giáo sư trợ lý Stanford liên kết với Google nói: "Loại bỏ con người khỏi quá trình học tập của robot là điều thực sự khó khăn. Bằng cách cho phép robot học tự chủ, nó có thể hoạt động gần gũi hơn với khả năng học sâu tăng cường trong thế giới thực".

An Phạm (Theo Techxplore)

CÓ THỂ BẠN QUAN TÂM