Công dụng của các công cụ dựa trên trí tuệ nhân tạo (AI) có thể lên tới hàng trăm. Đó không chỉ là công nghệ đã cách mạng hóa việc tạo ra nội dung như DALL-E, hay ChatGPT hoặc Bing Chat (đã đổi tên thành Copilot) mà giờ đây còn có thể đoán ra bức ảnh được chụp ở đâu.
Hệ thống AI PIGEON có thể giúp xác định vị trí bức ảnh khi nhìn vào chúng.
Ba sinh viên Đại học Stanford là Michal Skreta, Silas Alberti và Lukas Haas đã bắt tay vào dự án liên quan đến GeoGuessr. Đó là một trò chơi trực tuyến nổi tiếng mà ở đó, người chơi được cung cấp một hình ảnh thu được từ công cụ Street View của Google và họ phải ghim trên bản đồ thế giới để cố gắng đến vị trí được đề cập gần nhất có thể.
Vì trò chơi này rất phổ biến nên sinh viên tự hỏi liệu AI có thể đánh bại một người chơi hay không. Để làm được điều đó, họ đã chọn một phần mềm phân tích hình ảnh dựa trên hệ thống OpenAI được gọi là CLIP. Về cơ bản, những gì hệ thống làm là tìm hiểu về hình ảnh thông qua văn bản.
Sau một số lần chỉnh sửa hệ thống và đào tạo với khoảng 500.000 hình ảnh từ Google Street View, bộ ba sinh viên đã tạo ra hệ thống PIGEON. Mặc dù quá trình đào tạo không quá chuyên sâu nhưng PIGEON vẫn có thể đoán chính xác quốc gia trong 95% hình ảnh và đưa ra vị trí chính xác, với sai số chỉ ở mức 40km.
Dữ liệu Street View của Google đóng vai trò quan trọng trong hoạt độgn của PIGEON.
Với những gì mang lại, PIGEON có thể giúp các tổ chức môi trường sử dụng để giám sát đa dạng sinh học của môi trường, như một công cụ giảng dạy hoặc xác định con đường hay đường dây điện cần sửa chữa. Tuy nhiên, nó cũng có thể gây ra mối nguy hiểm khi các tổ chức do thám hoặc cơ quan chính phủ có thể kiểm soát công dân của họ.
Mặc dù ba sinh viên trên đã xuất bản bài báo trên trang web arXiv để trình bày một số khía cạnh của hệ thống nhưng họ chưa tiết lộ tất cả những bí mật bên trong PIGEON do lo ngại rằng nó có thể được sử dụng cho các mục đích phi đạo đức.
Cát Tường