Claude của Anthropic vẫn chưa đánh bại được Pokémon – Ars Technica

**Phần Giới thiệu**

Bài viết phân tích thí nghiệm “Claude chơi Pokémon” của Anthropic, cho thấy dù mô hình AI Claude 3.7 Sonnet có những tiến bộ đáng kể trong khả năng lập luận, nhưng vẫn gặp khó khăn trong việc chơi một trò chơi dành cho trẻ em, đặt ra câu hỏi về sự phát triển của trí tuệ nhân tạo tổng quát (AGI).

**Nội dung chi tiết**

Nhiều chuyên gia dự đoán AGI sẽ xuất hiện trong vài năm tới. Anthropic đã giới thiệu thí nghiệm Claude chơi Pokémon để chứng minh khả năng lập luận cải thiện của mô hình Claude 3.7 Sonnet. Mặc dù Sonnet vượt trội so với các phiên bản trước, nhưng nó vẫn gặp nhiều khó khăn như đi lạc, bị mắc kẹt, hoặc tương tác lặp lại với NPC. Khả năng hiểu hình ảnh của Claude còn hạn chế, đặc biệt với đồ họa độ phân giải thấp của Game Boy. Tuy nhiên, Claude thể hiện khả năng xử lý văn bản tốt hơn, tích hợp thông tin và xây dựng chiến lược hiệu quả trong các trận đấu. Hạn chế về “bộ nhớ” (context window) và việc tin tưởng mù quáng vào thông tin sai lệch trong cơ sở dữ liệu cũng cản trở tiến trình chơi game của Claude. Dù vậy, Claude 3.7 Sonnet thể hiện khả năng tự nhận biết sai lầm và điều chỉnh chiến lược tốt hơn các phiên bản trước.

**Kết bài**

Thí nghiệm Claude chơi Pokémon cho thấy sự tiến bộ đáng kể của AI nhưng cũng làm nổi bật khoảng cách giữa khả năng hiện tại và AGI. Việc cải thiện khả năng xử lý hình ảnh, mở rộng bộ nhớ, và tăng cường khả năng tự nhận thức là những hướng phát triển quan trọng cho tương lai.

**Từ khóa**: Anthropic, Claude, AGI, Trí tuệ nhân tạo tổng quát, Pokémon, AI, lập luận, xử lý hình ảnh, bộ nhớ, Game Boy.

Nguồn: https://arstechnica.com/ai/2025/03/why-anthropics-claude-still-hasnt-beaten-pokemon/

Optimized by Optimole