Anthropic hủy hàng triệu sách in để huấn luyện AI.

**Phần Giới thiệu**

Công ty AI Anthropic đã chi hàng triệu đô la để số hóa sách in, thậm chí cắt xén và vứt bỏ bản gốc, nhằm huấn luyện mô hình AI Claude, tương tự như ChatGPT.

**Phần chính**

* **Thuê chuyên gia:** Anthropic đã thuê một cựu giám đốc dự án quét sách của Google để thực hiện dự án tham vọng: số hóa “tất cả sách trên thế giới”.

* **Quy trình số hóa:** Hàng triệu cuốn sách in đã bị cắt xén, quét thành dữ liệu số, và bản gốc bị loại bỏ hoàn toàn. Mục đích duy nhất là cung cấp dữ liệu huấn luyện cho AI Claude.

* **Tiết lộ trong phán quyết:** Chi tiết này được hé lộ trong một phán quyết về quyền tác giả liên quan đến sử dụng hợp lý (fair use). Những tác động rộng lớn hơn của phán quyết này đã được báo cáo trước đó.

**Kết bài**

Hành động này của Anthropic gây ra nhiều tranh cãi về đạo đức và quyền tác giả trong quá trình phát triển AI. Chúng ta cần thảo luận sâu hơn về việc sử dụng tài liệu có bản quyền để huấn luyện AI một cách công bằng và bền vững.

**Từ khóa**

* Anthropic
* Claude
* AI
* Số hóa sách
* Quét sách
* Quyền tác giả
* Sử dụng hợp lý (Fair use)
* Huấn luyện AI
* ChatGPT

Nguồn: https://arstechnica.com/ai/2025/06/anthropic-destroyed-millions-of-print-books-to-build-its-ai-models/

Optimized by Optimole