Chuyên Mục

​Google mài giũa ngôn ngữ trí tuệ nhân tạo bằng 11.000 tiểu thuyết

TTO - Học hỏi cách sử dụng ngôn ngữ trong 11.000 cuốn tiểu thuyết, Google mong muốn khả năng xử lý ngôn ngữ trong công nghệ trí tuệ nhân tạo của họ sẽ tự nhiên hơn. 

Google đang đẩy mạnh các dự án nghiên cứu trí tuệ nhân tạo - Ảnh: Hubpages
Google đang đẩy mạnh các dự án nghiên cứu trí tuệ nhân tạo - Ảnh: Hubpages

Điều đáng nói là Google đã lẳng lặng làm việc này mà không thông báo cho các tác giả biết và nhiều nhà văn đã "té ngửa" khi biết chuyện.

Theo Guardian, lần đầu tiên khi nhà văn Rebecca Forster biết việc Google đang sử dụng tác phẩm của bà cho dự án công nghệ của họ, bà nói: "Chuyện này có khác gì so với việc ai đó dùng một cuốn sách của tôi để nhóm lửa không? Tôi chưa rõ. Tôi không biết mục đích của họ là gì. Nhưng chắc chắn là nó sẽ không đưa tôi đến với các độc giả của mình".

Sau sự nghiệp viết lách 25 năm, bà đã xuất bản 29 tiểu thuyết với đủ loại đề tài, từ lãng mạn cho tới điều tra, tuy nhiên điều mà bà không ngờ nhất là tới một thời đại sách của bà lại có thêm một độc giả mới: trí truệ nhân tạo của Google.

Tuy nhiên, sách của bà Forster chỉ là một trong số 11.000 cuốn tiểu thuyết khác đang được các nhà nghiên cứu thuộc dự án Google Brain sử dụng với mục đích nâng cao khả năng sử dụng ngôn ngữ của trí tuệ nhân tạo (AI).

Sau khi đưa dữ liệu thông tin từ những cuốn sách này vào hệ thống AI, thông qua các giải pháp công nghệ của họ, hệ thống sẽ có khả năng tạo ra được những câu nói trôi chảy, tự nhiên hơn.

Theo một người phát ngôn của Google, những ứng dụng kiểu như của Google sẽ "hữu dụng hơn nhiều nếu chúng có thể nắm bắt được sắc thái ngôn ngữ tốt hơn".

Cũng theo người này, hiện tại nghiên cứu mới chỉ đang ở giai đoạn kiểm nghiệm ý tưởng, tuy nhiên các phương pháp đó sẽ giúp Google hiểu hơn và tạo ra được một loạt dạng thức văn bản có sắc thái tự nhiên hơn trong khi xử lý từng nhiệm vụ cụ thể.

Người này cho biết sở dĩ các nhà nghiên cứu sử dụng tiểu thuyết để "đào tạo" ngôn ngữ cho AI là vì ở thể loại sách này, AI có thể học được nhiều cách diễn đạt khác nhau về cùng một vấn đề, cùng với đó ngôn ngữ, cụm từ và ngữ pháp trong các cuốn sách hư cấu thường đa dạng và phong phú hơn so với các sách phi hư cấu.

Tuy nhiên vấn đề duy nhất trong dự án này là họ đã không hỏi ý kiến các tác giả. Google cho biết những cuốn tiểu thuyết họ dùng trong dự án này là lấy từ bộ sưu tập sách Books Corpus do Ryan Kiros và những người khác thu thập gồm 11.038 cuốn sách từ mạng Internet. Đó cũng là bộ sưu tập đã được các nhà nghiên cứu khác làm việc trong lĩnh vực trí tuệ nhân tạo sử dụng.

Nhiều tác giả khi biết chuyện đều cho rằng lẽ ra Google nên thông báo với họ về việc này, nhất là trong thời buổi công nghệ, việc gửi một thông báo như thế tới họ hoàn toàn rất đơn giản.

D. KIM THOA

Bình Luận

Vui lòng nhập nội dung bình luận.

Gửi
Top