Dịch máy: NMT dịch tác phẩm văn học với độ chính xác đến 25%

Nghiên cứu mới về dịch máy bằng nơ-ron (NMT) khẳng định rằng công nghệ này có thể dịch tác phẩm văn học với độ chính xác lên đến 25%. Nghe thì có vẻ đây không phải là một con số to tát mấy nhưng với độ phức tạp của việc dịch thuật văn học sáng tạo sẽ khiến con số này trở nên ấn tượng với kết quả của công nghệ này.

Các ứng dụng nổi tiếng nhất của NMT là các nền tảng như Google Dịch và Skype Translator, thậm chí nếu công nghệ đằng sau chúng vẫn còn là một bí ẩn đối với đa số người dùng. Dịch máy bằng nơ-ron vận dụng deep learning (học sâu) để áp dụng bối cảnh với các từ và cụm từ, như vậy nó giúp loại bỏ một trong những chướng ngại lớn nhất giữa dịch máy và ứng dụng của nó trong thế giới thực.

NMT dịch chính xác đến 25%


NMT đạt được tỷ lệ chính xác đến 25% đối với tác phẩm văn học

Lối nói tự nhiên là một điều phức tạp và thách thức lớn nhất đối với dịch máy chính là hiểu được ý nghĩa đằng sau những lựa chọn ngôn từ của chúng ta, tự truyền tải ý nghĩa tương tự qua một ngôn ngữ khác. Ví dụ như từ “set” vừa có thể là danh từ, động từ hay tính từ với các nghĩa đa dạng khác nhau phụ thuộc vào việc chúng đứng ở đâu và được sử dụng như thế nào trong câu.

Dịch máy bằng nơ-ron hướng đến việc hiểu các hàm nghĩa đằng sau các từ và cụm từ bằng các dự đoán thứ tự từ và ứng dụng chúng vào bối cảnh thông qua deep learning. Điều này cho phép công nghệ quyết định khi nào “set” được sử dụng như một danh từ và khi nào nó được dùng như một động từ.

Đây là một ví dụ đơn giản nhưng giúp giải thích được điều gì đang diễn ra ở các cấp độ của thuật toán.

Một trường hợp vận dụng phức tạp hơn khi dùng NMT để dịch các tác phẩm văn chương và đây chính xác là điều mà Tiến sĩ Antonio Toral, Trợ lý Giáo sư tại trường Đại học Groningen và Giáo sư Andy Way, Giảng viên Tin học và Phó Giám đốc của trung tâm ADAPT về công nghệ nội dung số của châu Âu, thực hiện trong dự án nghiên cứu của họ.

Họ sử dụng dịch máy bằng nơ-ron để dịch 12 tiểu thuyết nổi tiếng đình đám:

  1. Sunset Park của Auster (2010)
  2. Đấu trường sinh tử #3 của Collins (2010)
  3. Chúa Ruồi của Golding (1954)
  4. Ông già và biển cả của Hemingway (1952)
  5. Ripley Under Water của Highsmith (1991)
  6. Ngàn mặt trời rực rỡ của Hosseini (2007)
  7. Ulysses của Joyce (1922)
  8. Trên đường của Kerouac (1957)
  9. 1984 của Orwell (1949)
  10. Harry Potter #7 của Rowling (2007)
  11. Bắt trẻ đồng xanh của Salinger (1951)
  12. Chúa tể của những chiếc nhẫn #3 của Tolkien (1955)

Cả hai đã phát triển một mô hình NMT để dịch các tiểu thuyết từ tiếng Anh sang tiếng Catalunya và so sánh các kết quả đối ngược với một hệ thống dịch máy thống kê dựa theo cụm từ (PBSMT) với cùng các tác phẩm văn học. Họ nhận thấy rằng mô hình NMT thành công hơn tới 11% khi dịch các tiểu thuyết một cách chính xác, có 17%-34% người bản xứ so sánh các kết quả này có chất lượng ngang với sản phẩm được thực hiện bởi người dịch.

Điều này muốn nói gì cho chúng ta về dịch máy?

Những phát hiện của Tiến sĩ Antonio và Giáo sư Andy Way làm sáng tỏ việc dịch máy đã phát triển như thế nào trong những năm gần đây – phần lớn nhờ vào machine learning (học máy) và những công nghệ liên quan. Nửa thập kỷ trước khó mà tưởng tượng được rằng một thuật toán lại hữu dụng với các công việc dịch thuật văn học và các sản phẩm sáng tạo khác.

Tất nhiên, độ chính xác 25% vẫn chưa đủ để vận dụng vào tình huống thực tế nhưng công nghệ không cần phải dịch Harry Potter. Nếu nó đủ tiến bộ để dịch các cuộc đối thoại thật chính xác hay thậm chí dịch 50% số tài liệu mà con người dịch, công nghệ sẽ có ảnh hưởng to lớn trên con đường đối phó những rào cản ngôn ngữ của chúng ta.

Lý do cho bài kiểm tra bản chất này là để đặt MNT vào một trong những viễn cảnh thách thức nhất có thể và theo dõi xem nó có thể làm tốt đến mức nào. Các kết quả cũng khá ấn tượng. Điều này thậm chí mang đến cho chúng ta nhiều lý do để lạc quan với việc dịch máy một ngày nào đó có thể đóng vai trò thực sự trong việc con người và các doanh nghiệp giao tiếp với nhau.

Liên hệ Công ty dịch thuật IFK

Quý khách hàng có thể dễ dàng liên hệ yêu cầu báo giá dịch thuật tại trang web của chúng tôi. Truy cập tại đây để có thể gửi file dịch bằng cách hoàn thành form yêu cầu báo giá của chúng tôi. 
Quý khách có thể tham khảo dịch vụ dịch thuật tiếng Anh tại đây. 
Dịch vụ dịch thuật tiếng Nhật tại đây. 
Trường hợp bạn cần báo giá dịch thuật nhanh chóng hãy liên hệ với chúng tôi qua hotline của chúng tôi tại đây. 
Địa chỉ 1: Tầng 14, HM Town, 412 Nguyễn Thị Minh Khai, P.5, Q.3, HCM.
Địa chỉ 2: Tầng 5 – C5.17 Imperial Place, 631 Kinh Dương Vương, An LạcBình Tân, Thành phố Hồ Chí Minh. 

Nhấp vào một ngôi sao để đánh giá!

5 / 5. Lượt đánh giá: 482

Không có phiếu bầu cho đến nay! Hãy là người đầu tiên đánh giá bài này.

Bài viết liên quan

Trụ sở chính:

Tầng 14, HM Town, 412 Nguyễn Thị Minh Khai, P.5, Q.3, HCM

Văn Phòng:

Tầng 5 - C5.17 Imperial Place, 631 Kinh Dương Vương, An Lạc, Bình Tân, Thành phố Hồ Chí Minh

Điện thoại:

035.297.7755
0282.247.7755

Chung nhan Tin Nhiem Mang

Liên Hệ Chúng Tôi

 Copyright © 2015 – 2022 Công Ty Giáo Dục – Dịch Thuật IFK – / GPĐKKD số 0315596065 do Sở KHĐT TP.HCM cấp.