DỊCH MÁY VỪA LÀ ĐỐI THỦ, VỪA LÀ ĐỒNG MINH CỦA NGƯỜI DỊCH (PHẦN 1)

Bài viết này là một cuộc phỏng vấn với ông Yamada Yu, người đang nghiên cứu về lĩnh vực dịch thuật với tư cách là giáo sư của khoa Ngoại ngữ trường Đại học Kansai.
Chủ đề nghiên cứu của giáo sư Yamada là “Nghiên cứu tiến trình dịch thuật”. Ông đang nghiên cứu não bộ sẽ hoạt động như thế nào khi con người dịch một cái gì đó. Và ông nói rằng kết quả của cuộc nghiên cứu sẽ có ích cho việc phát triển công cụ dịch máy mới nhất được trang bị trí tuệ nhân tạo (AI).
Dịch máy vẫn đang được tiếp tục phát triển với mục tiêu đạt đến các cấp độ cao hơn để hướng đến việc hiện thực hóa, đưa vào sử dụng trong thực tế. Vậy hiện nay, tình hình phát triển của dịch máy đang ở giai đoạn nào và sẽ mang lại những thay đổi như thế nào cho ngành dịch thuật? Dưới đây là những trao đổi của ông Yamada Yu về những vấn đề trên.

DỊCH MÁY BƯỚC VÀO THỜI ĐẠI CỦA TRÍ TUỆ NHÂN TẠO, HƯỚNG ĐẾN MỤC TIÊU PHÁT TRIỂN HƠN NỮA

Sự phát triển của dịch máy được cho là bắt đầu từ dự án quốc gia của Hoa kỳ được thực hiện từ những năm 1950 đến 1960. Trong thời kỳ chiến tranh lạnh giữa Mỹ và Liên Xô, nhà nước Hoa Kỳ muốn phát triển dịch máy để có thể nhanh chóng giải mã tiếng Nga. Bằng cách triển khai ý tưởng rằng nếu có thể cài sẵn các ngữ pháp cho máy thì máy có thể dịch được, và đây được gọi là dịch máy “dựa trên quy tắc” (rule-based).) Tuy nhiên, như những gì các dịch giả chúng ta đã biết, việc chỉ đơn giản áp dụng ngữ pháp rồi thay thế từ vựng thì không thể dịch được. Và như vậy, dự án quốc gia sẽ kết thúc mà không đạt được mục tiêu đề ra.

Sau đó, các nhà nghiên cứu khắp nơi trên thế giới vẫn tiếp tục các nghiên cứu kĩ hơn về dịch máy. Ở Nhật, Cơ quan Khoa học và Công nghệ cũng đã khởi động một dự án dịch máy vào năm 1982. Các cuộc nghiên cứu và phát triển vẫn được tiếp tục cho đến năm 1985, với sự tham gia của Đại học Kyoto, công ty Fujitsu và nhiều công ty lớn khác. Công cụ được áp dụng trong nghiên cứu này là dịch máy “dựa trên ví dụ” (example based). Nó hoạt động tương tự như CAT (Computer Assisted Translation – Công cụ hỗ trợ dịch thuật) ngày nay, nhưng CAT lại có nhiều cặp văn bản gốc và bản dịch cùng, những câu từ nào giống trong số đó sẽ được lọc và cho ra bản dịch.

Trong khi đó, thời đại của Internet đã đến và dịch máy sẽ có cú phát triển nhảy vọt. Số lượng các ví dụ ban đầu vẫn còn bị còn hạn chế, nhưng bằng cách áp dụng Internet, người ta có thể thu thập một lượng lớn các ví dụ, và dịch máy “dựa trên thống kê”  (statistical based) bằng cách sử dụng các ví dụ đó đã xuất hiện. Chính là “Google dịch”, xuất hiện vào năm 2006. Đó là một sự kiện mang tính cách mạng trong lịch sử của dịch máy.

Người ta dự đoán rằng nếu lượng dữ liệu càng tăng lên thì độ chính xác của loại dịch máy “dựa trên thống kê” cũng sẽ càng tăng lên, và từ đó hi vọng rằng việc hiện thực hóa dịch máy vào thực tế sẽ tiến triển ngay lập tức hay sao. Tuy nhiên, có một điều đã được nhận thấy rằng: nếu cứ tiếp tục đưa dữ liệu ngày càng nhiều và một khi nó đạt đến một mức độ nhất định nào đó thì độ chính xác vẫn sẽ không được cải thiện thêm được nữa. Do đó, các nhà nghiên cứu đã tìm nhiều cách để cải thiện chúng, chẳng hạn một lần nữa kết hợp dịch máy “dựa trên thống kê” với cái cũ trước đó là “dựa trên quy tắc”. Tuy nhiên, lại không cho ra kết quả.

Và rồi chính Google đã phá vỡ rào cản đó một lần nữa. Trên thực tế, tại Nhật Bản, từ năm 2016, Google dịch đã có bước phát triển sang giai đoạn kế tiếp. Ở giai đoạn nà, nó được gọi là “Neural Net Machine Translation” (viết tắt là NMT), hay nói cách khác, đó là hệ thống dịch máy sử dụng trí tuệ nhân tạo AI.

Dịch máy công nghệ AI

Hệ thống dịch máy sử dụng công nghệ AI là quá trình bộ não con người nhận biết các đối tượng được tái tạo bằng trí tuệ nhân tạo và sau đó áp dụng vào dịch thuật. Ví dụ, nếu có một tách cà phê trước mặt chúng ta, con người sẽ nhận diện nó từ nhiều khía cạnh khác nhau, chẳng hạn “thứ màu đen”, “chất lỏng”, “vị đắng”, “đồ uống”. Mỗi một đặc điểm được phân tán và lưu trữ trong vô số tế bào thần kinh (nơron) trong não. Trong một nơron chỉ có thể lưu trữ một đặc điểm. Sau đó bộ não tiếp tục đi đến cấp độ tiếp theo để phân tích xem “thứ màu đen’ là “đen đến mức nào”… não bộ sẽ nhận biết các hiện tượng phức tạp trong hệ thống phân cấp nhiều lớp như vậy. Do đó, ở lần tiếp theo, khi chúng ta nhìn thấy “chất lỏng màu đen” một lần nữa, các tế bào thần kinh trong não sẽ kết nối với nhau dựa trên thông tin đã được lưu trữ trong não và đưa ra phán đoán rằng đó là cà phê.

Có nhiều cách nghĩ khác nhau về trí tuệ nhân tạo, chẳng hạn như cách nghĩ về “Học sâu” (Deep Learning). Cho đến giai đoạn dịch máy “dựa trên thống kê”, chỉ có hai lớp là văn bản gốc và văn bản dịch. Ngược lại, dịch máy mạng lưới Nơron được thiết kế để xâm nhập vào, tiến hành nhận dạng các lớp sâu hơn và các lớp phân nhánh phức tạp.

Ví dụ, giả sử dịch câu sau sang tiếng Anh: 「僕たちは同じ釜の飯を食べた仲である」(chúng ta là những người ăn chung nồi). Nếu là con người dịch, không phải chúng ta sẽ có cách nghĩ như thế này sao? Nếu dịch sát nghĩa sẽ là “We are the friends who ate rice from the same rice cooker” (chúng ta là những người bạn ăn cơm từ một nồi), nhưng với cách dịch đó nó có thực sự truyền đạt đúng nghĩa của câu gốc? Nếu dịch đại ý là “We are best friends” (chúng ta là những người bạn tốt) thì như thế nào?

Cách dịch “We are best friends” sẽ được sử dụng bởi vì con người dựa trên việc học mà biết rằng giữa “ăn chung nồi cơm” và “là bạn thân” có những đặc điểm chung. Dịch máy sử dụng AI được kỳ vọng sẽ có thể dịch được những bản dịch như vậy, có cách dịch tương tự như tư duy của con người. Tất nhiên, dịch máy sử dụng AI vẫn đang trong giai đoạn phát triển và không có nghĩa là nó có thể tái hiện hoàn toàn bộ não con người, nhưng rõ ràng dịch máy đã bước vào thời đại của công nghệ AI và không chỉ Google mà các nhà phát triển trên khắp thế giới đang thúc đẩy phát triển những cái mới đã đưa công nghệ AI vào. Vì vậy, chúng ta chắc chắn có thể kỳ vọng vào các loại dịch máy mới trên toàn thế giới ở một tương lai không xa.

Translation for everyone - Dịch máy sẽ mở rộng thị trường dịch thuật

Không sai khi nói loại dịch máy tiên tiến nhất hiện nay là Google dịch đã tích hợp mạng lưới Nơron, nhưng vì nó luôn được kết nối với Internet nên nhiều doanh nghiệp không sẵn sàng sử dụng Google dịch vì lý do bảo mật.

Mặt khác, đối với dịch máy “dựa trên thống kê”, ví dụ, nếu công ty của bạn có một tập hợp các từ gốc và các từ dịch trong khuôn mẫu đã được dịch trước đây, dựa trên những dữ liệu có sẵn này sẽ không khó để xây dựng hệ thống dịch máy của riêng công ty dựa trên những dữ liệu có sẵn. Điều kiện là lượng dữ liệu lưu trữ phải nhiều, nhưng về mặt kỹ thuật, hoàn toàn có thể tạo ra một hệ thống có độ chính xác cao. Tuy nhiên, rất khó để nói liệu hệ thống ấy sẽ được sử dụng rộng rãi ngay lập tức hay không. Bản thân tôi cũng đã từng tham gia vào một số dự án và chứng kiến việc triển khai thực tế của công nghệ này, vì vậy tôi có thể nói rằng nó đang được áp dụng, nhưng trên toàn thế giới vẫn chưa đạt được nhiều tiến bộ.

Tại sao lại như thế? Đây cũng chỉ là nhận định của cá nhân tôi. Tôi không nghĩ rằng các công ty vốn dĩ từ trước đến nay đã đặt hàng bản dịch từ các công ty dịch thuật sẽ dễ dàng chuyển sang dịch máy. Bởi vì đây không chỉ còn là vấn đề chính xác mà còn là việc thay đổi văn hóa doanh nghiệp và nguyên tắc hành vi của con người. Đó là những việc không thể dễ dàng thay đổi được. Tất nhiên, dịch máy sẽ có sự khác biệt nếu nó có một bước tiến mang tính đột phá, nhưng hiện tại dịch máy vẫn chưa đạt được đến giai đoạn đó.

Có thể nói theo một cách khác như thế này. Cho dù chúng ta có thể phát triển loại thuốc nước có tác dụng giống như việc chỉ cần súc miệng thay cho việc đánh răng, thì cũng không có nghĩa là những người Nhật vốn xem việc đánh răng từ trước đến nay là chuyện hiển nhiên sẽ ngay lập tức chuyển sang dùng loại nước súc miệng này. Chắc hẳn sẽ có nhiều người tiếp tục đánh răng và xem việc đó như một thói quen bởi vì không có điều gì đặc biệt bất tiện xảy ra khi làm như vậy cả. Tuy nhiên, nếu nước súc miệng được phân phát cho những người đang sinh sống tại những nơi lạc hậu mà ở đó có rất nhiều người bị sâu răng vì vốn dĩ họ không xem chuyện đánh răng là một thói quen của họ, thì có thể loại nước ấy sẽ được trở nên phổ biến một cách lan rộng.

Nếu chúng ta đặt suy nghĩ ấy vào trong ngành dịch thuật, có thể nói rằng chưa chắc một công ty đã và đang thuê công ty dịch thuật và nhận bản dịch từ những người dịch giả, sẽ ngay lập tức chuyển sang sử dụng dịch máy. Họ có phần hài lòng với các bản dịch của những dịch giả trước đây và có lẽ do họ chưa cảm thấy nhiều lợi ích khi chuyển sang dịch máy. Nhưng mặt khác, chắc hẳn sẽ có một số công ty đã nói như thế này: “Chúng tôi có tài liệu cần được dịch, nhưng mà tốn kém chi phí quá nên chắc thôi đi”, “Ngay từ đầu, chúng tôi không biết nên yêcần có nhiều công ty như vậy hơn (đúng hơn là có nhiều công ty suy nghĩ như vậy. Dịch máy sẽ có ích với những công ty như vậy. Đây chính là “Translation for everyone”. Tôi cảm thấy rằng dịch máy sẽ thâm nhập vào các lớp đó nhanh hơn. Thay vì chiếm lĩnh thị trường dịch thuật, dịch máy sẽ giúp mở rộng nó. Và tất nhiên, khi dịch máy ngày càng chính xác hơn thì khả năng lớn nó sẽ “ăn đứt” thị trường dịch thuật hiện tại. Vì vậy những dịch giả cần chuẩn bị cho điều đó xảy ra.

Dịch máy làm giảm thiệt hại thiên tai

Nếu như phải đưa ra một ví dụ về một lĩnh vực mà có thể dễ dàng thấy được sự thâm nhập của dịch máy thì phải kể đến lĩnh vực dự đoán khủng hoảng, tức là kịch bản dự đoán các khủng hoảng sẽ xảy ra. Trong trận động đất lớn ở Kobe vào năm 1995  (đại động đất Hanshin Awaji), tỉ lệ người nước ngoài tử vong cao gấp đôi số người Nhật tử vong. Lý do là vì mặc dù những thông tin về nơi trú ẩn ở đâu, lương thực và nước uống sẽ được phân phát ở đâu…đã được thông báo bằng cả tiếng Anh và tiếng Nhật, nhưng những người nước ngoài không biết tiếng Anh thì họ không hiểu được các thông tin đó. Giờ đây, khi mà internet đã được phổ biến, nếu như chúng ta có thể ngay lập tức dịch các thông tin do nhà nước ban hành sang một số ngôn ngữ khác bằng dịch máy, thì có thể sẽ làm giảm bớt các thiệt hại xảy ra. Ở những nơi có nhiều thiên tai như thế thì hệ thống này đang được áp dụng ngày càng nhiều.

Trong dịch máy có hai công việc. Một là chỉnh sửa trước, tức là chỉnh sửa các văn bản nguồn trước khi đưa nó vào máy dịch, hai là chỉnh sửa sau, tức là chỉnh sửa bản dịch đã được máy dịch. Và các công việc này sẽ do con người đảm nhận. Ví dụ, khi muốn dịch máy các thông tin được đăng trên trang web của văn phòng chính phủ sang một số ngôn ngữ khác, chúng ta cần phải chỉnh sửa các văn bản gốc sao cho đơn giản và ngắn gọn để máy có thể dễ dàng hiểu được.

Đối với phần chỉnh sửa sau, các công ty dịch thuật sẽ yêu cầu các dịch giả, sẽ phải là người kiểm tra cuối cùng bản dịch máy đó. Nó giống như một quy trình vậy. Cho dù là bản dịch của con người thì cũng không hề đúng 100%, sẽ có một số lỗi chẳng hạn như lỗi chính tả, dịch thiếu hoặc hiểu sai. Trong trường hợp dịch máy, nếu so sánh với bản dịch của con người, các lỗi trên sẽ có khác đôi chút. Mặc dù bản dịch đại khái vẫn được hoàn thành nhưng thỉnh thoảng vẫn có một số bản dịch lạ, không có sự liên kết logic, không theo ý muốn của chúng ta và người kiểm tra bản dịch đó chắc cũng “bật ngửa” luôn đó. (cười)

Nếu dịch máy vẫn tiếp tục phát triển, thì vai trò của người dịch hoàn toàn có khả năng sẽ bị mất đi. Bởi vì giữa những dịch giả với nhau vốn đã có sự khác nhau về trình độ và đặc trưng dịch thuật, nên rất có thể độ chính xác của dịch máy sẽ vượt qua cả người dịch. Nếu trong thời đại như thế, dịch giả sẽ không thể trụ vững chỉ bằng việc dịch một cách chính xác các tài liệu có ở ngay trước mặt. Để cung cấp các bản dịch trong bối cảnh yêu cầu sự toàn cầu hóa, tôi nghĩ rằng, nó không chỉ còn ở mỗi kỹ năng dịch thuật đơn thuần, mà còn cần phải nỗ lực trở thành một dịch giả có sự hiểu biết toàn diện về ngôn ngữ học, công nghệ, lý thuyết văn hóa… có thể nhìn mọi thứ từ quan điểm toàn diện và cung cấp dịch vụ dịch thuật tối ưu nhất.

CÔNG TY TNHH GIÁO DỤC VÀ DỊCH THUẬT IFK

Nhấp vào một ngôi sao để đánh giá!

5 / 5. Lượt đánh giá: 264

Không có phiếu bầu cho đến nay! Hãy là người đầu tiên đánh giá bài này.

Bài viết liên quan

Trụ sở chính:

Tầng 14, HM Town, 412 Nguyễn Thị Minh Khai, P.5, Q.3, HCM

Văn Phòng:

Tầng 5 - C5.17 Imperial Place, 631 Kinh Dương Vương, An Lạc, Bình Tân, Thành phố Hồ Chí Minh

Điện thoại:

035.297.7755
0282.247.7755

Chung nhan Tin Nhiem Mang

Liên Hệ Chúng Tôi

 Copyright © 2015 – 2022 Công Ty Giáo Dục – Dịch Thuật IFK – / GPĐKKD số 0315596065 do Sở KHĐT TP.HCM cấp.