Monday, October 16, 2017

Từ Google Translate nghĩ về AI

Từ Google Translate nghĩ về AI

Với nhiều người cho đến nay, Google Translate chỉ là một nơi để minh họa cho lối dịch ngớ ngẩn, nhiều sai sót. Đôi lúc có người vào Google Translate bắt nó dịch một hai câu rồi cười thú vị về cách dịch đôi lúc rất quái đản của nó. Nhưng từ tháng 3 năm nay nếu họ vào lại Google Translate, thử bắt nó dịch một bài báo tiếng Anh ra tiếng Việt, có thể họ sẽ ngạc nhiên.

Kết quả dịch có thể vẫn còn trúc trắc, vẫn còn lỗi, đọc vẫn biết là “máy dịch” nhưng nhìn tổng thể Google Translate hôm nay so với năm ngoái là một bước tiến nhảy vọt thật sự gây bất ngờ. Cứ thử bắt nó dịch một hai câu rồi nguyên cả một bài báo, một tài liệu, một bài diễn văn, càng dài càng tốt, nó sẽ giúp người đọc nắm bắt được ý chính của văn bản, câu kéo khá chính xác và tốc độ thì nhanh không thể tưởng.

Đó là bởi từ cuối năm ngoái Google đã thay đổi cách tiếp cận để giải quyết vấn đề dịch thuật bằng máy. Trước đây máy dịch theo từ hay cụm từ, tức dựa vào hàng triệu từ hay cụm từ đã được dịch để đối chiếu, so sánh và chọn cụm từ nào sát nhất bằng phương pháp thống kê để đưa vào kết quả (phrase-based machine translation). Nay thì máy dịch theo cả câu, rồi dùng ngữ cảnh để quyết định xem từ đó trong ngữ cảnh đó thì chọn nghĩa nào cho chính xác nhất (Google Neural Machine Translation - GNMT). 

Nói ngắn gọn thì Google đã ứng dụng các tiến bộ mới nhất trong lĩnh vực trí tuệ nhân tạo, máy tự học và mạng nơ rôn để Google Translate ngày càng thông minh hơn, dịch chính xác hơn, câu văn dịch tự nhiên hơn. Theo đánh giá của nhiều người ở các cặp ngôn ngữ khác như Anh-Tây Ban Nha, Anh-Pháp, Anh-Đức, Anh- Nhật, cách dịch mới cải thiện chất lượng dịch vượt bậc so với trước.

Thế nhưng vấn đề đặt ra cho cặp Anh-Việt là gì? Vì sao người dùng vẫn còn thấy lấn cấn, chất lượng Google Translate cho cặp Anh-Việt dù tiến bộ nhiều vẫn chưa như kỳ vọng? Tháng 11-2016 cách dịch mới được áp dụng cho 8 ngôn ngữ và đến tháng 3-2017 đã mở rộng thêm cho 3 ngôn ngữ khác, trong đó có tiếng Việt rồi.

Google Translate thông minh lên, đầu tiên nó sẽ giải quyết những lỗi sai do máy dịch gây ra. Trước đây, nó sẽ không phân biệt được khi nào bank được dùng theo nghĩa ngân hàng, khi nào là bờ sông; nay bằng cách liên kết cả câu hay các yếu tố trước đó, nó sẽ dịch chính xác, bạn cứ thử bắt nó dịch, she went to the bankshe went to the river bank cho xem.Cái tiến bộ rõ nhất là giảm hẳn lỗi do máy dù vẫn còn không ít.

Nhưng lỗi do con người cũng mắc phải thì cho đến nay Google Translate bó tay.Dù gọi là trí tuệ thông minh nhân tạo nhưng máy cũng phải dựa vào hàng triệu, triệu câu đã được dịch để học. Nếu chúng ta đọc một cuốn sách và nhận ra ngay đó là sách dịch do văn nghe rất “Tây” thì làm sao kỳ vọng Google Translate dịch thanh thoát như thể nó không phải là bản dịch được. 

Lâu nay ai học tiếng Anh thấy câu “We worked hard” đều dịch thành “Chúng tôi làm việc chăm chỉ”, biểu sao Google Translate dịch khác khi đến đoạn Steve Jobs kể lại những ngày đầu ông khởi nghiệp cùng Steve Wozniak trong bài diễn văn nổi tiếng đọc ở đại học Stanford. Hầu hết các bản dịch đều dịch work hard là làm việc chăm chỉ; Google Translate cũng thế!Lúc nào thì tự nó quyết định, thôi nói “làm việc cật lực” cho nó ra tiếng Việt?

Đó là chưa kể tiếng Anh thì chỉ một từ mà tiếng Việt, với khái niệm tương đương, chục người dùng chục từ khác nhau, ví dụ như commodities, futures contract…Đưa cho 10 người đến 9 người dịch commodities là “hàng hóa” và chỉ 1 người dịch thành “thương phẩm”. Chắc máy cũng đau đầu chọn lựa và đi theo cách chọn từ nào được dùng nhiều nhất!

Vậy trí tuệ thông minh nhân tạo (AI), ở đây là một dạng AI chuyên biệt chứ chưa phải là AI tổng quátcó thể nào vượt qua được trí tuệ thông minh của con người như một tập thể để đem lại giá trị thật sự trong tương lai? Liệu Google Translate có thể học nhưng sau đó vượt qua được cách dịch của số đông để hoàn thiện kỹ năng dịch đến mức hoàn hảo trong tương lai?

Hiện nay đã có nhiều ý kiến phản đối cách dùng một cách máy móc các thuật toán máy tính như một dạng trí tuệ thông minh nhân tạo sơ khai để giải quyết các vấn đề liên quan đến con người, ví dụ quan tòa dựa vào máy móc để đưa ra quyết định có cho tù nhân này được tạm thachưa hay một cơ quan quản lý giáo dục dựa vào thuật toán để quyết định tuyển hay sa thải giáo viên ở địa phương.Dựa vào máy tưởng đâu khách quan hoàn toàn nhưng không phải. 

Máy cũng phải dựa vào big data mà kho dữ liệu dù khổng lồ đến đâu cũng dựa vào thực tế cuộc sống, có cả thiên kiến, định kiến, sự thù hằn, sự phân biệt đối xử trong vô thức hay đơn giản là sự máy móc của con người vô tâm… Máy thấy một giáo viên năm xưa lúc còn là sinh viên từng bị bắt vì một lần hút cần sa nay cứ ghi dấu chuyện đó để làm thước đo cân nhắc, liệu có thỏa đáng?Sinh viên nào từng hút nhưng không bị phát hiện nay có gì hơn người bị tì vết đó?

Google thấy một ai tìm “máy giặt” và sau đó liên tục dội bom người này bằng các quảng cáo máy giặt ở bất cứ nơi nào trong không gian mạng người ấy ghé qua, tưởng đâu thế là thông minh theo kiểu AI nhưng có ở trong hoàn cảnh nhu cầu máy giặt chỉ là thoáng qua và cả tuần lễ bị máy giặt quấy rầy mới thấy còn lâu AI mới trở thành một trí tuệ thật sự chứ không phải sự phiền toái.

Vì thế, Google Translate sẽ tiến bộ, các lỗi ngớ ngẩn chỉ có máy mới mắc phải sẽ dần biến mất. Nhưng khó lòng trông chờ đến ngày nó cho chúng ta những kết quả dịch thuật hoàn hảo, đọc vô không biết là văn dịch – ít ra là với cặp ngôn ngữ Anh – Việt. Bạn cứ thử dùng Google Translate dịch từ Việt sang Anh sẽ thấy kết quả khá hơn nhiều bởi máy đã quen với loại tiếng Anh tự nhiên cũng như hiện nay máy đã quen với loại tiếng Việt ngây ngô của dịch thuật.

Trừ phi Google thay đổi cách tiếp cận thêm một lần nữa. Đừng bắt máy học – dù là deep learning–theo các bản dịch đã có. Hãy bắt máy hiểu nội dung của đầu vào và bắt máy viết luận, làm luận đầu ra bằng thứ tiếng Việt tự nhiên của người Việt đang dùng. Hãy quên chuyện dịch đi, may đâu mới đạt được đỉnh cao của dịch thuật.

Đó là chuyện khó bởi cho đến nay người ta đã chấp nhận chuyện dịchnhư một thực tế. Lấy ví dụ, bản dịch Hiệp định thương mại tự do giữa Mỹ và Việt Nam là một bản dịch hoàn hảo nhưng bảo đảm bất kỳ người Việt nào đọc bản Hiệp định này bằng tiếng Việt sẽ cho đó không phải là tiếng Việt tự nhiên.

Hãy đọc câu này ở trang nhất xem thử nó có phải là tiếng Việt không: “Mỗi bên điều hành các biện pháp thuế quan và phi thuế quan có ảnh hưởng đến thương mại để tạo cho hàng hóa của Bên kia những cơ hội cạnh tranh có ý nghĩa đối với các nhà cạnh tranh trong nước”.Nhưng dễ gì chính phủ hai nước chấp nhận một “bản dịch” thuần Việt theo kiểu “làm luận”, được viết lại toàn bộ trừ phi phía Việt Nam là bên soạn thảo và phía Mỹ phải dịch ra tiếng Anh?

Cho dù Google Translate đọc câu sau “The Government’s approach to restructuring its banking sector is considerably different fromwhat is generally considered as good practice” và hiểu ý của nó nói cách chính phủ tái cơ cấu hệ thống ngân hàng là không giống ai nhưng nó cũng sẽ dịch như hiện nay nó đang dịch (và vậy đã là quá tốt): “Cách tiếp cận của Chính phủ để tái cơ cấu ngành ngân hàng khác biệt đáng kể so vớinhững gì thường được coi là thực hành tốt”.


Thôi đành đợi một bước đột phá khác của Google Translate trong tương lai vậy!

Tuesday, October 10, 2017

Phớt lờ quy luật cung - cầu ?


Phớt lờ quy luật cung - cầu ?

Một dự báo đưa ra con số 70.000 giáo viên có thể bị dư thừa đến năm 2020. Cầu giảm làm giáo viên dư thừa. Thế nhưng ngành sư phạm có biết điều chỉnh để giảm cung không? Không hề.

Chúng ta hãy thử dùng cách thu hẹp thế giới lại để dễ hình dung. Một thị trấn nhỏ chừng 10.000 dân, có chừng ba chục bác sĩ và mỗi năm cần đào tạo thêm một bác sĩ để thay thế người về hưu. Bỗng dưng dân số thị trấn giảm mạnh vì nhiều người dọn đi nơi khác sinh sống, trong ba chục bác sĩ có cả chục người không có bệnh nhân. Rồi trường đại học thay vì đào tạo một bác sĩ lại ồ ạt tuyển sinh đào tạo chừng chục bác sĩ mỗi năm. Rất dễ hình dung trước đây trường thoải mái chọn em học sinh tốt nghiệp 30 điểm vào để đào tạo nay hạ điểm chuẩn xuống còn 10 cũng không tìm đủ người chịu vào học. Ai bỏ công học suốt chừng ấy năm nếu biết chắc ra trường họ sẽ không thể hành nghề bác sĩ vì thị trấn không có nhu cầu?

Có thể dùng quy luật cung cầu này để nhìn lại bức tranh tuyển sinh ngành sư phạm đang gây lo lắng vì điểm chuẩn đầu vào quá thấp.

Theo số liệu chính thức của Bộ Giáo dục và Đào tạo (đáng tiếc Bộ chỉ cập nhật số liệu đến năm 2013!) thì số lượng học sinh trong cả nước giảm mạnh trong những năm qua. Nếu như năm học 1999-2000 cả nước có 17,8 triệu học sinh phổ thông thì đến năm học 2012-2013 giảm còn 14,7 triệu em (tức giảm đến hơn 3 triệu em). Giảm mạnh nhất là học sinh tiểu học, trong từng ấy năm đã giảm từ 10 triệu học sinh còn 7,2 triệu học sinh. Điều đó có nghĩa, trong mấy năm gần đây dù không có số liệu thống kê của Bộ chúng ta vẫn có thể suy luận ra mức giảm học sinh vẫn kéo dài, ít nhất là ở bậc trung học cơ sở và trung học phổ thông.

Cũng theo số liệu thống kê này, số lượng giáo viên lại tăng. Năm học 1999-2000 có hơn 614.000 giáo viên các cấp phổ thông thì đến năm học 2012-2013 con số này tăng lên hơn 847.000 giáo viên. Tăng mạnh nhất lại là giáo viên phổ thông trung học, từ 65.000 người năm học 1999-2000 lên trên 150.000 người năm học 2012-2013 trong khi giáo viên tiểu học tăng không nhiều đến thế. Điều đó cộng với hiện tượng giảm mạnh học sinh tiểu học những năm trước dẫn chúng ta đến kết luận chắc chắn số lượng giáo viên sẽ dư thừa nhiều và nhiều nhất là ở bậc trung học phổ thông.

Bộ Giáo dục và Đào tạo có biết điều này không?

Có. Bởi chính Bộ đưa ra con số giáo viên dư thừa trong năm 2014 là 27.000 giáo viên. Có nơi như huyện Krông Pắk (tỉnh Đắk Lắk) thừa 603 giáo viên. Một dự báo đưa ra con số 70.000 giáo viên có thể bị dư thừa đến năm 2020.

Cầu giảm làm giáo viên dư thừa. Thế nhưng ngành sư phạm có biết điều chỉnh để giảm cung không? Không hề.

Theo thống kê của ngành giáo dục, hiện có 58 trường đại học, 57 trường cao đẳng, 40 trường trung cấp có ngành đào tạo giáo viên (trong đó có 14 trường đại học sư phạm, 33 trường cao đẳng sư phạm và 2 trường trung cấp sư phạm. Mặc dù không có số liệu so sánh với thời điểm trước đó, nhiều người nhận xét số lượng trường sư phạm và đào tạo giáo viên đã tăng vọt. Trong khi so với cầu giảm, các trường này lẽ ra chỉ cần đạo tạo một số lượng giáo viên vừa phải để thay thế số giáo viên nghỉ hưu hàng năm (chừng 130.000 người trong năm năm 2016-2020) họ lại ồ ạt đào tạo giáo viên bất kể sinh viên ra trường có làm giáo viên được hay chăng. Chỉ tiêu Bộ Giáo dục và Đào tạo giao cho các trường tuy có giảm nhưng vẫn còn rất cao so với nhu cầu (năm học 2016 - 2017 là 65.300 chỉ tiêu sư phạm, năm 2017 - 2018 này là 52.000 chỉ tiêu).

Nhưng dù sao đó vẫn là con số chính quy. Các trường còn đào tạo giáo viên theo các con đường phi chính quy khác nữa và con số cuối cùng mới là khổng lồ so với nhu cầu thực tế. Lấy ví dụ trường đại học Sư phạm Hà Nội, chỉ tiêu đào tạo (tính cả sinh viên ngành sư phạm và sinh viên ngành ngoài sư phạm) công bố những năm gần đây vẫn tăng đều (năm 2010 là 2.400; năm 2017 là 2.900). Thế nhưng quy mô sinh viên của trường này lại lên đến trên 33.000 sinh viên. Đó là bởi đào tạo chính quy theo chỉ tiêu nói trên chỉ chiếm chừng một phần ba; hai phần ba còn lại là đào tạo tại chức, học bằng hai, hoàn chỉnh kiến thức… Tương tự với các trường đại học sư phạm khác, chẳng hạn Đại học Sư phạm Huế: chỉ tiêu mỗi năm hơn 1.000 mà quy mô đào tạo đang gần 10.000!

Cần xem lại cách đào tạo bất kể nhu cầu như thế vì nơi đào tạo chỉ lo công ăn việc làm cho bộ máy của chính họ bất kể sản phẩm họ đào tạo ra có kiếm được việc làm hay không.

Đến đây nhìn lại bức tranh tuyển sinh ngành sư phạm, ắt chúng ta đã có câu trả lời. Hãy để quy luật cung cầu phát huy tác dụng, cầu đã giảm thì cung ắt phải giảm theo. Hiện nay các trường không chịu giảm vì nồi cơm của chính họ. Nhưng sinh viên ắt không dễ bị lừa nên họ đành hạ đầu vào tuyển sinh – hạ đến mức như năm nay thì chính họ sẽ bị xã hội lên án và chính cách tuyển sinh bất kể hậu quả như thế sẽ bị đào thải.







Khi người dân không được “chia sẻ”

Khi người dân không được “chia sẻ”

Thử hình dung một tình huống rất có thể xảy ra. Với một thành phố lớn, đông dân như TPHCM, hầu như mọi con đường đều có một vài điểm sửa xe nhỏ, ở đó với bộ đồ nghề đơn giản, một máy bơm cũ, một người thợ tay nghề vừa phải đã có thể mưu sinh khi thỉnh thoảng bơm vá lốp hay chùi bugi cho khách vãng lai. Ngày xưa khi xe dễ hỏng hóc hơn, có thể có nhiều điểm sửa xe hơn nhưng quy luật cung cầu điều chỉnh sự hiện diện của những người thợ vỉa hè này ở từng góc phố.

Tình huống rất có thể xảy ra là như thế này: một ngày đẹp trời nào đó, một người đam mê khởi nghiệp (mà nói theo từ thời thượng hiện nay là start-up) bèn nghĩ ra một ứng dụng (app). Người dùng tải về và khi cần bấm bấm vài cái, ngay lập tức thông tin cần vá xe đang xẹp lốp được tung lên không gian ảo, mạng lưới thợ sửa xe lưu động đã đăng ký tham gia trước đó được cảnh báo và ai ở gần nhà người có xe xẹp lốp nhất bấm nút nhận lời đến vá ngay tại nhà. 

Thử hình dung một app như thế ắt sẽ ăn khách: xe đề không nổ, xe cần thay nhớt, xe gãy gương chiếu hậu… cần bất kỳ dịch vụ gì, người dùng nhanh chóng được phục vụ, giá rẻ hơn ra tiệm, thậm chí rẻ hơn điểm sửa xe góc phố. Không còn lo bị chặt chém vì khách có quyền nhận xét đánh giá chất lượng phục vụ; không còn lo bị đổi phụ tùng vì mọi thông tin đều lưu trên mây, tiện kiện cáo khi có sự cố…

Ngày trước, với một hình dung như thế, nhiều người đã phấn kích không tiếc lời khen ngợi cho những ứng dụng thực tiễn của một nền kinh tế chia sẻ, đem đến biết bao lợi ích. Nhưng cứ nghĩ xa thêm một chút nữa, coi thử rốt cuộc cách sắp xếp lại nguồn lực của xã hội theo kiểu “Uber hóa” như thế có thật sự lợi chăng?

Mấu chốt của nền kinh tế chia sẻ nằm ở hai chữ “chia sẻ”. Trước đây người viết ủng hộ mô hình Uber vì cứ nghĩ mô hình này sẽ giúp tận dụng nguồn lực tạm thời nhàn rỗi để tăng thêm lợi ích cho cộng đồng. Một người có xe hơi trùm mền ít chạy, lại có vài giờ rảnh vào buổi chiều tối, có thể kiếm thêm thu nhập khi đăng ký tham gia mạng lưới xe Uber. Một người khác thường đi làm từ nhà ở đầu này thành phố đến chỗ làm ở cuối thành phố, tận dụng app Uber hay Grab để có thể chở thêm người khác đi cùng lộ trình, cùng thời gian. Thế mới gọi là kinh tế chia sẻ.

Còn như hiện nay, có những trường hợp vay tiền ngân hàng để mua xe chạy Uber, Grab, phải cày suốt mười mấy tiếng mỗi ngày mới hy vọng có đủ thu nhập trả lãi ngân hàng, duy trì một mức sống tối thiểu thì có đáng là một mô hình tốt chăng? Có những ông chủ bỏ tiền mua cỡ chục chiếc xe để cho thuê chạy Uber, với họ mô hình Uber là mô hình kiếm tiền tốt nhưng tài xế lái xe thuê của họ thì sao? Cung cầu thị trường thường ở mức cân bằng, sự ra đời xe Uber hay Grab rẻ hơn taxi truyền thống có thể làm tăng cầu một chút nhưng không đủ để cân bằng lại mức cung tăng đột biến như hiện nay. Trong hoàn cảnh đó, giá ắt sẽ phải giảm, phần thiệt thòi rơi vào tài xế taxi truyền thống thì đã rõ nhưng thực tế các tài xế Uber, Grab cũng gánh phần thiệt thòi này khi lao động vất vả hơn nhiều cho một khoản thu nhập không tương xứng.

Cái lợi về giá, về chất lượng phục vụ được nâng lêndĩ nhiên có phần dành cho người tiêu dùng nên sự ủng hộ mô hình mới này của họ là điều đương nhiên. Nhưng một phần cái lợi về giá này gom góp lại để tạo nên một giá trị thị trường lên đến 70 tỷ đô-la cho một công ty không có tài sản gì đáng kể thì thật là vô lý. Thật ra Uber đang lỗ - họ vẫn cứ đang tung ra các cuốc xe miễn phí cho mọi người, miễn sao càng nhiều người sử dụng Uber càng tốt, đó là cái làm nên giá trị thị trường của những công ty start-up kiểu này.

Sự xung đột giữa Uber và các hãng taxi truyền thống không chỉ xảy ra ở Việt Nam, nó có hầu như ở mọi thị trường Uber hiện diện, thậm chí còn gay gắt hơn nhiều vì ở nhiều nơi, giấy phép sở hữu một biển số xe taxi từng lên đến cả triệu đô-la như ở New York. Phải nói thẳng, ít ai ủng hộ các hãng taxi già cỗi, xe thì dơ, tài xế thì bất lịch sự, có dịp là chặt chém. Nhưng chính cái dư luận ban đầu ấy đẩy cuộc cạnh tranh này vào thế bất lợi một cách không sòng phẳng cho phía taxi truyền thống. Ở nhiều thị trường Uber chơi không đẹp, chuyên phớt lờ các quy định mà taxi truyền thống phải tuân thủ.

Quay lại tình huống giả định nêu ở đầu bài, giả thử việc “Uber hóa” dịch vụ sửa xe lưu động thành công rồi sao nữa? Có thể người tiêu dùng thoải mái hơn một chút; một vài nhà sáng lập cái start-up này trở thành triệu phú, không phải bằng tiền cắc gom từ thợ sửa xe mà từ tiền của các quỹ đầu tư mạo hiểm rót vào. Nhưng chắc chắn cuộc sống của hàng ngàn thợ sửa xe ở góc phố sẽ bị đảo lộn. Nhiều người mất việc, cuộc sống bị đẩy xuống thấp một chút nữa; nhiều người khác phải vay tiền để nâng cấp dịch vụ thì mới tham gia được mạng lưới thuộc “nền kinh tế số”. Thu nhập của họ giảm sút để bù cho lợi nhuận tăng lên của giới ngân hàng… Tất cả những cái này đã có ai đặt lên bàn cân để xem có đáng không, có đáng để đánh đổi không?

Nhìn rộng ra, ví dụ mô hình của Amazon chẳng hạn, có đáng là nơi lãnh ấn tiên phong của một cuộc cách mạng công nghệ mệnh danh 4.0?

Người tiêu dùng được lợi một chút khi mua hàng mà không cần tốt công sức ra cửa hàng, giá có thể rẻ hơn, hàng giao đến tận cửa. Đổi lại, hàng triệu cửa hàng bách hóa nhỏ lẻ vì thế mà biến mất. Chủ nhân các cửa hàng này có thể phải vào làm cho các trung tâm giao nhận của Amazon, đồng lương thấp hơn, hàng ngày phải đi cả chục cây số để sắp xếp hàng theo lệnh của máy tính. Công việc của họ rồi cũng sẽ mất đi vào tay các con rô-bốt không cần lương, không cần giờ nghỉ. Người tiêu dùng cũng dần dần rơi vào vòng kiểm soát của các nhà bán hàng bởi nhất cử nhất động của họ trên không gian mạng đều bị máy móc theo dõi để điều chỉnh hành vi mua sắm của họ.

Bây giờ thì chưa nhưng đã manh nha xu hướng tự động hóa các khâu sản xuất trước đây giao cho lao động giản đơn như cắt may, da giày. Thử tưởng tượng xã hội sẽ biến động như thế nào nếu hàng triệu lao động trong ngành may mặc mất việc vì rô-bốt? Đừng nói theo lý thuyết là họ sẽ phải hay sẽ được nâng lên một nấc trên các bực thang tạo ra giá trị theo kiểu không may nữa thì đi làm thiết kế!!! Hàng triệu người Mỹ đã không bước lên bực thang mới như thế đã bỏ phiếu cho Donald Trump và quay lưng lại với toàn cầu hóa. Khi người dân không được “chia sẻ” miếng bánh tăng trưởng thì cũng đừng hòng có một nền kinh tế chia sẻ đúng nghĩa.