Dịch tự động (machine translation) là một ứng dụng trên máy tính được áp dụng để chuyển tự động một văn bản từ ngôn ngữ này sang một ngôn ngữ khác. Đây là một bài toán lớn áp dụng trí tuệ nhân tạo và đã được đặt ra cách đây hơn 60 năm từ sự ra đời và phát triển của máy tính điện tử. Ngày nay, nhu cầu của một hệ thống dịch tự động đang trở nên vô cùng bức thiết khi số lượng văn bản xuất hiện trên môi trường mạng toàn cầu gia tăng một cách khủng khiếp. Sự tồn tại của một hệ dịch tự động hiệu quả sẽ giúp tiết kiệm một khoảng chi phí không nhỏ cho các tổ chức, và cá nhân. Đồng thời, việc nắm bắt thông tin sẽ trở nên nhanh chóng hơn bao giờ hết.
Có nhiều chương trình dịch tự động khác nhau và các chương trình dịch này cũng có cấu trúc chi tiết khác nhau, tuy nhiên, về mặt cấu trúc tổng thể, tất cả các chương trình đều được chia làm 3 khối chính: khối xử lý hình thái, khối xử lý ngữ pháp và khối xử lý ngữ nghĩa.
Khối xử lý hình thái
Khối xử lý hình thái thường làm các nhiệm vụ sau:
- Chia cắt một câu trong ngôn ngữ nguồn thành các từ độc lập.
- Tìm tất cả các hình thái và thông tin bổ sung của các từ trong câu để phục vụ quá trình xử lý về sau.
Khối xử lý ngữ pháp
Khối xử lý ngữ pháp xây dựng cây phân tích ngữ pháp cho câu đầu vào dựa trên văn phạm của ngôn ngữ nguồn. Khối này nhận danh sách cách hình thái từ đã được sinh ra bởi khối xử lý hình thái, khối này sẽ tiến hành phân tích văn phạm của câu dựa trên văn phạm của ngôn ngữ nguồn và thông tin bổ sung - thường là các văn phạm bổ sung cho phép sinh cây phân tích chính xác hơn.
Khối xử lý ngữ nghĩa
Xử lý ngữ nghĩa là khối cuối cùng trong dịch tự động, khối nhận đầu vào là cây phân tích từ khối xử lý ngữ pháp và thực hiện việc sinh câu ở ngôn ngữ đích. Nhiệm vụ chính của khối xử lý ngữ nghĩa là:
- Thực hiện việc đánh giá các cây phân tích cú pháp (nếu khối xử lý ngữ pháp phân tích được nhiều cây phân tích) và lựa chọn cây tốt nhất.
- Thực hiện việc chọn nghĩa thích hợp nhất cho các từ tố của ngôn ngữ nguồn trong ngôn ngữ đích.
- Sinh câu trong ngôn ngữ đích đúng với văn phạm của ngôn ngữ đó (vấn đề xử lý thứ tự các từ).
» Tin mới nhất:
» Các tin khác: