所謂媒介語,是指為了機器翻譯的需要,人工所創造出來的一種提供在不同語言之間交流用的算法。 對媒介語的要求,是國際交流頻繁的情況下,機器翻譯向多語種發展的一種需求。例如,沒有媒介語,那么在四種語言之間互譯就需要12種算法。而使用媒介語則4種語言互譯只需要8種算法。這樣對於機器翻譯來說簡單了許多
充當的語言,辭彙和語法,語意資料庫,
充當的語言
有些語言學家主張使用一種自然語言作為媒介語,但是每種語言都有許多各自特殊的規則和例外,很難將他讓機器容易認讀。又有主張使用人工語言,但是人工語言過多的效仿自然語言,因此作為媒介語也不適合。
辭彙和語法
媒介語也有辭彙和語法,這些語法規則是以自然語言為基礎的,但是只能包括最常用的規則和辭彙。媒介語的每個詞表示一個單一而且精確的意義,句子則是表示確定意義的詞的綜合。
語意資料庫
語意資料庫介紹
計算語言學的專家一般認為,建立一個語意資料庫反而是一個更可行的辦法。因為無論任何一種語言,都至少有一個詞語帶有歧義。而若要建立一個數學上整全的翻譯系統,唯一的方法是對每一個詞語建立一個獨有的定義,這樣,轉換才能變得順暢。因此,相對於設立一個媒介語,更好的辦法應該是建立一個語意資料庫。
語意資料庫理論的爭論