廈門(mén)大學(xué)第四屆機(jī)器翻譯研討會(huì)評(píng)測(cè)系統(tǒng)描述.ppt
《廈門(mén)大學(xué)第四屆機(jī)器翻譯研討會(huì)評(píng)測(cè)系統(tǒng)描述.ppt》由會(huì)員分享,可在線(xiàn)閱讀,更多相關(guān)《廈門(mén)大學(xué)第四屆機(jī)器翻譯研討會(huì)評(píng)測(cè)系統(tǒng)描述.ppt(19頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
廈門(mén)大學(xué)第四屆機(jī)器翻譯研討會(huì)評(píng)測(cè)系統(tǒng)描述 陳毅東史曉東周昌樂(lè) ydchen mandel dozero 廈門(mén)大學(xué)信息科學(xué)與技術(shù)學(xué)院智能科學(xué)與技術(shù)系2008年11月北京 提綱 概述機(jī)器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測(cè)評(píng)數(shù)據(jù)與結(jié)果小結(jié) 提綱 概述機(jī)器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測(cè)評(píng)數(shù)據(jù)與結(jié)果小結(jié) 概述 廈門(mén)大學(xué)參加了漢英新聞?lì)I(lǐng)域機(jī)器翻譯 開(kāi)放 漢英新聞?lì)I(lǐng)域系統(tǒng)融合英漢新聞?lì)I(lǐng)域機(jī)器翻譯 受限 英漢科技領(lǐng)域機(jī)器翻譯 受限 使用的模型漢英機(jī)器翻譯 短語(yǔ) 短語(yǔ) 規(guī)則英漢機(jī)器翻譯 短語(yǔ) 規(guī)則 規(guī)則 使用的融合方法和系統(tǒng)融合評(píng)測(cè)中使用的相同 提綱 概述機(jī)器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測(cè)評(píng)數(shù)據(jù)與結(jié)果小結(jié) 機(jī)器翻譯系統(tǒng)概要 1 統(tǒng)計(jì)翻譯系統(tǒng)短語(yǔ)模型對(duì)數(shù)線(xiàn)性模型融合特征 短語(yǔ)翻譯概率 正向 反向 詞匯化短語(yǔ)翻譯概率 正向 反向 語(yǔ)言模型 長(zhǎng)度懲罰因子 短語(yǔ)懲罰因子單調(diào)解碼 動(dòng)態(tài)規(guī)劃方法漢英機(jī)器翻譯評(píng)測(cè)中 我們的短語(yǔ)翻譯系統(tǒng)則結(jié)合了基于組塊的詞語(yǔ)調(diào)序模型 機(jī)器翻譯系統(tǒng)概要 2 規(guī)則翻譯系統(tǒng)基本模塊 詞法分析 句法分析 詞義消歧 譯文生成采用依存文法描述英語(yǔ)和漢語(yǔ) 文法由程序來(lái)描述詞典條目大約10萬(wàn)結(jié)合了部分TM技術(shù)沒(méi)有專(zhuān)門(mén)針對(duì)這次評(píng)測(cè)進(jìn)行調(diào)整 提綱 概述機(jī)器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測(cè)評(píng)數(shù)據(jù)與結(jié)果小結(jié) 系統(tǒng)融合方法概要 1 早在1994年就有研究者研究多引擎翻譯系統(tǒng) 多引擎系統(tǒng)的研究可以粗略地分成兩類(lèi) 簡(jiǎn)單地在各系統(tǒng)的輸出中選出一個(gè)最佳的結(jié)果 從各系統(tǒng)的輸出中各選取最佳片段并構(gòu)成新的結(jié)果 由于融合粒度更細(xì) 第二類(lèi)方法常??梢垣@得更好的融合效果 第二類(lèi)系統(tǒng)融合技術(shù)需要解決的兩個(gè)問(wèn)題 必須從候選翻譯中抽取出與原文相對(duì)應(yīng)的翻譯片段 必須在這些可用的翻譯片段中篩選并組合成新的翻譯結(jié)果 系統(tǒng)融合方法概要 2 參考文獻(xiàn)ChenYu AndreasEisele ChristianFedermann EvaHasler MichaelJellinghaus andSilkeTheison 2007 Multi EngineMachineTranslaitonwithanOpen SourceDecoderforStatisticalMachineTranslaiton In ProceedingsoftheSecondWorkshoponStatisticalMachineTranslation Prague 193 196 提綱 概述機(jī)器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測(cè)評(píng)數(shù)據(jù)與結(jié)果小結(jié) 評(píng)測(cè)數(shù)據(jù)與結(jié)果 1 使用的外部工具GIZA 工具包對(duì)雙語(yǔ)語(yǔ)料進(jìn)行詞對(duì)齊 訓(xùn)練模式是15H53545使用SRI語(yǔ)言模型工具包來(lái)訓(xùn)練語(yǔ)言模型使用CRF 工具包來(lái)訓(xùn)練組塊分析器 漢英測(cè)評(píng)中 評(píng)測(cè)數(shù)據(jù)與結(jié)果 2 漢英新聞機(jī)器翻譯評(píng)測(cè)數(shù)據(jù)結(jié)果 評(píng)測(cè)數(shù)據(jù)與結(jié)果 3 漢英新聞系統(tǒng)融合評(píng)測(cè)根據(jù)諸系統(tǒng)在ssmt2007測(cè)試集上的成績(jī)僅挑選了前4名的系統(tǒng)參與融合采用的數(shù)據(jù)情況同漢英新聞機(jī)器翻譯評(píng)測(cè)結(jié)果constrast系統(tǒng)使用和漢英新聞機(jī)器翻譯評(píng)測(cè)相同的參數(shù) primary系統(tǒng)則將長(zhǎng)度懲罰因子參數(shù)增加到原來(lái)的兩倍 評(píng)測(cè)數(shù)據(jù)與結(jié)果 4 英漢新聞機(jī)器翻譯評(píng)測(cè)數(shù)據(jù)情況結(jié)果 評(píng)測(cè)數(shù)據(jù)與結(jié)果 5 英漢科技機(jī)器翻譯評(píng)測(cè)數(shù)據(jù)情況結(jié)果xmu constrast memt2系統(tǒng)僅使用科技語(yǔ)料 提綱 概述機(jī)器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測(cè)評(píng)數(shù)據(jù)與結(jié)果小結(jié) 小結(jié) 本次評(píng)測(cè)我們參加的系統(tǒng)在技術(shù)上沒(méi)有太多的進(jìn)步 本次評(píng)測(cè)我們所使用的系統(tǒng)融合技術(shù)太簡(jiǎn)陋 是將來(lái)努力的重點(diǎn) 謝謝大家 陳毅東史曉東 ydchen mandel- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 廈門(mén)大學(xué) 第四 機(jī)器翻譯 研討會(huì) 評(píng)測(cè) 系統(tǒng) 描述
鏈接地址:http://www.szxfmmzy.com/p-8732271.html