《機器翻譯簡介整理.ppt》由會員分享,可在線閱讀,更多相關(guān)《機器翻譯簡介整理.ppt(49頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、,,MACHINETRANSLATION,機器翻譯,MachineTranslation,DefinitionofMTHistoryofDevelopmentContrastbetweenMTandHTProspectofMT,TheDefinitionofMT,MT,theabbreviationofmachinetranslation,isasub-fieldofcomputationallinguisticsthatinvestigatestheuseofsoftwaretotranslatetextorspeechfromonenaturallanguagetoanother.,什么是
2、機器翻譯,機器翻譯(machinetranslation,MT)是利用計算機把一種語言(源語言,sourcelanguage)翻譯成另一種語言(目標語言,targetlanguage)的一門學(xué)科和技術(shù)。,MACHINETRANSLATION,機器翻譯的產(chǎn)生發(fā)展,機器翻譯遇到的困難,添加文本,機器翻譯的現(xiàn)狀,機器翻譯的產(chǎn)生發(fā)展,19471964:草創(chuàng)時期19701976:復(fù)蘇階段1976現(xiàn)在:繁榮時期,HistoryofDevelopment,1開創(chuàng)期(1947-1964)1954年,美國喬治敦大學(xué)在IBM公司協(xié)同下,用IBM-701計算機首次完成了英俄機器翻譯試驗,拉開了機器翻譯研究的序幕。中
3、國早在1956年,國家就把這項研究列入了全國科學(xué)工作發(fā)展規(guī)劃,課題名稱是“機器翻譯、自然語言翻譯規(guī)則的建設(shè)和自然語言的數(shù)學(xué)理論”。從20世紀50年代開始到20世紀60年代前半期,美國和前蘇聯(lián)兩個超級大國出于軍事、政治、經(jīng)濟目的,均對機器翻譯項目提供了大量的資金支持,而歐洲國家由于地緣政治和經(jīng)濟的需要也對機器翻譯研究給予了相當大的重視,機器翻譯一時出現(xiàn)熱潮。,2受挫期(1964-1975)1964年,為了對機器翻譯的研究進展作出評價,美國科學(xué)院成立了語言自動處理咨詢委員會(AutomaticLanguageProcessingAdvisoryCommittee,簡稱ALPAC委員會),開始了為期
4、兩年的綜合調(diào)查分析和測試。1966年11月,該委員會公布了一個題為語言與機器的報告(簡稱ALPAC報告),該報告全面否定了機器翻譯的可行性,并建議停止對機器翻譯項目的資金支持。這一報告的發(fā)表給了正在蓬勃發(fā)展的機器翻譯當頭一棒,機器翻譯研究陷入了近乎停滯的僵局。無獨有偶,在此期間,中國爆發(fā)了“十年文革”,基本上這些研究也停滯了。機器翻譯步入蕭條期。,3恢復(fù)期(1975-1989)進入70年代后,隨著科學(xué)技術(shù)的發(fā)展和各國科技情報交流的日趨頻繁,國與國之間的語言障礙顯得更為嚴重,傳統(tǒng)的人工作業(yè)方式已經(jīng)遠遠不能滿足需求,迫切地需要計算機來從事翻譯工作。同時,計算機科學(xué)、語言學(xué)研究的發(fā)展,特別是計算機硬
5、件技術(shù)的大幅度提高以及人工智能在自然語言處理上的應(yīng)用,從技術(shù)層面推動了機器翻譯研究的復(fù)蘇,機器翻譯項目又開始發(fā)展起來,各種實用的以及實驗的系統(tǒng)被先后推出,例如Weinder系統(tǒng)、EURPOTRA多國語翻譯系統(tǒng)、TAUM-METEO系統(tǒng)等。,4新時期(1990現(xiàn)在)隨著Internet的普遍應(yīng)用,世界經(jīng)濟一體化進程的加速以及國際社會交流的日漸頻繁,傳統(tǒng)的人工作業(yè)的方式已經(jīng)遠遠不能滿足迅猛增長的翻譯需求,人們對于機器翻譯的需求空前增長,機器翻譯迎來了一個新的發(fā)展機遇。國際性的關(guān)于機器翻譯研究的會議頻繁召開,中國也取得了前所未有的成就,相繼推出了一系列機器翻譯軟件,例如“譯星”、“雅信”、“通譯”、
6、“華建”等。在市場需求的推動下,商用機器翻譯系統(tǒng)邁入了實用化階段,走進了市場,來到了用戶面前。,基本翻譯方法,1.直接轉(zhuǎn)換法2.基于規(guī)則的翻譯方法3.基于中間語言的翻譯方法4.基于語料庫的翻譯方法基于實例的翻譯方法基于統(tǒng)計的翻譯方法,ContrastbetweenMTandHT,MachineTranslationVSHumanTranslationTheLimitationofMT,,例1:Thesightandsoundofourjetplanesfilledmewithspeciallonging.科智系統(tǒng):我們的噴氣式飛機的情景和聲音使我充滿特別的渴望。功學(xué)系統(tǒng):我們的噴射機的景象和聲
7、音充滿我以(和)特別的longing。參考譯文:看到我們的噴氣式飛機,聽到隆隆的機聲,令我特別神往。,,,例2:Themountainsbegantothrowtheirlongblueshadowsoverthevalley.科智系統(tǒng):這些高山開始越過這個(山)谷投他們的長的藍色的影子。功學(xué)系統(tǒng):這些山開始擲他們的長藍色陰影超過這valley。參考譯文:群山已開始在山谷里投下它們蔚藍色的長影。,,,例4:Ihadacarstolenyesterday.金山快譯:我昨天偷一輛汽車。東方快車:我把了一輛汽車昨天被偷竊。例5:Iusedtohavethreecars.Icouldntkeepthe
8、mallinmysmallgarage.Iparkedsomewherearoundmyhouse,butIhadacarstolenyesterday.金山快譯:我過去一直有三輛汽車。我無法在我的小車庫中使他們保持所有的。我停車了在我的房子周圍的某處。但是我昨天偷一輛汽車。東方快車:我過去常有3輛汽車。我都不能把他們放在我的小車庫。在我的房子附近我停車了某地。但是我把了一輛汽車昨天被偷竊。,,例6:Hewasintheseventhheavenlastnight.金山快譯:他昨晚是在第七天堂方面;東方快車:昨晚他在第7天堂;參考譯文:昨晚他欣喜若狂。,,例7:Oh!Myeye!hesaid,
9、Lookingverylowspirited.Iamsorryforthat.(CharlesDickens:DavidCopperfield,ch.5)金山快譯:/Oh!我的眼睛!他說,看起來非常無精神。我為那感到抱歉。東方快車:/oh!我的眼睛!他說,看起來很沒有精神。我是抱歉的為那。參考譯文:/噢,天哪!他看起來很喪氣,說道:這件事可糟了。,,例8:Ourhistoryteacherisagoodtalker.Idliketoaskhim,Wheresthebeef?Becausewesuredontlearnmuchfromhim.金山快譯:我們的歷史老師是一個好說話的人。我想要問他,
10、牛肉在哪里?因為我們當然不從他得知多。東方快譯:我們的歷史教師是一位好的空談?wù)?。我很想問?牛肉在哪兒?因為向他我們沒問題不學(xué)習(xí)很多。參考譯文:我們的歷史老師很能夸夸其談。我真想問問他,/管用的貨色在哪兒?因為我們真的沒有從他那里學(xué)到多少東西。,TheLimitationofMT,人名翻譯MT表現(xiàn)稍有遜色,例如將“彭定康”翻譯為“Patten”而沒有譯成全名“ChristopherFrancispattern”,將Google創(chuàng)始人之一LarryPage的名字翻譯為“佩奇”而沒有譯成“拉里佩奇”,“金庸”的名字只提供了“JinYong”而沒有使用更加準確的“LouisCha”,不能不說是一種遺
11、憾。,習(xí)語翻譯MT的表現(xiàn)中規(guī)中矩,對大多數(shù)習(xí)語的識別顯然還算不錯,但稍艱深或涉及文化的成語則呈現(xiàn)出一定差異,例如將“海誓山盟asolemnpledgeoflove”譯作“eternal”不夠全面,英文習(xí)語“tocarrycoaltoNewcastle做徒勞無益的事(多此一舉,白費力氣)”直譯為“運煤到紐卡斯爾”,“禍起蕭墻Troublebreaksoutathome”則干脆譯成了莫名其妙的“Harris”。,文學(xué)作品翻譯文學(xué)作品翻譯方面,MT翻譯基本上是逐字翻譯,根本無法傳達作品的深層內(nèi)涵。,滿地黃花堆積,憔悴損,而今有誰堪摘?MT:Everywhereyellowfloweraccumula
12、tiongauntwhocanpickthelossnow?HT:Thegroundiscoveredwithyellowflowersfadedandfalleninshowers.Whowillpickthemupnow?,明月幾時有,把酒問青天MT:Whenthemoonis,wineaskbluesky.HT:Whenwillthemoonbeclearandbright?Withacupofwineinmyhand,Iaskthebluesky.,成語典故翻譯在成語典故方面,MT翻譯只能翻譯出字面意思,無法結(jié)合語境和歷史文化背景,給出合適恰當?shù)姆g。,別狗咬呂洞賓,不識好人心。MT:
13、Thedogbitelvdongbindoesnotknowgoodhearts.HT:Dontbitethehandthatfeedsyou.,機器翻譯遇到困難,1.詞法歧義自動化研究所取得的成就自動化/研究所/取得/的/成就/。自動化/研究/所/取得/的/成就/。AchievementsmadebytheInstituteofAutomation,,2.新的詞匯無法理解上大學(xué)子燭光追思錢偉長UniversitysubcandlelightmemorialchangOnthebigstudentsqianwei-changcandlelightmemorialShanghaiUniversi
14、tystudentsmournQianWeichangwiththecandlelight,,3.結(jié)構(gòu)歧義今天中午吃食堂Atnoontoday,mealsinthecafeteriaChiShiTangatnoontodayWewillhavelunchinthecafeteriatoday,,IsawamanwithatelescopeIsawamanwithatelescope.Isawamanwithatelescope.我看到一個人用望遠鏡我看見一個男人與一個望遠鏡,4.語義歧義,他說:“她這個人真有意思(funny)”。她說:“他這個人怪有意思的(funny)”。于是人們以為他們有了
15、意思(wish),并讓他向她意思意思(express)。他火了:“我根本沒有那個意思(thought)”!她也生氣了:“你們這么說是什么意思(intention)”?事后有人說:“真有意思(funny)”。也有人說:“真沒意思(nonsense)”。,Yourbrainhastwoparts:theleftandtheright.Yourleftbrainhasnothingright,andyourrightbrainhasnothingleft。你的大腦有兩部分:左邊的和好的。左腦有什么權(quán)利,你的右腦有一無所有你的大腦有兩部分:左和右。你的左腦沒有正確的,你的右腦沒剩下什么東西。,機器翻譯
16、的現(xiàn)狀,我們需要的是計算機幫助人類完成某些翻譯工作,而不是完全替代人,人與機器翻譯系統(tǒng)之間應(yīng)該是互補的關(guān)系,而不是相互競爭。機器翻譯還不成熟(instate-of-the-art),需要的是人與系統(tǒng)的配合,而不是有意為難,輔助機器翻譯可以大大減輕人的負擔。,目前機器翻譯的價值不在于它可以取代翻譯專家,而在于它可在一個完整翻譯過程的部分環(huán)節(jié)中有所貢獻。雖然機器翻譯的可理解性和忠實度還不夠理想,但倘若數(shù)學(xué)、計算機科學(xué)、翻譯學(xué)及語言學(xué)等領(lǐng)域的研究者齊心協(xié)力,并且把上下文語境和文化語境考慮在程序編寫過程中,就能使譯文的語篇性更強,使語言的三大功能,即概念功能、人際功能和篇章功能表現(xiàn)得更加突出。,Pro
17、spectofMT,Geekssavetheworld!!!技術(shù)宅改變世界?。。?翻譯記憶方法1,翻譯記憶方法(TranslationMemory)是基于實例方法的特例;也可以把基于實例的方法理解為廣義的翻譯記憶方法;翻譯記憶的基本思想:把已經(jīng)翻譯過的句子保存起來翻譯新句子時,直接到語料庫中去查找如果發(fā)現(xiàn)相同的句子,直接輸出譯文否則交給人去翻譯,但可以提供相似的句子的參考譯文,翻譯記憶方法2,翻譯記憶方法主要被應(yīng)用于計算機輔助翻譯(CAT)軟件中翻譯記憶方法的優(yōu)缺點翻譯質(zhì)量有保證隨著使用時間匹配成功率逐步提高特別適用于重復(fù)率高的文本翻譯,例如公司的產(chǎn)品說明書的新版本翻譯與語言無關(guān),適用于各種語
18、言對缺點是匹配成功率不高,特別是剛開始使用時,翻譯記憶方法3,計算機輔助翻譯(CAT)軟件已經(jīng)形成了比較成熟的產(chǎn)業(yè)TRADOS號稱占有國際CAT市場的70%Microsoft、Siemens、SAP等國際大公司和一些著名的國際組織都是其用戶雅信CAT適合中國人的習(xí)慣產(chǎn)品已比較成熟國際組織:LISA(LocalisationIndustryStandardsAssociation本地化產(chǎn)業(yè)標準協(xié)會)面向用戶:專業(yè)翻譯人員數(shù)據(jù)交換:LISA制定了TMX(TranslationMemoryExchange)標準。,,,翻譯記憶方法4,完整的計算機輔助翻譯軟件除了包括翻譯記憶功能以外,還應(yīng)該包括以下功能多種文件格式的分解與合成術(shù)語庫管理功能語料庫的句子對齊(歷史資料的重復(fù)利用)項目管理:翻譯任務(wù)的分解與合并翻譯工作量的估計數(shù)據(jù)共享和數(shù)據(jù)交換,翻譯記憶方法5,,Thanksforyourattention!,,,,,