《機器翻譯簡介整理》PPT課件.ppt
《《機器翻譯簡介整理》PPT課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《《機器翻譯簡介整理》PPT課件.ppt(49頁珍藏版)》請在裝配圖網(wǎng)上搜索。
,,MACHINETRANSLATION,機器翻譯,MachineTranslation,DefinitionofMTHistoryofDevelopmentContrastbetweenMTandHTProspectofMT,TheDefinitionofMT,MT,theabbreviationofmachinetranslation,isasub-fieldofcomputationallinguisticsthatinvestigatestheuseofsoftwaretotranslatetextorspeechfromonenaturallanguagetoanother.,什么是機器翻譯,機器翻譯(machinetranslation,MT)是利用計算機把一種語言(源語言,sourcelanguage)翻譯成另一種語言(目標語言,targetlanguage)的一門學(xué)科和技術(shù)。,MACHINETRANSLATION,機器翻譯的產(chǎn)生發(fā)展,機器翻譯遇到的困難,添加文本,機器翻譯的現(xiàn)狀,機器翻譯的產(chǎn)生發(fā)展,1947~1964:草創(chuàng)時期1970~1976:復(fù)蘇階段1976~現(xiàn)在:繁榮時期,HistoryofDevelopment,1.開創(chuàng)期(1947-1964)1954年,美國喬治敦大學(xué)在IBM公司協(xié)同下,用IBM-701計算機首次完成了英俄機器翻譯試驗,拉開了機器翻譯研究的序幕。中國早在1956年,國家就把這項研究列入了全國科學(xué)工作發(fā)展規(guī)劃,課題名稱是“機器翻譯、自然語言翻譯規(guī)則的建設(shè)和自然語言的數(shù)學(xué)理論”。從20世紀50年代開始到20世紀60年代前半期,美國和前蘇聯(lián)兩個超級大國出于軍事、政治、經(jīng)濟目的,均對機器翻譯項目提供了大量的資金支持,而歐洲國家由于地緣政治和經(jīng)濟的需要也對機器翻譯研究給予了相當大的重視,機器翻譯一時出現(xiàn)熱潮。,2.受挫期(1964-1975)1964年,為了對機器翻譯的研究進展作出評價,美國科學(xué)院成立了語言自動處理咨詢委員會(AutomaticLanguageProcessingAdvisoryCommittee,簡稱ALPAC委員會),開始了為期兩年的綜合調(diào)查分析和測試。1966年11月,該委員會公布了一個題為《語言與機器》的報告(簡稱ALPAC報告),該報告全面否定了機器翻譯的可行性,并建議停止對機器翻譯項目的資金支持。這一報告的發(fā)表給了正在蓬勃發(fā)展的機器翻譯當頭一棒,機器翻譯研究陷入了近乎停滯的僵局。無獨有偶,在此期間,中國爆發(fā)了“十年文革”,基本上這些研究也停滯了。機器翻譯步入蕭條期。,3.恢復(fù)期(1975-1989)進入70年代后,隨著科學(xué)技術(shù)的發(fā)展和各國科技情報交流的日趨頻繁,國與國之間的語言障礙顯得更為嚴重,傳統(tǒng)的人工作業(yè)方式已經(jīng)遠遠不能滿足需求,迫切地需要計算機來從事翻譯工作。同時,計算機科學(xué)、語言學(xué)研究的發(fā)展,特別是計算機硬件技術(shù)的大幅度提高以及人工智能在自然語言處理上的應(yīng)用,從技術(shù)層面推動了機器翻譯研究的復(fù)蘇,機器翻譯項目又開始發(fā)展起來,各種實用的以及實驗的系統(tǒng)被先后推出,例如Weinder系統(tǒng)、EURPOTRA多國語翻譯系統(tǒng)、TAUM-METEO系統(tǒng)等。,4.新時期(1990~現(xiàn)在)隨著Internet的普遍應(yīng)用,世界經(jīng)濟一體化進程的加速以及國際社會交流的日漸頻繁,傳統(tǒng)的人工作業(yè)的方式已經(jīng)遠遠不能滿足迅猛增長的翻譯需求,人們對于機器翻譯的需求空前增長,機器翻譯迎來了一個新的發(fā)展機遇。國際性的關(guān)于機器翻譯研究的會議頻繁召開,中國也取得了前所未有的成就,相繼推出了一系列機器翻譯軟件,例如“譯星”、“雅信”、“通譯”、“華建”等。在市場需求的推動下,商用機器翻譯系統(tǒng)邁入了實用化階段,走進了市場,來到了用戶面前。,基本翻譯方法,1.直接轉(zhuǎn)換法2.基于規(guī)則的翻譯方法3.基于中間語言的翻譯方法4.基于語料庫的翻譯方法-基于實例的翻譯方法-基于統(tǒng)計的翻譯方法,ContrastbetweenMTandHT,MachineTranslationVSHumanTranslationTheLimitationofMT,,例1:Thesightandsoundofourjetplanesfilledmewithspeciallonging.科智系統(tǒng):我們的噴氣式飛機的情景和聲音使我充滿特別的渴望。功學(xué)系統(tǒng):我們的噴射機的景象和聲音充滿我以(和)特別的longing。參考譯文:看到我們的噴氣式飛機,聽到隆隆的機聲,令我特別神往。,,,例2:Themountainsbegantothrowtheirlongblueshadowsoverthevalley.科智系統(tǒng):這些高山開始越過這個(山)谷投他們的長的藍色的影子。功學(xué)系統(tǒng):這些山開始擲他們的長藍色陰影超過這valley。參考譯文:群山已開始在山谷里投下它們蔚藍色的長影。,,,例4:Ihadacarstolenyesterday.金山快譯:我昨天偷一輛汽車。東方快車:我把了一輛汽車昨天被偷竊。例5:Iusedtohavethreecars.Icouldn’tkeepthemallinmysmallgarage.Iparkedsomewherearoundmyhouse,butIhadacarstolenyesterday.金山快譯:我過去一直有三輛汽車。我無法在我的小車庫中使他們保持所有的。我停車了在我的房子周圍的某處。但是我昨天偷一輛汽車。東方快車:我過去常有3輛汽車。我都不能把他們放在我的小車庫。在我的房子附近我停車了某地。但是我把了一輛汽車昨天被偷竊。,,例6:Hewasintheseventhheavenlastnight.金山快譯:他昨晚是在第七天堂方面;東方快車:昨晚他在第7天堂;參考譯文:昨晚他欣喜若狂。,,例7:Oh!Myeye!hesaid,Lookingverylowspirited.Iamsorryforthat.(CharlesDickens:DavidCopperfield,ch.5)金山快譯:/Oh!我的眼睛!他說,看起來非常無精神。我為那感到抱歉。東方快車:/oh!我的眼睛!他說,看起來很沒有精神。我是抱歉的為那。參考譯文:/噢,天哪!他看起來很喪氣,說道:這件事可糟了。,,例8:Ourhistoryteacherisagoodtalker.Idliketoaskhim,Where’sthebeef?Becausewesuredontlearnmuchfromhim.金山快譯:我們的歷史老師是一個好說話的人。我想要問他,牛肉在哪里?因為我們當然不從他得知多。東方快譯:我們的歷史教師是一位好的空談?wù)摺N液芟雴査?牛肉在哪兒?因為向他我們沒問題不學(xué)習很多。參考譯文:我們的歷史老師很能夸夸其談。我真想問問他,/管用的貨色在哪兒?因為我們真的沒有從他那里學(xué)到多少東西。,TheLimitationofMT,人名翻譯MT表現(xiàn)稍有遜色,例如將“彭定康”翻譯為“Patten”而沒有譯成全名“ChristopherFrancispattern”,將Google創(chuàng)始人之一LarryPage的名字翻譯為“佩奇”而沒有譯成“拉里佩奇”,“金庸”的名字只提供了“JinYong”而沒有使用更加準確的“LouisCha”,不能不說是一種遺憾。,習語翻譯MT的表現(xiàn)中規(guī)中矩,對大多數(shù)習語的識別顯然還算不錯,但稍艱深或涉及文化的成語則呈現(xiàn)出一定差異,例如將“海誓山盟asolemnpledgeoflove”譯作“eternal”不夠全面,英文習語“tocarrycoaltoNewcastle做徒勞無益的事(多此一舉,白費力氣)”直譯為“運煤到紐卡斯爾”,“禍起蕭墻Troublebreaksoutathome”則干脆譯成了莫名其妙的“Harris”。,文學(xué)作品翻譯文學(xué)作品翻譯方面,MT翻譯基本上是逐字翻譯,根本無法傳達作品的深層內(nèi)涵。,滿地黃花堆積,憔悴損,而今有誰堪摘?MT:Everywhereyellowfloweraccumulationgauntwhocanpickthelossnow?HT:Thegroundiscoveredwithyellowflowersfadedandfalleninshowers.Whowillpickthemupnow?,明月幾時有,把酒問青天MT:Whenthemoonis,wineaskbluesky.HT:Whenwillthemoonbeclearandbright?Withacupofwineinmyhand,Iaskthebluesky.,成語典故翻譯在成語典故方面,MT翻譯只能翻譯出字面意思,無法結(jié)合語境和歷史文化背景,給出合適恰當?shù)姆g。,別狗咬呂洞賓,不識好人心。MT:Thedogbitelvdongbindoesnotknowgoodhearts.HT:Dontbitethehandthatfeedsyou.,機器翻譯遇到困難,1.詞法歧義自動化研究所取得的成就自動化/研究所/取得/的/成就/。自動化/研究/所/取得/的/成就/。AchievementsmadebytheInstituteofAutomation,,2.新的詞匯無法理解上大學(xué)子燭光追思錢偉長UniversitysubcandlelightmemorialchangOnthebigstudentsqianwei-changcandlelightmemorialShanghaiUniversitystudentsmournQianWeichangwiththecandlelight,,3.結(jié)構(gòu)歧義今天中午吃食堂Atnoontoday,mealsinthecafeteriaChiShiTangatnoontodayWewillhavelunchinthecafeteriatoday,,IsawamanwithatelescopeIsaw[amanwithatelescope].I[sawaman]withatelescope.我看到一個人用望遠鏡我看見一個男人與一個望遠鏡,4.語義歧義,他說:“她這個人真有意思(funny)”。她說:“他這個人怪有意思的(funny)”。于是人們以為他們有了意思(wish),并讓他向她意思意思(express)。他火了:“我根本沒有那個意思(thought)”!她也生氣了:“你們這么說是什么意思(intention)”?事后有人說:“真有意思(funny)”。也有人說:“真沒意思(nonsense)”。,Yourbrainhastwoparts:theleftandtheright.Yourleftbrainhasnothingright,andyourrightbrainhasnothingleft。你的大腦有兩部分:左邊的和好的。左腦有什么權(quán)利,你的右腦有一無所有你的大腦有兩部分:左和右。你的左腦沒有正確的,你的右腦沒剩下什么東西。,機器翻譯的現(xiàn)狀,我們需要的是計算機幫助人類完成某些翻譯工作,而不是完全替代人,人與機器翻譯系統(tǒng)之間應(yīng)該是互補的關(guān)系,而不是相互競爭。機器翻譯還不成熟(instate-of-the-art),需要的是人與系統(tǒng)的配合,而不是有意為難,輔助機器翻譯可以大大減輕人的負擔。,目前機器翻譯的價值不在于它可以取代翻譯專家,而在于它可在一個完整翻譯過程的部分環(huán)節(jié)中有所貢獻。雖然機器翻譯的可理解性和忠實度還不夠理想,但倘若數(shù)學(xué)、計算機科學(xué)、翻譯學(xué)及語言學(xué)等領(lǐng)域的研究者齊心協(xié)力,并且把上下文語境和文化語境考慮在程序編寫過程中,就能使譯文的語篇性更強,使語言的三大功能,即概念功能、人際功能和篇章功能表現(xiàn)得更加突出。,ProspectofMT,Geekssavetheworld!!!技術(shù)宅改變世界?。。?翻譯記憶方法1,翻譯記憶方法(TranslationMemory)是基于實例方法的特例;也可以把基于實例的方法理解為廣義的翻譯記憶方法;翻譯記憶的基本思想:把已經(jīng)翻譯過的句子保存起來翻譯新句子時,直接到語料庫中去查找如果發(fā)現(xiàn)相同的句子,直接輸出譯文否則交給人去翻譯,但可以提供相似的句子的參考譯文,翻譯記憶方法2,翻譯記憶方法主要被應(yīng)用于計算機輔助翻譯(CAT)軟件中翻譯記憶方法的優(yōu)缺點翻譯質(zhì)量有保證隨著使用時間匹配成功率逐步提高特別適用于重復(fù)率高的文本翻譯,例如公司的產(chǎn)品說明書的新版本翻譯與語言無關(guān),適用于各種語言對缺點是匹配成功率不高,特別是剛開始使用時,翻譯記憶方法3,計算機輔助翻譯(CAT)軟件已經(jīng)形成了比較成熟的產(chǎn)業(yè)TRADOS號稱占有國際CAT市場的70%Microsoft、Siemens、SAP等國際大公司和一些著名的國際組織都是其用戶雅信CAT適合中國人的習慣產(chǎn)品已比較成熟國際組織:LISA(LocalisationIndustryStandardsAssociation本地化產(chǎn)業(yè)標準協(xié)會)面向用戶:專業(yè)翻譯人員數(shù)據(jù)交換:LISA制定了TMX(TranslationMemoryExchange)標準。,,,翻譯記憶方法4,完整的計算機輔助翻譯軟件除了包括翻譯記憶功能以外,還應(yīng)該包括以下功能多種文件格式的分解與合成術(shù)語庫管理功能語料庫的句子對齊(歷史資料的重復(fù)利用)項目管理:翻譯任務(wù)的分解與合并翻譯工作量的估計數(shù)據(jù)共享和數(shù)據(jù)交換,翻譯記憶方法5,,Thanksforyourattention!,,,,,- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 機器翻譯簡介整理 機器翻譯 簡介 整理 PPT 課件
鏈接地址:http://www.szxfmmzy.com/p-11509349.html