《基於統計機器翻譯和自動文摘的查詢擴展研究》是依託昆明理工大學,由李衛疆擔任項目負責人的地區科學基金項目。
基本介紹
- 中文名:基於統計機器翻譯和自動文摘的查詢擴展研究
- 項目類別:地區科學基金項目
- 項目負責人:李衛疆
- 依託單位:昆明理工大學
《基於統計機器翻譯和自動文摘的查詢擴展研究》是依託昆明理工大學,由李衛疆擔任項目負責人的地區科學基金項目。
《基於統計機器翻譯和自動文摘的查詢擴展研究》是依託昆明理工大學,由李衛疆擔任項目負責人的地區科學基金項目。項目摘要信息檢索麵臨的一個主要問題是查詢詞和文檔詞之間的語義鴻溝,而自然語言 內在的模糊性加劇了這個問題。因此需要...
《基於自然語言處理的信息檢索》作者對自然語言處理和信息檢索進行了系統、深入的研究,闡述了自然語言處理技術套用於信息檢索的意義和必要性。對自然語言處理的一些關鍵技術,比如機器翻譯、自動文摘分別進行了重點研究,闡明了這些技術如何套用於信息檢索的方法。《基於自然語言處理的信息檢索》共分九章:第一章介紹自然...
《中文信息處理叢書:統計自然語言處理(第2版)》全面介紹了統計自然語言處理的基本概念、理論方法和最新研究進展,內容包括形式語言與自動機及其在自然語言處理中的套用、語言模型、隱馬爾可夫模型、語料庫技術、漢語自動分詞與詞性標註、句法分析、詞義消歧、篇章分析、統計機器翻譯、語音翻譯、文本分類、信息檢索與問答...
根據進度計畫穩步開展了研究工作,有計畫分階段地實現了人才培養目標,取得了階段性的研究成果,並為項目組以後在辭彙語義理解領域深入開展研究奠定了紮實的基礎。在本項目資助下,目前共發表論文10餘篇。本項目的研究成果,對於機器翻譯、信息檢索、文本分析、自動文摘、知識挖掘等具有重要的理論和套用價值。
《國外計算機科學教材系列:統計機器翻譯》是2012年電子工業出版社出版的圖書,作者是菲利普•科恩。內容簡介 本書是介紹統計機器翻譯理論和方法的教材。全書分三部分(總計11章),分別討論基礎知識、核心方法和前沿研究。全書首先簡要介紹語言學和機率論基礎知識,然後全面討論各種經典統計機器翻譯模型和系統實現方法,...
哈工大智慧型技術與自然語言處理研究室,是哈爾濱工業大學成立的研究室。是國內較早從事自然語言處理研究的科研團體之一。自八十年代初期以來,先後開展了俄漢機器翻譯、固定段落問答、自動文摘、文本糾錯、漢字智慧型輸入、語音識別與合成、語料庫多級加工、語言模型、信息檢索、問答系統等多項研究。科研成果 研究室的代表性...
跨語言(Cross Language: CL)組主要研究為信息檢索服務的機器翻譯和複述技術。CL組在複述領域已做了一些嘗試並取得了初步的成果,2007年發表2篇IJCAI論文,2008年發表2篇ACL論文。項目列表 基於實例動態泛化的共指消解,60975055,國家自然科學基金面上項目,2010-2012 漢語依存句法分析若干關鍵技術研究,60803093,國家...
本書內容包括下列6類(106篇): ①大會邀請報告,3篇; ②詞法、句法、語義和篇章分析,45篇; ③語言資源建設及相關技術,13篇; ④機器翻譯技術與系統,9篇; ⑤智慧型檢索(信息檢索、信息抽取、文本挖掘、文本分類、文本聚類、自動文摘、問答系統、話題跟蹤、情感分析、文本傾向性分析等),32篇; ⑥其他(...
《面向信息檢索的漢語同義詞自動識別》是在著者碩士論文和課題研究成果的基礎上寫成。同義詞的識別在知識組織系統構建和互操作、在信息檢索、自動標引、自動文摘、自動分類、機器翻譯、自動問答等自然語言理解領域,起著重要的作用。《面向信息檢索的漢語同義詞自動識別》提出了特徵模式匹配及基於PageRank算法等多種漢語同義...
非齊次機率模型的特徵表示、抽取和組合最佳化;非齊次機率模型的理論評價標準等。在對特定模型齊次化的基礎上總結適合非齊次機率建模的通用原則和基本方法,以期對詞性標註、句法分析等各層次的自然語言分析以及語音識別、音字轉換、信息檢索、機器翻譯、信息抽取、自動文摘等自然語言處理套用的性能提高起到普遍促進作用。
第三節 機器翻譯的原理 第四節 機器翻譯系統的評價 第五節 機器翻譯的現狀與前景 第九章 計算機輔助教學 第一節 國內外計算機輔助教學發展歷史研究 第二節 計算機輔助教學教師角色的轉換 第三節 計算機輔助教學的主要實踐形式 第四節 計算機輔助教學的發展趨勢 第十章 計算機語言學的其他套用領域 第一節 自...
第一節 機器翻譯思想的產生 第二節 俄羅斯機器翻譯發展歷程 第三節 機器翻譯方法 第四節 機器翻譯理論流派 第五節 俄羅斯機器翻譯系統 第六節 總結與展望 第七節 與UNL接口的機器翻譯系統ETAP-3 第十章 語言信息處理系統 第一節 信息檢索系統 第二節 基於語義分析的文本自動文摘研究 第三節 計算機輔助語言教學...
本書內容包括以下5類:(1)詞法、句法、語義和篇章分析,35篇;(2)語言資源建設及相關技術,12篇;(3)機器翻譯技術與系統,10篇;(4)智慧型檢索(信息檢索、信息抽取、文本挖掘、文本分類、文本聚類、自動文摘、問答系統、話題跟蹤、情感分析、文本傾向性分析等),31篇;(5)其他,5篇。本書充分展示了國內...
共指消解是指將篇章中同一實體對象的各種描述進行合併,是自然語言處理研究的重要課題。共指消解技術的研究對機器翻譯、信息抽取、信息檢索及自動文摘等自然語言處理領域都有積極的促進作用。但是目前在有限的訓練語料上,基於規則和統計共指消解方法只能覆蓋有限的高頻實例,忽略了更多的低頻實例的作用,並且在傳統的方法...
文摘自動生成中權重計算的對偶性策略 《全衡》網上中文輸入系統的詞典建設 《全衡》網上中文輸入系統——特性與功能 聲母統計分析的軟體實現 廣東話文本語音轉換系統的設計與實現 漢語語音識別的糾錯處理 文本檢索會議簡介 機譯研究中的一些誤區——從譯文質量分析看 關於機器翻譯的評測問題 漢語詞語的兩字hash算法 中國...
3.6.2 主動學習 3.6.3 句法數據標註現狀 3.6.4 遷移學習 3.7 句法語義分析的套用 3.7.1 作為抽取規則 ……4 知識圖譜 5 文本分類與自動文摘 6 情感分析 7 信息檢索與推薦的神經網路方法:前沿與挑戰 8 自動問答與機器閱讀理解 9 機器翻譯 10 深度學習在社會計算中的套用與進展 索引 ...
機器翻譯、搜尋引擎都是利用統計方法獲得了成功。神經網路自然語言處理 神經網路自然語言處理(2010s至2024年):深度學習開始在語音和圖像發揮威力。近來的研究更加聚焦於非監督式學習和半監督學習的算法。這種算法,能夠從沒有人工註解理想答案的資料里學習。2011年以來,深度學習技巧紛紛出爐 在自然語言處理方面獲得最尖端...
《自然語言處理實踐(第2版)》是2023年清華大學出版社出版的圖書,作者是李軒涯、曹焯然、計湘婷。內容簡介 本書是一本基於PaddlePaddle深度學習框架的實踐性NLP教程,內容包括文本表示、文本分類、文本匹配、信息抽取、機器翻譯、自動文摘、機器閱讀理解、聊天機器人設計與實現等多個領域的知識,以及多種經典算法的實踐...
AIRS、Knowledge and Information Systems等國內外學術會議和期刊上發表論文30餘篇,其中被scI檢索4篇,被cPcI—s檢索4篇,被EI核心檢索12篇。獲得智慧型摘要軟體等計算機軟體著作權3項。主持科研項目2項。主要研究領域為自然語言處理(信息檢索、信息過濾、機器翻譯、自動文摘)和人工智慧(機器學習、數據挖掘、文本分類)。
90年代 ,機器翻譯研究還發展了基於統計與 基於實例的各種模型。不過,當前世界上實際運行的機器翻譯系統基本上仍以基於規則的模型為基礎。從這個基本模型可以了解到,機器翻譯系統的基本原理乃是要素合成原理。首先將原文的句子分解成基本構成要素(詞 ,慣用語等),這樣才可以查詞典,才好運用語法規則找出句子的結構,...
④介紹分散式人工智慧與Agent、計算智慧型、機器學習、反向傳播神經網路、Hopfield神經網路和知識發現等已成為當前研究熱點的人工智慧技術和方法;⑤比較詳細地分析人工智慧的主要套用領域,涉及自動規劃系統、自然語言處理、信息檢索、語言翻譯、語音識別、機器人和網際網路智慧型等。本書適合作為面向計算機專業大學高年級和非計算機...
針對統計出現的數據稀疏問題,介紹了常見的數據稀疏處理方法。 第10章系統地介紹了機器翻譯的方法、困難及解決策略、套用類型及套用領域和機器翻譯的自動評價。重點介紹了統計機器翻譯方法,包括基於詞對齊的機器翻譯、基於短語對齊的機器翻譯和基於句法的機器翻譯。詞對齊主要有IBM的詞對齊和基於HMM的詞對齊。短語對齊主要...
HNC是英文Hierarchical Network of Concepts(概念層次網路)的縮寫,HNC理論是一個關於自然語言理解(Natural Language Understanding)的理論體系,它以概念聯想脈絡為主線,建立了一種表述和處理自然語言的新模式,這一模式不但能套用於自然語言的計算機理解處理,如機器翻譯、智慧型檢索、自動文摘、人機對話等 ...
7.5.2 統計學方法的套用及所面臨的問題 7.5.3 漢語語料庫加工的基本方法 7.6 信息搜尋 7.6.1 信息搜尋概述 7.6.2 搜尋引擎 7.6.3 智慧型搜尋引擎 7.7 機器翻譯 7.7.1 機譯系統概述 7.7.2 機器翻譯理論與方法 7.8 自動文摘 7.9 語音識別 7.9.1 組成單詞讀音的基本單元 7.9.2 信號處理 7...
他在北京語言文化大學參與創辦語言信息處理研究所,並在中國科學院軟體研究所、北京信息工程學院、黑龍江大學、中軟公司等單位指導課題研究,涉及漢字輸入、文本編輯、機器翻譯、語言理解、自動文摘、漢語計算機輔助教學等方面,並親自設計算法、調試程式。他曾撰寫多篇文章論及兩個學科的關係,並熱情洋溢地為他的研究生的...
在自然語言處理的套用領域主要介紹了信息抽取、自動文摘、文本排重、文本分類、文本傾向性分析等領域的基本理論和實現過程,此外還有問答系統、機器翻譯等目前套用非常廣泛的領域。作者簡介 主要研究項目及領域: 自然語言處理、人工智慧、搜尋引擎 以前出版的圖書: 《自然語言處理原理與技術實現》 其他社會頭銜、榮譽: ...
典型的例子有:種資料庫和專家系統的自然語言接口、各種機器翻譯系統、全文信息檢索系統、自動文摘系統等。自然語言處理,即實現人機間自然語言通信,或實現自然語言理解和自然語言生成是十分困難的。造成困難的根本原因是自然語言文本和對話的各個層次上廣泛存在的各種各樣的歧義性或多義性(ambiguity)。一個中文文本從形式...
當漢字由句轉化為詞之後,才能使得句法分析、語句理解、自動文摘、自動分類和機器翻譯等文本處理具有可行性。可以說,分詞是機器 語言學的基礎。字元匹配 百度分詞方法 百度分詞3種技術:字元串匹配的分詞方法、詞義分詞法、統計分詞法。機械分詞方法 字元串匹配這種方法又叫做機械分詞方法,它是按照一定的策略將待分析的...
1998年-2002年期間的研究情況和發展態勢依然如此。在本文上述的各種套用目標中,研究力量比較集中的項目有:文本信息檢索、文獻自動分類、自動文摘、語音自動識別與合成、機器翻譯,還有文本信息提取和過濾。另外,語言資源的建設和基於語料庫的語言分析方法也受到了格外關注,取得了比較快的進展。
第5章機器翻譯 實踐十六: 基於序列到序列模型的中英機器翻譯 實踐十七: 基於注意力機制的中英機器翻譯 實踐十八: 基於Transformer的中英機器翻譯 第6章自動文摘 實踐十九: 基於注意力機制的英文新聞標題生成 實踐二十: 基於Transformer的英文自動文摘 實踐二十一: 基於ERNIEGEN的中文自動文摘 第7章機器...