算法語言學,即“計算語言學”。
基本介紹
- 中文名:算法語言學
- 別稱:計算語言學
算法語言學,即“計算語言學”。
算法語言學,即“計算語言學”。...
為了滿足計算機加工的要求,計算語言學最大的特點就是要求語言的形式化,因為只有形式化,才能算法化、自動化。根據這項要求,制定出一系列面向語言信息處理的自動分析方法,其中包括預示分析法、從屬分析法、中介成分體系、優選語義學、擴充轉移網路、概念從屬論等等。這些自動分析方法,已在機器翻譯和自然語言理解的系統...
《計算語言學(修訂版)》是2014年清華大學出版社出版的圖書,作者是劉穎。內容簡介 本書側重最經典的工作,闡述計算語言學的基本理論和方法,主要介紹現代句法理論和語義理論,詞法、句法和語義階段重要的分析算法、統計語言學和機器翻譯。計算語言學是一門涉及語言學、計算機科學和數學等多門學科的交叉學科,覆蓋面廣。
計算語言學是指通過建立形式化的數學模型來分析、處理自然語言,並在計算機上用程式來實現分析和處理的過程,旨在以機器來模擬人的部分或全部語言能力的目的。 《自然語言處理與計算語言學》作為一本藉助於Python程式語言以及各種開源工具(如Gensim、spaCy等)來執行文本分析、自然語言處理和計算語言學算法的圖書,從套用...
向前算法 向前算法(forward algorithm)是2011年公布的語言學名詞。定義 隱馬爾可夫模型中一種快速計算觀察序列機率的算法。是一種動態規划算法,通過向前變數以循環疊代的方式沿著狀態格線向前計算。出處 《語言學名詞》第一版。
《計算語言學概論》是2003年商務印書館出版的圖書,作者是俞士汶。該書從“基礎”“算法”和“套用”三個方面,較為系統地介紹計算語言學的基礎理論、相關的自然語言處理技術和套用。簡介 基礎部分(包括一、二、三章)主要講述計算語言學的數學和語言學基本概念,計算語言學和自然語言處理技術的關係,自然語言處理的...
向後算法 向後算法(backward algorithm)是2011年公布的語言學名詞,出自《語言學名詞》第一版。定義 隱馬爾可夫模型中一種快速計算觀察序列機率的算法。是一種動態規划算法,通過向後變數以循環疊代的方式沿著狀態格線向後計算。出處 《語言學名詞》第一版。
向內算法 向內算法(inside algorithm)是2011年公布的語言學名詞,出自《語言學名詞》第一版。定義 一種基於機率上下文無關文法的快速計算句子機率的算法。是一種動態規划算法,通過向內變數由內向外以循環疊代的方式計算句子的機率。出處 《語言學名詞》第一版。
三、向內向外算法(140)第九章語言學習(145)第一節詞分類(145)第二節詞法學習(148)一、語法框架(148)二、辭彙選擇(lexicalselection)(152)第三節語法學習(155)一、有限狀態自動機的機器學習(155)二、語接推導的理論問題(159)三、貝葉斯推理在語怯推導中的套用(161)第十章當前計算語言學的研究...
非確定性算法 非確定性算法(nondeterministic algorithm)是2011年公布的語言學名詞,出自《語言學名詞》第一版。定義 一種語言分析算法。在分析過程面對多種選擇時,需要進行回溯或並行處理。在這種分析方法中,並非每一個局部分析結果都會成為最終結果的組成部分。出處 《語言學名詞》第一版。
為了建立第3類機器翻譯系統,語言學家要深入研究語義學,數學家要制定語義表示和語義加工的算法,在程式設計方面,也要考慮語義加工的特點。知識型 目標是給機器配上人類常識,以實現基於理解的翻譯系統,以Tomita提出的知識型機譯系統為代表。知識型機譯系統利用龐大的語義知識庫,把源文轉化為中間語義表示,並利用專業...
現代語言學理論 (70610753)3學分(考試)當代西方語言學流派 (70611092)2學分(考試)漢語史 (70610763)3學分(考試)計算語言學基礎理論 (70611043)2學分(考試)組合數學 (60240013)3學分(考試)算法與算法複雜性理論 (70240193)3學分(考試)隨機過程 (80420074)4學分(考試)(4) 專業基礎課(...
富田勝算法 富田勝算法(Tomita algorithm)是2011年公布的語言學名詞。定義 日本學者富田勝提出的由分析表驅動的自底向上的句法分析算法。因該算法從改進LR分析算法得到,所以又稱“廣義LR分析算法”。出處 《語言學名詞》第一版。
計算語言學的學科交叉性決定了語言理論研究方法的選擇,它必然是代表實證主義語言觀的描寫取向,並且必須以套用價值為先導。唯此方可把所觀察到的語言現象形式化、算法化,並使之在計算機上加以實現。目前,計算機的研製已發展到第五代,其特點是帶有人類的智慧型,關鍵在於要求機器更好地識別和處理自然語言。有專家認為,...
而其框架可分成聲學模型、語言模型和解碼三個部分。Transformer 模型 Transformer 模型在2017 年,由Google 團隊中首次提出。Transformer 是一種基於注意力機制來加速深度學習算法的模型,模型由一組編碼器和一組解碼器組成,編碼器負責處理任意長度的輸入並生成其表達,解碼器負責把新表達轉換為目的詞。Transformer 模型...
第二節 基本構句塊及其識別算法 第三節 俄語句法結構的模式化描述及操作原理 第四節 形容詞擴展模式的形式化 第五章 俄語語義信息的自動化分析 第一節 語義中介語及其計算原理 第二節 辭彙語義資源及語義分析 第三節 意念詞典和語義詞典 第四節 MAMM壓模型與語句意義表示 第五節 一種基於TM技術的機助翻譯系統...
全書共7章,分為3部分: 第1部分包括第1~2章,介紹文本作者身份識別的基本概念、研究內容、建模基本方法和主要套用領域; 第2部分包括第3~4章,介紹現有的作者身份文體特徵、作者身份識別算法、性能評價指標、主要實驗平台等; 第3部分包括第5~7章,介紹本書對作者身份識別研究的貢獻和在中英文部落格、微博語料上的...
本書主要利用計算語言學方法討論了認知解讀過程中的語言頓悟和折返,對多種語言中各個層面上的花園幽徑現象,從認知心理、計算處理等多個角度進行了研究。研究表明遞歸轉移網路、良構子串表和CYK算法等計算語言學的形式化方法可用於闡釋具有“由行漸頓,頓而後悟,悟終復行”的花園幽徑模式行進錯位效應。這對了解人類...
(5) 當掃描content[6]的時候,發現"計算語言學課"並不是詞表中的詞,也不是詞的前綴。因此可以切分出前面最大的詞——"計算語言學"。由此可見,最大匹配出的詞必須保證下一個掃描不是詞表中的詞或詞的前綴才可以結束。逆向最大匹配算法思想 逆向匹配算法大致思路是從右往左開始切分。我們還是用上面的例子:...
主要從事計算動詞理論、物理語言學、非線性電子電路、計算認知、視覺晶片結構及算法,以及視頻理解算法及體系結構等方向的研究。楊先生擁有一項美國專利,出版了11本專著,發表了超過100篇的學術論文。現為江蘇漢德天坤科技發展有限公司首席科學家。發展歷程 從1997年到2000年是計算動詞理論的萌芽期。在這一時期主要致力於...
另外,還和劉汝佳合著了信息學競賽的著名黑書:算法藝術與信息學競賽(黑書)。人物榮譽 黃亮教授於2008年獲得ACL最佳論文獎,是中國學者首次獲得此項計算語言學和自然語言處理界的最高論文榮譽。同時這也是ACL歷史上僅有的4次單一作者(single author)論文獲獎之一。他還獲得EMNLP2016最佳論文榮譽獎,多次最佳論文獎...
詞性標註(Part-Of-Speech tagging, POS tagging)也被稱為語法標註(grammatical tagging)或詞類消疑(word-category disambiguation),是語料庫語言學(corpus linguistics)中將語料庫內單詞的詞性按其含義和上下文內容進行標記的文本數據處理技術。詞性標註可以由人工或特定算法完成,使用機器學習(machine learning)方法...
簡單聚類 簡單聚類(simple clustering)是2011年公布的語言學名詞。定義 一種聚類分析方法。把所有樣本直接按照屬於或不屬於某類進行聚類。出處 《語言學名詞》