《基於語料庫的意象和語義可視化研究》是2019年10月中國社會科學出版社出版的圖書,作者是丁國旗。
基本介紹
- 中文名:基於語料庫的意象和語義可視化研究
- 作者:丁國旗
- 出版社:中國社會科學出版社
- 出版時間:2019年10月
- 頁數:220 頁
- 定價:86 元
- 裝幀:平裝
- ISBN:9787520351041
- 版次:1
內容簡介,圖書目錄,
內容簡介
《基於語料庫的意象和語義可視化研究》以認知語言學提出的基於使用的語言模型為理論依據,以英漢原創與翻譯散文語料庫為基礎,對比分析文學性語言中的意象和語義結構,並探索對分析結果進行可視化的方法。研究的創新性在於將語料庫與數據可視化相結合,有效利用R、Python、D3.js等多種文本分析、統計計算、數據處理和呈現手段,展示了數字人文方法對英漢對比與翻譯及語言歷時研究的意義。數字人文是近年來在國外蓬勃發展的一個研究方向,然而在國內人文社科領域此類研究較少,專著形式的研究成果亦不多見。
圖書目錄
章 引言
節 研究背景
第二節 研究內容與意義
第三節 本書的結構
第二章 語義研究中的語料庫方法
節 語言使用和語料庫
第二節 語言形式的本質
一 語言的象似性
二 語法即意象
第三節 語言的意義、可譯性及語料庫的套用
一 意義的體驗性
二 意義的主觀性
三 意義即是概念化
四 語義的百科性
五 意義的可譯性
六 意義的語料庫分析案例
七 小結
第三章 語料庫創建及研究方法
節 語料庫的創建與加工
一 語料庫結構和選材
二 對齊
三 分詞與賦碼
四 語料庫基本信息
第二節 研究方法與工具
―― WordSmith & AntConc
二 Notepad
三 PowerGREP
四 TextPro
五 ReNamer
六 R
七 Python
八 Gephi
九 D3.js
十 Photoshop
第三節 小結
第四章 頻率、關鍵字、搭配、語義韻
節 頻率
一 原始頻率
二 詞語過濾
第二節 關鍵字
一 參照詞表
二 藉助參照語料庫或詞表的關鍵字分析
三 TF―IDF
第三節 搭配
一 quanteda
二 tidytext
第四節 語義傾向和語義韻
一 語義韻的定義及研究現狀
二 更廣意義上的語義韻
三 情感分析與數據驅動的語義韻研究
四 中英翻譯及原創散文語義韻分析
第五節 小結
第五章 英譯中散文詞類對比
節 相關研究
第二節 理論前提
一 刻畫
二 名詞與動詞
第三節 材料與方法
第四節 數據與分析
一 詞類分布及差異
二 詞類相關性分析
三 中譯動詞的回歸分析
第五節 討論
第六節 小結
第六章 語義研究:詞語關聯
節 tidytext
第二節 詞語關聯
一 英文散文
二 中譯散文
三 中文散文
第三節 翻譯對等詞
第四節 小結
第七章 語義研究:詞語嵌入
節 word2vec詞語嵌人原理
第二節 t-SNE
一 英文散文
二 中譯散文
三 中文散文
第三節 語義網路
一 英文散文
二 中譯散文
三 中文散文
第四節 小結
第八章 語義研究:主題分析1
節 主題建模及其研究現狀
一 主題
二 主題建模的定義與簡單原理
三 研究現狀
第二節 材料、工具與步驟
一 語料庫
二 主題建模工具
三 分析步驟
第三節 結果與討論
第四節 小結
第九章 語義研究:主題分析2
節 研究現狀
第二節 材料、工具與步驟
一 語料庫
二 中文分詞
三 主題建模工具
四 分析步驟
第三節 結果與討論
一 tidytext語義相關性分析
二 Gensim神經網路分析
三 dfrtopics主題模型分析
第四節 小結
第十章 結語
節 本書的發現
第二節 本書的不足和對未來研究的建議
附錄
附錄1 史丹福大學的分詞和賦碼工具使用方法及代碼
附錄2 藉助參照語料庫或詞表的關鍵字分析和繪圖代碼(R)
附錄3 文本中關鍵字的TF-IDF計算和繪圖代碼(R)
附錄4 回歸分析可視化代碼(R)
附錄5 獲取翻譯對等詞的代碼(R)
附錄6 詞嵌入模型訓練代碼(Python)
附錄7 使用t―sNE降維和可視化代碼(Python)
附錄8 用於生成語義網路的代碼(Python)
附錄9 用於主題模型的代碼(R)
參考文獻
索引