O\x27Reilly:基於Spark NLP的自然語言處理

《O'Reilly:基於Spark NLP的自然語言處理》是2022年中國電力出版社出版的圖書。

基本介紹

  • 中文名:O'Reilly:基於Spark NLP的自然語言處理
  • 出版時間:2022年9月1日
  • 出版社:中國電力出版社
  • ISBN:9787519869670
內容簡介,圖書目錄,

內容簡介

本書介紹NLP基礎知識和構建模組,然後再深入研究應用程式和系統構建。
• 基礎知識:了解自然語言處理、Apache Spark上的NLP和深度學習的基礎知識。
• 構建模組:學習構建 NLP 應用程式的技術(包括標記化、句子分割和命名實體識別),並了解它們的工作方式和原因。
• 應用程式:探索構建你自己的NLP應用程式的設計、開發和實驗過程。
• 構建NLP系統:考慮生產和部署NLP模型的選項,包括支持哪些人類語言。

圖書目錄

前言 . 1
第一部分 基礎知識
第1 章 快速入門 . 9
1.1 簡介 9
1.2 其他工具 11
1.3 建立你自己的開發環境 12
1.3.1 前置條件 12
1.3.2 啟動Apache Spark 13
1.3.3 檢查代碼 13
1.4 熟悉Apache Spark .14
1.4.1 使用Spark NLP 啟動Apache Spark 14
1.4.2 在Apache Spark 中載入和查看數據 15
1.5 Spark NLP 的Hello World 示例 18
第2 章 自然語言基礎知識 27
2.1 什麼是自然語言 27
2.1.1 語言的起源 28
2.1.2 口頭語言和書面語言29
2.2 語言學 30
2.2.1 語音學和音系學 .30
2.2.2 詞法學(形態學) 31
2.2.3 語法 32
2.2.4 語義學 .33
2.3 社會語言學:方言、語域和其他變體 34
2.3.1 禮節 34
2.3.2 語境 35
2.4 語用學 35
2.4.1 羅曼·雅各布森 .35
2.4.2 如何運用語用學 .37
2.5 書寫系統 37
2.5.1 起源 37
2.5.2 字母 38
2.5.3 輔音音素文字 .39
2.5.4 元音附標文字 .40
2.5.5 音節表 41
2.5.6 標識象形符 .41
2.6 編碼 42
2.6.1 ASCII 42
2.6.2 Unicode 42
2.6.3 UTF-8 43
2.7 練習:分詞 .44
2.7.1 英語分詞 44
2.7.2 希臘語分詞 45
2.7.3 Ge'ez(阿姆哈拉語)分詞 45
2.8 資源 46
第3 章 Apache Spark 上的NLP 49
3.1 並行性、並發性、分散式計算 .50
3.1.1 Apache Hadoop 之前的並行化 53

相關詞條

熱門詞條

聯絡我們