人工智慧數學基礎(廖盛斌編著)

人工智慧數學基礎(廖盛斌編著)

本詞條是多義詞,共7個義項
更多義項 ▼ 收起列表 ▲

本書分為7章,其內容包括代數學和分析學的基礎概念、微積分的基礎概念、矩陣與線性變換、矩陣分解、最最佳化理論與算法、機率模型和資訊理論的基礎概念。本書突出強調數學概念並採用圖形化的方法對其進行解釋,以利於讀者理解,同時,本書給出相關知識在機器學習和人工智慧領域的具體套用,將理論知識和工程實踐有機結合,以使讀者能對理論知識有更深層次的理解。

本書可供高等院校計算機科學與技術、數據科學、人工智慧、網路通信、控制、運籌與最佳化、套用數學等專業大學教師、高年級本科生和研究生閱讀,也可供相關領域的工程技術人員與產品開發人員參考。

本書所有數學知識經過系統梳理,自成一個體系,覆蓋了學習機器學習與人工智慧所需的基礎數學知識。本書的目標是為機器學習與人工智慧相關專業的學生或從業者及學習相關技術知識的工程技術人員或愛好者打下堅實的數學基礎。

基本介紹

  • 中文名:人工智慧數學基礎
  • 作者:廖盛斌
  • 出版社:電子工業出版社
  • 出版時間:2023年9月
第1章 代數學和分析學的基礎概念
1.1 人工智慧需要數學的原因
1.2 向量與範數
1.2.1 向量和線性空間
1.2.2 向量的內積
1.2.3 向量的外積
1.2.4 向量的範數
1.3 矩陣的定義及其基本運算
1.3.1 矩陣的定義
1.3.2 矩陣的基本運算
1.3.3 逆矩陣
1.3.4 深入理解矩陣因子的幾何意義
1.4 行列式
1.4.1 行列式的定義
1.4.2 行列式的性質
1.4.3 行列式的幾何意義
1.5 函式的極限與連續性
1.5.1 函式的極限
1.5.2 函式的連續性
1.6 參考文獻
第2章 微積分的基礎概念
2.1 導數
2.1.1 導數、偏導數與方嚮導數
2.1.2 梯度、雅可比矩陣和黑塞矩陣
2.1.3 泰勒公式
2.1.4 機器學習中常見函式的導數
2.2 微分
2.2.1 微分的概述
2.2.2 微分中值定理
2.3 積分
2.3.1 不定積分
2.3.2 定積分
2.3.3 廣義積分
2.3.4 多重積分
2.4 常微分方程
2.4.1 常微分方程的概述
2.4.2 一階微分方程的概述
2.5 參考文獻
第3章 線性變換
3.1 矩陣秩的基礎概念
3.1.1 矩陣的初等變換
3.1.2 矩陣的秩
3.2 向量組的線性相關性
3.2.1 線性組合
3.2.2 向量組的秩
3.3 特徵值與特徵向量的基礎概念
3.3.1 特徵值與特徵向量
3.3.2 特徵值與特徵向量的基本性質
3.3.3 相似矩陣與相似對角化
3.3.4 正交矩陣和對稱矩陣的對角化
3.4 線性空間
3.4.1 線性空間的相關定義
3.4.2 線性空間的基與維數
3.5 線性變換
3.5.1 基變換的定義
3.5.2 坐標變換的定義
3.5.3 線性變換的定義
3.6 內積空間
3.6.1 內積空間的定義
3.6.2 格拉姆-施密特正交化方法
3.6.3 標準正交基的常用性質
3.7 參考文獻
第4章 矩陣分解
4.1 矩陣的LU分解
4.1.1 矩陣 分解的定義及本質
4.1.2 矩陣 分解的條件
4.1.3 矩陣 分解的擴展形式
4.1.4 利用矩陣的 分解求解線性方程組
4.2 矩陣的QR分解
4.2.1 矩陣 分解的定義
4.2.2 利用格拉姆-施密特正交化方法進行矩陣的 分解
4.3 矩陣的特徵值分解
4.3.1 矩陣特徵值分解的定義
4.3.2 矩陣特徵值分解的本質
4.3.3 矩陣特徵值分解的套用
4.4 矩陣的奇異值分解
4.4.1 矩陣奇異值分解的定義
4.4.2 矩陣奇異值分解的計算
4.4.3 矩陣奇異值分解的意義及逼近
4.4.4 矩陣奇異值分解的套用
4.5 參考文獻
第5章 最最佳化理論與算法
5.1 凸集與凸函式
5.1.1 凸集
5.1.2 凸函式
5.1.3 凸函式的判定
5.2 最最佳化問題與求解算法的一般形式
5.2.1 最最佳化問題及解的定義
5.2.2 最佳化算法的一般思路
5.2.3 可行方向與下降方向
5.3 最優性條件
5.3.1 無約束問題的最優性條件
5.3.2 約束問題的最優性條件
5.3.3 KKT條件
5.4 梯度下降法
5.4.1 最速下降方向
5.4.2 梯度下降算法
5.4.3 隨機梯度下降算法
5.5 牛頓法
5.5.1 牛頓法的定義
5.5.2 擬牛頓法的定義
5.6 最佳化算法在機器學習中的套用
5.6.1 最佳化算法求解機器學習問題的一般模式
5.6.2 支持向量機的動機與基本概念
5.6.3 線性可分支持向量機
5.6.4 軟間隔最大化
5.7 參考文獻
第6章 機率模型
6.1 隨機變數及其分布
6.1.1 機率的基本概念
6.1.2 隨機變數
6.1.3 離散型隨機變數
6.1.4 連續型隨機變數
6.1.5 隨機變數的函式及其分布
6.1.6 多維隨機變數及其分布
6.1.7 條件機率與條件分布
6.2 隨機變數的數字特徵
6.2.1 隨機變數的數學期望
6.2.2 方差
6.2.3 協方差與相關係數
6.2.4 方差和協方差在PCA中的套用舉例
6.3 極限理論
6.3.1 隨機變數的矩與切比雪夫不等式
6.3.2 大數定律
6.3.3 中心極限定理
6.4 機器學習中的參數估計
6.4.1 最大似然估計
6.4.2 最大後驗估計
6.4.3 貝葉斯最優分類器
6.4.4 貝葉斯估計
6.5 參考文獻
第7章 資訊理論的基礎概念
7.1 熵
7.1.1 熵的概念
7.1.2 聯合熵
7.1.3 條件熵
7.1.4 互信息
7.1.5 熵的性質
7.1.6 熵在機器學習中的套用
7.2 交叉熵與損失函式
7.2.1 交叉熵的定義
7.2.2 交叉熵的性質
7.2.3 機率分布推斷
7.2.4 交叉熵損失函式
7.3 KL散度
7.3.1 KL散度的定義
7.3.2 從熵編碼的角度理解KL散度
7.3.3 KL散度的性質
7.3.4 KL散度在機器學習中的套用
7.4 參考文獻

相關詞條

熱門詞條

聯絡我們