Stata正則表達式及其在財務數據中的套用

Stata正則表達式及其在財務數據中的套用

《Stata正則表達式及其在財務數據中的套用》是2022年中國金融出版社出版的圖書,作者是李春濤。

基本介紹

  • 中文名:Stata正則表達式及其在財務數據中的套用
  • 作者:李春濤
  • 出版時間:2022年9月
  • 出版社中國金融出版社
  • ISBN:9787522016276
  • 開本:16 開
  • 裝幀:平裝
內容簡介,圖書目錄,

內容簡介

隨著教學和數據分析業務的開展,我們發現更多的數據來自文本,而正則表達式是對文本數據的分析必不可少的技能。因此近年來,爬蟲俱樂部在開展的Stata編程課程中融入了較多的正則表達式內容。雖然我們在課程中融入很多生動的案例,但是正則表達式看似簡單實則一學就會但是容易忘,客觀上需要一本常備參考手冊。市面上關於正則表達式的參考書很少,而且沒有關於Stata使用正則表達式的資料,用戶只能閱讀Stata公司提供的晦澀難懂的手冊,因此每次上課都會有學員諮詢有沒有可能寫一本專門介紹Stata使用正則表達式方法的書。為此,我們下決心撰寫本書,希望系統地介紹Stata調用正則表達式的方法及其套用。

圖書目錄

目錄
第1 章 正則表達式入門 ·· 1
1.1 通配符 · 1
1.2 正則表達式 · 4
1.3 正則表達式的用途 · 6
1.4 如何使用正則表達式 ·· 15
1.5 Stata 版本選擇 · 16
1.6 字元、位元組與Stata 編碼 · 17
1.7 本章小結 ·· 18
第2 章 正則表達式字元串函式 20
2.1 匹配函式:regexm( )和ustrregexm( ) 20
2.2 提取函式:regexs( )和ustrregexs( ) ·· 23
2.3 替換函式:regexr( )、ustrregexrf( )和ustrregexra( ) 27
2.4 本章小結 ·· 32
第3 章 元字元 33
3.1 基本元字元 ·· 33
3.2 數量元字元 ·· 44
3.3 特殊字元元字元 ·· 61
3.4 位置元字元 ·· 68
3.5 前後查找 ·· 74
3.6 空白元字元 ·· 80
3.7 回溯引用:前後一致匹配 ·· 91
3.8 Unicode 轉義字元 98
3.9 POSIX 字元類元字元 · 101
3.10 本章小結 104
第4 章 正則表達式綜合運用 ·· 105
4.1 英文地址提取郵編(三) · 105
4.2 提取性別、年齡、種族 · 108
4.3 中文地址中城市名稱的提取· 115
4.4 英文姓名拆分(二) · 129
4.5 提取生產日期 · 135
4.6 本章小結 · 139
第5 章 與正則表達式相關的命令·· 140
5.1 moss 命令 140
5.2 subinfile 命令 · 146
5.3 filesearch 命令 152
5.4 fromroman 命令 · 159
5.5 toroman 命令 ·· 162
5.6 varsearch 命令 163
5.7 screening 命令 166
5.8 jregex 命令 · 175
5.9 本章小結 · 181
第6 章 正則表達式與網路爬蟲·· 182
6.1 網路爬蟲概述 · 182
6.2 基於網路爬蟲編寫的命令 · 182
6.3 網路爬蟲實例 · 195
6.4 本章小結 · 248
附錄A 基礎ASCII 字元表 · 249
附錄B 生成基礎ASCII 表的Stata 程式· 254
後 記 ·· 256

熱門詞條

聯絡我們