用戶體驗度量:量化用戶體驗的統計學方法

用戶體驗度量:量化用戶體驗的統計學方法

本書是使用統計學解決用戶研究中常見問題的指南。它包含了你每天都要面對的常見問題,例如:當前的產品是否比競爭者的產品更易用?我們能確信70%的用戶在第一次嘗試時就完成任務嗎?用戶在網站上購買商品需要花費多長時間?本書詳細闡述如何選擇統計檢驗方法,以及在套用這些方法時如何為統計理論和最佳實踐提供基礎。本書聚焦於可套用於實際用戶研究項目的方法,是作者實際工作經驗、調查研究,以及對最新的統計學、心理學、人因工程學的文獻資料研讀的結晶。它不只是對傳統統計學的複述,而是為當今從業者提供了全新和切題的解讀。為各種項目中可用性測試的統計問題提供操作指南,包括使用六西格瑪的項目向從業者展示選擇哪種檢驗方法,其適用的原因以及套用中的最佳實踐,並為分析數據提供易於使用的Excel公式和網頁形式的計算器向從業者推薦使用通俗易懂的語言與相關人員溝通結論的一些方法

基本介紹

  • 中文名:用戶體驗度量:量化用戶體驗的統計學方法
  • 外文名:Quantifying the User Experience:Practical Statistics for User Research
  • 作者:邵羅 (Jeff Sauro)
  • 出版社:機械工業出版社
  • 頁數:270頁
  • 開本:16
  • 品牌:機械工業出版社
  • 類型:計算機與網際網路
  • 出版日期:2014年4月1日
  • 語種:簡體中文
  • ISBN:9787111459040
基本介紹,內容簡介,作者簡介,專業推薦,媒體推薦,名人推薦,圖書目錄,序言,

基本介紹

內容簡介

Amazon五星級暢銷書,資深用戶體驗專家、統計分析師、心理學專家10餘年工作經驗結晶,著眼於用戶體驗設計人員工作中所遇到的疑難問題,推薦最佳解決方案
從科學的量化視角給從業者以思考,注重實戰,每個知識點都輔之以設計精巧的案例,包含大量操作技巧和最佳實踐

作者簡介

Jeff Sauro是一名接受過6 sigma培訓的統計分析師,也是Measuring Usability公司的主要創始人。15年來,他一直為諸如PayPal、Walmart、Autodesk和Kelley Blue Book這類公司進行可用性項目和統計分析,也曾在Oracle、Intuit和General Electric等公司工作。
Jeff發表過超過15篇同行評審的研究文章,他也是《Journal of Usability Studies》的編輯委員。另外,Jeff也是人機互動(Computer Human Interaction,CHI)和可用性專家協會大會(Usability Professionals Associations,UPA)的常任演講者和講師。
Jeff在史丹福大學獲得了設計和技術專業的碩士學位,期間主要研習統計概念。在史丹福大學之前,他在錫拉丘茲大學獲得了信息管理與技術專業以及電視廣播電影專業的雙學士學位。如今Jeff和他的妻子以及3個孩子生活在丹佛。
James R.(Jim)Lewis博士是一名資深的人因工程師(1981年起在IBM工作),現今主要從事語音套用的設計和評估,他也是《Practical Speech User Interface Design》一書的作者。他是認證的人因專家,獲得了實驗心理學(語言心理學)的博士學位和工程心理學碩士學位,另外也是音樂理論和作曲專業的音樂碩士。Jim是國際公認的可用性測試和測量方面的專家。他(受邀)撰寫了《Handbook of Human Factors and Ergonomics》第3版和第4版的可用性測試章節,並在各種專家會議上演講關於可用性測試和度量指標的內容。
Jim是IBM大師級的發明家,擁有77項美國專利局頒發的專利。他最近在《International Journal of Human-Computer Interaction》和《Journal of Usability Studies》的編輯委員會工作,同時也在老齡化與技術增強研究與互動中心(Center for Research and Education on Aging and Technology Enhancement,CREATE)的科學諮詢委員會工作。他也是可用性專家協會(Usability Professionals Association,UPA)、人因和工效學會(Human Factors and Ergonomics Society,HFES)、心理科學協會(Association for Psychological Science,APS)和美國心理協會(American Psychological Association,APA)的會員。另外,Jim還是跆拳道黑帶5級和美國跆拳道協會(American Taekwondo Association,ATA)的認證導師。

專業推薦

媒體推薦

閱讀本書是一種愉悅的享受。它涉及用戶體驗領域的統計推理。它既不居高臨下,也不難於理解。
—— Joe Dumas,用戶體驗顧問,《Practical Guide to Usability Testing》作者

名人推薦

閱讀本書是一種愉悅的享受。它涉及用戶體驗領域的統計推理。它既不居高臨下,也不難於理解。
——Joe Dumas,用戶體驗顧問,《Practical Guide to Usability Testing》作者

圖書目錄

譯者序
致謝
作者介紹
第1章 導論11.1 簡介1
1.2 本書的組織結構1
1.3 如何使用本書2
1.3.1 應該使用何種檢驗2
1.3.2 我需要多大的樣本量5
1.3.3 你不必手動計算6
1.4 本章要點7
1.5 本章思考題7
1.6 參考資料8
第2章 量化用戶研究9
2.1 什麼是用戶研究9
2.2 用戶研究的數據9
2.3 可用性測試10
2.3.1 樣本量10
2.3.2 代表性和隨機性10
2.3.3 數據收集12
2.3.4 任務完成率12
2.3.5 可用性問題13
2.3.6 任務時間14
2.3.7 出錯數14
2.3.8 滿意度評分14
2.3.9 複合分數14
2.4 A/B測試15
2.5 調查數據15
2.5.1 等級量表15
2.5.2 淨推薦值16
2.5.3 評論和開放性數據16
2.6 需求收集16
2.7 本章要點17
2.8 參考資料17
第3章 我們的估算到底有多準確19
3.1 簡介19
3.1.1 置信區間=誤差幅度的兩倍19
3.1.2 置信區間提供了精確度和位置20
3.1.3 置信區間的三個組成部分20
3.2 完成率的置信區間20
3.2.1 置信區間的歷史21
3.2.2 Wald區間:對於小樣本來說就太不靠譜了21
3.2.3 精確置信區間22
3.2.4 Wald校正區間:增加兩個成功與兩個失敗22
3.2.5 完成率的最佳點估計24
3.2.6 遭遇可用性問題的置信區間26
3.3 等級量表和其他連續性數據的置信區間26
3.3.1 任務時長數據的置信區間29
3.3.2 任務時長均值還是任務時長中位數30
3.3.3 幾何均值30
3.3.4 大樣本任務時長的置信區間32
3.3.5 圍繞中位數的置信區間33
3.4 本章要點34
3.5 本章思考題35
3.6 參考資料36
第4章 我們達到或超過目標了嗎38
4.1 簡介38
4.2 單側檢驗和雙側檢驗40
4.3 完成率與基準的比對41
4.3.1 小樣本檢驗42
4.3.2 大樣本檢驗44
4.4 滿意度分數與基準的比對46
4.5 任務時間和基準的比對50
4.6 本章要點54
4.7 本章思考題54
4.8 參考資料57
第5章 不同設計之間有統計學差異嗎59
5.1 簡介59
5.2 比較兩個平均值(等級量表和反應時)59
5.2.1 被試內設計比較——配對t檢驗60
5.2.2 比較任務時長62
5.2.3 組間比較(雙樣本t檢驗)64
5.2.4 t檢驗的假設68
5.3 比較完成率、轉換率以及A/B測試69
5.3.1 組間比較69
5.3.2 組內比較78
5.4 本章要點86
5.5 本章思考題88
5.6 參考資料94
第一部分:總結性研究95
第6章 我們需要多大的樣本量
6.1 簡介95
6.1.1 我們為何要關注95
6.1.2 可用性研究的類型至關重要96
6.1.3 總結性可用性測試樣本量預估的基本原則96
6.2 預估數值97
6.3 比較數值104
6.4 如何控制變異性109
6.5 二項置信區間樣本量的估計110
6.5.1 大樣本的二項樣本量估計110
6.5.2 小樣本的二項樣本量估計112
6.5.3 與基準比例相比較的樣本量115
6.6 卡方檢驗的樣本量預估(獨立比例)117
6.7 MCNEMAR精確檢驗的樣本預估(配對比例)120
6.8 本章要點123
6.9 本章思考題124
6.10 參考資料130
第二部分:形成性研究131
第7章 我們需要多大的樣本量
7.1 簡介131
7.2 使用發現問題的機率模型來估計形成性用戶研究的樣本量131
7.2.1 著名方程:P(x≥1)=1—(1—p)n131
7.2.2 從1—(1—p)n中推導出樣本量估計方程133
7.2.3 使用表格計畫形成性用戶研究樣本量135
7.3 二項機率模型的假設136
7.4 模型的附加套用137
7.4.1 估計多重問題或其他事件的複合p值137
7.4.2 校正小樣本p的複合估計值138
7.4.3 估計可發現的問題數和未被發現的問題數143
7.5 影響p值的是什麼144
7.6 什麼是合理的目標問題發現率145
7.7 調解“神奇的數字5”和“8還不夠”147
7.7.1 一段歷史:20世紀80年代147
7.7.2 又一段歷史:20世紀90年代148
7.7.3 “神奇的數字5”的起源149
7.7.4 “8還不夠”:一個調解方法151
7.8 更多關於二項機率公式和其小樣本校正155
7.8.1 二項機率公式的起源155
7.8.2 緊縮校正是如何起作用的156
7.9 針對問題發現的其他統計模型159
7.9.1 對問題發現使用二項式模型的批評159
7.9.2 擴展的二項式模型160
7.9.3 Capture recapture模型161
7.9.4 在計畫形成性用戶研究時為什麼不用其他模型161
7.10 本章要點165
7.11 本章思考題166
7.12 參考資料168
第8章 標準化的可用性問卷171
8.1 簡介171
8.1.1 什麼是標準化的問卷171
8.1.2 標準化可用性問卷的優點171
8.1.3 什麼樣的標準化可用性問卷是有用的172
8.1.4 標準化問卷的質量評估:信度、效度和靈敏度173
8.1.5 問卷的步距數174
8.2 整體評估問卷174
8.2.1 QUIS(用戶互動滿意度問卷)175
8.2.2 SUMI(軟體可用性測試問卷)176
8.2.3 PSSUQ178
8.2.4 SUS(軟體可用性問卷)182
8.2.5 可用性整體評估問卷的實驗比較194
8.3 任務評估問卷197
8.3.1 場景後問卷197
8.3.2 單項難易度問卷198
8.3.3 主觀腦力負荷問題198
8.3.4 期望評級199
8.3.5 可用性等級評估201
8.3.6 任務評估問卷的實驗比較203
8.4 網站感知可用性的評估問卷205
8.4.1 網站分析和測量問卷206
8.4.2 標準通用的百分等級問卷207
8.4.3 其他評估網站的問卷209
8.5 其他有趣的問卷210
8.5.1 計算機系統可用性問卷210
8.5.2 有用性、滿意度、易用性211
8.5.3 用戶經驗的可用性度量211
8.5.4 享受性質量212
8.5.5 美國消費者滿意度指標213
8.5.6 淨推薦值213
8.5.7 福雷斯特客戶體驗指數215
8.5.8 技術接受模型215
8.6 本章要點216
8.7 本章思考題217
8.8 參考資料220
第9章 測量和統計的六大持久論戰224
9.1 介紹224
9.2 對多點量表數據進行平均合理嗎225
9.2.1 一方觀點225
9.2.2 另一方觀點226
9.2.3 我們的推薦228
9.3 需要測試至少30名用戶嗎229
9.3.1 一方觀點229
9.3.2 另一方觀點230
9.3.3 我們的推薦231
9.4 所有的實驗都要進行雙側檢驗嗎231
9.4.1 一方觀點231
9.4.2 另一方觀點232
9.4.3 我們的推薦233
9.5 當p>0.05時,我們能拒絕原假設嗎233
9.5.1 一方觀點233
9.5.2 另一方觀點234
9.5.3 我們的推薦235
9.6 能將各種可用性度量指標合併到一個分數中嗎236
9.6.1 一方觀點236
9.6.2 另一方觀點238
9.6.3 我們的推薦239
9.7 假使你需要進行多次檢驗該怎么辦239
9.7.1 一方觀點239
9.7.2 另一方觀點241
9.7.3 我們的推薦241
9.8 本章要點245
9.9 本章思考題246
9.10 參考資料249
第10章 總結251
10.1 簡介251
10.2 更多信息251
10.3 好運254
10.4 本章要點254
10.5 參考資料254
附錄A 基礎統計概念速成255

序言

譯 者 序

首先感謝機械工業出版社編輯和我們親愛的同事周莜將此書介紹給我們,同時也帶給了我們一次書籍翻譯的經歷。
時下用戶體驗的概念甚為時興,相關書籍俯拾即是,但作為一名從業者,想找到一本真正對實踐有指導意義的資料卻十分困難。看到此書時我們甚為驚喜:作者為業界資深專家,有豐富的從業經驗;書中的討論重點著眼於用戶體驗設計人員工作中所遇到的疑難問題。由此,我們欣然接下了本書的翻譯任務,也希望將其介紹給國內更多關注用戶體驗的朋友。
譯者小團隊有5名成員,皆為騰訊公司的用戶體驗從業者。團隊成員來自上海、深圳、成都三地,部分成員雖是同事但之前少有機會合作,都因此書結緣而走到一起。譯者團隊有用戶研究人員,也有設計師,從業經驗最長6年,最短兩年。其中兩名成員還是騰訊公司用戶體驗與設計部“CDC翻客”團隊的主力成員。
寫書難,譯書亦不簡單。網際網路行業的從業者工作之餘的時間少得可憐,加之本書涉及眾多統計概念和推導分析,極大地增加了翻譯工作的難度。各位譯者迎難而上,犧牲了周末、年假、工作中的休息時間,持續4個月進行翻譯、交叉校對、討論、統稿,最終完成本書翻譯工作。其中辛苦只有自知。憑藉團隊成員的知識背景、工作經驗和辛勤付出,相信我們為讀者提供的是一份有誠意的高質量譯本。
在此我們也向團隊成員互表感激,感謝大家在這4個月中的付出和精誠合作。同時感謝鼓勵我們的家人、團隊領導和同事們。
以下是團隊成員的翻譯感言,排序不分先後。
殷文婧:翻譯本書,感觸最深的是作者面對問題的堅持精神和實證方法。我認為這正是自己對這本書和作者的敬佩之處,也是業界對用戶研究從業者的“專業”給予認可和尊重之源。
徐沙:從事用戶體驗相關工作以來,我不斷對自己原有學術的“科學方法體系”進行調整。類似可用性測試這類方法,如何科學衡量結果,一直困擾著我們。“科學的一個本質特徵是發展新的創意以及將新老想法進行實證測試”,在實際工作中我們採用可用性測試進行評估,但往往忽視了對結果的評估,導致可用性測試變成了信息蒐集而不能直接幫助決策。當然評估的標準不限於本書,本書的價值在於從科學的量化視角給從業者以思考,本書推薦的很多問卷也可以在實踐中嘗試使用。
楊晨燕:用戶研究從業者在研究過程中常會遇到這樣的問題和挑戰:“測試多少樣本足以揭示問題?”“小樣本用戶研究結果能說明總體情況嗎?”本書針對用戶研究中的這些實踐性問題,全面深入地梳理了作者及國際上其他最前沿的研究結果,並結合自己的工作經驗,推薦了最佳解決辦法,特別是在可用性測試和測量方面。對用戶研究從業者或關注用戶體驗的人來說,相信本書能夠帶給大家幫助和啟發。
隋馨緣:在平日的工作中,常常會遇到資源緊缺的問題:時間資源、樣本資源、財務預算。你甚至會懷疑在多大程度上對自己的結論有信心。統計學能夠幫助你評估,在你能承受的誤差範圍之內需要多少資源。也能讓你審視自己的資源,更有效地利用資源來幫助你做出決策。
陶伯仲:作為設計師,我們一直倡導“以用戶需求出發”來做設計,但在實際工作中往往由於時間、資源上的限制只能在沒有用戶測試數據的情況下自己拍板。由於對“需要多少樣本?”“結果可不可信?”等問題心裡沒底,普通設計師想要自己蒐集用戶信息時還是舉步維艱。本書作者根據自身多年的工作經驗,深入淺出地介紹了不同情況下可用性測試中的數據蒐集方法和衡量方式,對於想用心做用戶喜歡的產品的設計師來說,是一本不可錯過的指南和工作手冊。最後,還想對翻譯過程中一起辛苦熬夜的同事和家人說一聲:“謝謝!辛苦了!”

相關詞條

熱門詞條

聯絡我們