基本介紹,研究背景,技術來源,支持設備,功能介紹,使用技術,概況介紹,前端方面,後台技術,網頁搜尋,知識計算,軟體套用,十一功用,專利侵權,流量需求,涉黃爭議,問題曝光,事件處理,監管盲點,
基本介紹 研究背景 Siri 成立於2007年,2010年被蘋果以2億
美金 收購,最初是以文字聊天服務為主,隨後通過與全球最大的語音識別廠商
Nuance 合作,Siri實現了語音識別功能。
技術來源 Siri 技術來源於
美國國防部 高級研究規劃局所公布的 CALO 計畫:一個讓軍方簡化處理一些繁複
庶務 ,並具學習、組織以及認知能力的數字助理,其所衍生出來的民用版軟體 Siri 虛擬個人助理。
支持設備 原生:
iPhone XS
iPhone XS Max
iPhone XR
iPad Air 3
iPod touch5
註:iPhone4S的Siri支持
中文 需要iOS 6.0(或更高版本)
The new iPad支持Siri需要iOS6.0(或更高版本)
越獄後:
註:1.越獄後是利用Siri Proxy 中轉接入蘋果官方
伺服器 或FeelSiri伺服器。
2.iPhone 3GS 和 iPod touch 4 支持iOS 5和iOS 6 系統下的Siri移植。由於iOS 7 不支持這兩款設備,故不能移植。
4. iPad 1 可以在
IOS 5 下移植Siri。由於不能升級iOS 6和iOS 7 故不能移植。
5.除iPad 1不是完美GUI移植。在iOS 6 環境下,iPad 2完成了完美
GUI 移植。
功能介紹 使用者可以通過
聲控 、
文字 輸入的方式,來搜尋
餐廳 、
電影 院等生活信息,同時也可以直接收看各項相關評論,甚至是直接訂位、訂票;另外其適地性(location based)服務的能力也相當強悍,能夠依據用戶默認的居家地址或是所在位置來判斷、過濾搜尋的結果。
功能改進 不過其最大的特色,則是人機的互動方面,不僅有十分生動的對話接口,其針對用戶詢問所給予的回答,也不至於答非所問,有時候更是讓人有種心有靈犀的驚喜,例如使用者如果在說出、輸入的內容包括了『喝了點』、『家』這些字(甚至不需要符合語法,相當人性化...),Siri 則會判斷為喝醉酒、要回家,並自動建議是否要幫忙叫計程車。
Siri 和系統的整合更加緊密
Siri 在併購前的版本整合了大量網路服務的 APIs 。比如
OpenTable ,Tickets,Taxi Magic 等等。
而 Siri 被蘋果收購了之後, 他已經被整合為系統的一部分了。
在
iOS 5 的 Siri 視頻中,出現新短訊息之後,互動由 Siri 發起。說明他已經常駐系統後台並且可以接管重要的系統功能了。(除了短訊息還有天氣,時鐘,Maps 等等)
Siri 支持的語言
截至IOS6.1,Siri支持中文(國語 - 中國),中文(粵語 - 中國香港),德文(德國),德文(瑞士),義大利文(義大利),義大利文(瑞士),日文,法文(加拿大),法文(法國),法文(瑞士)英文(澳大利亞),英文(美國),英文(英國),英文(澳大利亞),西班牙文(墨西哥),西班牙文(美國),西班牙文(西班牙)和韓文。
iOS10的Siri 使用技術 概況介紹 Siri所用到的技術,很多人會回答,人工智慧以及
雲計算 ,的確,總體來說,是這兩樣技術,不過,這種概述感覺幾乎沒有任何意義,何不直接說“計算技術”(注意,不是計算機技術)呢。因此,在本文,我將介紹下我了解 Siri 可能採用的技術(由於有個人猜測,不一定準確)。
iOS9的Siri能幫你做更多 前端方面 在前端方面,即面向用戶,和用戶互動(User Interface,
UI )的技術,主要是語音識別以及語音合成技術。語音識別技術是把用戶的口語轉化成文字,其中需要強大的語音知識庫,因此需要用到所謂的“雲計算”技術。而語音合成則是把返回的文字結果轉化成語音輸出,這個技術理論上本地就能完成,但不知道Siri是否如此,當然,在雲端完成也並無不可,在當前無線頻寬下,那點語音流量根本不算什麼。
與中文百科合作
後台技術 後台技術,這些其實才是真正的大角色。這些技術的目的就是處理用戶的請求,並返回最匹配的結果,這些請求類型很多,千奇百怪,要處理好並不簡單。基本的結構猜測可能是分析用戶的輸入(已經通過語音轉化),根據輸入類型,分別採用合適的技術(合適的技術後台)進行處理。這些合適的後台技術包括,①以Google 為代表的網頁搜尋技術;②以
Wolfram Alpha 為代表的知識搜尋技術(或者知識計算技術);③以
Wikipedia 為代表的知識庫(和 Wolfram Alpha 不同的是,這些知識來自人類的手工編輯)技術(包括其他百科,如電影百科等);④以
Yelp 為代表的問答以及推薦技術。
Siri功能介紹 網頁搜尋 大家天天用的
Google 就是這個技術的代表,而國內則以百度為代表。
知識計算 (搜尋)技術(Computational Knowledge)
這個技術的代表是WolframAlpha。
不同於搜尋網際網路信息,Wolfram|Alpha將從公眾的(包括公開的網頁等)和獲得授權的資源中,發掘、建立起一個異常龐大的經過組織的資料庫,再利用高級的自然語言算法進行處理,最終構造出一個類似於谷歌搜尋的工具。
和網頁搜尋技術不同的是,在這個系統中,得到的答案結構化程度很高,比如搜尋China,能得到和中國相關的各種參數以及資料,並以接近表格的方式呈現。Wolfram|Alpha也能理解部分自然語言,比如輸出How old are you,其會回答Wolfram|Alpha的年齡。想測試這項技術的請移步Wolfram|Alpha。
這個技術國內做的應該有,但還沒有產品,也許百度的
框計算 算是半個。所以機會大大的有。
知識庫技術
相比於網頁搜尋技術,基本以一個詞條或者主題為單位,因此得到的數據價值高,知識量大,並且結構化程度好。相比於知識計算技術,這些技術需要人的參與,這有利也有弊,利就是,畢竟暫時人比機器聰明,編輯出來的知識更豐富,準確;弊就是,人力有限,即使像維基那樣,發動社區的力量,也不能產生足夠的知識,而知識計算,理論上,只需要算法夠,是可以產生“無限”的知識的。
問答推薦技術
其實這不能稱為一個技術,應該屬於知識庫的技術。不同的是,這個技術針對的是一些生活信息,這些信息的地域化程度很高,典型代表為
Yelp 。由於這東西比較簡單,就不仔細介紹了。
語言模型技術
這是如何提升Siri識別企業和餐廳等本地興趣點名稱的方法,融合了用戶所在地的知識,也就是所謂的Geo-LM,藉此提升Siri的語音識別能力。這些模型讓Siri可以更好地評估用戶的發音內容。
軟體套用 Assistant 將會成為 iOS 的一部分。Siri 原是一個第三方套用,是蘋果花費2億美元購買所得的。雖然在收購後很長的一段時間裡我們仍能在 App Store 上看到這一套用的身影,不過它將近有一年多的時間沒有更新。而直到今天蘋果在發布會上介紹Siri這一功能後,Siri 這一套用才正式下架。
原Siri套用界面(現已下架)
大家可能沒有注意到的是,Siri 下架是精心安排的:Siri 在蘋果大會上第一次被提及的時候,這一套用還能在
App Store 上輕鬆的找到。但在大會結束後,這一套用就再也找不著了。看起來Siri這一套用是在大會結束的同時下架的。
為什麼要下架呢?這是可能是因為蘋果擔心第三方套用若能夠實現 iPhone 4S 的功能的話,會影響現有的 iPhone 用戶購買新 iPhone 的欲望,從而影響銷量。
Siri 支持英文、法文和德文的語音識別,其中英文部分只支持美國、英國和澳大利亞的口音,對於其他國家和地區的
英語 口音在識別上還存在困難。
此外,被蘋果定義為仍處在“測試階段”的 Siri 支持在美國進行地圖和本地搜尋,不過蘋果官網的 Siri FAQ 頁面也承諾,相關功能在2012年將拓展到其他國家。
蘋果公司搭載在 iOS6 上的 Siri,新的 Siri 支持語言包括日語、義大利語、中國漢語、台灣、香港等地區語言,你可以用 Siri 查看當前的球賽信息,足球,籃球,排球等。包括比分和球員信息等;用它搜尋最新的電影資訊,和附近的電影院;Siri 甚至可以幫你尋找餐館美食,
價格 ,位置,甚至有評星功能。
台北時間2012年9月20日凌晨,蘋果在
iPod 、iPhone和iPad設備上正式放出
iOS6 作業系統更新。據更新信息顯示,該
升級 包將有超過200項新功能,其中內置了全新的蘋果地圖。在此次更新中,Siri也將支持中文。
2013年6月10日,蘋果在iPod、iPhone和iPad設備上正式放出
iOS7 作業系統更新。其中在Siri方面去除了“測試版”字樣。
十一功用 1.Siri 變身鬧鐘
這應該是用戶最容易想到的Siri的“正經”用法了。按住“Home”鍵,告訴Siri,“早上7點15的時候叫醒我”;想打會兒小盹,就說“40分鐘後叫醒我”。只要準確地報上時間,Siri將是最好用的
鬧鐘 。
2.用 Siri 尋找咖啡廳
喝咖啡是很多上班族的習慣,一杯咖啡能夠迅速地將人調整成工作狀態。出門在外的時候,想找個咖啡廳?利用Siri就可以搞定這一切。告訴 Siri,尋找離當前位置最近的咖啡廳即可。如果你沒有附加更多的要求,Siri將反饋給還算不錯的答案,很可能是告訴你最近的星巴克在哪。如果星巴克還不能滿足你的要求,還是用更專業的套用Help吧,它會給你更詳細的答案。
3.想去哪,Siri 告訴你
查找出行路線的過程中往往要輸入不少文字。想省事的話,還是用Siri完成這一切吧。報上要去的地點,Siri會調用 Google 地圖來尋找出行路線的方案。從測試過的這種用法的用戶的反饋上看,Siri還沒有出過什麼差錯,就像GPS那樣好使。2016年9月14日,蘋果iOS 10正式版問世,易到是目前iOS10中首個支持Siri語音叫車的軟體。Siri可以直接啟動易到,並幫用戶完成訂車。
4.用 Siri 播放隨機音樂
如果你厭倦了固定順序的音樂播放列表,可以試著用Siri播放隨機音樂。首先,你需要將喜歡的音樂導入到一個名為“最愛”的播放列表中。開始聽
音樂 的時候,告訴Siri”放皇后樂隊的歌曲”。緊接著,Siri就會在“最愛”列表中匹配皇后樂隊的歌曲並將其播放。這樣就實現了隨機播放音樂的功能。
5.傳送簡訊,Siri 代勞
還在邊走路邊發簡訊?行路不安全不說,發簡訊還費勁,以後用Siri代勞吧。走路的時候,將iPhone放在耳邊,告訴Siri“用簡訊告訴她,我將晚點到家”。不用匆忙,告訴Siri你想表達的內容,即可輕輕鬆鬆地傳送簡訊。
6.天氣預報,Siri 知道
這也是Siri十分擅長的一項功能。關於氣象信息的問題,Siri都能正確理解。想要知道明天的天氣怎樣,問問Siri就知道了。
7.用Siri提醒日程安排
既然能把Siri當鬧鐘用,你當然可以用它來提醒日程安排。很多人都有使用
Google 日曆的習慣,用Google日曆安排自己的各項日程。生活中的一些需要提醒的小事,完全沒有必要一項項地加到Google日曆中去,用Siri就可以搞定這個問題。比如說,“十點鐘的時候,提醒我去刷牙”。
8.用 Siri 提醒地點
Siri 提醒地點的功能還不是很完善。除了“家”或“上班處”,Siri 對於一些位置稱呼的理解能力不佳。但是,Siri 對“這裡”的理解十分準確,即當前的GPS坐標位置。所以你可以這樣用 Siri 的提醒功能,途經一家不錯的小店時,可以將它的位置標記為“這裡”並設定好提醒,以便日後有時間時再次光顧。
9.Siri 為你答疑解惑
珠穆朗瑪峰多高?美國的GDP是多少?回答不上來的話,無需 Google,張嘴問問 Siri 吧。Siri 本身是不知道這些問題的答案的,它會從“知識問答引擎”
Wolfram Alpha 中尋找答案。所有的回答都會以自然語言的形式呈現。這也是 Siri 被認為將對 Google 重要威脅的原因。當然,Siri 在相當長的一段時間肯定不能取代Google,但對 Google 的威脅將是長遠的。當 Siri 足夠智慧型的時候,人們用它取代 Google 並不是沒有可能。
10.用 Siri 傳送微博(支持新浪微博、騰訊微博)
不過在使用 Siri 發微博前,還得做一些必要的設定。
11.用 Siri來訂電影票。(美國)
iOS 9 中的 Siri 擁有新外觀、新聲音和新功能。它的界面經過重新設計,以淡入視圖浮現於任意螢幕畫面的最上層。Siri 回答問題的速度更快,還能查詢更多信息源,如中文百科。它可以承擔更多任務,如回電話、播放語音郵件、調節螢幕亮度,以及更多
專利侵權 2012年7月3日,上海某法院確認,已經收到上海智臻網路科技有限公司(下稱“智臻網路”)的訴狀,被告正是蘋果電腦貿易(上海)有限公司和美國的蘋果公司。
智臻網路認為蘋果公司iPhone 4S中的Siri侵犯了其發明專利權。本報記者通過中國國家知識產權局的專利檢索看到,這個名為“一種聊天機器人系統”的專利,申請日為2004年8月13日,公告日為2006年2月15日。
在該專利的公開說明中,註明專利權人為上海贏思軟體技術有限公司和袁輝,後者也是智臻網路的法定代表人。他們都與一個使用MSN工具的人熟悉的套用“小i機器人”有關,在該公司網站上,袁輝被稱為“中國網路機器人之父”、小i機器人董事長。此外,小i機器人的產品合作商,還包括聯想智慧型電視、中國移動、京東商城及上海人力資源和社會保障局等公司、部門。
流量需求 蘋果的iPhone 4S,
iPhone 5 ,ipad3,ipad4,ipad mini1,
ipod touch 5 都帶有一個智慧型的語音助手 Siri。已經能夠完成類似網頁搜尋、接打電話、設定提醒事件、傳送簡訊和郵件等任務。
但是有一個很大的問題,就是 Siri 需要網路才能工作。Siri 接收到用戶的命令之後會把語音傳給蘋果的伺服器,經過處理後伺服器將結果傳回用戶的手機,Siri 便會給出相應的回答或執行相應的動作。但是有些任務壓根用不著網路連線(建立一個提醒事項),要是網路連線狀況不好甚至沒有 Wi-Fi時就很讓人頭痛了。更進一步考慮,有些用戶認為使用 Siri 還有個更大的弊端:如果你敞開用,月底數據流量費用可能會讓你嚇一跳。流量費用並不便宜,這個問題確實會越來越突出。不過,Siri 消耗的流量是否真的會“嚇你一跳”呢?
在進行 11 種不同的測試時仔細觀察了數據量,分別有本地設備上的任務和需要上網查詢的任務。我們還進行了 4 次聽寫測試。當然了,每位用戶具體的流量數值是完全基於如何使用 Siri 以及使用頻度的。以下是的測試結果。
執行任務
我們執行了 6 項應該屬於本地的任務。其中包括:“設定一個 3 小時候之後的鬧鐘,”“設定一個周五下午 2 點的約見,”(之後讓 Siri 取消了這項任務)“我到家後提醒我總結開支報告,”以及“Ars Technica 的聯繫人信息是什麼?”
這些任務執行後的數據流量是 220 KB,平均每個任務消耗 36.7 KB。實際上,流量最低的任務用掉了 18 KB,最多的 60 KB。我們認為這和執行任務所用的句子複雜程度以及何種語言有關。
另外五個任務是需要上網查詢的,有些可以直接從 Wolfram Alpha 獲取結果,有些會提示我們是否要用我們告訴 Siri 的關鍵字在瀏覽器進行搜尋。比如我們問了“一個鬆餅里有多少卡路里?”“Kevin Bacon 一共演了多少部電影?”(這一條要進行 Google 搜尋,我們說了 yes)以及“
Lady Gaga 的真實姓名是什麼?”等問題。
這五個任務的數據流量消耗是 473.5 KB,平均每個任務 94.72 KB。具體流量從 23 KB 到 187 KB 不等,這隨問題本身的情況而定。
統計一下,我們的這 11 個任務總共用掉 693.6 KB 數據流量,平均每個任務 63 KB。從上文你可以看到,本地的 Siri 任務消耗的流量明顯更少,這是符合邏輯的。
除了這 11 個任務之外,我們還用 Siri 進行了 4 次聽寫:兩個簡短的電子郵件(一封有 15 詞,另一封大概 40 詞),和兩條簡訊(每條大約 6-10 個詞)。簡訊聽寫用掉的流量分別為 12 KB 和 18 KB,平均每條 15 KB。電子郵件的分別為 36 KB 和 109 KB,平均每條 72.5 KB。很明顯,訊息長度越長,所耗流量就越多,這完全取決於你的措辭。
結果
如果你使用iPhone4S,通過手機數據流量(比如 3G 網路)讓 Siri 每天都執行一遍這 11 項任務,那么 30 天后消耗的流量大約為 20 MB。但每個用戶肯定會問不同的問題,並且使用頻度也會大不一樣。
根據調查(包括身邊的同事、以及在
Twitter 上開展的調查),大概可以把不同用戶的使用頻度分為三類:每天 1-3 次的,每天 4-6 次的,和每天 10-15 次的。也有用戶說自己每天使用的次數超過 20 次,但這種情況是極少數的。從我個人角度來講,看到這么大的數字頗有些驚訝,我自己每天使用的次數不過 2-3 次,不過我的同事 Ken Fisher 說他每天會使用大約 15 次。
這些數字實在不容易看出什麼。而且我們之前說過,你的用量完全取決於你的措辭、你要求執行的任務種類以及你的使用頻度。這些統計數字就僅作參考吧,它們只能顯示出一個大致範圍。
如果你每天使用 2-3 次 Siri,每次用掉 63 KB 流量,那么每天的用量將達到 126 KB 到 189 KB,所以每月流量消耗為 3.7 MB 到 5.5 MB。對於每天使用 4-6 次的用戶來說,每天的流量會達到 252 KB 到 378 KB,每個月要用掉 7.4 MB 到 11 MB 左右。如果你一天使用 10-15 次,每天的流量將是 630 KB 到 945 KB,每個月要消耗 18.5 MB 到 27.7 MB 的數據流量。
接下來的問題就是:你的數據流量套餐是否夠用?大陸的 iPhone 手機上網主要包括聯通的 3G 網路、移動的 GPRS 或 EDGE 網路。聯通的 3G 數據流量從每月 40 MB 起,分許多不同的套餐檔位,移動的也類似。具體套餐選擇和搭配可以根據自己情況而定。不過目前來看,即使每天使用 15 次 Siri,流量也不會超過最小套餐的限度。
正如我們一再強調的,由於使用頻度的不同等幾大主要因素,每個用戶所產生的實際流量也不盡相同。這些數值就是我們測試的結果,可以作為自己選定數據套餐時的參考。
蘋果針對
Verizon 版本的iPhone 5發布了運營商升級包,以解決出現的無線問題。
涉黃爭議 問題曝光 2012年10月,有網友稱蘋果iPhone手機的語音對話軟體Siri可以提供“三陪”場所信息,這一說法引發輿論熱議。調查發現,蘋果提供的部分場所確有“涉黃”嫌疑。蘋果公司回應稱,Siri不能進行關鍵字禁止設定,但專家指出,蘋果具有對敏感詞進行特殊處理的設計,只是並未將上述內容列入禁止名單。
事件處理 到2012年10月28日,Siri不會再搜尋“嫖娼”的場所了!蘋果公司客服人員表示,已經將“三陪”信息列入禁止範圍。
Siri不再提供“三陪”場所的信息。對此,蘋果公司客服人員稱,根據用戶的反映,也將“三陪”信息列入禁止範圍;禁止範圍除“三陪”等涉黃信息外,還包括涉及暴力等違反中國法律的信息。
監管盲點 考慮到這種信息為性交易提供便利,可能會危害社會秩序。而且,由於用戶眾多,潛在危害面也較大,蘋果公司必須及時做出糾正,且職能部門可以出面進行監管。
根據現有法律,網際網路信息服務提供商不得登載和傳播
淫穢 、色情等中華人民共和國法律、法規禁止的不良信息內容。但是Siri提供“三陪”場所信息,並不像
淫穢 圖片和視頻等直接對未成年人身心造成傷害,因此夠不上違法。
然而,根據《網際網路站禁止傳播淫穢色情等
不良 信息自律規範》,網際網路信息服務提供商不得開設或變相開設為不
道德 性行為和性交易提供便利的頻道或專欄。若違反該自律規範的,應及時糾正
違規 行為;經勸說、
警告 無效的,中國網際網路協會網際網路新聞信息服務工作委員會有義務向政府有關部門建議,取消其提供相關信息服務的資質。
監管部門可要求蘋果公司對已銷售和將要銷售的手機產品統一“打補丁”,禁止潛在的危害社會秩序的內容。
如果Siri提到的場所不是涉黃場所,蘋果公司也可能要冒被這些場所
民事訴訟 、索賠的風險。