siri -蘋果語音控製功能

siri

蘋果語音控製功能
更多義項 ▼ 收起更多 ▲

Siri是蘋果公司在其產品iPhone4S,iPad 3及以上版本手機上套用的一項語音控製功能。Siri可以令iPhone4S及以上手機(iPad 3以上平板)變身為一台智慧型化機器人,利用Siri使用者可以通過手機讀簡訊、介紹餐廳、詢問天氣、語音設定鬧鍾等。Siri可以支持自然語言輸入,並且可以調用系統自帶的天氣預報、日程安排、搜尋資料等套用,還能夠不斷學習新的聲音和語調,提供對話式的應答。然而,2012年10月,SIRI曾被曝有"涉黃"嫌疑引起爭議,目前已解決。

  • 外文名稱
    Siri
  • 類似軟體
  • 成立時間
    2007年
  • 軟體類型
    語音助手

基本介紹

研究背景

Siri成立于2007年,2010年被蘋果以2億美金收購,最初是以文字聊天服務為主,隨後通過與全球最大的語音識別廠商Nuance合作,Siri實現了語音識別功能。

技術來源

Siri 技術來源于美國國防部高級研究規劃局所公布的 CALO 計畫:一個讓軍方簡化處理一些繁復庶務,並具學習、組織以及認知能力的數位助理,其所衍生出來的民用版軟體 Siri 虛擬個人助理。

支持設備

原生:

sirisiri

iPhone4S

iPhone5

iPhone 5C

iPhone 5S

iPhone 6

iPhone6 Plus

The new iPad(iPad3)

具備Retina顯示屏的iPad

iPad mini

iPad Mini 2

iPad Mini 3

iPad Air

iPad Air 2

iPod touch(第五代或更新)

針對筆電的Siri功能仍在開發當中。

註:iPhone4S的Siri支持中文需要iOS 6.0(或更高版本)

The new iPad支持Siri需要iOS6.0(或更高版本)

越獄後:

iPhone 3GS

iPod touch 4

iPhone 4

iPad 1

註:1.越獄後是利用Siri Proxy 中轉接入蘋果官方伺服器或FeelSiri伺服器。

2.iPhone 3GS 和 iPod touch 4 支持iOS 5和iOS 6 系統下的Siri移植。由于iOS 7 不支持這兩款設備,故不能移植。

3.iPhone 4 除支持iOS 5iOS 6 外,因為可以升級iOS 7。不排除iOS 7移植Siri可能。

4. iPad 1 可以在IOS 5下移植Siri。由于不能升級iOS 6和iOS 7 故不能移植。

5.除iPad 1不是完美GUI移植。在iOS 6 環境下,iPad 2完成了完美GUI移植。

功能介紹

使用者可以通過聲控、文字輸入的方式,來搜尋餐廳、電影院等生活信息,同時也可以直接收看各項相關評論,甚至是直接訂位、訂票;另外其適地性(location based)服務的能力也相當強悍,能夠依據使用者默認的居家地址或是所在位置來判斷、過濾搜尋的結果。

sirisiri

不過其最大的特色,則是人機的互動方面,不僅有十分生動的對話接口,其針對使用者詢問所給予的回答,也不至于答非所問,有時候更是讓人有種心有靈犀的驚喜,例如使用者如果在說出、輸入的內容包括了『喝了點』、『家』這些字(甚至不需要符合文法,相當人性化...),Siri 則會判斷為喝醉酒、要回家,並自動建議是否要幫忙叫計程車。

Siri 和系統的整合更加緊密

Siri 在並購前的版本整合了大量網路服務的 APIs 。比如 OpenTable,Tickets,Taxi Magic 等等。

而 Siri 被蘋果收購了之後, 他已經被整合為系統的一部分了。

iOS 5的 Siri 影片中,出現新短訊息之後,互動由 Siri 發起。說明他已經常駐系統後台並且可以接管重要的系統功能了。(除了短訊息還有天氣,時鍾,Maps 等等)

Siri 支持的語言

截至IOS6.1,siri支持中文(國語 - 中國),中文(粵語 - 香港),德文(德國),德文(瑞士),義大利文(義大利),義大利文(瑞士),日文,法文(加拿大),法文(法國),法文(瑞士)英文(澳大利亞),英文(美國),英文(英國),英文(澳大利亞),西班牙文(墨西哥),西班牙文(美國),西班牙文(西班牙)和韓文。

使用技術

概況介紹

Siri 所用到的技術,很多人會回答,人工智慧以及雲計算,的確,整體來說,是這兩樣技術,不過,這種概述感覺幾乎沒有任何意義,何不直接說“計算技術”(註意,不是電腦技術)呢。因此,在本文,我將介紹下我了解 Siri 可能採用的技術(由于有個人猜測,不一定準確)。

前端方面

在前端方面,即面向使用者,和使用者互動(User Interface,UI)的技術,主要是語音識別以及語音合成技術。語音識別技術是把使用者的口語轉化成文字,其中需要強大的語音知識庫,因此需要用到所謂的“雲計算”技術。而語音合成則是把返回的文字結果轉化成語音輸出,這個技術理論上在地就能完成,但不知道Siri是否如此,當然,在雲端完成也並無不可,在當前無線頻寬下,那點語音流量根本不算什麽。

後台技術

後台技術,這些其實才是真正的大角色。這些技術的目的就是處理使用者的請求,並返回最匹配的結果,這些請求類型很多,千奇百怪,要處理好並不簡單。基本的結構猜測可能是分析使用者的輸入(已經通過語音轉化),根據輸入類型,分別採用合適的技術(合適的技術後台)進行處理。這些合適的後台技術包括,①以Google 為代表的網頁搜尋技術;②以Wolfram Alpha為代表的知識搜尋技術(或者知識計算技術);③以Wikipedia 為代表的知識庫(和 Wolfram Alpha 不同的是,這些知識來自人類的手工編輯)技術(包括其他百科,如電影百科等);④以Yelp 為代表的問答以及推薦技術。

網頁搜尋

大家天天用的Google就是這個技術的代表,而國內則以百度為代表。

知識計算

(搜尋)技術(Computational Knowledge)

sirisiri

這個技術的代表是Wolfram|Alpha。

不同于搜尋網際網路信息,Wolfram|Alpha將從公眾的(包括公開的網頁等)和獲得授權的資源中,發掘、建立起一個異常龐大的經過組織的資料庫,再利用高級的自然語言演算法進行處理,最終構造出一個類似于谷歌搜尋的工具。

和網頁搜尋技術不同的是,在這個系統中,得到的答案結構化程度很高,比如搜尋China,能得到和中國相關的各種參數以及資料,並以接近表格的方式呈現。Wolfram|Alpha也能理解部分自然語言,比如輸出How old are you,其會回答Wolfram|Alpha的年齡。想測試這項技術的請移步Wolfram|Alpha。

這個技術國內做的應該有,但還沒有產品,也許百度的框計算算是半個。所以機會大大的有。

知識庫技術

相比于網頁搜尋技術,基本以一個詞條或者主題為單位,因此得到的資料價值高,知識量大,並且結構化程度好。相比于知識計算技術,這些技術需要人的參與,這有利也有弊,利就是,畢竟暫時人比機器聰明,編輯出來的知識更豐富,準確;弊就是,人力有限,即使像維基那樣,發動社區的力量,也不能產生足夠的知識,而知識計算,理論上,隻需要演算法夠,是可以產生“無限”的知識的。

問答推薦技術

其實這不能稱為一個技術,應該屬于知識庫的技術。不同的是,這個技術針對的是一些生活信息,這些信息的地域化程度很高,典型代表為Yelp。由于這東西比較簡單,就不仔細介紹了。

軟體套用

在iPhone 4S的蘋果發布會中蘋果稱 Siri VoiceAssistant 將會成為 iOS 的一部分。Siri 原是一個第三方套用,是蘋果花費2億美元購買所得的。雖然在收購後很長的一段時間裏我們仍能在 App Store 上看到這一套用的身影,不過它將近有一年多的時間沒有更新。而直到今天蘋果在發布會上介紹Siri這一功能後,Siri 這一套用才正式下架。

原Siri套用介面(現已下架)原Siri套用介面(現已下架)

大家可能沒有註意到的是,Siri 下架是精心安排的:Siri 在蘋果大會上第一次被提及的時候,這一套用還能在 App Store 上輕松的找到。但在大會結束後,這一套用就再也找不著了。看起來Siri這一套用是在大會結束的同時下架的。

為什麽要下架呢?這是可能是因為蘋果擔心第三方套用若能夠實現 iPhone 4S 的功能的話,會影響現有的 iPhone 使用者購買新 iPhone 的欲望,從而影響銷量。

Siri 支持英文、法文和德文的語音識別,其中英文部分隻支持美國、英國和澳大利亞的口音,對于其他國家和地區的英語口音在識別上還存在困難。

此外,被蘋果定義為仍處在“測試階段”的 Siri 支持在美國進行地圖和在地搜尋,不過蘋果官網的 Siri FAQ 頁面也承諾,相關功能在2012年將拓展到其他國家。

蘋果公司搭載在 iOS6 上的 Siri,新的 Siri 支持語言包括日語、義大利語、中國漢語、台灣、香港等地區語言,你可以用 Siri 查看當前的球賽信息,足球,籃球,排球等。包括比分和球員信息等;用它搜尋最新的電影資訊,和附近的電影院;Siri 甚至可以幫你尋找餐館美食,價格,位置,甚至有評星功能。

台北時間2012年9月20日凌晨,蘋果在iPod、iPhone和iPad設備上正式放出iOS6作業系統更新。據更新信息顯示,該升級包將有超過200項新功能,其中內置了全新的蘋果地圖。在此次更新中,Siri也將支持中文。

2013年6月10日,蘋果在iPod、iPhone和iPad設備上正式放出iOS7作業系統更新。其中在Siri方面去除了“測試版”字樣。

十一功用

1.Siri 變身鬧鍾

sirisiri

這應該是使用者最容易想到的Siri的“正經”用法了。按住“Home”鍵,告訴Siri,“早上7點15的時候叫醒我”;想打會兒小盹,就說“40分鍾後叫醒我”。隻要準確地報上時間,Siri將是最好用的鬧鍾。

2.用 Siri 尋找咖啡廳

喝咖啡是很多上班族的習慣,一杯咖啡能夠迅速地將人調整成工作狀態。出門在外的時候,想找個咖啡廳?利用Siri就可以搞定這一切。告訴 Siri,尋找離當前位置最近的咖啡廳即可。如果你沒有附加更多的要求,Siri將反饋給還算不錯的答案,很可能是告訴你最近的星巴克在哪。如果星巴克還不能滿足你的要求,還是用更專業的套用Help吧,它會給你更詳細的答案。

3.想去哪,Siri 告訴你

查找出行路線的過程中往往要輸入不少文字。想省事的話,還是用Siri完成這一切吧。報上要去的地點,Siri會調用 Google 地圖來尋找出行路線的方案。從測試過的這種用法的使用者的反饋上看,Siri還沒有出過什麽差錯,就像GPS那樣好使。

4.用 Siri 播放隨機音樂

如果你厭倦了固定順序的音樂播放列表,可以試著用Siri播放隨機音樂。首先,你需要將喜歡的音樂導入到一個名為“最愛”的播放列表中。開始聽音樂的時候,告訴Siri”放皇後樂隊的歌曲”。緊接著,Siri就會在“最愛”列表中匹配皇後樂隊的歌曲並將其播放。這樣就實現了隨機播放音樂的功能。

5.傳送簡訊,Siri 代勞

還在邊走路邊發簡訊?行路不安全不說,發簡訊還費勁,以後用Siri代勞吧。走路的時候,將iPhone放在耳邊,告訴Siri“用簡訊告訴她,我將晚點到家”。不用匆忙,告訴Siri你想表達的內容,即可輕輕松松地傳送簡訊。

6.天氣預報,Siri 知道

這也是Siri十分擅長的一項功能。關于氣象信息的問題,Siri都能正確理解。想要知道明天的天氣怎樣,問問Siri就知道了。

7.用Siri提醒日程安排

既然能把Siri當鬧鍾用,你當然可以用它來提醒日程安排。很多人都有使用Google日歷的習慣,用Google日歷安排自己的各項日程。生活中的一些需要提醒的小事,完全沒有必要一項項地加到Google日歷中去,用Siri就可以搞定這個問題。比如說,“十點鍾的時候,提醒我去刷牙”。

8.用 Siri 提醒地點

Siri 提醒地點的功能還不是很完善。除了“家”或“上班處”,Siri 對于一些位置稱呼的理解能力不佳。但是,Siri 對“這裏”的理解十分準確,即當前的GPS坐標位置。所以你可以這樣用 Siri 的提醒功能,途經一家不錯的小店時,可以將它的位置標記為“這裏”並設定好提醒,以便日後有時間時再次光顧。

9.Siri 為你答疑解惑

珠穆朗瑪峰多高?美國去年的GDP是多少?回答不上來的話,無需 Google,張嘴問問 Siri 吧。Siri 本身是不知道這些問題的答案的,它會從“知識問答引擎”Wolfram Alpha中尋找答案。所有的回答都會以自然語言的形式呈現。這也是 Siri 被認為將對 Google 重要威脅的原因。當然,Siri 在相當長的一段時間肯定不能取代Google,但對 Google 的威脅將是長遠的。當 Siri 足夠智慧型的時候,人們用它取代 Google 並不是沒有可能。

10.用 Siri 傳送微博(支持新浪微博)

不過在使用 Siri 發微博前,還得做一些必要的設定。

11.用 Siri來訂電影票。(美國)

iOS 7 中的 Siri 擁有新面板、新聲音和新功能。它的介面經過重新設計,以淡入視圖浮現于任意螢幕畫面的最上層。Siri 回答問題的速度更快,還能查詢更多信息源,如維基百科。它可以承擔更多任務,如回電話、播放語音郵件、調節螢幕亮度,以及更多

專利侵權

2012年7月3日,上海某法院確認,已經收到上海智臻網路科技有限公司(下稱“智臻網路”)的訴狀,被告正是蘋果電腦貿易(上海)有限公司和美國的蘋果公司。

智臻網路認為蘋果公司iPhone 4S中的Siri侵犯了其發明專利權。本報記者通過中國國家智慧產權局的專利檢索看到,這個名為“一種聊天機器人系統”的專利,申請日為2004年8月13日,公告日為2006年2月15日。

在該專利的公開說明中,註明專利權人為上海贏思軟體技術有限公司和袁輝,後者也是智臻網路的法定代表人。他們都與一個使用MSN工具的人熟悉的套用“小機器人”有關,在該公司網站上,袁輝被稱為“中國網路機器人之父”、小i機器人董事長。此外,小i機器人的產品合作商,還包括聯想智慧型電視、中國移動、京東商城及上海人力資源和社會保障局等公司、部門。

流量需求

蘋果的iPhone 4S, iPhone 5,ipad3,ipad4,ipad mini1,ipod touch 5都帶有一個智慧型的語音助手 Siri。已經能夠完成類似網頁搜尋、接打電話、設定提醒事件、傳送簡訊和郵件等任務。

sirisiri

但是有一個很大的問題,就是 Siri 需要網路才能工作。Siri 接收到使用者的命令之後會把語音傳給蘋果的伺服器,經過處理後伺服器將結果傳回使用者的手機,Siri 便會給出相應的回答或執行相應的動作。但是有些任務壓根用不著網路連線(建立一個提醒事項),要是網路連線狀況不好甚至沒有 Wi-Fi時就很讓人頭痛了。更進一步考慮,有些使用者認為使用 Siri 還有個更大的弊端:如果你敞開用,月底資料流量費用可能會讓你嚇一跳。流量費用並不便宜,這個問題確實會越來越突出。不過,Siri 消耗的流量是否真的會“嚇你一跳”呢?

在進行 11 種不同的測試時仔細觀察了資料量,分別有在地設備上的任務和需要上網查詢的任務。我們還進行了 4 次聽寫測試。當然了,每位使用者具體的流量數值是完全基于如何使用 Siri 以及使用頻度的。以下是的測試結果。

執行任務

我們執行了 6 項應該屬于在地的任務。其中包括:“設定一個 3 小時候之後的鬧鍾,”“設定一個周五下午 2 點的約見,”(之後讓 Siri 取消了這項任務)“我到家後提醒我總結開支報告,”以及“Ars Technica 的聯系人信息是什麽?”

這些任務執行後的資料流量是 220 KB,平均每個任務消耗 36.7 KB。實際上,流量最低的任務用掉了 18 KB,最多的 60 KB。我們認為這和執行任務所用的句子復雜程度以及何種語言有關。

另外五個任務是需要上網查詢的,有些可以直接從 Wolfram Alpha 獲取結果,有些會提示我們是否要用我們告訴 Siri 的關鍵字在流覽器進行搜尋。比如我們問了“一個松餅裏有多少卡路裏?”“Kevin Bacon 一共演了多少部電影?”(這一條要進行 Google 搜尋,我們說了 yes)以及“Lady Gaga 的真實姓名是什麽?”等問題。

這五個任務的資料流量消耗是 473.5 KB,平均每個任務 94.72 KB。具體流量從 23 KB 到 187 KB 不等,這隨問題本身的情況而定。

統計一下,我們的這 11 個任務總共用掉 693.6 KB 資料流量,平均每個任務 63 KB。從上文你可以看到,在地的 Siri 任務消耗的流量明顯更少,這是符合邏輯的。

除了這 11 個任務之外,我們還用 Siri 進行了 4 次聽寫:兩個簡短的電子郵件(一封有 15 詞,另一封大概 40 詞),和兩條簡訊(每條大約 6-10 個詞)。簡訊聽寫用掉的流量分別為 12 KB 和 18 KB,平均每條 15 KB。電子郵件的分別為 36 KB 和 109 KB,平均每條 72.5 KB。很明顯,訊息長度越長,所耗流量就越多,這完全取決于你的措辭。

結果

如果你使用iPhone4S,通過手機資料流量(比如 3G 網路)讓 Siri 每天都執行一遍這 11 項任務,那麽 30 天後消耗的流量大約為 20 MB。但每個使用者肯定會問不同的問題,並且使用頻度也會大不一樣。

根據調查(包括身邊的同事、以及在 Twitter上開展的調查),大概可以把不同使用者的使用頻度分為三類:每天 1-3 次的,每天 4-6 次的,和每天 10-15 次的。也有使用者說自己每天使用的次數超過 20 次,但這種情況是極少數的。從我個人角度來講,看到這麽大的數位頗有些驚訝,我自己每天使用的次數不過 2-3 次,不過我的同事 Ken Fisher 說他每天會使用大約 15 次。

這些數位實在不容易看出什麽。而且我們之前說過,你的用量完全取決于你的措辭、你要求執行的任務種類以及你的使用頻度。這些統計數位就僅作參考吧,它們隻能顯示出一個大致範圍。

如果你每天使用 2-3 次 Siri,每次用掉 63 KB 流量,那麽每天的用量將達到 126 KB 到 189 KB,所以每月流量消耗為 3.7 MB 到 5.5 MB。對于每天使用 4-6 次的使用者來說,每天的流量會達到 252 KB 到 378 KB,每個月要用掉 7.4 MB 到 11 MB 左右。如果你一天使用 10-15 次,每天的流量將是 630 KB 到 945 KB,每個月要消耗 18.5 MB 到 27.7 MB 的資料流量。

接下來的問題就是:你的資料流量套餐是否夠用?大陸的 iPhone 手機上網主要包括聯通的 3G 網路、移動的 GPRS 或 EDGE 網路。聯通的 3G 資料流量從每月 40 MB 起,分許多不同的套餐檔位,移動的也類似。具體套餐選擇和搭配可以根據自己情況而定。不過目前來看,即使每天使用 15 次 Siri,流量也不會超過最小套餐的限度。

正如我們一再強調的,由于使用頻度的不同等幾大主要因素,每個使用者所產生的實際流量也不盡相同。這些數值就是我們測試的結果,可以作為自己選定資料套餐時的參考。

蘋果針對Verizon版本的iPhone 5發布了運營商升級包,以解決出現的無線問題。

涉黃爭議

問題曝光

2012年10月,有網友稱蘋果iPhone手機的語音對話軟體Siri可以提供“三陪”場所信息,這一說法引發輿論熱議。調查發現,蘋果提供的部分場所確有“涉黃”嫌疑。蘋果公司回應稱,Siri不能進行關鍵字禁止設定,但專家指出,蘋果具有對敏感詞進行特殊處理的設計,隻是並未將上述內容列入禁止名單。

siri涉黃siri涉黃

事件處理

到2012年10月28日,Siri不會再搜尋“嫖娼”的場所了!蘋果公司客服人員表示,已經將“三陪”信息列入禁止範圍。

敏感詞被禁止敏感詞被禁止

Siri不再提供“三陪”場所的信息。對此,蘋果公司客服人員稱,根據使用者的反映,也將“三陪”信息列入禁止範圍;禁止範圍除“三陪”等涉黃信息外,還包括涉及暴力等違反中國法律的信息。

監管盲點

考慮到這種信息為性交易提供便利,可能會危害社會秩序。而且,由于使用者眾多,潛在危害面也較大,蘋果公司必須及時做出糾正,且職能部門可以出面進行監管。

根據現有法律,網際網路信息服務提供商不得登載和傳播淫穢、色情等中華人民共和國法律、法規禁止的不良信息內容。但是Siri提供“三陪”場所信息,並不像淫穢圖片和影片等直接對未成年人身心造成傷害,因此夠不上違法。

然而,根據《網際網路站禁止傳播淫穢色情等不良信息自律規範》,網際網路信息服務提供商不得開設或變相開設為不道德性行為和性交易提供便利的頻道或專欄。若違反該自律規範的,應及時糾正違規行為;經勸說、警告無效的,中國網際網路協會網際網路新聞信息服務工作委員會有義務向政府有關部門建議,取消其提供相關信息服務的資質。

監管部門可要求蘋果公司對已銷售和將要銷售的手機產品統一“打補丁”,禁止潛在的危害社會秩序的內容。

如果Siri提到的場所不是涉黃場所,蘋果公司也可能要冒被這些場所民事訴訟、索賠的風險。

安全隱患

蘋果的 Siri 開啓了智慧型語音助手的新時代,特別是在 iOS9 中 Siri 將一直保持開啓狀態,不過這樣的改變使用者來說方便了不少,但對于黑客而言卻是等同于敞開了大門。法國安全研究人員表示,Siri 存在極大的安全隱患,黑客可通過無線電實行靜默攻擊,即便什麽聲音都沒有發出,依然可以向 Siri 下達各種指令。Siri 面臨的問題,任何隻要插著麥克風耳機並且能夠激活 Sifi 服務的手機都可通過無線電進行遠程攻擊。研究人員表示,耳機的麥克風將聲音轉化稱電信號,而無線電同樣能傳遞相似的信號,耳機線被作為天線使用,黑客發出的特定無線電波被接收之後,Siri 將會被激活並執行相關的命令,不過在默認情況下,Siri 許可權有限,並不會對手機造成致命的破壞,但可據此撥打指定電話、傳送特定簡訊、流覽網頁、傳送虛假信息等潛在危害依然不容忽視。目前避免類似攻擊的唯一辦法是禁止 Siri 在關屏的情況下被激活,另外當沒有接入耳機時被攻擊的可能性也大大降低。

相關詞條

相關搜尋

其它詞條