關於部落格
ursmart
  • 133980

    累積人氣

  • 5

    今日人氣

    0

    追蹤人氣

[轉載]跨時代的強力智慧人工智慧----Siri

跨時代的強力智慧人工智慧 -「Siri」
在Steve Jobs死後最後一個參與的I Phone設計裡
最新的I Phone 4S蘋果手機中搭載了人性化的個人語音助理「Siri」
而Siri的出現意味著智慧型手積即將進入一個跨時代的設計和里程碑
為什麼Siri的出現是一個智慧型手機的里程碑
因為Siri的出現與存在
極有可能在未來的日子裡殺死Google,阻斷其賴以維生的命脈
關於Siri的觀點我會分幾個角度來參考
 
我們先來看一下關於Siri的發展歷史
 
---------------------------------
以下資料來源引用自「維基百科」
引用網址為:http://zh.wikipedia.org/wiki/Siri
 
Siri是一種內建在蘋果公司所推出的智慧型手機-iPhone 4S內的人工智慧助理軟體。此軟體使用到自然語言處理技術,使用者可以使用自然的對話與手機進行互動,完成搜尋資料、查詢天氣、設定手機日曆、設定鬧鈴等服務。[1]
Siri最初是iOSApp Store中的一個應用。[2]蘋果公司在2010年4月28日完成了對Siri公司的收購。Siri公司最初也在黑莓平台與Android平台開發Siri軟體,但是所有在除iOS平台外的軟體研發都已經在Apple完成收購後取消。[3]
 
現在Siri內嵌於iOS 5,並且只可用於2011年10月初發售的iPhone 4S上。[4]
 
一些獨立的開發者已成功將Siri移植到iPhone 4上[2011年10月29日]。[5][6][7]但是目前根據一些新聞媒體的報導,目前已完成移植的Siri只能顯示用戶界面,並不能完成語音命令。所以到目前為止這種移植並沒有任何意義。[8]
 
--------------------------------
 
很多人認為
新的蘋果手機I Phone 4s搭載Siri個人語音助理
只是將Siri當作一項比較新的語音辨識軟體而已
這是因為很多人對於語音辨識還停留在舊有的印象當中
很多人對語音辨識第一項疑問和詬病的地方就是「辨識度不高」
由於口音、詞義、地方用語的不同導致語音辨識在判讀上常出現錯誤
所以大家對於語音辨識通常只是當成玩具或是一個應用程式而已
並不將其當成主要的控制過程
因此目前主要操控的主流仍舊以「手部的輸入」為主,而不是「語音輸入」
但是Siri在語音的辨識度上除了大大的提升之外
更重要的
是Siri創造了一個新的語音辨識系統
 
在最新發表的I Phone 4s所搭載的Siri中我們發現
Siri跳脫了以往我們所認知的舊時代語音辨識
除了可以進行比較高程度的語音辨識以成功辨識不同口音的口語輸入之外
更重要的
是Siri顛覆了舊的語音辨識過程
它顛覆了以往語音辨識的「單向互動」
 
什麼是「單向互動」
白話來說,就是「Voice to Search」
也就是我說一段詞彙
而語音辨識系統根據所輸入的語音詞彙除了進行正確的語音辨識之外
還根據我們所說的資訊進到資料庫找到我們要的資料進行搜尋
將最後的搜尋結果呈現到我們的眼前
最後,「Search for link」
我們會得到一個我們要的資訊的網頁搜尋果的連結
這就是舊的語音辨識
 
但是新的Siri我們發現了一種新的語音辨識模式
蘋果公司把它叫「個人助理」
也就是說Siri雖然也是語音辨識軟體
但是它卻是利用AI人工智慧的方式進行
Siri將語音辨識的功能和我們的語音輸入變成「雙向的」
是利用語音辨識軟體來進行輸入者和AI語音辨識的對話
讓具有AI人工智慧的Siri和使用者進行對話的過程中
不是只有單純的輸入資訊
還可以和使用者進行「類人類的溝通」
同時從對話的過程中得到更高且直接的資料搜尋結果
更將其周邊使用者可能會需要的資訊一併顯示
讓使用者對資訊和搜尋與操控具有更高的主導權和便利性
 
比方說
以往如果要查天氣
向語音辨識軟體口語輸入查詢天氣
跳出的可能是中央氣象局的搜尋連結
或是連結到YAHOO的「天氣」頁面
這時的語音辨識軟體只能提供「搜尋」的功能
並沒有提供「互動」的功能
我們最後得到的是許多跟我們想要的搜尋結果一樣或類似的「搜尋頁面」
這等於我們對於我們要的資訊還必須進行第二層或更多層的搜尋和連結
 
但是Siri則不同
當你向Siri語音輸入查詢某地天氣時
他會以個人助理秘書的方式向你直接報告天氣
而你可以根據直接顯示出來的結果再進行其他的資訊搜尋
最後直接將你要的資料顯示在你面前幾乎只進行一層的搜尋
簡單來說
Siri做到了「Voice to Result」
更白話一點
當你用語音輸了你想要的資訊
而Siri只給你你想要的答案
而不是一堆廢話的網頁連結
這就是Siri跨時代革命性的創新
 
當然看到這裡
很多人一定會覺得講到這的過程
跟GOOGLE也即將有的個人語音辨識很像啊
感覺沒有什麼特別的地方
的確
如果只從上面這樣來看Siri自然看不出來Siri龐大且可怕之處
各位想想
蘋果為什麼今年年初才開始積極的推行所謂的「雲端服務」
因為雲端服務將大量的資料全丟在遠處龐大的串連伺服器中運算
大量減少了用戶端裝置所需的硬體配備
同時一旦大量累積了使用者
則這些使用者的黏著度會很高
更重要的
當這些雲端伺服器大量的進行串連運算時
則是一台超級大的超級電腦
之前我也只是認為蘋果想從App Store和i Tune的成功大量的累積蘋果使用者進行網路上的消費
但是Siri出現之後我發現了蘋果更大的野心
 
各位可能不知道
Siri是被蘋果購併之後才開始將蘋果所有資料庫的資訊跟Siri做連結
簡單說
Siri是裝上了蘋果的資料庫之後才變的現在這麼聰明的
Siri的發展前身是由美國國防部的AI人工智慧項目中的開發團隊脫離之後所創立
當時候的AI人工智慧互動需要大量的數據和網路的連結
可是在移動通訊未大量開發完善前
這些技術能只能倚靠大量的文字輸入
當手機的通訊服務開始正式進到手機3G之後
同時手機上網的費率大幅降低
3G的手機等網路移動設備是在2007年才開始大量普及
而主要的推進也是來自於蘋果I Phone的成功
 
今年蘋果才開始推出Siri我覺得是一個重要的時間點
因為今年開始手機的通訊將開始要往4G高頻寬的項目移動
同時許多大公司在去年開始大量建構了雲端伺服器
讓手機頻寬除了越來越快之外
藉由智慧手機的大量流行以及運算速度加快
讓資料的接收和擷取從固定式的轉往移動式
Siri也正因為如此才在今年底會上市
我認為這是最重要的關鍵
換言之
是環境的建構才讓Siri正式的和世人見面
我之所以說Siri的可怕
是因為他是AI互動式的人工智慧
各位如果聽過電腦的「類神經網路」就可以知道
現在的超級電腦是可以根據大量的資料去自動做資料的連結
這跟人類的神經網絡是一樣的
我相信蘋果公司將Siri搭載在I Phone 4S
而不是搭載在最新的I Phone 5或新的手機上
是因為蘋果在作一項大家都不知道的事
那就是「訓練」
 
各位可以想像一下
如果大量的文字或語音資料進入蘋果所架構的雲端伺服器中
而這些資料進到AI電腦類神經的程式資料庫裡
這些看似散亂的資訊卻可以在極龐大的電腦運算中找到關鍵字
並進行分類、搜尋、判別
而這些龐大的資料庫的建立或處理若只要靠蘋果公司幾萬人的員工辦到
基本上是不可能的事
這些互動式的人工智慧語音辨識系統會犯錯
因此會從這些犯錯的過程當中去做修復和建立新的連結
換個角度來說
各位如果在Siri進行口說辨識
但是Siri最後找到的卻不是你要的資訊時各位會怎麼做
沒錯
各位會回到手寫輸入去搜尋最為正確的結果
而這個過程辨識就是我說的「錯誤過程」
當各位手寫輸入找到正確的資料之後
蘋果公司便可以藉由各位輸入的搜尋結果和最初錯誤的輸入做連結
讓未來下一個輸入此資訊的人能夠更準確的找到資訊
說到這裡
不知道各位聽出Siri威力的地方沒有
 
沒錯
Siri就是一款會自動進化的個人語音辨識助理
而它的進化
靠的就是龐大使用它的使用者所建立、輸入、反饋的各種資訊
藉由Siri的運算平台傳回蘋果的雲端資料庫去
簡單說
蘋果公司丟出Siri這一項人工智慧產品
而讓全球超過2000萬人的I Phone使用者在24小時內不間斷的一直訓練Siri
當Siri未來越來越聰明同時辨識度和互動性越來越高時
就會再吸引更多使用者加入蘋果的陣營
而當這些資料庫大到沒有一家公司可以拼過時
這就會成為這世界上唯一僅有的一家公司
同時掌控著全世界大多人使用移動裝置人口的眼球和使用習慣
未來
就算蘋果不賣硬體了
光是語音個人助理就會成為蘋果最大的吸金來源
這就是Siri最具破壞性的創新之處
也是很多人還沒有想到的地方
 
再來
大家都知道蘋果最重要的競爭對手是Google
可是各位有沒有想過
Siri有可能是蘋果公司割掉Google命脈的利器
請問大家Google最大的收入來源為何
沒錯
就是廣告收入
Google如果沒了廣告收入就是一家廢掉的公司
因此蘋果知道
要殺死Google最好的方式不是發展出多新多好的技術與其對抗
而是讓其賴以維生的命脈斷掉即可
舉個例來說
要讓石油公司倒掉最好的方式不是叫大家不要開車、不要用油
而是讓油價一桶爬上500美元就可以了
處理Google的方式也是一樣
讓廣告商不在Google投入廣告就可以了
這說來簡單但是辦起來卻不容易
但是
Siri卻可以辦到
為什麼
 
我請問各位
如果今天當你向Srir說:「我要買信義區華納威秀的電影票」
請問Siri如果接收你發出的這項訊息
然後跳出華納威秀的訂票系統
接著你就開始進行購票的動作
而這一連串的過程
請問各位看出來Google的危機了沒
不知道?
不知道的人可以往上翻我剛對Siri的幾個觀察點中最重要的一點
那就是「Voice to result」
你直接口語輸入訊息,手機跳出你要的資訊
而不是一大堆的資料連結讓你再去點擊
一旦沒有了還要到搜尋引擎這一個環節
請問各位看的到Google搜尋引擎嗎
沒看到Google的搜尋引擎
請問各位又怎麼看到在Google搜尋引擎上廣告商投放的廣告
既然各位如果看不到在Google上頭放的廣告
那未來廣告商又何必投放顧客看不到的廣告在Google上
那Google如果未來大量流失了廣告贊助商
那他的收入來源又從哪裡來
各位請不要忘了
大家現在習慣付蘋果App Store和i Tune錢
可是沒有人習慣向不收錢的Google付錢
未來如果Google要收錢
而蘋果能提供相同使用者一樣的產品
我敢保證沒有人會繼續用Google的產品
那麼請問Google如果大量在廣告業務上收入流失
同時又無法從現有龐大免費使用者中收取到合理的費用
最後
就算Google是一隻對蘋果有威脅的巨獸
一樣會被割斷賴以維生的咽喉命脈而死亡
因為無法獲利的公司最後的一途就是走向滅亡
這也正是我看到3~5年後當I Phone如果出到7或是更後面的次世代產品時
所搭載的全新進化版的Siri
將會大幅度的改變人類所想像的科技生活
同時會有大量的公司走向滅亡
也會有大量相關的公司大量興起
一個最壞也最美好的科技時代也將捲土再來
有準備的人
便會在其中找到生活或投資的樂趣
沒準備的人則將會面臨進行現在工作的產業高速度的淘汰賽
 
這一篇文章的觀點是我近期看了一些文章和科技網站之後的想法
提供給喜歡研究未來產業趨勢的朋友們參考
也歡迎大家討論自己的想法
 
一點意見與想法提供給大家參考之
 
 
Evacarry
相簿設定
標籤設定
相簿狀態