您的位置:首頁»數碼科技»正文

手機AI戰場,三星 Galaxy S9的Bixby視覺如何實現降維攻擊?

文/王新喜

據市場研究公司Canalys發佈的一份新的報告顯示, 在2018年第一季度, 中國智慧手機銷量從去年同期的1.14億部狂減了21%, 減少到了9100萬部。 隨著智慧手機整體陷入頹勢, 手機廠商將AI能力作為手機反覆運算創新、增強用戶體驗、驅動用戶換機的關鍵點, 越來越多的廠商在發佈新機的時候, 都會圍繞著智慧AI的賣點侃侃而談, AI正在成為手機的標配。

都在玩AI概念, 但AI的能力不僅僅體現在拍照

但是當下許多國產手機廠商的AI能力更多停留在拍照層面的優化, 比如華為Mate10、榮耀V10以及iPhone X的AI攝影能力體現在識別、動作捕捉、光影分析、AR以及美顏等多個方面。

比如美圖手機、紅米Note5, 小米Mix2S等廠商主打“AI攝影”與美顏的賣點, 但在這背後, 由於僅僅搭載了基於演算法的“AI應用”或者“AI濾鏡”, 缺少了硬體底層的AI晶片的支援, 更多只是實現了普通的美顏演算法的功能。 有業內人士一針見血的指出, 這些能力說白了可以下載一個拍照APP就能實現, 和曾經流行的很多概念或技術一樣, 對有些廠商而言, AI不過是另一個華麗的行銷包裝罷了。

三星Bixby站在更高維度上 視覺識別實現差異化破局

而語音助手則是各廠商將AI技術落地的關鍵形態。 目前無論是亞馬遜的Alexa、微軟Cortana、蘋果Siri等, 互聯網巨頭推出的AI智慧助理都主打的是語音辨識。 雖然語音辨識是主流, 但其中各廠商表現差別巨大。

其中, 蘋果的Siri語音技術表現已經落後於其他幾家巨頭。 針對Siri在蘋果HomePod語音辨識表現。 Loup Ventures曾做了一項測試, 共詢問了782個問題, HomePod只答對了52.3%, 在整個測試中排名倒數第一。 Thinknum分析師約書亞·弗洛林格指出, Siri被認為落後于亞馬遜的Alexa、穀歌的Google Assistant和微軟的Cortana“已經不是什麼秘密”。

而從眾多國產手機的“AI助理”來看, 基本可以實現在手機上輕鬆幫用戶實現發短信、設置鬧鐘、查詢天氣等功能, 它們往往是通過接入協力廠商技術的語音助手來支援語音辨識搜索、照片識別美化、語音撥號、開啟一些系統自帶應用等功能。

而反觀三星, 目前它不只是支援應用開啟等簡單語音辨識, 而且還支援應用內的深度、連續的應用內的語音命令。 包括支援如電話,

相冊, 時間等大部分原生應用以及微信, 微博、QQ、淘寶等在內的眾多協力廠商應用。 舉個例子, 當我對Siri和Bixby說“打開微信給xx發個紅包”或幫我掃共用單車”或“把我剛拍的照片發送到微博或朋友圈”, Siri會瞬間懵逼, 而Bixby可以快速執行命令。 Bixby更接近人工智慧的定義——真實對話交流, 有效執行人的指令, 解放了人的雙手。

但儘管三星AI語音辨識力壓群雄, 三星Bixby的視覺識別能力才是其與市面上其他語音助手截然不同的最大的亮點。 Bixby不僅僅包含語音辨識, 還包含視覺, 主頁, 提醒等功能, 可以完成語音、視覺、觸摸、文本控制等多種對話模式, 用戶可以自由切換並且結合進行操作。

在今天, 大多數廠商的AI拍照功能可以識別出是花還是景物、並對不同景物進行優化,

比如說榮耀10可以自動完成取景框中各類物體的識別, 可以識別出天空、植物、動物、人等不同要素。 但這種識別能力更多停留在靜態化的照片優化層面, 沒有與現實世界達成交流與互動。

而三星S9的人工智慧平臺Bixby當前已經做到了通過攝像頭結合增強現實技術和深度學習技術, 使用者只需在打開Bixby視覺, 用攝像頭對準現實中的物品, 相關資訊便會迅速浮現在螢幕之上, 這在目前所有的廠商中, 是獨一無二的功能存在。

如果說三星Bixby的視覺識別更接近真正的人工智慧表現, 或許就在於它這種結合增強現實技術和深度學習技術體現出來的高實用價值。 三星Bixby目前主要有9種攝影模式, 包括文字、美食、美顏、購物、圖片搜索、二維碼等,

目前新增了美妝、搜題、紅酒識別等功能。

也就是說, AI視覺識別可以説明使用者迅速認知周遭環境, 如前所述, 打開Bixby視覺, 用攝像頭對準想瞭解的物件, 即能迅速顯示該物品的相關資訊, 實現一些實用的功能包括即時翻譯、貨幣匯率換算、美妝、識別紅酒等商品的價格與品牌等, 也可以進行視覺識別購物。 即使用者可以通過Bixby視覺識別與現實世界達成連接, 為手機帶來了更為豐富的線下應用場景擴展。

比如說, 如果你在國外出差, 語言不通, 這時三星Bixby的即時翻譯功能就可以完美解決你人在異鄉的各種煩惱, 包括點餐、識別路標, 貨幣匯率換算等。 比如在出國旅遊或者購物過程中碰到不懂的文字, 可以用攝像頭掃描外文,Bixby視覺即可識別翻譯進行語言的轉換,並將翻譯好的文字呈現螢幕中原文的位置。

目前,Bixby可識別10種語言,並將其翻譯成27種外語。而通過街景的相機視窗,也可以快速定位自己所在位置。另外,如果看到一件自己喜歡的物品時,只需用Bixby掃一下便能準確判斷出物品的資訊和在電商售賣的價格,也可以即刻完成下單。

甚至當你拿到一份紙質檔,想要把裡面的內容分享給別人或者轉發到朋友圈,只需用Bixby掃一下便能將其中的文本內容提取出來進行編輯分享。

也就是說,三星Bixby不僅能通過語音交互讓使用者更加便捷的操控手機,還能通過攝像頭來幫助用戶更加高效的與世界連接,這種“看圖識物”的智慧化視覺識別在關鍵時刻的實用價值完整契合了消費者線下場景的各種消費心理與需求。在這裡,攝像頭相當於一雙能夠智慧識別的眼睛,快速識別、接收現實世界的各種資訊,擴展了AI的移動化應用場景。

多數廠商依賴協力廠商語音技術,而AI助手依賴自研有什麼好處?

之所以三星能達成這種長板能力的突破,在於它將軟硬體技術掌控在自己手裡做到了一體化優化。我們看到,2017年手機出貨量全球前十的公司以及國內的一些手機廠商,多數手機廠商採取合作的模式使用協力廠商的語音技術。

從之前某業內人士盤點整理的2017年全球TOP10出貨手機語音助手盤點可以看出,在手機廠商的AI能力與語音助手技術來源方面,多數廠商均是依賴協力廠商語音技術的接入——華為小E、聯想樂語音的語音技術源於科大訊飛、vivo是技術用的是百度DuerOS、LG的語音技術源自于穀歌,小米的小愛同學的語音技術用的是DuerOS/搜狗知音、獵戶星座等。手機廠商唯有三星Bixby、蘋果Siri在語音助手方面做到了自研。

而AI語音技術依賴自研有什麼好處?其一,是技術掌控在自己手裡,可以按照研發節奏與用戶需求不斷反覆運算創新。其二,可以確保軟硬體更好的融合,做出差異化創新,當前三星Bixby功能的實現是Bixby人工智慧平臺與攝像頭深度集成,針對相機的優化、硬體感測器和系統軟體的多方面的調試與融合的結果。而許多廠商如果依賴協力廠商廠商則在技術上受制於協力廠商大廠,難以做到軟硬體深度融合集成創新。

目前來而在AI這一輪的競爭中,三星與蘋果目前是站在第一陣營的競爭維度上。但當前蘋果也沒有在視覺智慧識別層面有動作與突破,三星搶佔了該領域的話語權。

三星Bixby通過AI的視覺識別長板實現降維攻擊?

綜上所述,在AI戰場上,三星與其他廠商所佈局的AI語音助手不同的是,不僅僅是在語音智慧化識別能力層面更為凸顯,在視覺化識別層面也走的更深,不僅能聽、能通過語音交流,而更能通過視覺、觸控等方式與外界實體溝通識別,説明使用者理解它所需要的資訊。

目前三星S9的Bixby視覺所實現的“會看”這一能力幾乎是當前所有廠商缺失的短板,這讓三星站在一個更高的技術維度上——為用戶提供高效準確的執行、回饋與識別能力(Bixby語音功能)、更加數位化與實用性的虛擬實境呈現(Bixby視覺功能),更加綜合的資訊展現等,關鍵是,Bixby具備情景感知與自我學習能力——可以通過機器學習,更懂並自動適應用戶,想用戶之所想。三星Bixby正在逐步接近目前最人們理想中人工智慧技術所應有的體驗。

某種程度上,三星Bixby通過視覺識別提高了AI的門檻,從更高的維度實現降維攻擊——手機廠商能有的語音辨識我有而且做的更好,但視覺AI識別則是更高維度更具殺傷力的武器,它達成了人無我有獨樹一幟的存在。而這種技術也契合消費者快捷與世界發生連接、解決消費識別與需求痛點的能力。

面對三星Bixby視覺識別技術,手機廠商該有危機感嗎?

從未來趨勢來看,隨著技術的發展與即將到來的5G時代,智慧AI技術將會迎來一個高爆發時期,而5G時代更高的傳輸速率,更大的接入容量,更低的網路時延,可以為AI技術提供了更好的應用土壤,包括增強現實(AR)技術在手機上獲得更好的體驗,也會產生新的機會與應用場景——包括用AI來識別文字和商品、景物等能力可能給諸多手機應用帶來新的機會,比如圖片分類、物體識別等可以用於自媒體、社交網路和AR購物等應用操作方面。

而三星S9系列在通過AI將軟硬體整合提供超出當前AI助手的用戶體驗來佔領用戶的心智,通過一個比原有體系更高維度的東西,實現對其他對手的降維。隨著Bixby未來的改進與完善以及實現對更多協力廠商APP的覆蓋支持,產生更多的使用場景,那麼它未來可能將逐步在視覺識別層面建立自身的技術壁壘與護城河。

因此,對於諸多廠商而言,對於三星在AI視覺技術上的前瞻佈局應該有危機感,如何在AI視覺識別層面快速跟上節奏,是當下需要思考的。

作者:王新喜 TMT資深評論人 本文未經許可謝絕轉載 我的微信公眾號:redianweiping

可以用攝像頭掃描外文,Bixby視覺即可識別翻譯進行語言的轉換,並將翻譯好的文字呈現螢幕中原文的位置。

目前,Bixby可識別10種語言,並將其翻譯成27種外語。而通過街景的相機視窗,也可以快速定位自己所在位置。另外,如果看到一件自己喜歡的物品時,只需用Bixby掃一下便能準確判斷出物品的資訊和在電商售賣的價格,也可以即刻完成下單。

甚至當你拿到一份紙質檔,想要把裡面的內容分享給別人或者轉發到朋友圈,只需用Bixby掃一下便能將其中的文本內容提取出來進行編輯分享。

也就是說,三星Bixby不僅能通過語音交互讓使用者更加便捷的操控手機,還能通過攝像頭來幫助用戶更加高效的與世界連接,這種“看圖識物”的智慧化視覺識別在關鍵時刻的實用價值完整契合了消費者線下場景的各種消費心理與需求。在這裡,攝像頭相當於一雙能夠智慧識別的眼睛,快速識別、接收現實世界的各種資訊,擴展了AI的移動化應用場景。

多數廠商依賴協力廠商語音技術,而AI助手依賴自研有什麼好處?

之所以三星能達成這種長板能力的突破,在於它將軟硬體技術掌控在自己手裡做到了一體化優化。我們看到,2017年手機出貨量全球前十的公司以及國內的一些手機廠商,多數手機廠商採取合作的模式使用協力廠商的語音技術。

從之前某業內人士盤點整理的2017年全球TOP10出貨手機語音助手盤點可以看出,在手機廠商的AI能力與語音助手技術來源方面,多數廠商均是依賴協力廠商語音技術的接入——華為小E、聯想樂語音的語音技術源於科大訊飛、vivo是技術用的是百度DuerOS、LG的語音技術源自于穀歌,小米的小愛同學的語音技術用的是DuerOS/搜狗知音、獵戶星座等。手機廠商唯有三星Bixby、蘋果Siri在語音助手方面做到了自研。

而AI語音技術依賴自研有什麼好處?其一,是技術掌控在自己手裡,可以按照研發節奏與用戶需求不斷反覆運算創新。其二,可以確保軟硬體更好的融合,做出差異化創新,當前三星Bixby功能的實現是Bixby人工智慧平臺與攝像頭深度集成,針對相機的優化、硬體感測器和系統軟體的多方面的調試與融合的結果。而許多廠商如果依賴協力廠商廠商則在技術上受制於協力廠商大廠,難以做到軟硬體深度融合集成創新。

目前來而在AI這一輪的競爭中,三星與蘋果目前是站在第一陣營的競爭維度上。但當前蘋果也沒有在視覺智慧識別層面有動作與突破,三星搶佔了該領域的話語權。

三星Bixby通過AI的視覺識別長板實現降維攻擊?

綜上所述,在AI戰場上,三星與其他廠商所佈局的AI語音助手不同的是,不僅僅是在語音智慧化識別能力層面更為凸顯,在視覺化識別層面也走的更深,不僅能聽、能通過語音交流,而更能通過視覺、觸控等方式與外界實體溝通識別,説明使用者理解它所需要的資訊。

目前三星S9的Bixby視覺所實現的“會看”這一能力幾乎是當前所有廠商缺失的短板,這讓三星站在一個更高的技術維度上——為用戶提供高效準確的執行、回饋與識別能力(Bixby語音功能)、更加數位化與實用性的虛擬實境呈現(Bixby視覺功能),更加綜合的資訊展現等,關鍵是,Bixby具備情景感知與自我學習能力——可以通過機器學習,更懂並自動適應用戶,想用戶之所想。三星Bixby正在逐步接近目前最人們理想中人工智慧技術所應有的體驗。

某種程度上,三星Bixby通過視覺識別提高了AI的門檻,從更高的維度實現降維攻擊——手機廠商能有的語音辨識我有而且做的更好,但視覺AI識別則是更高維度更具殺傷力的武器,它達成了人無我有獨樹一幟的存在。而這種技術也契合消費者快捷與世界發生連接、解決消費識別與需求痛點的能力。

面對三星Bixby視覺識別技術,手機廠商該有危機感嗎?

從未來趨勢來看,隨著技術的發展與即將到來的5G時代,智慧AI技術將會迎來一個高爆發時期,而5G時代更高的傳輸速率,更大的接入容量,更低的網路時延,可以為AI技術提供了更好的應用土壤,包括增強現實(AR)技術在手機上獲得更好的體驗,也會產生新的機會與應用場景——包括用AI來識別文字和商品、景物等能力可能給諸多手機應用帶來新的機會,比如圖片分類、物體識別等可以用於自媒體、社交網路和AR購物等應用操作方面。

而三星S9系列在通過AI將軟硬體整合提供超出當前AI助手的用戶體驗來佔領用戶的心智,通過一個比原有體系更高維度的東西,實現對其他對手的降維。隨著Bixby未來的改進與完善以及實現對更多協力廠商APP的覆蓋支持,產生更多的使用場景,那麼它未來可能將逐步在視覺識別層面建立自身的技術壁壘與護城河。

因此,對於諸多廠商而言,對於三星在AI視覺技術上的前瞻佈局應該有危機感,如何在AI視覺識別層面快速跟上節奏,是當下需要思考的。

作者:王新喜 TMT資深評論人 本文未經許可謝絕轉載 我的微信公眾號:redianweiping

Next Article
喜欢就按个赞吧!!!
点击关闭提示