深度學(xué)習(xí)(DL)和人工智能(AI)已經(jīng)不再是科幻小說中遙不可及的目標,目前已成為了互聯(lián)網(wǎng)和大數(shù)據(jù)等領(lǐng)域的前沿研究內(nèi)容。
由于云計算提供強的計算能力、提出的先進算法以及充裕的資金,這創(chuàng)造了五年前難以想象的新技術(shù)。此外,層出不窮的豐富數(shù)據(jù)也使得深度學(xué)習(xí)成為了現(xiàn)實。
相關(guān)內(nèi)容分成四個部分,主要深入探索深度學(xué)習(xí)、數(shù)據(jù)庫的選擇以及相關(guān)實際商業(yè)應(yīng)用問題等。
在今天的第I部分內(nèi)容中,主要是講解人工智能的歷史以及它現(xiàn)在高速發(fā)展的原因;
在第II部分內(nèi)容中,將討論一下人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)之間的區(qū)別;
在第III部分內(nèi)容中,將深入研究深度學(xué)習(xí)以及在為新項目選擇數(shù)據(jù)庫時需要評估的關(guān)鍵事項;
在第IV部分內(nèi)容中,將討論深度學(xué)習(xí)為何使用MongoDB,并提供相關(guān)使用實例;
第I部分
人工智能的歷史
我們目前生活在人工智能開始嶄露頭角的時代,人工智能不僅創(chuàng)造了擾亂工業(yè)和變革工作場所的可能性,而且還可以解決一些社會上的挑戰(zhàn)。比如自動駕駛可以挽救數(shù)萬人的生命、增加老年人和殘疾人的流動性,精準醫(yī)學(xué)可以開展個體化治療以延長生命,智能建筑有助于減少碳排放并節(jié)約能源等,這些只是人工智能承諾的一些潛在的好處,并且大多已經(jīng)取得相關(guān)突破性的進展。
到2018年,Gartner公司估計機器將占全球所有業(yè)務(wù)內(nèi)容的20%,并預(yù)計60億個聯(lián)網(wǎng)設(shè)備將產(chǎn)生大量的數(shù)據(jù)。人工智能對理解這一切顯得至關(guān)重要,AI不再局限于科幻電影中,人工智能和機器學(xué)習(xí)正在被現(xiàn)實世界中的相關(guān)業(yè)務(wù)采用。
自從艾倫·圖靈(Alan Turing)于1950年寫了篇論文《計算機器與智能》以來,人工智能一直是人們的一個夢想。在這篇論文中,圖靈提出了一個根本性的問題——“機器能思考嗎?”,并考慮計算機是否能像人類那樣進行思考。人工智能領(lǐng)域的研究真正誕生于1956年的夏天,一組聚集在達特茅斯學(xué)院(Dartmouth College)的研究人員發(fā)起了一系列的研究項目,他們的目標是讓計算機做出像人類一樣行為。“人工智能”這一詞也是第一次在這所學(xué)院被創(chuàng)造出來,該會議的概念形成了一個合法的跨學(xué)科交流的研究領(lǐng)域。
在接下來的十年中,隨著新技術(shù)的發(fā)展受到當代技術(shù)的限制,人工智能的發(fā)展經(jīng)歷了繁榮和蕭條周期。在1968年,科幻電影《2001:太空漫游》中的智能電腦——HAL9000說了一句著名的話,“對不起,戴夫,恐怕我不能那么做”,這幫助AI在主流意識中留下了不可磨滅的印象。在20世紀70年代末,電影《星球大戰(zhàn)》中智能機器人幫助拯救銀河的場景進一步鞏固了AI在主流文化中的地位。
但直到20世紀90年代末,人工智能才開始從科幻傳說轉(zhuǎn)變?yōu)楝F(xiàn)實世界中的實際應(yīng)用。1997年初,由IBM的深藍國際象棋程序擊敗了當時的世界冠軍Garry Kasparov,人工智能在上世界90年代迎來了一個新的時代,AI的研究進展也開始加速。研究人員變得開始關(guān)注人工智能的相關(guān)子問題,并利用它來解決現(xiàn)實世界中的應(yīng)用任務(wù),比如圖像和語音識別等。研究人員沒有試圖構(gòu)造由專家知識決定的邏輯規(guī)則,而是開始研究如何通過算法學(xué)習(xí)邏輯規(guī)則本身,這一趨勢有助于將研究重點轉(zhuǎn)移到人工神經(jīng)網(wǎng)絡(luò)(ANNs)中。
在20世紀40年代,人工神經(jīng)網(wǎng)絡(luò)被發(fā)明成“松散地”模仿人腦的學(xué)習(xí)方式。當反向傳播梯度下降算法得到改進時,人工神經(jīng)網(wǎng)絡(luò)的研究于1986年開始變得流行起來,反向傳播算法減少了人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練時需要大量手工調(diào)參問題,因此反向傳播算法(BP)也是一種有效的減少人工智能訓(xùn)練時間的方法。
即使在算法方面取得新的進展,但神經(jīng)網(wǎng)絡(luò)仍然受到技術(shù)上的限制,這些限制也影響了ANNs在過去幾十年的應(yīng)用情況。直到2000年中期,人工智能才重新掀起一次科技浪潮。在2006年,多倫多大學(xué)的Geoffrey Hinton提出對人工神經(jīng)網(wǎng)絡(luò)進行修改,并將其研究成果稱為“深度學(xué)習(xí)(Deep Neural Network)”。Hinton對人工神經(jīng)網(wǎng)絡(luò)添加多個隱藏層并對每層進行數(shù)學(xué)優(yōu)化,逐層學(xué)習(xí)使得模型訓(xùn)練變得更快。在2012年,斯坦福大學(xué)的Andrew Ng進一步推動了深度學(xué)習(xí)的發(fā)展,他建造了一個簡陋的利用圖形處理單元(GPU)實現(xiàn)深度神經(jīng)網(wǎng)絡(luò)的模型,Andrew Ng發(fā)現(xiàn)集群GPU仿真訓(xùn)練深度學(xué)習(xí)模型比通用的CPU訓(xùn)練快得多,對于同樣的任務(wù)而言,GPU可能只需要一天的時間,而CPU需要幾周的時間才能產(chǎn)生相同的結(jié)果,這是由于GPU是大規(guī)模并行架構(gòu),而且能同時處理多個任務(wù)。
從本質(zhì)上講,將軟件算法與高性能的硬件相結(jié)合已經(jīng)醞釀了幾十年,這也將迎來AI正在經(jīng)歷的快速發(fā)展。
人工智能現(xiàn)在為什么高速發(fā)展?
目前有四個主要因素推動了人工智能的發(fā)展:
1.更豐富的數(shù)據(jù)。人工智能需要大量的數(shù)據(jù)來學(xué)習(xí),社交的數(shù)字化為其進步提供了可利用的原材料。諸如物聯(lián)網(wǎng)(傳感器等)、社交和移動計算、科學(xué)和學(xué)術(shù)界、醫(yī)療保健以及許多新的應(yīng)用程序等來源的大數(shù)據(jù)可以用來訓(xùn)練人工智能模型。不出意料,目前在人工智能領(lǐng)域投資較多的公司,比如亞馬遜、蘋果、百度、谷歌、微軟等,同時也是數(shù)據(jù)較多的公司。
2.更便宜的計算成本。在過去,即使人工智能相關(guān)算法得到改進,硬件仍然是一個制約因素。由于硬件和新的計算模型取得新的突破,尤其是GPU,加速了人工智能的發(fā)展過程。GPU由于其自身的并行處理能力及高效的執(zhí)行矩陣乘法的方式使得其在人工智能社區(qū)得到普及應(yīng)用,這也締造了英偉達這一優(yōu)秀公司的行業(yè)地位。 最近,英特爾在Xeon和Xeon Phi處理器中增加了新的深度學(xué)習(xí)指令,這允許其能更好地進行并行和高效的矩陣運算。隨著人工智能技術(shù)的應(yīng)用,硬件廠商現(xiàn)在需要專門針對人工智能進行開發(fā)、設(shè)計和制造相關(guān)產(chǎn)品,這些進步將導(dǎo)致更好的硬件設(shè)計、性能、功耗以及配置文件。
3.更復(fù)雜的算法。更高效的性能和更便宜的計算花費使得科研人員能夠開發(fā)和訓(xùn)練更高級的算法,這是因為他們不再受限于過去硬件約束的限制。因此,深度學(xué)習(xí)現(xiàn)在正以驚人的精確度解決特定的問題(例如,語音識別、圖像分類、手寫識別、欺詐檢測等),更先進的算法繼續(xù)推動人工智能技術(shù)的發(fā)展。
4.更廣泛的投資。在過去的幾十年中,人工智能的研究和發(fā)展主要局限于大學(xué)和研究院等機構(gòu)。資金缺乏以及人工智能問題的困難性導(dǎo)致其發(fā)展甚微。如今,人工智能投資不再局限于大學(xué)實驗室,而是在許多領(lǐng)域都在進行發(fā)展——政府、風(fēng)險資本支持的初創(chuàng)公司、互聯(lián)網(wǎng)巨頭和各行業(yè)的大型企業(yè)等。
第II部分
人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)之間的區(qū)別
在很多情況下,人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)可以互換使用。但實際上,機器學(xué)習(xí)和深度學(xué)習(xí)都是人工智能的子集。人工智能作為計算機科學(xué)研究領(lǐng)域中的一個分支,其重點是建立能夠具有智能行為的機器,而機器學(xué)習(xí)和深度學(xué)習(xí)則是利用算法篩選數(shù)據(jù),并從數(shù)據(jù)中學(xué)習(xí)、預(yù)測或采取自主行動的實踐。因此,這些算法不需要根據(jù)特定的約束進行編程,而是使用大量數(shù)據(jù)進行訓(xùn)練,使其能夠獨立學(xué)習(xí)、推理和執(zhí)行特定的任務(wù)。
那么,機器學(xué)習(xí)和深度學(xué)習(xí)之間存在哪些區(qū)別呢?在定義深度學(xué)習(xí)之前,先深入地理解機器學(xué)習(xí)吧。
機器學(xué)習(xí):有監(jiān)督VS.無監(jiān)督
機器學(xué)習(xí)方法主要分成兩大類:有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。
有監(jiān)督學(xué)習(xí):目前,有監(jiān)督學(xué)習(xí)是機器學(xué)習(xí)中最為常用的算法。在有監(jiān)督學(xué)習(xí)的情況下,相關(guān)算法的輸入是開發(fā)人員和分析人員手動標記的數(shù)據(jù),即有標記的數(shù)據(jù),這些標記就是數(shù)據(jù)的期望輸出值,使用這些數(shù)據(jù)來訓(xùn)練模型并生成預(yù)測。監(jiān)督學(xué)習(xí)任務(wù)又可以分為兩大類:回歸和分類問題。
上圖演示了一個簡單的回歸問題。從圖中可以看到,存在兩個輸入或特征(平方英尺和價格),被用于生成擬合曲線,并預(yù)測未來的房地產(chǎn)價格。這個模型相當簡單,只考慮了房子的面積這一個特征對房價的影響,在國內(nèi)的話,如果只考慮這房子面積這一個特征就去購買或投資房產(chǎn)的話,將會鬧出笑話。因此,一般而言,考慮的特征越多,模型會越復(fù)雜,預(yù)測也會更加準確。
上圖演示了一個有監(jiān)督分類問題。使用的數(shù)據(jù)集是有標記為良性腫瘤和惡性腫瘤的乳腺癌患者。有監(jiān)督分類算法試圖通過將數(shù)據(jù)擬合成直線將腫瘤劃分為兩種不同的類別。當算法學(xué)習(xí)好后,即劃分直線確定,將來的數(shù)據(jù)可以之間通過這條劃分直線來確定患者的腫瘤是良性或惡性。分類問題導(dǎo)致離散輸出,但不一定限制固定數(shù)據(jù)集的輸出數(shù)量,上圖中只有兩個離散輸出,但可以有更多分類類別(1表示良性,2表示惡性,3表示待定等)。
無監(jiān)督學(xué)習(xí)。在有監(jiān)督學(xué)習(xí)的示例中,可以看到使用的數(shù)據(jù)集都具有標記(良性或惡性分類),數(shù)據(jù)標記有助于算法確定正確的答案是什么,進而調(diào)整模型參數(shù)以使得模型輸出盡可能與標記相近。而在無監(jiān)督學(xué)習(xí)中,數(shù)據(jù)集是不具有標記的,需要依賴于算法來發(fā)現(xiàn)數(shù)據(jù)中的結(jié)構(gòu)和模型。
從上圖中可以看到,每個數(shù)據(jù)點代表的信息不明確,因此要求算法在不受任何監(jiān)督的情況下查找數(shù)據(jù)中存在的結(jié)構(gòu)信息。圖中的無監(jiān)督學(xué)習(xí)算法可以確定兩個不同的集群,并在集群之間進行直線分類。無監(jiān)督學(xué)習(xí)廣泛應(yīng)用于新聞、社會網(wǎng)絡(luò)分析、市場分割及銀河系周圍的天文分析等許多應(yīng)用案例中。
第III部分
深度學(xué)習(xí)是什么?
深度學(xué)習(xí)是機器學(xué)習(xí)研究領(lǐng)域中的一個分支,近年來在圖像識別、自然語言處理和圖像分類等領(lǐng)域應(yīng)用十分火熱,受到世界范圍內(nèi)的廣泛關(guān)注。深度學(xué)習(xí)是人工神經(jīng)網(wǎng)絡(luò)(ANN)的一種改進,正如人工神經(jīng)網(wǎng)絡(luò)一樣,是模擬人類大腦學(xué)習(xí)和解決問題的一種方法。
在深入了解深度學(xué)習(xí)的工作原理前,首先理解人工神經(jīng)網(wǎng)絡(luò)(ANN)是如何工作的。人工神經(jīng)網(wǎng)絡(luò)是由一組互相連接的神經(jīng)元組成,類似于人類大腦中的神經(jīng)元網(wǎng)絡(luò)。
上圖是一個簡化的神經(jīng)元連接示意圖。神經(jīng)網(wǎng)絡(luò)中的每個神經(jīng)元接收與之連接的其它神經(jīng)元的輸入信息(Xi),然后通過計算后輸出到網(wǎng)絡(luò)中的其它神經(jīng)元或節(jié)點。神經(jīng)元之間的連接參數(shù)用權(quán)重(Wj)表示,權(quán)重的大小表示二者連接的強度,權(quán)重的值可正可負。將所有的輸入信息都與對應(yīng)的連接權(quán)重相乘(X1W1,X2W2等)并進行求和作為該節(jié)點的輸出。最后一步是對神經(jīng)元執(zhí)行計算或激活函數(shù)處理。激活函數(shù)允許人工神經(jīng)網(wǎng)絡(luò)模擬簡單模式無法正確表示的復(fù)雜的非線性問題,常用的激活函數(shù)是Sigmoid函數(shù)。
上圖表示一個三層的神經(jīng)網(wǎng)絡(luò),從左往右第一層為輸入層,輸入對應(yīng)的特征(X1,X2,X3),第二層被稱作隱藏層,隱藏層可以有多層,第三層是輸出層。對于一個層而言,只要該層不是輸入層或輸出層,那么該層就可以稱作隱藏層。
“深度”學(xué)習(xí)最初就是這樣產(chǎn)生的,因為其含有多個隱藏層,通常包含多于3個的隱藏層。在一些情況下,隱藏層的個數(shù)高達1200多個。
多個隱藏層的好處是什么呢?在某些模式下,可能需要更加深入的調(diào)查,因此多個隱藏層可以進行額外的特征處理。深度學(xué)習(xí)在圖像分類領(lǐng)域中表現(xiàn)優(yōu)異,甚至在某些特定任務(wù)上超過了人類的表現(xiàn)。現(xiàn)在,通過一個額外隱藏層有助于面部識別的例子來說明這一點。
當一張圖片被輸入到一個深層次的學(xué)習(xí)網(wǎng)絡(luò)中時,它首先被分解成圖像像素。然后該算法將在圖像中的某些位置尋找特定形狀的圖案。第一個隱藏層可能試圖揭示特定的面部模式:眼睛、嘴巴、鼻子、耳朵等。添加一個額外的隱藏層來解析更加細粒度的屬性。例如,“嘴巴”可以進一步分解為“牙齒”、“嘴唇”、“牙齦”等。添加額外的隱藏層可以將這些模式更進一步抽象。最終的結(jié)果是一個深層的學(xué)習(xí)網(wǎng)絡(luò)可以將一個非常復(fù)雜的問題分解成一系列簡單的問題。隱藏層的本質(zhì)是一個層次化的特征學(xué)習(xí),它們能夠更好地提取特征。目前,大多數(shù)深度學(xué)習(xí)算法都是有監(jiān)督學(xué)習(xí),即對已知的標記數(shù)據(jù)進行深度學(xué)習(xí)。
訓(xùn)練是如何工作的?
訓(xùn)練深度學(xué)習(xí)的最終目的是降低代價函數(shù),即期望輸出與實際輸出之間的差異盡可能小。節(jié)點之間的連接將會有特定的權(quán)重,不斷修改這些權(quán)重參數(shù)使得網(wǎng)絡(luò)的代價函數(shù)變小。通過修改權(quán)重值,可以將代價函數(shù)最小化到全局最小值,這意味著模型的誤差降到最小值。深度學(xué)習(xí)之所以計算如此密集就是因為它需要找到合適的數(shù)以十億的連接權(quán)重值,這需要通過不斷迭代訓(xùn)練調(diào)整得到,以找到使得代價函數(shù)全局最小值的權(quán)重集。
深度學(xué)習(xí)中最為常用的訓(xùn)練方法是反向傳播梯度下降算法。梯度下降算法是一種有效的數(shù)學(xué)優(yōu)化方法,它能有效地處理大量的數(shù)據(jù)(特征),而不必強力進行維度分析。梯度下降算法根據(jù)權(quán)重函數(shù)的全局最小值來計算梯度(斜率)。
在訓(xùn)練過程中,首先隨機分配權(quán)重并計算出一個誤差。然后基于這個誤差,通過使用梯度下降算法來修改權(quán)重,之后反向逐層調(diào)整每層的權(quán)重參數(shù),當調(diào)整完每層參數(shù)后又正向進行傳播,計算得到一個新的誤差,之后基于新的誤差調(diào)整每層的參數(shù),一直迭代到代價函數(shù)達到全局最小值為止。可能會出現(xiàn)一些例子,梯度下降算法是以局部最小值而不是全局最小值來計算的,減輕這個問題的方法是使用凸的代價函數(shù)或?qū)?shù)產(chǎn)生更多的隨機性。
深度學(xué)習(xí)中對數(shù)據(jù)庫的思考
非關(guān)系數(shù)據(jù)庫在促進機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的最新進展中起著不可或缺的作用。收集和存儲大量結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)的能力為提升深度學(xué)習(xí)預(yù)測提供的必要的原材料。在構(gòu)建深度學(xué)習(xí)應(yīng)用程序時,選擇用于管理底層數(shù)據(jù)的數(shù)據(jù)庫時要牢記一些注意事項。
靈活的數(shù)據(jù)模型。在深度學(xué)習(xí)中,數(shù)據(jù)需要經(jīng)歷三個階段——輸入數(shù)據(jù)、訓(xùn)練數(shù)據(jù)和結(jié)果數(shù)據(jù)。深度學(xué)習(xí)是一個動態(tài)的過程,通常涉及大量的實驗,比如,實驗過程中參數(shù)調(diào)整是很正常的事情,加上非結(jié)構(gòu)化數(shù)據(jù)的輸入、輸出結(jié)果的修改是自然而然地發(fā)生。隨著新的信息和見解被發(fā)現(xiàn),重要的是在靈活數(shù)據(jù)模型上選擇一個合適的數(shù)據(jù)庫,避免在數(shù)據(jù)結(jié)構(gòu)需要改變時需要執(zhí)行昂貴的模式遷移。
規(guī)模。深度學(xué)習(xí)面臨的最大挑戰(zhàn)之一是模型訓(xùn)練耗費的時間比較長,有些模型可能需要幾個星期的訓(xùn)練時間,這是由于梯度下降等算法需要通過多次迭代來調(diào)整模型的數(shù)十億個參數(shù)。為了減少訓(xùn)練次數(shù),深度學(xué)習(xí)框架嘗試并行運算,將訓(xùn)練負荷分布到多個高性能的服務(wù)器上。
并行化訓(xùn)練主要有兩種方式:數(shù)據(jù)并行性和模型并行性。
數(shù)據(jù)并行性。通過分布式系統(tǒng)將數(shù)據(jù)分割成多個節(jié)點進行處理并存儲,比如Apache Spark、MongoDB和Apache Hadoop。
模型并行性。通過相關(guān)軟件庫和框架在多個節(jié)點上分割模型及其相關(guān)層,如TensorFlow、Caffe和Theano。分裂提供并行性,但是在協(xié)調(diào)不同節(jié)點之間的輸出時會產(chǎn)生性能代價。
除了模型訓(xùn)練階段耗費時間長外,深度學(xué)習(xí)的另一個大挑戰(zhàn)是輸入數(shù)據(jù)集不斷增長,這增加了訓(xùn)練參數(shù)的數(shù)量。這不僅意味著輸入數(shù)據(jù)集可能超過可用的服務(wù)器內(nèi)存,而且還意味著涉及梯度下降的矩陣也能超過節(jié)點的內(nèi)存。因此,縮放比擴展更加重要,這使得工作負載和相關(guān)的數(shù)據(jù)集在多個節(jié)點上分布,允許并行執(zhí)行計算。
容錯。許多深度學(xué)習(xí)算法使用檢驗點作為故障發(fā)生時恢復(fù)訓(xùn)練數(shù)據(jù)的一種方法。然而,頻繁設(shè)置的檢查點需要大量的系統(tǒng)開銷。另一種方法是利用駐留在分割節(jié)點上的多個數(shù)據(jù)副本,這些副本提供冗余和數(shù)據(jù)可用性,而無需消耗系統(tǒng)主節(jié)點上的資源。
一致性。對于大多數(shù)深度學(xué)習(xí)算法而言,建議使用強數(shù)據(jù)一致性模型,具有強一致性的分布式數(shù)據(jù)庫集群中每個節(jié)點都運行在最新的數(shù)據(jù)副本上。雖然有些算法可以容忍一定程度的不一致性,比如隨機梯度下降算法(SGD),但強一致性能夠提供最精確的結(jié)果。然而,在某些情況下,算法更加看重訓(xùn)練時間而不是精度,那么最終的一致性是可以接受的。為了優(yōu)化精度和性能,數(shù)據(jù)庫應(yīng)該提供可調(diào)的一致性。
第IV部分
為什么MongoDB適合深度學(xué)習(xí)?
如果你沒有閱讀第III部分的內(nèi)容,強力推薦閱讀一下,以更多地了解在做深度學(xué)習(xí)項目時選擇數(shù)據(jù)庫應(yīng)該考慮的關(guān)鍵因素有哪些。在以下的講解部分中,開發(fā)者和數(shù)據(jù)科學(xué)家可以利用MongoDB作為一個靈活、可擴展、高性能的分布式數(shù)據(jù)庫來滿足人工智能應(yīng)用開發(fā)的嚴峻考驗。
靈活的數(shù)據(jù)模型
MongoDB的文檔數(shù)據(jù)模型,便于開發(fā)者和數(shù)據(jù)科學(xué)家存儲和結(jié)合其他任何數(shù)據(jù)庫的數(shù)據(jù),且沒有放棄利用復(fù)雜的驗證規(guī)則來管理數(shù)據(jù)的質(zhì)量。該模式可以在不停用應(yīng)用程序或數(shù)據(jù)庫的情況下動態(tài)地修改數(shù)據(jù),這是由關(guān)系數(shù)據(jù)庫系統(tǒng)的模式修改或重新設(shè)計的代價高所引起的。
這種數(shù)據(jù)模型的靈活性對于深度學(xué)習(xí)是特別有價值的,這需要不斷的實驗來發(fā)現(xiàn)新的見解和預(yù)測:
輸入數(shù)據(jù)集可以包括快速變化的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)集可以從點擊流、日志文件、社交網(wǎng)絡(luò)和物聯(lián)網(wǎng)傳感器流、CSV文件、txt文本、圖像、視頻等,這些數(shù)據(jù)集很多都不能映射成關(guān)系數(shù)據(jù)庫固定的行和列格式。
深度學(xué)習(xí)的訓(xùn)練過程中往往會增加新的隱藏層、特征標簽、參數(shù)以及輸入數(shù)據(jù),這需要頻繁地修改底層數(shù)據(jù)模型。
因此,一個支持各種輸入數(shù)據(jù)集的數(shù)據(jù)庫能夠無縫地修改模型訓(xùn)練的參數(shù),這對于深度學(xué)習(xí)而言是不可多得的。
豐富的編程和查詢模型
MongoDB為開發(fā)者和數(shù)據(jù)科學(xué)家提供本地驅(qū)動程序和認證連接來建立深度學(xué)習(xí)模型,PyMongo驅(qū)動器是一個用于MongoDB的Python工具,也是一個被推薦的Python操作MongoDB數(shù)據(jù)庫的方式。社區(qū)也開發(fā)了R語言的MongoDB客戶端,這也可用于R語言程序員。
MongoDB的查詢語句和豐富的二級索引使得開發(fā)人員能夠開發(fā)應(yīng)用程序,可以以多種方式查詢和數(shù)據(jù)分析。數(shù)據(jù)可以在毫秒級的響應(yīng)時間內(nèi)通過單鍵、范圍、文本搜索、圖表和地理空間查詢到復(fù)雜的聚合和MapReduce任務(wù)。
為了在分布式數(shù)據(jù)庫集群上并行處理數(shù)據(jù),MongoDB提供了聚合管道(aggregation pipeline)和MapReduce。MongoDB聚合管道是仿照數(shù)據(jù)處理管道的基本原理設(shè)計,數(shù)據(jù)經(jīng)過一個一個的階段,每階段將數(shù)據(jù)處理后的結(jié)果傳遞給下一個階段,最終得到多重處理后的結(jié)果。其中,最基本的管道階段提供像查詢等操作的過濾器及輸出文檔格式的轉(zhuǎn)換等功能,其它管道操作提供按特定字段對文檔進行分組、排序以及聚合數(shù)組中的內(nèi)容等功能。此外,管道階段可以使用操作符進行相關(guān)計算,比如計算跨文檔集合的平均值或標準差等。MongoDB同樣也提供了原生MapReduce操作,使用JavaScript函數(shù)來執(zhí)行相關(guān)的map和reduce階段。
除了原生的查詢框架外,MongoDB同樣也提供了針對Apache Spark的一種高性能連接器,該連接器連接了Spark所有的庫,包括Python、R、Scala和Java。對于機器學(xué)習(xí)、圖表以及SQL API等分析而言,MongoDB數(shù)據(jù)可以作為其數(shù)據(jù)幀和數(shù)據(jù)集。
針對于Apache Spark的MongoDB連接器可以利用好MongoDB的聚合管道以及提取、篩選和處理其所需數(shù)據(jù)范圍的二級索引。比如,分析特定地理位置的所有客戶這一任務(wù),簡單的非關(guān)系數(shù)據(jù)存儲不支持二級或在數(shù)據(jù)庫中聚合。而在這種情況下,Spark需要基于簡單的主鍵提取所有數(shù)據(jù),這意味著數(shù)據(jù)科學(xué)家和工程師們在進行該過程時需要更多的時間上和硬件上的開銷。為了最大限度地提高性能,對于分布式數(shù)據(jù)集而言,MongoDB連接器可以將彈性分布數(shù)據(jù)集(RDDs)和源MongoDB節(jié)點同地協(xié)作,進而最小化跨集群之間的數(shù)據(jù)移動并減少延遲。
可升縮性和冗余性
模型的訓(xùn)練時間可以通過建立一個深度學(xué)習(xí)平臺以及可擴展數(shù)據(jù)庫層來減少,MongoDB提供了以下一些措施來盡可能地增大吞吐量以及盡可能地減少深度學(xué)習(xí)工作負載的延遲。
WiredTiger是MongoDB的默認存儲引擎,也是世界上部署最廣泛的嵌入式數(shù)據(jù)管理軟件,它是基于現(xiàn)代多核架構(gòu),并使用了多種編程技術(shù),如風(fēng)險指針、無鎖算法、快速鎖定和消息傳遞等。WiredTiger盡可能地增大每個CPU核和時鐘周期內(nèi)的計算工作量,此外,WiredTiger使用緊湊的文件格式和壓縮存儲盡可能地減少磁盤開銷。
對于大多數(shù)對延遲敏感的深度學(xué)習(xí)應(yīng)用而言,MongoDB可以配置存儲引擎?;赪iredTiger這個存儲引擎,可以在不犧牲傳統(tǒng)數(shù)據(jù)庫提供的豐富靈活查詢、實時分析和可升縮能力的情況下,為用戶提供內(nèi)存計算的好處。
為了并行地進行模型訓(xùn)練以及縮放輸入數(shù)據(jù)集,MongoDB使用分片(sharding)技術(shù)。MongoDB分片是完全彈性地、自動地調(diào)整集群中的數(shù)據(jù)作為輸入數(shù)據(jù)集的增長,或者是添加和刪除節(jié)點。
在MongoDB集群中,每個分片數(shù)據(jù)自動分發(fā)到多個駐留在不同節(jié)點上的多個副本,其副本集提供冗余性以在訓(xùn)練數(shù)據(jù)發(fā)生故障時恢復(fù)數(shù)據(jù),并減少檢查點的開銷。
可調(diào)一致性
在一般情況下,MongoDB具有強一致性。啟動深度學(xué)習(xí)應(yīng)用程序可用立體讀取已寫入的數(shù)據(jù)庫中的內(nèi)容,從而避免了最終一致性系統(tǒng)導(dǎo)致的開發(fā)人員復(fù)雜。強一致性會為機器學(xué)習(xí)算法提供最準確的結(jié)果,然而,在某些情況下,如隨機梯度下降算法(SGD),其結(jié)果不是很好但尚可接受。
MongoDB人工智能部署情況
基于MongoDB具備上述討論的性質(zhì),MongoDB已經(jīng)作為許多人工智能和深度學(xué)習(xí)平臺的數(shù)據(jù)庫,不同應(yīng)用程序和行業(yè)用戶的選擇如下:
IBM Watson:分析與可視化
沃森分析是IBM的云托管服務(wù),提供智能數(shù)據(jù)發(fā)現(xiàn)來指導(dǎo)數(shù)據(jù)探索、自動預(yù)測分析和可視化輸出。沃森分析應(yīng)用場景十分廣泛,比如銀行、保險、零售、電信、石油和政府應(yīng)用等。MongoDB被用來管理數(shù)據(jù)存儲,提供所有源數(shù)據(jù)集的元數(shù)據(jù)和分析可視化,并存儲在豐富的JSON文檔結(jié)構(gòu)中,可以支持數(shù)以萬計的用戶并發(fā)訪問服務(wù)。
x.ai:個人助理
x.ai是智能驅(qū)動的個人助理,它能夠為用戶安排會議。用戶將他們的日歷連接到x.ai上,然后只要郵件抄送給amy@x.ai,該公司的虛擬私人助理Amy就能接手你的會議日常安排。MongoDB作為x.ai的整個平臺記錄系統(tǒng),支持所有的服務(wù),包括自然語言處理、有監(jiān)督學(xué)習(xí)、分析和電子郵件通信等。MongoDB靈活的數(shù)據(jù)模型成為使得x.ai迅速適應(yīng)于訓(xùn)練集和輸入數(shù)據(jù)集的關(guān)鍵,同時也支持復(fù)雜的數(shù)據(jù)結(jié)構(gòu)。更多內(nèi)容可以看此案例了解。
汽車貿(mào)易商:預(yù)測價值
英國最大的汽車市場廣泛應(yīng)用機器學(xué)習(xí),使用的關(guān)于車的規(guī)格及細節(jié)數(shù)據(jù)都存儲在MongoDB中。比如,先前車主的個數(shù)、顏色、里程數(shù)、保險歷史等。這些數(shù)據(jù)由汽車貿(mào)易商的數(shù)據(jù)科學(xué)團隊編寫的機器學(xué)習(xí)算法提取得到,并建立模型以預(yù)測準確的價值,然后再寫入數(shù)據(jù)庫中,選擇MongoDB由于其靈活的數(shù)據(jù)模型和分布式設(shè)計。更多內(nèi)容可以看此案例了解。
Mintigo:銷售和市場預(yù)測
Mintigo是一家以企業(yè)為重點的預(yù)測市場和銷售的平臺。在B2B營銷領(lǐng)域,Mintigo利用數(shù)據(jù)進行營銷分析和預(yù)測,識別最有可能購買其產(chǎn)品的潛在客戶,幫助公司客戶提升銷量。Mintigo運行在AWS上,是用Python編寫的機器學(xué)習(xí)算法。MongoDB被用來存儲TB量級的數(shù)據(jù)集,這是看中了其數(shù)據(jù)流采集和存儲的可擴展性和靈活性、高效的查詢框架和二級索引,而無需掃描數(shù)據(jù)庫中的所有記錄。更多內(nèi)容可以看此案例了解。
零售定位分析
一個美國的移動APP開發(fā)者在MongoDB上建立的智能引擎,實時處理和存儲數(shù)以百萬計顧客的豐富地理空間數(shù)據(jù)點。該智能引擎使用可伸縮的機器學(xué)習(xí)和多維分析技術(shù)來展示行為模式,允許零售商通過移動設(shè)備預(yù)測和定位目標客戶。MongoDB支持具有復(fù)雜索引和查詢的空間數(shù)據(jù)結(jié)構(gòu),為機器學(xué)習(xí)算法提供基礎(chǔ)。MongoDB的分片擴展設(shè)計使得公司可以容納10-100百萬的客戶數(shù)據(jù)點。
自然語言處理(NLP)
一個北美的人工智能開發(fā)者已經(jīng)構(gòu)建了由主要消費電子產(chǎn)品嵌入到智能家居和移動設(shè)備中的自然語言處理軟件。設(shè)備和用戶之間的所有交互都存儲在MongoDB中,然后反饋給學(xué)習(xí)算法。選擇MongoDB的原因是其架構(gòu)的靈活性,且支持快速變化的數(shù)據(jù)結(jié)構(gòu)。
將數(shù)據(jù)科學(xué)引入人才招聘
該公司與財富500強的人力資源部門合作,利用數(shù)據(jù)科學(xué)和員工情況處理成堆的簡歷和候選者。該公司通過將人工智能應(yīng)用于簡歷以外的數(shù)據(jù)數(shù)千個信息源,包括公共的和企業(yè)數(shù)據(jù),為申請者提供實時分析和優(yōu)先次序。通過人工智能算法產(chǎn)生的預(yù)測分析,招聘人員可以立即確定主動申請以及潛在的應(yīng)聘者中最佳的候選人,加快整個招聘過程、降低雇傭成本。選擇MongoDB作為底層數(shù)據(jù)庫是由于其數(shù)據(jù)模型的靈活性和可伸縮性,此外,大范圍的安全管理權(quán)保護了個人可識別信息(PII)。
海外華文客戶端
德勤報告表示物聯(lián)網(wǎng)變得更加智能。公司正在將人工智能(特別是機器學(xué)習(xí))整合到他們的物聯(lián)網(wǎng)應(yīng)用程序中,并觀察功能的增長,包括提高運營效率并幫助避免意外停機。關(guān)鍵:洞察數(shù)據(jù)。
ITH是一波投資,一系列新產(chǎn)品和企業(yè)部署的崛起,人工智能正在物聯(lián)網(wǎng)(IoT)中掀起一陣熱潮。制定物聯(lián)網(wǎng)戰(zhàn)略,評估潛在的新物聯(lián)網(wǎng)項目或試圖從現(xiàn)有物聯(lián)網(wǎng)部署中獲得更多價值的公司可能需要探索人工智能的作用。
信號
以人工智能為重點的物聯(lián)網(wǎng)創(chuàng)業(yè)公司的風(fēng)險投資正在快速增長:2017年前8個月,這個類別的初創(chuàng)公司籌集了7.05億美元
以人工智能為重點的物聯(lián)網(wǎng)創(chuàng)業(yè)公司并購數(shù)量增加:2017年前8個月為21個,2016年為24個,高于2015年的11個
包括亞馬遜,通用電氣,IBM,微軟,甲骨文,PTC和Salesforce在內(nèi)的IoT平臺供應(yīng)商正在整合AI功能
跨行業(yè)的大型組織已經(jīng)在利用物聯(lián)網(wǎng)來借助或探索人工智能的力量,提供新產(chǎn)品并更高效地運營
Gartner預(yù)測,到2022年,超過80%的企業(yè)物聯(lián)網(wǎng)項目將包含一個AI組件,今天只有10%
AI是解鎖物聯(lián)網(wǎng)潛力的鑰匙
人工智能在物聯(lián)網(wǎng)應(yīng)用和部署中扮演著越來越重要的角色,這一領(lǐng)域的公司行為顯然發(fā)生了變化。使用AI的物聯(lián)網(wǎng)初創(chuàng)企業(yè)的風(fēng)險投資大幅增加。在過去的兩年里,公司已經(jīng)收購了數(shù)十家在人工智能和物聯(lián)網(wǎng)交叉點工作的公司。物聯(lián)網(wǎng)平臺軟件的主要供應(yīng)商現(xiàn)在提供集成的AI功能,如基于機器學(xué)習(xí)的分析。
人工智能在物聯(lián)網(wǎng)中扮演著主要角色,因為它能夠快速從數(shù)據(jù)中獲取洞察力。機器學(xué)習(xí)是一項人工智能技術(shù),它可以自動識別模式并檢測智能傳感器和設(shè)備生成的數(shù)據(jù)中的異常情況,諸如溫度,壓力,濕度,空氣質(zhì)量,振動和聲音等信息。各公司發(fā)現(xiàn)機器學(xué)習(xí)可以比傳統(tǒng)的商業(yè)智能工具在分析物聯(lián)網(wǎng)數(shù)據(jù)方面具有顯著優(yōu)勢,包括能夠比基于閾值的監(jiān)控系統(tǒng)提前20倍和更高的準確度進行運營預(yù)測。而其他人工智能技術(shù),如語音識別和計算機視覺可以幫助從過去需要人工評估的數(shù)據(jù)中獲得見解。
AI和物聯(lián)網(wǎng)技術(shù)的強大組合幫助公司避免意外停機,提高運營效率,啟用新產(chǎn)品和服務(wù),并加強風(fēng)險管理。
避免昂貴的非計劃停機時間
在一些行業(yè)中,設(shè)備故障導(dǎo)致的意外停機可能造成嚴重損失。例如,根據(jù)一項研究,海上石油和天然氣經(jīng)營者每年平均損失3800萬美元。另一個消息估計,對于工業(yè)制造業(yè)來說,意外停機時間每年花費500億美元,設(shè)備故障導(dǎo)致42%的停機。
使用預(yù)測性維護分析功能提前預(yù)測設(shè)備故障,以便安排有序的維護程序,可以減少非計劃停機的破壞性經(jīng)濟性。例如,在制造業(yè)中,德勤發(fā)現(xiàn)預(yù)測性維護可以將維護計劃縮短20-50%,將設(shè)備正常運行時間和可用性增加10-20%,并將整體維護成本降低5-10%。
由于人工智能技術(shù),特別是機器學(xué)習(xí),可以幫助識別模式和異常情況,并基于大量數(shù)據(jù)進行預(yù)測,因此它們在實施預(yù)測性維護方面尤其有用。例如,領(lǐng)先的韓國煉油商SK Innovation通過使用機器學(xué)習(xí)預(yù)測連接的壓縮機預(yù)計故障可節(jié)省“數(shù)十億韓元”。同樣,意大利列車運營商Trenitalia希望避免意外停機,并節(jié)省8-10%的年度維護成本13億歐元。與此同時,法國電力公司EDF集團已經(jīng)通過機器學(xué)習(xí)驅(qū)動的設(shè)備故障預(yù)警節(jié)省了超過100萬美元。
提高運營效率
人工智能驅(qū)動的物聯(lián)網(wǎng)可以做的不僅僅是幫助避免意外停機。它還可以幫助提高運營效率。這部分得益于機器學(xué)習(xí)的力量,以產(chǎn)生快速、準確的預(yù)測和深刻見解,以及AI技術(shù)能夠使越來越多的任務(wù)自動化完成。
例如,對于Hershey來說,在生產(chǎn)過程中管理其產(chǎn)品的重量至關(guān)重要:重量精度每提高1%,就意味著可以為14,000加侖的Twizzlers等一批產(chǎn)品節(jié)省超過500,000美元的成本。該公司使用物聯(lián)網(wǎng)和機器學(xué)習(xí)來顯著是減少生產(chǎn)過程中的重量變化。第二個數(shù)據(jù)被捕獲和分析,重量變化可以通過機器學(xué)習(xí)模型進行預(yù)測,每天可以進行240個工藝調(diào)整,而安裝ML驅(qū)動的IoT解決方案前每天僅有12個。
基于人工智能的預(yù)測也有助于谷歌削減40%的數(shù)據(jù)中心冷卻成本。該解決方案通過對設(shè)施內(nèi)傳感器數(shù)據(jù)進行培訓(xùn),預(yù)測下一小時的溫度和壓力,以指導(dǎo)限制功耗的操作。
機器學(xué)習(xí)產(chǎn)生了深刻的見解,說服一家船隊運營商采取反直覺行動,為他們節(jié)省了大筆資金。從船載傳感器收集的數(shù)據(jù)被用來識別清洗船體的成本和燃油效率之間的相關(guān)性。分析表明,通過每年清洗船體兩次而不是每兩年清潔船體(從而將清潔費用翻兩番),由于燃油效率更高,最終可節(jié)省40萬美元。
實現(xiàn)新的和改進的產(chǎn)品和服務(wù)
物聯(lián)網(wǎng)技術(shù)與人工智能相結(jié)合,可以為改進并最終實現(xiàn)全新的產(chǎn)品和服務(wù)奠定基礎(chǔ)。例如,對于通用電氣的無人機和基于機器人的工業(yè)檢測服務(wù),公司希望AI能夠?qū)崿F(xiàn)檢測設(shè)備的導(dǎo)航自動化,并從他們捕獲的數(shù)據(jù)中識別缺陷。這可能會導(dǎo)致更安全,更精確,并且為客戶提供便宜高達25%的檢查。在醫(yī)療保健方面,費城托馬斯杰佛遜大學(xué)醫(yī)院試圖通過自然語言處理改善患者體驗,使患者能夠控制房間環(huán)境并通過語音命令請求各種信息。
與此同時,勞斯萊斯計劃盡快推出具有物聯(lián)網(wǎng)功能的飛機發(fā)動機維護服務(wù)新產(chǎn)品。該公司計劃使用機器學(xué)習(xí)來幫助其發(fā)現(xiàn)模式并確定將出售給航空公司的運營見解。汽車制造商Navistar正在研究實時連接車輛數(shù)據(jù)的機器學(xué)習(xí)分析,以實現(xiàn)車輛健康診斷和預(yù)測性維護服務(wù)的新收入流。根據(jù)Navistar技術(shù)合作伙伴Cloudera的說法,這些服務(wù)幫助近30萬輛汽車減少了高達40%的停機時間。
加強風(fēng)險管理
將物聯(lián)網(wǎng)與AI結(jié)合在一起的許多應(yīng)用程序,正在幫助企業(yè)更好地理解和預(yù)測各種風(fēng)險,以及自動執(zhí)行快速響應(yīng),使他們能夠更好地管理工作人員安全,財務(wù)損失和網(wǎng)絡(luò)威脅。
例如,富士通已經(jīng)在使用機器學(xué)習(xí)技術(shù)來分析連接可穿戴設(shè)備的數(shù)據(jù),以評估其工廠工人可能會在一段時間內(nèi)積累的潛在熱應(yīng)力。印度和北美的銀行已經(jīng)開始對ATM機中聯(lián)網(wǎng)監(jiān)控攝像頭的可疑活動進行實時識別。汽車保險公司進步正利用機器學(xué)習(xí)對聯(lián)網(wǎng)汽車的數(shù)據(jù)進行分析,從而準確地為其基于美國的保費定價,從而更好地管理承保風(fēng)險。拉斯維加斯已經(jīng)轉(zhuǎn)向了一種機器學(xué)習(xí)解決方案,以確保其智能城市計劃的安全,旨在實時檢測和應(yīng)對威脅。
對企業(yè)的影響
對于不同行業(yè)的企業(yè),人工智能有望提升物聯(lián)網(wǎng)部署所創(chuàng)造的價值,從而實現(xiàn)更好的產(chǎn)品和運營,從而在業(yè)務(wù)績效中發(fā)揮競爭優(yōu)勢。
考慮新的基于物聯(lián)網(wǎng)項目的高管們應(yīng)該意識到,預(yù)測功能的機器學(xué)習(xí)現(xiàn)在已經(jīng)與大多數(shù)橫向和工業(yè)物聯(lián)網(wǎng)平臺集成在一起,如微軟 Azure 物聯(lián)網(wǎng),IBM 沃森物聯(lián)網(wǎng)T,亞馬遜AWS物聯(lián)網(wǎng),通用電氣Predix和PTC ThingWorx。
越來越多的交鑰匙,捆綁或垂直物聯(lián)網(wǎng)解決方案利用機器學(xué)習(xí)等AI技術(shù)。例如,對于連接汽車的使用案例,寶馬的CarData平臺可以訪問車主分享的數(shù)據(jù)以及IBM 沃森物聯(lián)網(wǎng)的AI功能。在消費品和零售業(yè)中,一些補貨自動化和優(yōu)化解決方案使用機器學(xué)習(xí)來預(yù)測需求并優(yōu)化庫存水平。汽車保險行業(yè)的遠程信息處理解決方案提供商正在整合機器學(xué)習(xí),以創(chuàng)建更準確的風(fēng)險模型并預(yù)測索賠行為。
使用人工智能技術(shù)可能會從物聯(lián)網(wǎng)部署中獲得更多價值,而這些部署并非是在設(shè)計時考慮到使用人工智能而設(shè)計的。例如,一家匈牙利石油和天然氣公司將機器學(xué)習(xí)應(yīng)用于柴油生產(chǎn)過程中已經(jīng)收集到的傳感器數(shù)據(jù)。該分析使公司能夠更準確地預(yù)測燃料的硫含量,并幫助識別過程改進,現(xiàn)在每年為該公司節(jié)省超過600,000美元。主要的橫向和工業(yè)物聯(lián)網(wǎng)平臺 —— 企業(yè)可能已經(jīng)在使用 —— 正在提供新的基于人工智能的功能,可能有助于提升現(xiàn)有部署的價值。
物聯(lián)網(wǎng)的未來就是AI
很快就很難找到一個不能使用AI的物聯(lián)網(wǎng)實現(xiàn)。國際數(shù)據(jù)公司IDC預(yù)測,到2019年,AI將支持“所有有效的”物聯(lián)網(wǎng)工作,如果沒有人工智能,部署的數(shù)據(jù)將具有“有限的價值”。越來越多的物聯(lián)網(wǎng)供應(yīng)商提供至少基本的AI支持。各行業(yè)的先鋒公司已經(jīng)在其物聯(lián)網(wǎng)部署中獲得了AI的好處。如果你的公司有實施基于物聯(lián)網(wǎng)的解決方案的計劃,那么這些計劃也應(yīng)該包括人工智能。
人工智能賽博物理操作系統(tǒng)
AI-CPS OS
“人工智能賽博物理操作系統(tǒng)”(新一代技術(shù)+商業(yè)操作系統(tǒng)“AI-CPS OS”:云計算+大數(shù)據(jù)+物聯(lián)網(wǎng)+區(qū)塊鏈+人工智能)分支用來的今天,企業(yè)領(lǐng)導(dǎo)者必須了解如何將“技術(shù)”全面滲入整個公司、產(chǎn)品等“商業(yè)”場景中,利用AI-CPS OS形成數(shù)字化+智能化力量,實現(xiàn)行業(yè)的重新布局、企業(yè)的重新構(gòu)建和自我的煥然新生。
AI-CPS OS的真正價值并不來自構(gòu)成技術(shù)或功能,而是要以一種傳遞獨特競爭優(yōu)勢的方式將自動化+信息化、智造+產(chǎn)品+服務(wù)和數(shù)據(jù)+分析一體化,這種整合方式能夠釋放新的業(yè)務(wù)和運營模式。如果不能實現(xiàn)跨功能的更大規(guī)模融合,沒有顛覆現(xiàn)狀的意愿,這些將不可能實現(xiàn)。
領(lǐng)導(dǎo)者無法依靠某種單一戰(zhàn)略方法來應(yīng)對多維度的數(shù)字化變革。面對新一代技術(shù)+商業(yè)操作系統(tǒng)AI-CPS OS顛覆性的數(shù)字化+智能化力量,領(lǐng)導(dǎo)者必須在行業(yè)、企業(yè)與個人這三個層面都保持領(lǐng)先地位:
重新行業(yè)布局:你的世界觀要怎樣改變才算足夠?你必須對行業(yè)典范進行怎樣的反思?
重新構(gòu)建企業(yè):你的企業(yè)需要做出什么樣的變化?你準備如何重新定義你的公司?
重新打造自己:你需要成為怎樣的人?要重塑自己并在數(shù)字化+智能化時代保有領(lǐng)先地位,你必須如何去做?
AI-CPS OS是數(shù)字化智能化創(chuàng)新平臺,設(shè)計思路是將大數(shù)據(jù)、物聯(lián)網(wǎng)、區(qū)塊鏈和人工智能等無縫整合在云端,可以幫助企業(yè)將創(chuàng)新成果融入自身業(yè)務(wù)體系,實現(xiàn)各個前沿技術(shù)在云端的優(yōu)勢協(xié)同。AI-CPS OS形成的數(shù)字化+智能化力量與行業(yè)、企業(yè)及個人三個層面的交叉,形成了領(lǐng)導(dǎo)力模式,使數(shù)字化融入到領(lǐng)導(dǎo)者所在企業(yè)與領(lǐng)導(dǎo)方式的核心位置:
精細:這種力量能夠使人在更加真實、細致的層面觀察與感知現(xiàn)實世界和數(shù)字化世界正在發(fā)生的一切,進而理解和更加精細地進行產(chǎn)品個性化控制、微觀業(yè)務(wù)場景事件和結(jié)果控制。
智能:模型隨著時間(數(shù)據(jù))的變化而變化,整個系統(tǒng)就具備了智能(自學(xué)習(xí))的能力。
高效:企業(yè)需要建立實時或者準實時的數(shù)據(jù)采集傳輸、模型預(yù)測和響應(yīng)決策能力,這樣智能就從批量性、階段性的行為變成一個可以實時觸達的行為。
不確定性:數(shù)字化變更顛覆和改變了領(lǐng)導(dǎo)者曾經(jīng)仰仗的思維方式、結(jié)構(gòu)和實踐經(jīng)驗,其結(jié)果就是形成了復(fù)合不確定性這種顛覆性力量。主要的不確定性蘊含于三個領(lǐng)域:技術(shù)、文化、制度。
邊界模糊:數(shù)字世界與現(xiàn)實世界的不斷融合成CPS不僅讓人們所知行業(yè)的核心產(chǎn)品、經(jīng)濟學(xué)定理和可能性都產(chǎn)生了變化,還模糊了不同行業(yè)間的界限。這種效應(yīng)正在向生態(tài)系統(tǒng)、企業(yè)、客戶、產(chǎn)品快速蔓延。
AI-CPS OS形成的數(shù)字化+智能化力量通過三個方式激發(fā)經(jīng)濟增長:
創(chuàng)造虛擬勞動力,承擔需要適應(yīng)性和敏捷性的復(fù)雜任務(wù),即“智能自動化”,以區(qū)別于傳統(tǒng)的自動化解決方案;
對現(xiàn)有勞動力和實物資產(chǎn)進行有利的補充和提升,提高資本效率;
人工智能的普及,將推動多行業(yè)的相關(guān)創(chuàng)新,開辟嶄新的經(jīng)濟增長空間。
給決策制定者和商業(yè)領(lǐng)袖的建議:
超越自動化,開啟新創(chuàng)新模式:利用具有自主學(xué)習(xí)和自我控制能力的動態(tài)機器智能,為企業(yè)創(chuàng)造新商機;
迎接新一代信息技術(shù),迎接人工智能:無縫整合人類智慧與機器智能,重新
評估未來的知識和技能類型;
制定道德規(guī)范:切實為人工智能生態(tài)系統(tǒng)制定道德準則,并在智能機器的開
發(fā)過程中確定更加明晰的標準和最佳實踐;
重視再分配效應(yīng):對人工智能可能帶來的沖擊做好準備,制定戰(zhàn)略幫助面臨
較高失業(yè)風(fēng)險的人群;
開發(fā)數(shù)字化+智能化企業(yè)所需新能力:員工團隊需要積極掌握判斷、溝通及想象力和創(chuàng)造力等人類所特有的重要能力。對于中國企業(yè)來說,創(chuàng)造兼具包容性和多樣性的文化也非常重要。
子曰:“君子和而不同,小人同而不和?!? 《論語·子路》云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、區(qū)塊鏈和 人工智能,像君子一般融合,一起體現(xiàn)科技就是生產(chǎn)力。
如果說上一次哥倫布地理大發(fā)現(xiàn),拓展的是人類的物理空間。那么這一次地理大發(fā)現(xiàn),拓展的就是人們的數(shù)字空間。在數(shù)學(xué)空間,建立新的商業(yè)文明,從而發(fā)現(xiàn)新的創(chuàng)富模式,為人類社會帶來新的財富空間。云計算,大數(shù)據(jù)、物聯(lián)網(wǎng)和區(qū)塊鏈,是進入這個數(shù)字空間的船,而人工智能就是那船上的帆,哥倫布之帆!
新一代技術(shù)+商業(yè)的人工智能賽博物理操作系統(tǒng)AI-CPS OS作為新一輪產(chǎn)業(yè)變革的核心驅(qū)動力,將進一步釋放歷次科技革命和產(chǎn)業(yè)變革積蓄的巨大能量,并創(chuàng)造新的強大引擎。重構(gòu)生產(chǎn)、分配、交換、消費等經(jīng)濟活動各環(huán)節(jié),形成從宏觀到微觀各領(lǐng)域的智能化新需求,催生新技術(shù)、新產(chǎn)品、新產(chǎn)業(yè)、新業(yè)態(tài)、新模式。引發(fā)經(jīng)濟結(jié)構(gòu)重大變革,深刻改變?nèi)祟惿a(chǎn)生活方式和思維模式,實現(xiàn)社會生產(chǎn)力的整體躍升。
產(chǎn)業(yè)智能官 AI-CPS
用“人工智能賽博物理操作系統(tǒng)”(新一代技術(shù)+商業(yè)操作系統(tǒng)“AI-CPS OS”:云計算+大數(shù)據(jù)+物聯(lián)網(wǎng)+區(qū)塊鏈+人工智能),在場景中構(gòu)建狀態(tài)感知-實時分析-自主決策-精準執(zhí)行-學(xué)習(xí)提升的認知計算和機器智能;實現(xiàn)產(chǎn)業(yè)轉(zhuǎn)型升級、DT驅(qū)動業(yè)務(wù)、價值創(chuàng)新創(chuàng)造的產(chǎn)業(yè)互聯(lián)生態(tài)鏈。
本文系“產(chǎn)業(yè)智能官”(公眾號ID:AI-CPS)收集整理,轉(zhuǎn)載請注明出處!
版權(quán)聲明:由產(chǎn)業(yè)智能官(公眾號ID:AI-CPS)推薦的文章,除非確實無法確認,我們都會注明作者和來源。部分文章推送時未能與原作者取得聯(lián)系。若涉及版權(quán)問題,煩請原作者聯(lián)系我們,與您共同協(xié)商解決。聯(lián)系、投稿郵箱:erp_vip@hotmail.com