在 20 世紀 50 年代,一個能夠進行長除法的計算器,在現在看來很難說是 AI 中的一項先進技術。這就是這一領域中的“奇怪悖論” ——新技術出現后并入主流,它們對我們來說就變得不可見了。
人工智能本身并不是一種趨勢,而是當代最重要的技術發展。它不是一種技術趨勢,而是繼制表時代、編程時代之后的第三個計算時代,它連接著我們生活、商業、管理的方方面面。
2019 年,九家大型科技公司將主導 AI 領域,包括六家美國公司,三家中國公司,它們將對人工智能的未來負有最大的責任,分別是美國的 G-MAFIA——谷歌、亞馬遜、微軟、蘋果、IBM 和 Facebook。在中國,它們是 BAT——百度、阿里巴巴和騰訊。
這九家公司主要負責絕大部分 AI 研究、資金、政府參與和消費級應用。大學的研究人員和實驗室將依賴這些公司提供的數據、工具和資金。九大巨頭也負責合并和收購、資助 AI 初創公司,并支持下一代開發人員。
美國政府還沒有人工智能方面的大戰略,也沒有長期規劃,而是將 AI 的基礎研究有效地外包給商業部門和華爾街。與此同時,在中國,人工智能的發展軌道和政府拴在了一起。百度、騰訊和阿里巴巴以及所有涉及 AI 的公司,發展都要受到政府的限制。中國正在迅速奠定成為 AI 霸主的基礎。
不要過分樂觀或恐懼
當談到 AI 時,我們總是過于樂觀或恐懼,AI 將導致失業、殺死人類的論調不絕于耳。但是,隨著時間的流逝,我們越來越忽視 AI 取得的重大突破和進步,數據的獲取和探索的過程變得越來越模糊,自動化決策系統的決策機制越來越不透明。這就種下了不信任和誤解的種子。
在消費級人臉產品和應用中的 AI 趨勢
現在,專業研究人員使用的高技術 AI 應用程序已經在轉向更輕巧、用戶友好的應用程序。新的自動化機器學習平臺,如 DataRobot,使得非專家也可以構建和部署預測模型。在不久的將來,我們很可能可以在日常生活和工作中使用各種 AI 應用程序,就像我們今天使用 Microsoft Office 或 Google Docs 一樣。
數字助理(DAS),如 Siri、Alexa,以及它們的中國“同行”天貓,利用語義和自然語言處理和數據預測我們想要什么,或者下一步需要做什么?,F在,已經有成千上萬的應用程序和小工具可以跟蹤和響應 DA。舉一個例子,亞馬遜的 Alexa 在 2018 年推出了 4000 個小工具,現在有超過 28000 個設備與亞馬遜的 DA 集成。隨著設備價格的下降(如價格低于 20 美元的入門級揚聲器),系統與我們互動的能力越來越強,可以預測,在 2019 年 DA 將無處不在。
它也被稱為“零 UI”,我們的現代接口其實越來越像氛圍音樂,能夠在少量指導的前提下為我們做更多的事,且能夠吸引我們的注意力。我們將不再依靠單個輸入屏幕,或者很多屏幕,而是更加無障礙地與計算機進行交互。
在信息時代,普通成年人每天要做出超過 20000 個大大小小的決定,而新型數字助理將代替我們優化決策分配任務,甚至根據環境自動回復。這些決定很有可能不需要你的直接監督或輸入。氛圍設計變得如此具有吸引力,是因為在不遠的未來它能夠減少我們所做的決定。我們可以將之視為一種意愿自動完成機制。我們將主動和被動地與可用設備、恒溫器、汽車或口袋中的 DA 進行互動,他們會在后臺聽取和觀察,有時甚至會提問,有時還會根據需要為我們提供文本、音頻或觸覺通知,所有這些將由算法決定。梅特卡夫定律(Metcalfe's law:一個網絡的價值等于該網絡內的節點數的平方,而且該網絡的價值與聯網的用戶數的平方成正比)解釋了環境接口的定義。
隨著越來越多的人成為環境信息網絡的一部分,我們將來會看到更多的環境接口用例。
深度移動鏈接自智能手機出現起就已存在,它使我們可以更輕松地在所有手機應用中查找和共享數據。有三種深層次的聯系:傳統的、延遲的和語境的。傳統的深層鏈接可以從一個應用或網站重定位用戶:比如當你點擊某人在 Twitter 上發布的華爾街日報鏈接,只要你安裝了 WSJ 應用程序,它就可以在 WSJ 應用程序中自動打開。如果安裝了應用程序,延遲深層鏈接可以直接鏈接到內容,也可以連接到應用商店以下載應用程序。上下文深層鏈接提供更多的信息,它們可以將你從網站帶到 App,從 App 帶到網站,或從 App 帶到 App,還可以提供個性化信息。
隨著機器學習的進步,針對個人用戶習慣量身定制的應用到應用體驗可能會變得更加普及。
隨著人工智能領域的蓬勃發展,部署代碼的人數也在不斷增加。隨著自動化系統變得越來越普遍,所有代碼都會傳輸到算法中,其中一些算法會繼續生成新的算法,由此產生的過程和程序可能比最初的預期更復雜。這可能會導致不可預測性,使得理解決策過程變得更加困難。對于像 Facebook 這樣數十億算法同時工作的大公司而言,這已經是一個挑戰。
它也被稱為數字雙胞胎,許多初創公司可以構建可部署的 AI 版本,他們提供可定制、可訓練的平臺,能夠學習關于你本人的一切,作為你在網絡上的代表。Molly 是 Y Combinator 支持的一家創業公司,也是幾個新的 AI 代理商之一。它的功能更像 AMA(有問必答),在這里,每個人都可以得到關于你的信息。遇到不懂的,Molly 會“請教”你本人,學習關于你的知識。
人工智能有嚴重的偏見問題并不是秘密。這個問題是多方面的,例如:用于訓練的數據集通常來自維基百科等地,這本身就充滿了偏見。人們建造模型往往是同質的,并經常意識不到自己的偏見。隨著我們的計算機系統越來越習慣于做出決策,我們可能會發現自己被按算法做出毫無意義的分類,但這可能會產生巨大的影響。
每一天,我們都在主動(在 Facebook 上傳和標記照片)或被動地(在線搜索醫療癥狀、開車上班)創建難以想象的大量數據。這些數據經常在你未知的情況下被算法挖掘和使用,用于制作廣告,幫助潛在雇主預測我們的行為,確定我們的抵押貸款利率,甚至幫助執法預測我們是否可能犯罪。包括馬里蘭大學、哥倫比亞大學、卡內基梅隆大學、麻省理工學院、普林斯頓大學、加州大學伯克利分校、國際計算機科學研究所等多所大學的研究人員正在研究自動化決策的副作用。
毫無疑問,有人認為人工智能正在成為一個“黑匣子”,即使在該領域工作的研究人員也不了解最新的系統是如何運作的。但這并不完全正確,雖然計算機科學家、記者和計算機科學家越來越關注這一問題,認為人工智能系統不應該是個秘密。 展望未來,我們將討論 AI 是否應該、如何能夠解釋其決策,以及如何提高透明度。關于問責制的辯論也會很多。但解決這個問題面臨著一個巨大的挑戰,即透明度將要求公司公開其商業利潤的秘訣,而且要求系統同時解釋決策過程會降低輸出的速度和質量。
我們很快即將到達一個時刻,即無論是有意還是無意,我們都無法判斷數據集是否已經被篡改過。AI 系統依賴于我們的信任。如果我們不再相信結果,那么幾十年的研究和技術進步將是徒勞的。政府、企業、非營利組織等領域的領導者必須對所使用的數據和算法充滿信心。
建立信任和問責制是公開工作的一種方法,這個過程將非常復雜,因為公司、政府機關、執法機構和其他組織希望數據保密。
計算機完全按照命令行事。只要命令機器在游戲中獲勝,機器將會不惜不惜一切代價完成這個任務。顯然包括作弊。
斯坦福大學和谷歌的研究人員發現,將衛星圖像轉換為可用地圖的 AI 可能會“扣留”某些數據。這個名為 CycleGAN 的神經網絡可以學習如何映射圖像變換。例如,它可以從一張鄰居的舊航拍照片中區分街道、小巷、車道、建筑物和燈柱,并生成可供 GPS 使用的地圖。最初,他們使用了網絡尚未看到的航拍照片,由此產生的圖像看起來非常接近原始圖像。
但經過深入檢查,研究人員發現,原始圖像和生成的圖像中都有很多細節,這些細節在 AI 制作的地圖中是看不到的。事實證明,系統學會了在以低幅度高頻信號的形式產生的圖像中隱藏有關圖像內部原始圖像的信息。
2018 年發生了許多與人工智能有關的事故,但只有少數成為頭條新聞,比如一輛優步無人車在亞利桑那州坦佩致一名行人死亡。但事實上還有無數次事件沒有導致死亡,因此不為公眾所知。 目前,除非觸犯法律,研究人員沒有義務報告涉及我們的數據或 AI 流程的事故或意外。雖然大公司必須告知消費者他們的個人數據,如信用卡號碼等是否被盜,但他們并不需要公布算法根據種族或性別產生歧視的情況。
在過去的幾年里,中國在人工智能領域取得了巨大的飛躍。中國提出到 2030 年成為“世界最重要的人工智能創新中心”,作為一個國家,中國已經朝著這個目標取得了重大進展。九大巨頭中的百度、阿里巴巴和騰訊,加上其強大的學術環境,鞏固了中國作為全球人工智能霸主的地位。
阿里巴巴,中國版的亞馬遜將投資 150 億美元在未來三年內進行人工智能研究,在全球七個城市(包括加利福尼亞州圣馬特奧和華盛頓州貝爾維尤)建立研究中心。
百度(一家經常與谷歌相比的中國搜索引擎公司)在硅谷建立了一個人工智能研究中心。
騰訊(超級流行的消息應用程序微信的開發者)去年在西雅圖開設了一個人工智能實驗室,開始搜羅美國的人才。此后,騰訊還增持特斯拉和 Snap 等公司的股份。
中國企業收益不僅僅包括典型的投資回報,也更加重視知識產權??偛课挥谥袊娜斯ぶ悄軇摌I公司目前占全球投資總額的 48%。2018 年 4 月,商湯估值 45 億美元,使其成為當時全球最有價值的人工智能創業公司。與此同時,與美國同行相比,中國研究人員擁有的 AI 相關專利數量是其五倍。
接近 14 億的龐大人口為研究人員和創業公司提供了未來最有價值的資源——人類數據,而沒有世界其他大部分地區普遍存在的隱私和安全限制。如果數據是新的石油,那么中國就是新的石油輸出國組織。中國人正在挖掘的豐富數據可用于訓練人工智能的方方面面,從教育、制造到零售和軍事應用的各種模式。例如,中國創業公司曠視就是開創面紋生成技術的先驅。面紋生成是一種新型的生物識別身份驗證,它使用我們面部的骨骼結構、膚色,甚至毛細血管等特征來進行識別。這項技術安全性足以用于金融交易 ,并被中國警方廣泛用于監控。
如果中國開始影響其“一帶一路”國家將會如何?想想一下,如果這些國家強制采用國家社會信用評分系統,未經居民明確同意開始進行監控,并且有一個系統在默默打分會發生什么?
在過去的一年中,AI 生態系統的企業領導者一直在爭奪 AI 云共享份額,成為遠程服務器上值得信賴的 AI 提供商。
由于機器學習系統可以訪問的數據越多,舊可以學會做出更好的決策,因此企業客戶可能會堅持使用原始供應商。因此,AI 云的競賽開始了。在西方,該領域由亞馬遜、谷歌和微軟領導,其次是蘋果、IBM、Salesforce、SAP 和甲骨文等公司。在亞洲市場,AI 云由阿里巴巴和百度主導。這是一個價值 2500 億美元的行業,而且發展迅速。
紐約大學斯特恩商學院教授 Arun Sundararajan 講得好:“這場競賽的獎品將是成為下一個科技時代的操作系統。“
AWS、阿里巴巴云、微軟 Azure、谷歌云和百度云都為開發人員推出了新的產品和套餐,希望能讓更多人工智能創業公司更容易、成本更低地將他們的想法推向市場。亞馬遜的 AWS Lambda 讓團隊可以虛擬地運行任何類型的應用程序或后端服務代碼,而無需配置或管理服務器或實際管理。微軟 Azure 功能架構支持無數的編程語言,可根據需要進行擴展,僅對主動計算時間收費。然而,這并不適合一些工程師,他們擔心會失去控制。
法律往往落后于技術。然而,去年在亞利桑那州發生的優步無人車致命事故現在讓風險管理人員和法律部門考慮到因人工智能事故而導致意外損失的風險。我們面臨的挑戰是當前建立的法律制度是為了規范人類行為,而不是無人監督機器的行為。目前,安聯正在研究新的責任保險模型。
芯片廠商英偉達正在教 AI 構建來自短視頻剪輯的逼真 3D 環境。該方法建立在先前關于生成對抗網絡(GAN)的研究基礎上。英偉達的系統生成圖形取自自動駕駛領域使用的開源數據集,使用分割成各種類別(建筑物、天空、車輛等)的短片,英偉達訓練 GAN 生成這些物體的新的不同版本。
自動生成的虛擬環境未來應用潛力巨大:物流(倉庫、工廠、運輸中心)、城市訓練環境規劃模擬,以及測試游樂園和購物中心內的客戶流動場景等。
在建筑物內部署生物識別 ID 系統之前,公司可能需要三思而后行。機器學習新技術已經導致合成指紋和其他能夠愚弄監控系統的自動生成生物識別器出現。密歇根州立大學和紐約大學的研究人員構建了一種可以生成假貨的算法,這提醒了我們 AI 騙局的可怕之處,想象一下,惡意系統產生數百萬個指紋,遠程就可以開門或解鎖別人的電腦。
麻省理工學院計算機視覺科學家已經發現了如何利用他們所謂的“意外攝像機”,使用計算機視覺來跟蹤數據。結果,我們可能很快就會有 X 射線一樣的視力,穿墻透視。對于從事敏感項目的公司而言,這可能不是一個好消息。
從事信息安全和風險管理的人員應注意到計算機視覺的這一進步。
隨著我們進入第三個計算時代,最大的公司都開始在競爭市場份額的同時爭奪思想共享的高地。
微軟、IBM、百度、阿里巴巴、亞馬遜和谷歌等公司正在為開發人員發布軟件包,且 AI 應用程序有自己獨特的編程語言。優步發布了自己用 Python 編寫的概率編程語言 Pyro。這一舉動標志著人工智能生態系統未來可能碎片化,與我們的 OSX 與 Android 以及早期的 Mac 與 PC 陣營不同。企業將發現成本越來越高,且難以輕易在 AI 框架和語言之間切換。
我們的臺式機、筆記本電腦、平板電腦和手機中的標準 CPU 確實變得越來越強大,但它們的設計并不是為了滿足機器學習的需求。當前的 CPU 存在的問題,是它們沒有足夠的處理單元來完成下一代計算時代所需的所有連接和計算。我們在 SoC-“片上系統”中找到一套新的處理器。華為、蘋果、Alphabet、IBM、英偉達、英特爾和高通都在開發新的系統架構和 SoC,有些經過了預先訓練。簡而言之,這意味著用于 AI 項目的芯片已準備好,并且速度更快,數據更安全。 Elon Musk 表示特斯拉的新定制 AI 芯片將于 2019 年發布。谷歌的 TPU 專為 AI 深度學習而設計,適配公司采用的 TensorFlow 系統。
雖然向企業營銷預先訓練的芯片將加速 AI 芯片商業化,并進一步促進芯片研發,但是開發人員可能需要在不久的將來在不同的框架之間掙扎,尤其是當各種設備制造商都決定開始創建自有的協議。我們希望這些公司的產品最終能夠融合,競爭公司及其 SoC 和語言越少越好。
受人工智能云和無服務器計算的激勵,九大巨頭以及開發者社區都在新興的算法交易市場推出自己的算法。亞馬遜、IBM、微軟、谷歌、百度和阿里巴巴都提供預建和可定制的系統。AWS 擁有自己的市場,提供計算機視覺、語音識別和文本的模型和算法,其基礎客戶包括英特爾、CloudSight、Optpace 等。GenesisAI 為 AI 產品和服務提供市場。Algorithmia是一個通用的開放式算法市場,開發人員可以將他們的成果上傳到云端出售。Quantiacs 讓開發人員構建算法交易系統,并為算法和投資機構牽線搭橋。Nuance 是一家醫學成像 AI 算法“商店”,其 AI MarketPlace 允許用戶在購買之前試用算法。PrecisionHawk 提供預測性農業算法和模型的市場。Bonseyes 是一個歐洲的 AI 工具交易市場。2019 年,預計將出現更多通用的、云定制的市場。
目前只有九家大公司主導人工智能領域:谷歌、亞馬遜、微軟、IBM、Facebook 和蘋果在美國,以及在中國的大公司百度、阿里巴巴和騰訊(得到中國政府的大力支持)。在投資方面,高通、騰訊、英特爾投資、谷歌風險投資、英偉達、Salesforce、三星風險投資、阿里巴巴、蘋果、百度、花旗和 In-Q-Tel 正在為 AI 的成長提供大部分資金。在美國,人工智能公司的投資在 2018 年前兩個季度達到創紀錄的 42 億美元。中國的商湯完成了另一輪成功的融資,融資 6.2 億美元,估值 45 億美元。投資者包括阿里巴巴集團、富達國際和銀湖合伙公司。與所有技術一樣,只有少數幾家公司在 AI 領域占據主導地位,它們一般會壟斷人才和知識產權,并彼此合作。談到人工智能的未來,我們應該思考一個問題,整合是否意味著更大的利益,壟斷是否會破壞競爭,就像電信領域一樣。
實時機器學習的新研究可以使用連續的交易數據流來實時調整模型。這標志著數據流動和信息檢索的方式發生了巨大的變化。例如,即使是在多語言環境中,實時機器學習也可以自動翻譯語音。它可用于改進分類和預測,進行更好的個性化健康監測和更準確的風險計算。消費者可以期待收到零售商的更多定制化推薦。實時偏好不僅會使用歷史數據(客戶#1234 只喜歡紅色唇膏),而且會考慮上下文信息(顧客#1234 可能會在接下來的三周內購買紅色唇膏)。
我們被現實世界中的非結構化文本所包圍,它們存在于社交媒體、博客、公司網站、市政廳數字記錄等各個角落。NLU 允許研究人員通過提取概念、映射關系和分析情感量化并學習所有文本。NLU 將輔助從事科學和醫學、法律和政策、基礎設施、農業、交通、教育等領域的研究人員,使他們能夠比以往任何時候都能獲得更深入的見解。
2019 年,自然語言理解將在包括口音和語言識別在內的自然語言理解領域獲得進步。
對于 AI 研究人員來說,機器閱讀理解一直是一個重要且具有挑戰性的目標。MRC 使系統可以讀取、推斷意義,并在篩選大量數據集時立即得到答案。
一個消費級應用:當進行搜索查詢時,你會想要系統為你提供一個精確的答案而不僅是一個 URL 列表;一名航空機械師在飛機發生故障時為盡快解決引擎問題,計算機可以幫他閱讀所有技術文檔并提供修復建議,讓飛機盡快起飛。這是 MRC 的未來,它將不僅關注關鍵詞,經過訓練的 MRC 還可以遷移到沒有標簽或標準分類的各個領域。
MRC 是實現通用人工智能的必要步驟, 但在短期內它可能只能做到把技術手冊、歷史地圖、醫療記錄等內容轉變為易于搜索的資料庫信息。
算法可以使用自然語言生成將結構化數據變成自然語言。NLG 對于零售、金融和媒體在內的各個領域非常重要。2019 年,NLG 將成為大多數商業智能和分析平臺的標配,可以執行自動檢測、解析、可視化和敘述關鍵數據。Arria NLG、IBM Watson 文本 - 語音、亞馬遜 Polly、谷歌云文本 - 語音、Narrative Science 和 Automated Insights 都可以利用大數據集構建自然語言,幫助非數據科學人員更好地了解其組織。
NLG 在專業領域擁有無數的用例,例如協助律師、政治家、醫生、顧問、金融分析師、營銷人員及其他人將我們的個人信息作為自然語言的數據點。
芯片制造商英偉達的研究人員在 2018 年部署了一種新的生成算法,使用生成對抗網絡創建逼真的人臉。在他們的系統中,算法還可以調整各種元素,如年齡和雀斑密度。
加州大學伯克利分校的一個團隊開發了一個軟件,可以自動將視頻中一個人的動作遷移到另一個視頻中的另一個人身上。很長時間以來,我們都在訓練計算機觀看視頻并預測物理世界中的相應聲音,目的是了解現實世界中事物之間的交互方式。然而,這導致了越來越多的 AI 騙局,如虛假視頻和虛假圖像。未來,這個問題變得越來越嚴重,AI 以假亂真將引起更多的麻煩。
IBM 的 Project Debater 展示了如何在實時學習系統中使用上下文。Project Debater 可以就復雜的主題和人類辯論,通過消化大量文本,在給定主題上構建結構語言,傳達清晰的目的并反駁其對手。未來,Project Debater 將通過提供基于證據的論證,克服情緒、偏見或模糊的影響來幫助人們進行推理。Debater 只是此類新興系統的一個例子,它能夠實時學習并利用真實環境。
研究人員正在開發一種可以學習多項任務的單一算法。AlphaGo 背后的團隊開發了一種創新的算法:AlphaZero,不僅可以在圍棋中實現超人的表現,還可以在國際象棋和日本國際象棋等其他游戲中超過人類。除了游戲規則之外,這一算法沒有經過任何知識訓練,即開發出自己的策略來擊敗其他玩家。
如果計算機系統可以訪問足夠多的圖像,就可以修補并填充圖片中的空缺。我們可以利用這項技術生成更完美的圖像。
但是,這項技術下一階段將用于什么情景,產生什么影響?我們如何劃分現實與增強之間的界限?圖像補全還是執法和軍事情報人員的有力工具,計算機可以幫助他們識別取景框中的對象。鑒于機器學習算法和數據集的偏見,圖像補全未來可能引起關于隱私的爭論。
美國陸軍研究實驗室的一項新研究顯示,該系統使用一個裝有腦機接口的界面,利用計算機視覺技術讓人們在視線范圍內快速查看和分類圖像。總部位于洛杉磯的專業圖像字幕技術公司 CloudSight 正在研發一套混合眾包計算機視覺系統。
麻省理工學院 CSAIL 的研究人員訓練計算機不僅能識別視頻中的內容,還能預測人類接下來要做什么。目前,該計算機系統可以預測視頻中的兩個人是否可能擁抱、親吻、握手或擊掌。
這項研究將在某一天讓機器人能夠更輕松地探索現實環境,并從我們的肢體語言中獲取線索,和人類進行互動。它還可以應用于零售環境,以及機器操作、教室學習環境等。
深度學習系統經過訓練可以自主學習。從概念上講,深度學習不是新事物了,最近只是計算能力和可用的數據量有了變化,這意味著越來越多的人工流程將實現自動化,包括自動編寫軟件等。
深度學習受到計算機網絡處理能力的限制,就在幾年前,在 ImageNet 數據集上訓練圖像識別模型需要一個月或更長時間,現在,憑借更先進的設備,Facebook 可以在一小時內完成同樣的工作。隨著計算機變得越來越快和硬件架構的發展,我們的系統將以遠超人類的速度執行任務。
強化學習有一個問題:當代理沒有足夠的監督,或其目標是在很長一段時間內運行場景,對于它們來說是一個很大的挑戰。2019 年及以后,研究人員將嘗試使用分層強化學習解決這些問題——發現高級別的行動并有條不紊地通過學習,以人類無法想象的速度掌握新任務。這對于非技術人員來說也很重要:RL 將改善人工智能系統中的“智能”,幫助汽車學習在異常條件下行駛,幫助軍用無人機執行以前從未在現實世界中嘗試的復雜操作。
目前,深度學習技術可以幫助人類完成具體的任務,但完成任務需要嚴謹的順序:收集數據、確定目標、部署算法,這個過程需要人類操作且非常耗時,尤其是在需要監督訓練的早期階段。持續學習(CL)更多地是關于自主性和增量技能的建立和發展,研究人員將在 2019 計息推動其發展。
看起來毫不相關的任務之間實際上存在著千絲萬縷的關系,有助于達成最終目標。研究人員會監督系統,對其進行微調,直到模型按照預期工作。但只關注單一任務往往會導致效率低下,因此,多任務學習這個新的研究領域將幫助系統探索各種相關任務之間的聯系,以更好地解決問題。
GAN 是指由兩個對抗性神經網絡組成的無監督深度學習系統,可以視之為沒有人類參與的圖靈測試。經過兩個對抗神經網絡之間的“對抗”,AI 最終會自動生成現實世界不存在的逼真圖像。
GAN 的目標不是耍詭計,而是為了解決合成數據的問題。GAN 使 AI 系統能夠處理尚未清理的原始真實數據,且無需人工程序員的直接監督。
用于生成建模的自回歸分位數網絡(簡稱 AIQN)聽起來很復雜,但它是一個創新的想法,有助于改進算法,使算法更穩定。這意味著它可以加快 AI 進步,為整個生態系統創造更多機遇和創新。
這種新型的神經網絡可以利用分層關系處理信息,解決了一個關鍵問題:默認的卷積神經網絡無法檢測簡單和復雜對象之間的某些關鍵空間層次結構。因此,這些新型網絡可以將錯誤率減少 50%。
概率編程語言為開發概率模型減輕了一些壓力大且乏味的工作。這些新型語言允許開發人員構建、重用和共享他們的模型庫,同時可以容納不完整的信息。
傳統機器學習方法耗時,麻煩,尤其對于 AI 領域的數據科學家、專家和工程師。自動機器學習是一種新的方法:將原始數據和模型匹配在一起找到最相關信息?,F在有許多 AutoML 產品和服務由谷歌、亞馬遜和微軟提供。
很快,個人用戶就可以上傳自己的數據來定制現有的模型。谷歌的 Cloud AutoML 是一套機器學習工具,可以讓沒有經過嚴格訓練的員工定制機器學習模型。
機器人連續第五年出現在報告中。當今,機器人已經成為一個主流詞匯,且不僅只面向消費級群體,如英國勞埃德銀行的員工使用機器人訪問該公司的知識庫,谷歌于 2018 年推出智能助手 Duplex 系統,可以代表用戶打電話和預定餐廳。
未來,機器人的另一大進步將不是關于技術本身,而是規范。2018 年,機器人網絡發送虛假信息引起了人們對于機器人造成信任恐慌的擔憂,這導致了加利福尼亞決定立法,要求機器人在進行交互時表明自己不是人類,這條法律于 2019 年 7 月 1 日生效,要求機器人“清晰、有意識地、用合理的設計告知人類與其交互的是一個機器人”。這次立法成功將成為其他州和國家關于機器人立法的新基準,尤其是當 Duplex 這樣的產品大規模流入市場時。
谷歌、亞馬遜、Facebook、Jigsaw、推特、Instagram、Chatfuel、Pandorabots、Twilio、亞馬遜、科大訊飛、Slack、微信、騰訊、百度、微博、阿里巴巴、IBM、微軟、Snapchat、Coral Project。
這一部分技術趨勢包括面紋識別、聲紋識別、姿勢識別、個性化特征識別、情感識別、骨識別、基因識別、通用基因數據庫、行為生物識別、WIFI 識別、環境跟蹤、計算圖形、語音合成、持續識別、識別技術偏見。
現在,先進的計算機系統根據我們獨特的特征,如骨骼結構、姿勢、情感狀態等,不僅能夠識別出我們是誰,還可以知道我們在想什么。
2019 年,面紋識別技術將受到法律方面的挑戰。2017 年,一名聯邦法官通過了針對 Shutterfly 提起的集體訴訟,這家公司涉嫌違反伊利諾伊州生物識別信息隱私法案,該法案要求公司在收集包括面孔在內的生物識別數據之前需獲得書面許可。(伊利諾伊州的這條法律是美國唯一存在的此類法律。)Facebook 目前也正在處理伊利諾伊州居民提出的第 9 起訴訟,這些居民認為 Facebook 在平臺照片標簽功能中識別他們的臉部違反了該法律。
機器學習技術加上大數據,可以讓研究人員僅通過聲音的微妙信息就識別出你是誰,福特和大眾合作開發的駕駛室精準聲紋識別,可以檢測到駕駛員是否醉駕或處于疲憊狀態。
姿勢識別技術現在已經可以通過翻譯動作識別我們的身份,并代表我們做出決定。自然用戶接口(NUIs)是未來很多技術的組成部分,2019 年,我們將看到更多 NUIs 幫助我們通過身體姿勢控制機器,且工作場所將出現記錄我們的身體動作,預測我們生產效率最高時段的設備。
越來越多的分析工具將出現,收集關于你的數據、行為和偏好,為你進行個性畫像,以預測你在所有場景下可能有的反應,目標是預測你的特定需求和意愿,如未來的資金交易情況等。
去年,亞馬遜為一個新系統申請了專利,該系統根據用戶之前和當前的互動檢測用戶的身體和情緒健康狀況。如果它發現你生病了,那么亞馬遜會推薦一小時送藥到家。汽車制造商起亞于 2019 年在 CES 上首次推出其實時情感自適應駕駛系統(R.E.A.D.),這個識別系統可以通過傳感器監控乘客的面部表情、心率和皮膚活動,調整車輛內部環境以適應乘客的情緒狀態。
2018 年,美國空軍申請了一項專利,該專利解釋了寬帶雷達如何通過骨骼結構進行識別。人類會發射天線向彼此發送信號,將該人的生物識別雷達特征與數據庫中的已知特征進行比較。對于身體上有螺釘和金屬條的人來說,這是個壞消息,因為人類肉眼看不到的東西在掃描時會變成清晰的信標。
消費者基因檢測可以讓人們更輕松地了解自己的祖先,但同時讓人們在未授權的情況下變成檢測的目標。現在,人類的原始生物數據可以被上傳到 GEDmatch 等開源數據庫中,允許用戶在所有 DNA 平臺上尋蹤溯源。此外,在未經過你本人的同意的情況下,消費級 DNA 檢測機構共享的數據可能會被第三方合法使用。2018 年, 23andMe 收取了 3 億美元把數據共享給了醫藥公司 GlaxoSmithKline。
消費級 DNA 檢測服務為保險、醫藥等行業提供了無數的機會,但是目前還有一個疑點存在:在什么情況下,第三方能夠提取并使用私人數據庫中的遺傳數據?沙特阿拉伯、科威特、英國和中國政府一直在研究是否應該建立一個公民遺傳信息通用數據庫。
此外,該報告還給出了一個 2019 年全球智能城市 Top50 排名,中國無錫、銀川、杭州、上海四座城市上榜。