人工智能連續3年進入政府報告、“智能+”成為時代新命題,這些信息都顯示2019年會是AI產業全面加速落地的一年。AI行業的發展,離不開千萬開發者的助力。
3月20日,首場百度大腦開放日全新登場,介紹了全新開放的24種全新AI能力,AI賦能市政、物流、教育等行業的20個案例,也為向開發者、行業人士展現了如何搭上AI開放生態的高速列車。
百度大腦開放日來襲
作為百度在人工智能領域多年研究成果的集大成者,百度大腦正在飛速進步著。自2016年啟動開放以來,百度大腦目前已經是服務規模最大的AI開放平臺,開放了158項AI能力,24小時快速集成,開發者數量超過100萬,面向廣泛的企業和開發者提供最先進、最全面的AI能力,不斷降低AI應用落地的門檻。
百度AI技術生態部總經理喻友平談到,“在百度大腦的開放生態中,開發者一直是最為重要的一環。百度大腦開放能力不斷加速,有很多有價值的技術難以被開發者了解。2019年百度大腦開放日全新登場,希望為AI開發者提供及時、全面、近距離地了解百度大腦最新AI產品和案例,且能深度、持續交流的平臺。”
(百度AI技術生態部總經理喻友平)
首期開放日,喻友平介紹了百度大腦開源深度學習平臺PaddlePaddle以及通用AI能力兩方面的技術和產品更新,以及百度大腦在市政、物流、教育等行業的落地案例,與開發者們進行深度交流。
更廣、更快、更精的AI技術
深度學習是AI發展的燃料。百度在深度學習領域深耕已久,2016年,百度開源了深度學習框架PaddlePaddle。此次,PaddlePaddle迎來兩方面重大更新,核心框架Paddle Fluid v1.3新增發布業界首個視頻分類模型庫,新增支持NLP語義表示BERT模型,分布式訓練性能大幅提升,大規模稀疏參數服務器Benchmark發布;同時,基于PaddlePaddle的深度強化學習框架PARL,奪冠NeurIPS 2018。具有高靈活性和可擴展性,支持可定制的并行擴展,覆蓋DQN、DDPG、PPO、A3C等主流強化學習算法.
目前,百度PaddlePaddle已對外開放超過50種經過工業場景驗證的官方模型,例如,領邦利用PaddlePaddle,通過ICNet語義分割模型識別精密零件瑕疵,實現零件自動分揀。
在深度學習基礎之上,百度大腦通用AI能力開放涵蓋語音、視覺、自然語言處理、知識圖譜等全面AI技術。語音方面推出了語音識別極速版,首次對外開放在百度輸入法產品上采用的最領先語音技術(在線語音領域全球首創的流式多級截斷注意力模型SMLTA),擁有更快的響應速度,相對識別準確度提升15%,為開發者帶來更極致的識別體驗。此外,語音識別預置語義解析全新升級,預置場景由35個升級為51個,從影視娛樂到外賣打車,語義解析效果全面提升。另外,還預告了即將推出的幾款新產品,包括語音識別自訓練平臺、遠場語音開發套件和語音離線合成等產品。
視覺方向上,OCR、車輛分析、人臉人體、圖像識別都有重磅升級。比如卡證OCR新增了戶口本、出生醫學證明、港澳通行證和臺灣通行證四類新能力,可識別卡證總數達到9種。只需對著你的戶口本拍一張照片,系統就能字段進行結構化識別,然后反饋出信息頁的出生地、出生日期、姓名、民族、與戶主關系、性別、身份證號碼。而票據OCR和汽車場景OCR也分別新增了行程單、保單、通用機打發票、定額發票、車輛VIN碼、機動車銷售發票、車輛合格證等識別能力。目前,百度大腦OCR產品全系列可以識別類型多達34款,實現卡證、票據、文檔、汽車全場景覆蓋。
人臉人體識別方向,百度大腦此次發布了新能力——人臉情緒識別,同時升級了人臉關鍵點檢測和手勢識別,人臉檢測關鍵點由72個增至150個,常見手勢能識別種數也達到了24種。圖像識別方向,百度大腦更新了紅酒和地標識別兩個新能力。無論是盧浮宮還是82年的拉菲,只要上傳1張照片,就能獲得文字解析。車輛分析方面上線了車輛檢測和車流統計。喻友平透露,不久后,百度大腦還會陸續上線車輛屬性識別、車輛外觀損傷識別、人臉融合、手部關鍵點識別、更高精度的人像分割以及錢幣識別等有趣有用的應用場景。
同時,百度大腦語言及知識技術也進一步開放。在語言處理應用技術方面,百度大腦新增文本糾錯、新聞摘要、智能寫詩、智能春聯和對話情緒識別等能力,在知識理解方面,百度大腦推出了作文檢索和知識問答兩個新能力,讓學習和娛樂兩不誤,分分鐘化身“十萬個都知道”。同時,智能寫作平臺將在4月全面上線,從素材上為創作者提供工具、幫助找到靈感,提升創作者的寫作效率和產出質量,降低寫作成本。
在強勁的AI技術支持下,百度大腦也在重點發力智能硬件和設備。1月16日,百度大腦在深圳召開“在端上思考”百度大腦AI硬件平臺及產品發布會,發布13項端側新品,備受行業關注。在現場,喻友平介紹到,目前已有4款新品正式上架AI市場。
在AI能力廣度、速度、精度不斷提升的基礎下,百度大腦充分利用自己在AI領域內的成功經驗不斷雕琢著自身的核心技術,開始在產業界呈現“乘法效應”展現出產業智能化“頭雁”的速度。
AI落地的乘法效應
AI技術的發展,最終還是要落實到我們的生活中。在我們觸手可及的各個角落中都有百度大腦加持的智能產品。首期開放日著重介紹了近期開發者詢問較多的市政、物流、教育三個領域的落地案例。
比如百度EasyDL與分形科技打造的智能垃圾桶已成功地落地海淀公園,可以對7種常見垃圾自動分類,后期還可以通過增加訓練數據識別更多種類;在和德邦物流的合作中,為用戶免去了自行填寫信息的麻煩,使用定制詞法分析快遞申請,一秒拆分姓名、電話、住址等信息;更具科研意義的還有百度EasyDL與中科院在珍稀鳥類識別項目上展開的合作,在傳統分類學日漸沒落的今天,百度EasyDL可以利用強大的圖像識別技術協助專家們對動植物標本、照片進行快速鑒定,目前中科院使用EasyDL訓練對超過12萬幅圖片進行分析,目前在700多種鳥類模top5上的識別準確率達到93.89%,非雀形目鳥類模型top5準確率達到95.79%,滿足上線服務要求。
與卓繁信息的合作,百度大腦還打造了“AI便民”的新型無人值守受理站。通過UNIT、OCR、人臉識別等AI技術,“無人值守”的政務服務新模式為社會公眾提供全年無休的24小時自助辦事服務,提升了政府為民服務的能力。
開放日當天,網紅智能貓窩的設計者百度大腦工程師晚兮也在現場為大家講述了智能貓窩設計者們的初心。為了讓流浪喵過上幸福的生活,程序員出身的他用百度大腦動物識別技術和百度EasyDL打造出 “貓臉門禁”、“病貓識別”、“絕育識別”三大智能功能,給流浪貓一個溫暖的住所的同時幫助救助志愿者發現生病和未絕育的流浪貓。晚兮提到,憑借百度大腦的開放技術,他只用半天就設計出了智能貓窩的三項主要AI功能,看似高冷的AI技術最終化為貓咪們的守護神,讓現場的小伙伴們感到暖心又感動。
2018年百度大腦走進6大城市舉辦7場行業創新論壇,發布了企業服務、信息服務、地產物業、智能零售、智能工廠、智能校園、智能政務7大行業解決方案,推動AI與不同行業、具體場景相結合,AI技術滲透到產業的毛細血管。百度大腦目前已經落地20+行業,生態賦能已成燎原之勢。
百度大腦新品體驗師計劃
如果只是技術“閱兵”會讓你覺得意猶未盡,為了進一步激勵開發者學習應用百度大腦開源能力,百度大腦提出了“百度大腦新品體驗師計劃”,希望與開發者一起推動百度大腦進化,幫助他人一起成長,探索AI前沿應用。針對開放日介紹過的任意一款產品,開發者提出改進建議、使用技巧/攻略或者有價值有意思的案例并發表在AI社區,將會獲得社區積分、百度大腦定制禮品、現金禮品卡等多重獎勵。
技術更新、新品上線、開發者現身說法、行業案例詳細解讀、交流互動社區、培養激勵措施......首期百度大腦開放日可謂干貨滿滿。 “人工智能應用的領域可以說無處不在,只要企業、開發者、合作伙伴們能有發現問題的眼睛,就有創新創業的機會。百度大腦把平臺和AI能力開放出來,希望幫助大家快速地實現各自領域的業務解決方案,創造全新商業模式,帶來更多機遇。”喻友平在現場如是說。
來源:砍柴網