HCR強化學習智能應用之賦能工業(上)

來源:HCR慧辰資訊 時間:2019-07-23 06:36:44

些年科技進步的速度有點快:

 

從2012年開始深度學習取得飛躍式發展,在人臉識別、語音識別、機器翻譯等領域開始大量應用。

 

從2016年開始強化學習又火了一把,阿爾法狗先后戰勝世界頂級圍棋棋手李世乭和柯潔,OpenAI-Five打Dota2(一種競技游戲)也戰勝了人類選手。

 

作為一家數據智能公司,HCR持續關注最前沿的人工智能技術,并不斷應用到實際的業務場景。

 

HCR已經將深度學習和強化學習應用到了大量領域:

應用領域

應用點

相關技術

環保

區域污染物智能溯源

深度學習

區域空氣質量智能預測

深度學習

教育

試題知識點智能識別

深度學習

試題智能推薦

深度學習

學生成績智能預測

深度學習

新零售

人臉識別

深度學習

人物屬性識別

深度學習

消費者智能畫像

深度學習

交通

智能助手

深度學習

智能用戶畫像

深度學習

車型識別

深度學習

工業

優化燃煤工業鍋爐控制

強化學習+深度學習

優化機房制冷

強化學習+深度學習

 

那深度學習和強化學習有什么關系呢?通過公司近些年深度學習和強化學習的應用,我們總結如下:

 

相比之下,強化學習有哪些突出的特點呢?

 

強化學習通過智能體(如阿爾法狗)不斷實踐、探索來學習,每次探索包括以下幾個步驟:

 

智能體能夠感知環境(即下圖中地球,可以理解為要解決的具體場景),觀察當前狀態(observation)

 

智能體根據策略,采取某種行動(action)

 

智能體采取行動后,環境對智能體的行動會有一個反饋(reward)

 

智能體獲取反饋,根據反饋調整策略

強化學習與人類學習的方式更加相似,為什么HCR在實際業務中應用更多的卻是深度學習?

 

目前深度學習在各領域應用四處開花,為什么強化學習仍主要應用于游戲,其他領域應用極少?

 

HCR已經將強化學習應用于工業大數據領域,包括燃煤工業鍋爐控制優化、IDC機房制冷設備自動調控等,通過實踐積累了大量的寶貴經驗。

 

下篇我們會詳細介紹強化學習在工業領域的應用,并回答為什么強化學習目前仍主要應用于游戲領域的問題,敬請期待下周的推送。

天下国际登录