Google教你深度學習:中小企業如何利用會自己學習的電腦?
商品資訊
系列名:SENSE
ISBN13:9789861303680
替代書名:グーグルに学ぶディープラーニング:人工知能ブームの牽引役その仕組みをやさしく解説
出版社:財經傳訊
作者:日經大數據
譯者:李青芬
出版日:2017/09/29
裝訂/頁數:平裝/168頁
規格:21cm*14.8cm*1.3cm (高/寬/厚)
版次:1
商品簡介
你要聽特斯拉馬斯克的或是臉書祖克伯的?
前者認為人工智慧(AI)會毁滅人類,後者說不會!
其實你應聽Google的,
它提供平台讓中小企業也可以搭上人工智慧的特快車!
將衝擊世界的人工智慧類型基本上是指會自己學習的電腦,也就是所謂的機器學習(Machine Learning)及深度學習(Deep learning),而非過去大家習慣的電腦依程式行事。前者是指機器自己由大量資料中,得出某結論,如給電腦一堆貓的圖片,他會自己替貓做定義,進而由一張被切割的照片中,判斷那是不是貓。而深度學習則是電腦自行處理多層結構的訊息,而進行判讀。
人工智慧用5000部影片,就可以自己學會讀唇語!
曾有研究單位利用「深度學習」學習唇語的判讀,他們將英國BBC電視頻道的多個節目系列、合計約五千小時的影片做為學習的資料。學習後的電腦,在兩百支影片測驗組合中,光靠唇部動作便成功解讀出大約百分之五十的單字。而即使是在法庭上擁有十年以上經驗的唇語術專家,在相同的測驗中也只能判讀四分之一左右的單字。
電腦具備自主學習及判斷能力的事實將對人類社會產生重大衝擊,本書不只以一般人能理解的方式說明人工智慧在技術方面的進展,更以大量的實例,說明目前全球各種規模的企業如何利用會「學習」的電腦,來改變企業的運作。例如客戶服務的工作,原本極為依靠人力,但是,現在只要投入大量過去的QA,電腦會自己學會如何對應客戶;如語文的翻譯,電腦也可以自己由大量的翻譯資訊中學習,讓翻譯的品質提升。
善用人工智慧技術的企業,將在企業的經營上(至少成本的控制上),取得領先。問題是人工智慧的發展是否有很高的技術門檻?阻擋一般的中小企業於門外?其實不然。
中小企業也可以利用Google平台提供的應用程式介面,發展自己的深度學習運用
谷歌在其雲端服務「Google Cloud Platform(GCP)」中,將谷歌研究開發至今的深度學習成果透過兩種方式開放一般大眾使用(Google目前將人工智慧用在公司一千種服務以上):一種是將機器學習訓練完畢的模型,以應用程式介面 (Application Programming Interface;API)方式提供服務。另一種是提供機器學習程式庫「開源機器學習系統(Tensor Flow)」。
應用程式介面(API)一般是指能將擁有特定機能的電腦程式由外部程式叫出使用的介面。透過應用程式介面與電腦程式連結,就可以直接利用其功能。
谷歌將許多不同種類具有「機器學習」或是「深度學習」能力的「模型」放在「谷歌雲端平台(GCP)」。中小企業可以利用應用程式介面,直接利用其功能。而這些「模型」已經經過基本的「訓練」,因此使用者只要提供少量的資料,就可以達成學習的目的。
因為有了應用程式介面(API)的提供,使得「機器學習」與「深度學習」為一般企業所用的門檻大幅降低了。只需以程式介面(API)程式將「模型」叫出,就能使用圖像辨識與語音辨識的最新成果,真的很方便。
不過另一方面,許多太專業的運用,如人體器官病徵的辨識或是機械故障的預兆判斷等,無法以應用程式介面(API)套用現有的「模型」。谷歌所準備的機器學習程式庫「開源機器學習系統 TensorFlow」將派上用場。使用者可以下載程式,自行發展所需要的功能。「使用TensorFlow最大的好處,是只要以Python語言寫出簡單的程式碼,就能運用深度學習」。
本書不只告訴你人工智慧是什麼?將改變什麼?更告訴你可以做什麼,讓公司保持在科技的浪潮尖端。
從定義到駕御:讓你徹底搞懂將對人類產生鉅大影響的科技
本書在觀察大量企業的運用後,在第五章《架構活用篇》提出導入的深度學習的具體架構,讓讀者不只能懂,也能縮短運用時摸索的時間。本書發現人工智慧(機器學習、深度學習)的風潮席捲全球,不過其在企業運用的目的不外以下幾種:1、刪減成本。2、提高附加價值創造出新的商機。3、提升創意性。而在觀察幾百家企業的操作後,發現以刪減成本的目的最容易產生效果。
用案例讓讀者完全理解
對沒有技術背景的民眾而言,最關心的是人工智慧(機器學習、深度學習)要如何運用,本書以實際的案例說明相關問題:
■ 安藤HAZAMA――用以判斷隧道工程之岩盤硬度
為了建設隧道工程時能兼具安全與效率,安藤HAZAMA與日本系統軟體共同開發的「隧道開挖面AI自動評價系統」。將挖掘隧道時最尖端之開挖面照片輸入後,該系統就會自動評價其岩盤的硬度、脆性等工學特性。透過人工智慧帶來的岩盤工學特性評價自動化,即使沒有專家或資深技師在場,也能給予正確的判斷。
在學習之際,將五百張左右的相片進行分割,製作成五萬張的相片資料。結合相片岩石所代表的彈性波速度,一起讓機器學習的結果,在拍攝開挖面相片後,就能得到彈性波的速度值。新系統在從開挖面的相片辨識其相對應的彈性波速度上,正確率大約有百分之八十五。
■ AUCNET IBS――從車輛相片就能鎖定款式
深度學習特別適用於圖片的識別。從事支援中古車等業者間交易的AUCNET(位於東京都港區)系統開發子公司之AUCNET IBS就是圖片識別運用的例子。該公司運用深度學習技術,開發了能自動將車輛不同部位照片歸類上傳到網站的系統「konpeki(紺碧)」。二〇一六年十一月集團旗下的中古車經銷商FLEX(東京都港區)採用了這個系統,提升網站上資訊登錄作業的效率。
中古車經銷商經常需要為購入的中古車拍攝許多相片、進行上傳到自家網站或資訊網站的作業。車子的左斜前方、右斜前方、右側、左側、後方、還有車內的前座及後座、儀表板、導航等……。這些相片如果由店員手工整理的話,大概要花個五分鐘左右。Konpeki系統只要經銷商店員將拍攝的相片登錄,就立刻能自動依部位別分類,輕鬆地上傳至中古車資訊網站。
它將車輛外部區分為十八種、内部區分為十二種。它也會將包含車輛的相片、但並非銷售對象的圖像(如廣告)區分出來。甚至還能鎖定某品牌、車名、款式,顯示平均銷售價格帶。
「konpeki(紺碧)」系統的開發便是採用了谷歌的「谷歌雲端平台(GCP)」上為了開發深度學習模型的程式庫「開源機器學習系統(Tensor Flow)」、讓機器學習大量圖像資料而成。
■ 以少量的訓練資料構築出車輛台數檢測的系統
Aerosense與大數據的BrainPad公司共同合作、運用了深度學習技術的作法。開發了從空拍圖像中測出停車車輛數的系統。先從實驗結果來看的話,使用了深度學習的空拍圖辨識汽車模型,在顯示了一百一十六輛汽車的測試圖資料中,測岀結果為一百二十二輛。
Aerosense的汽車辨識模型,其特點在於其從空拍圖辨識汽車用的深度學習模型,並非是從零開始打造的。研發人員說明:「若要製作專用的模型,將需要大量的訓練資料。即使有一萬張也不夠吧!這次是運用了現有的模型,大約只有一百三十張的少量訓練資料,就顯示出其高精確度,很有價值。」
在深度學習模型的開發上,活用了谷歌的深度學習程式庫「TensorFlow」。利用TensorFlow中名為「Inception-V3」之一般圖像辨識模型,從圖像資料中製作抽取了特徵值的向量。此時,使用約一百三十張的汽車空拍照作為訓練資料。抽取了特徵值的向量,再以一種名為SVM(支援向量機;Support Vector Machine)的機器學習進行學習,得出結果。
結合500家企業的導入經驗,系統化說明著手運用深度學習的方法
作者輔導了500家以上企業導入深度學習於工作之中,他用資料×目的的矩陣,描繪出活用展望圖,協助讀者理清頭緒,讓公司縮短導入摸索的時間。
作者簡介
作者簡介
日經大數據
為「期許能善用資料制定成長戰略」的企業所撰寫的專業刊物。以採訪「大數據×人工智慧×物聯網(Internet of Things; IoT)」之活用事例為主,透過網站及月刊向定期訂閱者提供資訊。
譯者簡介
李青芬
輔仁大學日文系畢。自幼在祖母啟蒙下,對日本文化深感興趣,自修數年。大學二年級時取得日文檢定一級,目前於商界服務。時時刻刻透過文字推敲感受日文的醍醐味。著作有《一個人用日語一直聊一直聊》、《日本國民用語大全集》、《史上最強日語單字》(合譯)、《史上最強韓語單字》(合譯)、《一天看完的日文書信》、《NEW TOEIC 新多益990滿分王》等(均由國際學村出版)。《內容的力量》、《男女有別說話術》(均由財經傳訊出版)
序
深度學習將改變一切商務行為
打敗一流的職業圍棋棋士、贏過猜謎冠軍――人工智慧在這些特定領域中已展現出象徵性的成果。但近來已有多則實例,顯示人工智慧已具備改善人們生活與經濟活動、甚至進一步改變世界的可能性。
美國谷歌採用以大腦神經迴路為架構原點的「神經網路」,應用於人工智慧「Google翻譯」上,大幅改善了它的精確度。擔任許多技術性新聞及書籍翻譯的譯者・滑川海彥先生如此評價:「雖然仍無法期待它譯出自然流暢的日語譯文,但在閱讀阿拉伯語或泰語等看不懂語言的文章時,為了把握其內容我還是會使用」。
他更表示,「重點是透過採用神經網路的翻譯應用,提升其解析自然語言的處理能力。將英語文章放上Google翻譯,使其像人類般理解文章的構造(主詞、動詞、受詞、修飾語)進行判讀。若具備了這樣的英文處理能力,未來也許客服中心的八成業務都能換成由聊天機器人來應對。」一語道出其革新企業商務的可能性。
另外,谷歌活用人工智慧於自家公司的資訊中心,使伺服器等電器的冷卻電力降低了百分之四十之多。這似乎是透過掌握空調及窗戶的調節與開關等大約一百二十個要素、達到最適化的結果。
注意到這股力量的不只是谷歌。期待人工智慧技術能帶來未來新事業、業務創新的企業們,陸續進行著大型投資。豐田汽車(Toyota)在二〇一六年一月成立了研究開發人工智慧的據點「Toyota Research Institute」,在五年內投資了十億美元。松下電器(Panasonic)在國內外的五個據點進行人工智慧相關技術研究,目標在今後三年內增加三倍的人工智慧工程師。索尼(Sony)則收購了美國Cogitai公司――此公司以擁有深度學習中所稱「深層強化學習」之優異技術能力聞名――在索尼電腦科學實驗室(Sony Computer Science Laboratories, Inc)等機構進行著人工智慧及機器人方面的研究。
日本政府也在經濟產業省(相當於我國經濟部)、總務省(相當於我國內政部)、文部科學省(相當於我國教育部)旗下的研究中心設置人工智慧專門研究組織,積極地與企業共同進行研究作業。不僅如此,更設置促進三部會間緊密合作之人工智慧技術戰略小組,呈現出舉國上下傾力於人工智慧研究開發的態勢。
例如在文部省下的理化學研究中心即與京都大學及數十間大型製藥、化學、食品、醫療及保健相關企業等共同合作,進行開發生命科學領域的人工智慧與大數據的技術,於二〇一六年十一月成立了都市活力研究所(Life Intelligence Consortium)。
在這場人工智慧的開發競賽中,相較於美國與中國是由企業、國家來挹注大量投資,日本則是想結合政府與民間的力量來取勝。
深度學習因大數據得以展現實力
現在可說正逢第三次人工智慧熱潮,而深度學習技術的進化是其幕後的推手之一。二〇一六年,谷歌集團麾下的英國DeepMind公司所開發的圍棋程式「AlphaGo」打敗了一流職業棋士,此人工智慧也應用了深度學習的技術。
關於該應用架構的詳情,本書會在後續章節加以解說,但其實它並非新的技術。與深度學習同樣是模仿人腦的演算法研究,在一九四〇年代左右就開始了。雖然歷經多次受到矚目、又因發現了技術性問題使熱潮又消退;但在進入二〇〇〇年代後期,對於學習而言有了足夠大量的資料、且能處理該大量資料的電子計算機器變得較易於取得,所以精確度一口氣大幅躍升了。辨識圖片中有什麼物品的圖像辨識精確度,據說已超越了人眼辨識。
值此之際,谷歌宣布將「人工智慧優先」(AI First)」定為經營方針。該公司的執行長皮伽(Sundar Pichai)在二〇一六年四月給股東們的信中表示「我們的世界將從行動優先(Mobile First)轉而進入人工智慧優先(AI First)」。
谷歌的母公司—美國Alphabet Inc.執行董事長艾立克・史密特(Eric Schmidt)也預言「今後IPO(首次公開發行股票)的前五大將從機器學習(從事其相關事業的企業)中誕生」。
谷歌本身活用深度學習技術在一千種以上的服務項目,其數量還在年年增加中。並採用「RankBrain」(為影響谷歌服務核心:「搜尋結果」之人工智慧),視其為第三順位重要指標。
人工智慧也被徹底活用在搜尋連動型廣告等網路廣告中,其帶來的成果,使全球網路廣告市場在二〇一五年成長至超過一千七百億美元的驚人規模。
隨著物聯網(Internet of Things; IoT:能蒐集一切接上網路之機器運作資料服務)的無孔不入,現實世界的資料化、數位化將與時俱進。在資料急速膨脹的推波助瀾下,人工智慧活躍的領域似乎將從網路虛擬空間迅速拓展至真實世界。
TOYOTA為美日所有小客車搭載通訊配備
例如豐田汽車已表明預計在二〇二〇年之前,將車載通信設備做為標準配備搭載於美日兩地幾乎所有小客車上,讓所有車輛皆能接續網路系統。對於即日起所蒐集到的引擎等運作資料的應對維護、以及配合實車行走資料的保險等都在積極進行中。
當然不僅是車子,舉凡智慧型手機、可穿戴式電子終端裝置、路口監視器及感應器所記錄下人們時時刻刻的活動,都能被資料化;車輛、飛機、辦公室的數位事務機、工廠生產設備等機器的運作情況也都被記錄下來,成為大數據。
「企業的競争力在於蒐集資料、並將其轉化成價值的能力。」在富士軟片(FUJIFILM)負責資訊通訊技術(Information and Communication Technology;ICT)方面的柴田德夫常務執行董事如此說道(於二〇一六年十一月,日經大數據主辦活動現場)。
該公司在二〇一五年八月,建立了公司內部全體適用的大數據共享分析平台。保健等數個事業部門的網路銷售記錄、商店販賣機的操作等記錄、實際生產績效等多方面的記錄都被記載其中。
此作法提供了定期的分析報告,據說有效降低了公司內部資料應用的門檻。另外,也計畫開始與機器學習結合,進而成為業務決策的依據。
在二〇一六年四月,更成立了旨在應用物聯網(IoT)與人工智慧之創新產品及服務開發的訊息研究所。大數據與人工智慧在今後將創造出怎樣的商機呢?成功案例有美國優步(Uber Technologies, Inc.)及愛彼迎(Airbnb)等從事共享服務的事業。
優步是透過智慧型手機應用程式(APP)蒐集大量「需要交通工具者」的需求資訊,與「能提供交通工具者(車輛及駕駛)」的供給方資訊,執行需求與供給的最適媒合服務,如此便開發出了公司本身不必擁有車輛、就能提供便宜並有效率的交通服務。
同樣的,愛彼迎也是為「尋找住處者(房客)」與「能出借空屋者(房東)」的需求與供給進行媒合。不僅如此,從上百筆的資料透過人工智慧演算後,甚至能每天推測出最有利的住宿金額,提供房東參考。人工智慧可以從該房屋所在地都市的住房需求動向、交通便利性及該區域住民、過去曾住過的房客評價等資訊,判斷出最適當的價格。
像這樣能有效共享閒置資產的服務,將大數據與人工智慧的高精確度媒合力作為武器,引發對現存計程車產業及旅館業界具有破壞力的改革行動正在急速成長。
在這個人工智慧引領技術革新的時代
再次重新思考:創新(Innovation)是什麼呢?「所謂創新,是只有在解決被客戶問到卻答不出來的問題時才會誕生。」日本雀巢(Nestlé Japan)高岡浩三社長如此定義。為了能快速移動,並非用更快的馬車而是發明轎車、為了涼快,不是用更大的扇子而是製作電風扇――像這樣將使用者的問題,用其想不到的方式解決的產品或服務,才是創新的真諦。
另一方面高岡社長也表示:「現今遇到的問題幾乎都無法以電氣或石油解決,必須倚靠網路或人工智慧等解決不可,這就是二十一世紀。」因此該公司開發了物聯網(IoT)咖啡機「Barista I」,只要操作智慧型手機APP就能在任一機台沖泡出自己喜愛的咖啡口味,也能透過APP分享自己喝了咖啡的訊息,成為與遠方家人或朋友的交流契機等,實現了嶄新的顧客體驗。在二〇一六年十月上市後兩個月內,出貨量已突破一萬台。
大數據×人工智慧的相乘效果所帶來的創新商機存在於每一個業界之中。製造業如美國奇異公司(GE, General Electric Company)正在推動「工業網際網路(Industrial Internet)」的構想,從飛機引擎及發電機等蒐集資料、以人工智慧加以分析。出貨給顧客的產品異常偵測或故障預測,對於達成運作最適化的能源成本縮減等能發揮效用。
在流通業已普遍採取「全通路零售(Omni-Channel Retailing)」戰略來統合管理各店舖及經營型態中的顧客及商品資料,提供個別顧客串連所有接點的一條龍式體驗。例如日本迅銷(Fast Retailing Co., Ltd.,旗下有UNIQLO等品牌,為亞洲最大服裝公司)可在店內為顧客量尺寸,顧客即可在網路商店上訂購客製的襯衫與夾克。且標榜公司全體戰略為「資訊製造零售業」,期許達成將顧客意見當作大數據來分析、能立即商品化,隨時能透過購買動向分析來精確預測需求,以制訂、修正銷售計畫之「顧客中心主義(Customer-centric)」。
預期能帶來最大經濟效益的是醫療、保健領域。若能整合醫院、健保制度、個人保健APP等被個別分類記錄的治療、健康診斷、活動軌跡記錄資料,就能分析罹病者與健康者在飲食習慣、睡眠等生活、治療、服藥狀況上有什麼不同。以該結果為基礎進行健康指導及治療,對預防疾病、防止症病惡化、連帶減低伴隨高齡化而增加的醫療費等成果,備受期待。
可以想見,健康相關資料及其應用之影響,遍及醫院、製藥公司、保險公司、健身俱樂部、食品及住宅業者等各領域業界。其他像是金融業的話,有依據大數據所進行的投資資產分配、能完成融資或投保審查作業的「金融科技(FinTech)」、教育界則有分析成績優異學生的學習過程資料、據此改良指導方式幫助其他學生的「教育科技(EduTech)」,人事上則有分析優秀員工的錄用過程資料,以促進徵才效率的「人力資源科技(HR Tech)」等,創新正試圖在所有業界、業務中不斷發生。
在如此變革的根本之處,皆在於大數據的幫助。因IoT使真實世界數位化、再因網路搜尋及廣告品質提升而精進的人工智慧技術,讓數位化的真實世界進而可視化、最適化。正因為如此,物聯網(IoT)、大數據、人工智慧無論在哪個產業都廣受關注,各大企業無不競相研究開發,一爭長短。
目次
序章:深度學習將改變一切商務行為
深度學習因大數據得以展現實力
TOYOTA為美日所有小客車搭載通訊配備
在這個人工智慧引領技術革新的時代
中小企業也受惠於人工智慧
第一章 在入門之前:人工智慧、機器學習與深度學習有什麼不同?
深度學習是機器學習的一部分
機器學習並非靠人類寫的程式來運作
電腦發達使深度學習成為可能
人工智慧之拓展有如「研究的洪流」一般
從「手機優先」到「AI 優先」
第二章 入門:深度學習的架構
何謂機器學習「以外」的人工智慧
機器學習之基礎
即使是機器學習也有很多方式
類神經網絡是大腦神經構造
分類方式是電腦自學而來
以網路上的「遊樂場」來理解神經網路
監督式學習與強化學習
「AlphaGo」徹底活用了強化學習技術
第三章 Google事例篇:Google的深度學習活用事例
■ 放眼未來,愈發廣泛活用的深度學習
能以口語下指令的家庭用人工智慧管家
有辦法像人類對話般地溝通無礙嗎?
■ 支援自動駕駛的深度學習
用深度學習讓資訊中心大幅節能化
■ 超越人類之眼的精密判讀――圖像辨識能力
能自動分類照片的 「Google Photo」
電腦也會做夢嗎?「Deep Dream」實驗
創造出優秀藝術與音樂的「Magenta」
影片的辨識也沒問題!「唇語術勝過人類專家」
■ 理解文章內容的原文分析
能自動製作電子郵件回信備用內容的「Inbox」
過濾垃圾郵件的精密度也有長足進步
能讓企業資訊更易於被搜尋的「Google Springboard」
■ 只要說話就能與電腦溝通的「語音辨識」
邊對話邊支援人類的「Google Assistant」
能進行語音合成也能譜出鋼琴曲的 「Wave Net」
■ 讓跨越語言障礙成為可能的「機器翻譯」
透過類神經網路讓Google翻譯更進化
■ 能輕鬆使用深度學習成果的「機器學習API」
能活用客製化深度學習的「TensorFlow」
適合/不適合深度學習的領域
第四章 企業事例篇:國內漸漸開始採用深度學習達成業務效率化
■ 安藤HAZAMA――用以判斷隧道工程之岩盤硬度
以達到挖掘工程之自動最適化為展望
■ AUCNET IBS――從車輛照片到款式皆可判別
活用年度約五百萬台的中古車資料
因無法識別車子的方向而苦惱
對活化中古車交易的貢獻
■ Aerosense活用了空照圖資料庫
以少量的訓練資料構築出車輛台數檢測系統
開發能提升測量效率的標識
■ 樂桃航空利用語音辨識API能全天候二十四小時掌握航班動態
人與人工智慧的分工合作
■ 三井住友FG檢測非法交易的精確度大幅提升
導入使用於客服中心每個座位
資料本身不會有答案
第五章 架構活用篇:整理資料×目的,描繪出活用展望圖
■ 根據資料×目的之整理法
活用現有之圖像資料
語音資料主要用於客服中心
實務上先從成本縮減著手
■ 成功之應備常識及人才轉換
是否能畫出活用展開圖
需要的人才特質是?
機器學習商品化後,接下來具有特殊性的是⋯⋯
第六章 未來展望篇:邁向由深度學習解決問題的未來
訪問Google Cloud Machine Learning小組研究負責人- 李佳(Jia Li)
深度學習是技術革新的領頭羊
人間的優秀之處、演算法的研究仍有很大的進步空間
深度學習對資料「求知若渴」
解決現實世界的課題是AI研究主要目標
結語
書摘/試閱
第二章 入門:深度學習的架構
讀完第一章中人工智慧最初步的介紹,各位對機器學習與深度學習應該已在心中有了大致的輪廓:能進行知識性處理的電腦一般稱之為人工智慧,其中包括由電腦自力學習記憶事物的機器學習;而機器學習的其中一種方式為進行多層次處理的深度學習。
那麼,已經知道了這些以後,第二章開始我們就得以進入深度學習的本質了……嗎?但還是有一大堆不懂的地方吧!所以,在這第二章中,我們終於要「入門」了。讓我們一邊請教各位專家,一邊踏上瞭解深度學習架構的旅程吧……。
何謂機器學習「以外」的人工智慧
第一章中,曾以氏圖文表示人工智慧、機器學習與深度學習的關係。本章起將接著進入機器學習、深度學習的話題,在這之前,先請曾在第一章中登場的高級工程經理賀澤秀人先生為我們稍微說明一下關於「非機器學習的人工智慧」。
因為若能明白機器學習以外的人工智慧是在做些什麼,就會更容易想像機器學習的概念。賀澤先生如此說道。「機器學習以外的人工智慧其實已被廣泛應用於各種場合,其中具代表性的方式,是將世間事物以有邏輯的方式寫出來。像是以邏輯上推論『下雨了地面就會濕』的因果關係,藉此來導出其他所有現象。例如在多次重覆推論『進行A的話就會產生B』的關係後,結果就能找到最終答案。像數學證明等,不借助電腦的功能就無法完成,在此多次重覆『進行A的話就會產生B』的人工智慧推論就能被有效地利用。」
這種情況下,是由人類教導電腦「進行A的話就會產生B」的關係,所以不是機器學習。另外,還有先設定好目標、就會準備其他數個次要目標如「為了達成目標是否需要做些什麼?」的「自動規畫(Planning)」。也有用於操作機器人時,欲使其做出想要的動作,由人工智慧來思考要做些什麼才好。
另外還有在特定領域中借助人工智慧之力的「專家系統」。雖然人工智慧對所有知識都會去進行解釋,但要將一切都從事實推論或以演算法從終點往前追溯思考等,實際上執行起來相當困難。於是,限定某個領域讓人工智慧發揮它最大的能力,專家系統就從這個構想誕生了。
「專家系統在某個時期相當流行。此系統需要教它非常多的東西,但在小型領域內要進行機率高低的判斷時即可有效運用。像是醫療診斷等,從症狀就能計算出罹患特定疾病的機率。」(賀澤先生)這樣讀者們可以稍微看出端倪了嗎?這些機器學習以外的人工智慧,電腦用以思考的條件式必定要仰賴人類的教導。
例如,一張拍攝臉部的照片,要電腦判斷什麼是人類的眼睛,就要將「眼睛的定義」化為有邏輯的條件式,來教會電腦。像這樣多次重覆進行眼與鼻、頭髮、嘴巴、耳朵等同樣步驟,電腦才終於能從這張照片資料找出「人類的臉孔」。這是非常繁複的大工程。然後,若要再接著為人類的臉與猴子的臉作區別,為此又再度需要大量的條件式,讓人不頭昏也難。
因為需要訂下規則,所以有時候也稱之為「基於規則(rule based)的人工智慧」。那麼,接下來講機器學習。機器學習不像基於規則的人工智慧,它不需要人類提供條件指導。正因機器能自動地學習,故我們稱之為機器學習。
機器學習之基礎
在明白非機器學習的人工智慧後,各位對機器學習是否更想像無窮了呢?現在開始一起來瞭解機器學習的基本知識吧!基於規則的人工智慧,為了要對輸入的資訊找出對應的輸出,必須由人類提供條件式等。而另一方面,機器學習不需要有條件式,就會自動地學習。話雖如此,但光是電腦放在家中,它也是無法進行機器學習的,因為還要給它學習的材料、以及要灌輸它如何進行學習的思考模式。
基本的機器學習中,需要準備圖像、聲音、文字等作為輸入資料,另一方面也要準備與電腦回答相當的輸出量來作為對應內容。大量備妥這些輸入與輸出的組合,然後讓電腦去學習就稱為機器學習。
在此並無人類所寫的程式意圖介入,只是一味地讓電腦大量讀取輸入與輸出的組合,自動地製作出如圖2-1中央的電腦左右邊資料的關連性。在圖中的電腦所完成的東西,稱為「模型」。模型顯示出為了從輸入資訊找到輸出答案所進行的計算過程。計算的方式雖然包含了許許多多的技術在其中,但機器學習,可以說就是指從輸入輸出組合中製作出模型這件事。賀澤先生對此說明如下。
「機器學習在製作出模型這件事完全是自動進行的。輸入圖像資料就能進行圖像辨識、輸入聲音資料就能進行聲音辨識。在數位的世界裡,無論任何東西都是化為0跟1的訊號,所以不管資料是什麼內容,在電腦看來都只不過是訊號而已。機器來計算這些被大量賦予的訊號,就形成了連結輸出入之間關係的模型。」
小時候的益智教材中,有一種叫黑箱子的東西,放進某個物品後,就會變成不相干的東西跑出來。相信還有人記得當時花了不少腦筋去思考放入與出現的東西有何關連性的回憶吧。
機器學習也是,從輸入與輸出的關係來製作模型的意義上跟黑箱子遊戲蠻像的。但最大的不同,是必須要準備大量的輸入輸出組合、以及黑箱子是如何變換這點,是機器自動思考的。這樣比喻後,是否讓您對機器學習覺得更親近了呢?
即使是機器學習也有很多方式
瞭解了機器學習的基礎後,接下來是為機器學習的架構分類。機器從接收到的輸入輸出資料組合中,對其進行了什麼計算或處理、才得以形成記錄了適當關連性的模型——這在機器學習中,是由機器自動計算的。
要製作這樣的模型有許多方式。而模型的選擇,是由製造機器學習的人類來決定。若沒有經過計算方式等設定的一台單純的電腦,就算把輸入輸出的資料一股腦兒丟給它,也無法進行機器學習。要以怎樣的模型來進行機器學習,必須要由人類來設定。
機器學習所使用的模型有許多種類。其中具代表性的有「決策樹」、「歸納推理」、「類神經網路」、「深度學習」。在此「深度學習」終於登場了。因為機器學習其中一個方式,就是深度學習。
「決策樹」是指對某輸入資料判定「YES」或「NO」來導出輸出的答案。像是在算命網頁上,選擇符合自身情況的選項時,就會出現關於性格、運勢等內容的分支樹狀圖對吧?決策樹的概念與此相近。請各位可以想做是:若是在醫療領域,透過「是否有發疹現象」(YES/NO)、「是否有發燒」(YES/NO)等分支問題不斷進行下去,就能從症狀找出病名的人工智慧。
賀澤先生說:「決策樹也可以由人工作業,但那樣就不是機器學習。另一方面,它做出來的模型就是決策樹,會依照各個分支去理解YES/NO的關係。」「歸納推理」則是與決策樹稍微不同的思考方式。它所記述的並非條件分支,而是『進行A的話就會產生B』『進行B的話就會產生C』這樣邏輯式的記述。所以它的模型是邏輯式的集合體。這也是機器自動製作模型的方式,也被當作一種機器學習的方式來運用。
類神經網路(Neural Network)是大腦神經構造
「類神經網路」這個名詞相信有不少人曾經聽過吧!它是指透過有系統地模仿大腦神經構造,讓電腦進行知識性處理。腦神經細胞的「突觸」在接收到的訊息超過一定數值時,就會進行對下一個突觸送出訊號的單向神經傳遞。在電腦上,製造出像突觸一般的神經傳遞、讓其進行計算處理的做法,就稱為類神經網路。人工製造的神經元被稱為類神經網路的「節點(Node)」(圖2−2)。
類神經網路模擬了腦突觸的連結,使節點多層串聯。從前一層接收到訊號,當接收訊號的總量超過一定數值,節點就會發出訊號。要怎麼讓節點之間連結、要怎麼設定發出訊號的臨界值等——透過這種種思考,才得到對應所有輸入資訊的輸出答案。
類神經網路的典型架構,是如圖2−3中有輸入層、隱藏層、輸出層所構成的模型。其架構是在輸入層中輸入圖像或文字等數位訊號,節點再依據各自連結的比重向隱藏層、輸出層傳遞訊號,然後在輸出層導出答案。
在學習之際,從事先準備好的輸入輸出組合,來對節點間的關係比重及發出訊號的臨界值進行調整。讓機器能自動計算更為接近正確解答的數值,就是在執行機器學習了。
機器學習完畢後,之後在輸入層輸入資料,輸出層就會跑出答案。像是輸入聲音會跑出文字的聲音辨識、輸入圖像就會跑出圖像內容名稱的圖像辨識等,只要將資料輸入就可以了。
像以這樣的架構來驅動的類神經網路,卻也不是馬上就能實用化。賀澤先生說:「類神經網路從早年就一路被研究到現在。但是,要讓其學習從大規模資料中形成模型相當困難,在實務上的用途也很有限。即使早在西元兩千年左右,當我向人提到正在從事類神經網路的研究時,甚至還得到『現在才在研究?』的反應。不過,在資料量與電腦功能爆炸式的提升後,促使類神經網路的其中一個形式—深度學習更大有可為了。」
Deep Learning又稱為深度學習,因為它學習的範圍相當深層。我們可以併同類神經網路的架構來想想看:在類神經網路的典型架構中,有輸入層、隱藏層、輸出層三層架構。由此即使是門外漢也可想見,要進行複雜資訊的處理似乎並非易事。
那麼,在此我們來探討隱藏層的多層化。這也就是深度學習。將數十乃至上百的多層化節點組織後,使用大量的資料進行機器學習,使類神經網路得以導出實務上可用的答案。(圖2-4)。
「從二〇〇五年左右,深度學習的可能性便擴大了。深度學習需要大量的資料進行學習,在稍早之前,要大量蒐集圖像或文字的數位資料,本身就是個艱鉅的任務。但如今因網路的普及,附帶標籤的照片資料被大量地上傳到網路。只要從網路抓取(Crawling)就能蒐集大量資料,比以前加倍容易,電腦的功能也有了飛躍式的提升。在這些條件配合下,類神經網路之一的深度學習便邁入了實用性階段。」(賀澤先生)
深度學習從過去被質疑實用性的類神經網路,一口氣被推上了主角的位置。「深度學習與基於規則的人工智慧、還有其他機器學習的不同之處,在於它非常單純。因為雖然需要去制訂深度學習的架構,但之後的工作只剩下將大量資料交由機器學習而已,它就會幫忙作出導出答案的模型。」(賀澤先生)深度學習之所以受到矚目,就是它能將人工智慧的複雜處理,以較為簡單明瞭的方式做出來。
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。