AI歷史×深度學習×互動設計×技術運用×未來發展

人總有疲累、犯錯的時候，但是AI永遠乖巧聽話；
你說AI不懂創意，只能做死板的工作？
隨著科技發展，AI人性化程度也愈來愈高，
再不懂得提升自己，最後只能被人工智慧所淘汰！
跨界設計師甘苦談，讓前輩把經驗向你娓娓道來！

【人工智慧在紅什麼？】
．AI的誕生
1956年8月，在達特茅斯學院舉行的一次會議上，來自不同領域（數學、心理學、工程學、經濟學和政治學）的科學家一起討論如何利用機器來模仿人類學習以及其他方面的智慧，「人工智慧」正式被確立為研究學科。

．人機互動的發展歷程
60年前，人工智慧和人機互動就像藍綠一樣是勢如水火的兩大陣營？
明斯基：「我們要讓機器變得智慧，我們要讓它們擁有意識。」
恩格爾巴特：「你要為機器做這些事？那你又打算為人類做些什麼呢？」

．機器學習和深度學習
機器學習是一門涉及統計學、神經網路、優化理論、電腦科學、腦科學等多個領域的交叉學科，它主要研究電腦如何模擬或者實現人類的學習行為，以便獲取新的知識或技能，細分為：監督學習、非監督學習、半監督學習、強化學習。深度學習是機器學習下面的一條分支， AlphaGo正是採用了深度學習算法擊敗了人類世界冠軍，並促進了AI其他領域（如自然語言和機器視覺）的發展。

【人工智慧如何影響設計？】
．從圖片到影像，Adobe Sensei平臺幫助設計師解決在媒體素材創意過程中面臨的一系列問題，並將重複工作變得自動化。
．看動畫總覺得某些場景崩壞？自動描線的技術能夠自動辨識圖像，並確定圖像的具體輪廓，進而完成描線的工作，大大減輕畫師的負擔。
．圖文內容的排版涉及大量的專業知識，包括視覺傳達、色彩與美學、幾何構圖等， Duplo透過模組化和網格系統快速把內容放入尺寸各異的幾千種頁面中，解決不同螢幕尺寸下的圖文排版問題。

【AI衝擊！設計師該何去何從？】
既然AI如此方便，設計師的存在似乎就可有可無了？
．最容易被取代的三大設計，看看自己符合了哪些！
．深耕藝術設計、個性化設計、跨界思考……六種方法助你永保飯碗！

【比人還通人性！談AI的實踐】
．AI設計八大原則：個性化、環境理解、安靜、安全「後門」、準確性和即時性、自我學習與修正、有禮貌、人格設定。
．產品設計三要素：透過增強記憶、訓練思考和預測行動，將人工智慧最佳化。
．從圖形使用者介面（GUI）到語音命令裝置（VUI），為什麼要將GUI轉換為VUI？

【未來五年，人工智慧的發展】
．智慧城市
下水道設計不良，一遇到暴雨瞬間變水上威尼斯？
每次上路總是提心吊膽，深怕遇到馬路三寶？
警力資源嚴重不足！誰可以代替交警外出巡邏？
交通、能源、供水、建築……數位監控平臺將接管城市管理的工作！
．商場
對商場上的惡性競爭感到厭倦了嗎？透過AI技術，有錢大家一起賺！
讓不同性質的店家組成一個體系，推播優惠券製造雙贏效果。
．家園
在家裡擺上一幅霍格華茲的胖夫人畫像不再是夢？
Atmoph Window不僅能隨意切換內容，還能配合主題發出相應聲音，彷彿身歷其境！

★特別收錄：跨界設計師甘苦談、針對使用者的人工智慧系統底層設計

〔本書特色〕
本書從技術角度切入，介紹當前人工智慧的相關知識，再圍繞商業、產品、使用者需求等多個角度闡述人工智慧與設計的關係，提出人工智慧設計的相關見解，同時也結合了作者本身的學習和工作經驗，對設計師在AI時代下的發展規劃給予相關建議。

作者簡介

薛志榮，互動設計師，同時也是一名獨立開發者。平時喜歡研究新領域，如人工智慧、AR和深度學習，擁有多項發明和外觀專利。

序

序言一

在1990年代早期，中國設計界開始廣泛將電腦應用於設計工作中，特別在桌面出版（desktop publishing, DTP）領域，為設計師帶來了新型的排版和輸出方式。一方面，功能強大的軟體讓設計師擔心被取代；另外一方面，隨著電腦藝術設計軟體的廣泛運用，同質化的作品也開始出現，因而引發設計師的警覺與爭議。當前再回顧這段歷史，雖然仍有部分工作被取代，但是設計師獲取了更加便利和自由的工具和助手，以往的擔憂並沒有成為現實。
當前，人工智慧快速發展，人們再次擔心專業被取代的問題。哪怕是以人為本、帶來美感和靈感創作的設計領域都岌岌可危。各大企業紛紛制定出人工智慧領先的發展策略，主流的人工智慧平臺也借助開源的模式打造生態圈，同時支持更多領域的新創企業（startup company）和創新應用。設計作為科技、人文與商業交叉領域的學科，正受到人工智慧再次興起的影響。2017年阿里智慧設計實驗室推出「鹿班」系統，「雙11」期間設計出4億張橫幅廣告（banner），這對設計師確實帶來不小的衝擊。在這樣的環境下，我們該如何提升自己的能力？人工智慧會取代設計師還是成為更強大的設計輔助工具？
人工智慧已逐步演變成創新的基礎設施，也將成為設計師的助理和夥伴，一部分重複性的勞動以及海量的資料分析工作都可以由人工智慧協助，設計師可以有更多的精力著重於評價、判斷和選擇，由此使自己更具個性化的創造力、應對複雜問題辨識機會的能力、批判性思維能力，以上將成為設計師著力發展的核心。Dell公司EMC服務的技術長比爾·施馬佐（Bill Schmarzo）結合機器學習（machine learning），提出了分析（analyze）、合成（synthesize）、設想（ideate）、調優（tuning）、驗證（validate）的設計步驟，這與IDEO提出的設計思維有很大的契合點。以上過程中都需要對利益相關者、學習的事物進行分析，了解使用者的需求，對目標進行定義和計劃，為創建的問題提出一定數量的願景方案，再根據設想設計原型或調整模型，最後對產品進行評測和驗證。這也為人工智慧時代的設計發展提供了程式與方法上的支持。
對設計而言，人工智慧將是一種新的思考方式，也是一種新的執行方法。在產品策略方面，需要探索適合的應用場景，以需求為導向；在產品執行方面，要有技術執行能力，也需要獲取高品質的資料。這些都要求設計師具有對趨勢的掌握能力、對使用者體驗的塑造能力，以及跨學科的綜合執行能力。未來，對設計和設計師自身的研究，將成為設計與人工智慧結合的基礎，有多少對設計的深刻理解，也就有多少設計的智慧。
本書以設計師的語言，探索了人工智慧發展的歷史，並對人工智慧時代設計對象、設計流程、設計應用及設計師的能力塑造，提供了全方位的解析和描述。對於設計師來說，這是一個非常好的學習和理解人工智慧與相關設計知識旅程的起點。人工智慧作為設計工具和夥伴，能為設計師帶來更多的設計發揮空間和創新思想。也期待本書能夠引領更多設計師參與提升人工智慧的水準，為設計未來的發展提供更有創建性的解決方案。
付志勇
清華大學美術學院副教授

序言二

「AI時代的設計師生存手冊」？
這話其實說得不完全對，因為在AI時代中要考慮生存問題的，不只是設計師，而是各行各業的每個人！這是每個人都不得不面對的危險與機會。世界各地都有研究者對於人工智慧取代人類工作做出了預測，即便是最樂觀的結果，也是在接下來幾十年內會有一半以上的人類工作被人工智慧取代。最容易被取代的，是那些規則性強、易於做判斷的工作。例如，美國在網際網路和人工智慧的連續衝擊下，股票交易員事實上已經成為消失的職業。而最難被取代的三類職業，則是跨領域綜合決策類（例如CEO）、創造力類（例如設計師，但是各行各業都可以做到以創造力去解決問題）、情感與服務類（例如保姆）。
設計師位列最難被取代的三類職業之一，但千萬別覺得可以高枕無憂。
一方面，今天市場上存在大量的設計師，因為種種原因，事實上在做著規則性非常強、創造力水準非常低的工作，所以「鹿班」不僅在設計數量上，哪怕在設計品質上都能勝過很多「設計師」。這樣的「設計師」顯然是會被取代的。
另一方面，人工智慧應用將會帶來設計基礎、設計對象、設計方法上的全面衝擊，例如產品不一定有視覺化的介面，可能會讓視覺設計師感到無所適從；人工智慧產品對於軟硬體的共同依賴，可能會讓習慣了做軟體設計或硬體設計的設計師面臨巨大挑戰；人工智慧透過充分使用資料而使產品真正意義上做到千人千面，對於設計方法和流程更是提出了革新的要求……
設計面臨重大挑戰，設計師面臨重大挑戰；即便你不是設計師，也將在創造力上面臨重大挑戰。所幸，每一波技術進步，都首先要經歷技術成長期，進入到技術成熟期以後，競爭的焦點才會向產品設計轉移，設計才會真正站在這一波技術的浪潮之巔。網際網路從技術開始廣泛應用，到產品設計成為競爭的焦點，經歷了差不多十年的時間（大約是1995―2005年）；這一波人工智慧技術的發展很可能比網際網路當年更快。這也意味著，還有留給設計師準備的時間，但也不多了。
最後，我們現在說的可能都是錯的――在高速發展的技術面前，沒有人能用過去的經驗準確預知一切。所以每個人都需要更認真地發現自己內心的追求，更努力地為將來做準備，更坦然地面對可能發生的變化。
吳卓浩
創新工場人工智慧工程院副總裁

序言一
序言二
前言

第1章　人工智慧的定義與人機互動的發展
1.1　人工智慧的發展歷程
1.2　人機互動的發展歷程
1.3　人工智慧再次爆發的原因
1.4　現在說的人工智慧是什麼？
1.5　機器學習和深度學習是什麼？
1.6　人工智慧的基礎能力
1.7　人工智慧的主要發展方向

第2章　人工智慧對設計的影響
2.1　人工智慧如何影響設計
2.2　人工智慧對使用者體驗的影響
2.3　結語

第3章　人工智慧對設計師的影響
3.1　哪些設計容易被人工智慧取代？
3.2　設計師與人工智慧
3.3　AI時代下設計師的機會與挑戰

第4章　人工智慧時代下互動設計的改變
4.1　多模態互動
4.2　行動產品互動設計的改變
4.3　三維空間下的互動設計
4.4　語音互動設計

第5章　如何設計一款人工智慧產品
5.1　新的設計對象
5.2　參考與人類交流的方式
5.3　人工智慧設計八原則
5.4　簡化人工智慧的理解
5.5　從GUI到VUI

第6章　未來5年後的設計
6.1　智慧城市設計
6.2　新零售設計
6.3　家的設計

第7章　他山之石，可以攻玉―跨界設計師採訪
7.1　我們只是終身學習者而已
7.2　如何設計AI音箱和VR產品
7.3　設計師如何在智慧化時代持續學習和成長？

附錄　針對使用者的人工智慧系統底層設計
1. 「去中心化」的網際網路
2. 最合適的私人伺服器
3. 資料的進一步利用
4. 人工智慧資料倉儲設計

書摘/試閱

第2章　人工智慧對設計的影響
每個時代的設計都有不同的定義，農業和工業時代的設計更多是指設計師透過手工製作的方式闡釋自己對美感和藝術的理解；資訊時代的設計除了要考慮美感，還要考慮是否實用和好用。設計對象開始從真實世界轉向數位世界；設計思想開始考慮以使用者為中心的設計；設計方向也增加了很多領域，包括多媒體藝術、軟體設計、遊戲設計、網頁設計、行動應用設計等；設計工具不再只有紙和筆，各種設計軟體為設計師帶來更多靈感和便利。

2.1　人工智慧如何影響設計
在人工智慧時代下，AR設計、智慧硬體設計逐漸發展，設計的改革更多考慮的是如何將真實世界和數位世界進行融合，如何在自己產品上更好地闡釋藝術、美感和實用性。可能大家覺得人工智慧離我們還很遙遠，但其實我們已經很早就在使用各種AI技術，例如郵件過濾、個性化推薦、語音轉變成文字、蘋果Siri和Google Assistant、Bing搜尋、機器翻譯等。所以隨著AI技術的成熟，設計必定會發生新一輪的變化。在未來如何做設計？我們可以透過這幾年的設計案例來推測未來AI技術對設計產生的影響。

2.1.1　深度學習降低設計門檻
相信大家對Adobe的Photoshop、After Effects並不陌生，它是設計師手中的利器，但由於軟體的學習成本很高，使用並不容易，所以有不少設計新人望而卻步。2016年，Adobe發布了基於深度學習的Adobe Sensei平臺，它能夠利用Adobe長期累積的大量資料和內容，從圖片到影像幫助設計師解決在媒體素材創意過程中面臨的一系列問題，將重複工作變得自動化。
Photoshop CC 2018增加了一鍵去背功能，解決了需要耐心、極度枯燥的去背工作。使用者只需兩步驟操作就能將主體選取出來：第一步按下工具列上的「選擇主體」按鈕，第二步選中想要的主體，Sensei就會主動分析影像中的主體與背景的關係，並且直接將主體選取出來。
在Adobe MAX 2018大會上，Adobe發布了一項名為Fontphoria的功能。在演示中，演示人員只需要設計一個字母，Fontphoria就能透過深度學習技術把該藝術字體的風格複製到其他25個字母上，節省了字體設計師的大量時間。
此外，要從一張照片裡取出某個元素，再把它「神不知鬼不覺」地混入另一張圖片裡，也是一件很有難度的事情。2021年獲得康乃爾大學博士學位的欒福軍和同事共同研發了一種名叫Deep Painterly Harmonization的算法，它透過局部風格遷移的方式把各種物體融合進畫作裡，而且是真的「毫無PS痕跡」。大量藝術家的心血，甚至藝術家自己，都慘遭它的「毒手」。
如果說圖片編輯工具Prisma風靡了整個2016年，這裡還有一個更驚豔的例子。FastPhotoStyle是英偉達的圖片風格轉換工具，其中包含了將照片變為各種藝術風格的算法。只要提供風格照片和目標照片，該工具就能將風格照片上的風格特點遷移至目標照片上，效果簡直是以假亂真。

2.1.2　深度學習減輕畫師的工作量
每一部動畫角色在形象確認之前可能需要畫師畫上百張圖來定型，在製作二維動畫時每一幀畫面的變化也需要畫師一筆一筆畫出來。每一幅畫的背後，經歷了從草稿到線稿再到上色稿以及後期修正等各個階段，這些環節會耗費畫師大量的心血和精力。有些時候由於檔期的限制，我們會看到動畫由於製作時間緊張而出現畫面崩壞的情況，其實不是製作公司和畫師不想畫好，而是畫師真的太辛苦了。
2016年日本早稻田大學公開了一個自動描線的技術，這項技術能夠自動辨識圖像並確定圖像的具體輪廓而完成描線的工作，即便是衣物線條這類很複雜的草稿也可以完美地一口氣轉化成為線稿。目前這項自動描線技術僅作為早稻田內部的研究計畫，不過隨著技術的成熟早晚會有一天針對畫師開放。
對很多沒有繪畫經驗的人來說，繪畫是非常困難的，更困難的是為繪畫選擇和諧的色彩，即使是相似的顏色，其中的差異也會對繪畫結果產生巨大的影響。有家名叫Preferred Networks的日本AI創業公司把超越Google當作自己奮鬥的目標。在漫畫線稿上色AI這個領域，他們研發的PaintsChainer幾乎可以算是標竿。PaintsChainer操作非常簡單，使用者選好線稿上傳，自行選擇顏色並塗在相應區域，PaintsChainer會根據圖像和提示的顏色即時自動為新圖像上色。
Google I/O 2018大會上，Google Photos發布了一系列的功能改進，包括給黑白老照片自動上色的AI修圖功能。使用者只需要將黑白照片上傳到Google Photos，就能一鍵看到上色效果，而且效果非常自然。Google除了研發出給黑白照片上色的AI機器人，同時也在研發一款為黑白影片上色的AI機器人。研究人員可以從彩色影片裡截取某一幀作為參考，然後把該影片轉換成黑白影片，再利用他們開發的AI機器人，依據參考幀的顏色，將剛才的黑白影片還原為彩色影片。
日本有位名叫Hiroshiba的開發者搭建了一個網站Girl Friend Factory，它能設置不同的人物屬性，例如五官、髮型、髮色、眼睛的顏色、表情甚至是服裝、裝飾物，透過GAN（generative adversarial network，生成對抗網路）生成不同的二次元頭像。雖然該技術還不是很成熟，有些頭像會有明顯的扭曲，但相信隨著技術的完善，它可以使畫師的繪畫製作成本進一步降低。
在區塊鏈（blockchain）領域，有個名叫Crypko的區塊鏈遊戲震撼了整個二次元圈，其遊戲玩法跟之前流行的「謎戀貓」（CryptoKitties）非常類似：Crypko在前期透過收集網路上的不同插畫作品，利用GAN神經網路將兩張不同風格的插畫作品的特點進行融合，自動生成一張新的插畫作品。後期使用者可以透過租賃或者購買的方式獲取想要的插畫，再與自己已有的插畫進行融合，生成新的插畫。

2.1.3　AI自動生成高品質逼真場景
你可能不相信，下面這張高解析度、逼真的圖像是AI合成的。CG要達到這樣真實的效果，需要建模、定材質、貼圖、上燈光和渲染，工作量極大。這張逼真的圖像來自香港中文大學聯合英特爾視覺計算實驗室的最新成果，他們共同研究出了一種半參數模型，簡稱為SIMS，相關工作論文〈Semi-parametric Image Synthesis〉已被CVPR 2018收錄。這項技術主要思考方向是先用大型真實圖像資料庫訓練非參數模型獲得一個合成素材庫；然後利用語義布局分析虛構場景裡有什麼，再把這些素材填充進去；最後在接縫的地方，深度神經網路會計算好不同素材之間的空間關係，給予適當的光影關係，合成一幅逼真的圖片。
在電影裡，雖然空間和場景設計都不算是核心，但每一個細節都可能影響整部電影的品質；同理，沉浸感很強的VR也會面臨這個問題。隨著AI渲染環境技術的成熟，高品質、低成本創造真正模擬現實世界的遊戲場景將成為可能。SIMS的第二作者陳啟峰已經開始嘗試利用這套算法來替換《俠盜獵車手V》（Grand Theft Auto V）裡的遊戲場景。
來自英偉達和MIT的研究團隊，在2018年8月發布了迄今最強的AI高解析度影片生成網路——vid2vid。它不僅能做到自動合成街景的效果，而且能透過一個簡單的素描草圖，生成細節豐富、動作流暢的高解析度人臉。你只需要勾勒出人臉輪廓，系統就能自動生成一張張正在說話的人臉。你不僅可以定製人物的臉色和髮色，甚至可以更換人物身後的背景。除了自動合成與人臉相關的影片，vid2vid還能合成與人體動作相關的影片。只需要對下圖左側的人體模型進行調整，無論是姿勢還是身高、胖瘦，右側都能生成一個真人影片。在未來，AI除了能幫我們簡化場景設計，還能為我們簡化各種配角設計。

主題書展