隨著 Google Gemini 3 模型以及各式工具推出,在生成式 AI 的世界中 Google 強勢站穩腳步,再加上 Google 生態系的支援,採用 Google Gemini API 開發 AI Agent 是一個相當不錯的選擇。本書主要解說 Google Gemini API 中關鍵的成員,並利用 Python 版本的 Google GenAI SDK 實作範例,還會帶大家設計當前 AI Agent 的趨勢 -- Skills 機制,主題包含:|簡易 Skills 機制|現今 AI Agent 的共用規範標準就是 Skills,我們會帶大家實作一個簡單的 Skills 機制,讓你的 AI Agent 只要透過 markdown 檔,就可以讓非技術人員的一般使用者也可以客製自動化流程,或是搭配 CLI 工具與 MCP 伺服器等擴充模型能力,而不需要倚賴技術人員修改或是撰寫額外的程式碼。|建構彈性的 MCP 系統|即使有了 Skills 機制,也需要能夠實際完成任務的工具,MCP 就是其中之一。除此之外,MCP 也是擴充模型能力的好幫手,書中會設計讓使用者透過設定檔就能幫 AI Agent 串接各式功能 MCP 伺服器的機制,不論是要讀寫檔案、執行本機指令、操控瀏覽器,或是使用遠端 API 等等,都可以方便達成。|Live API|用講的絕對比用打的更快,書中會用 Live API 實作可隨時中斷插話的即時語音系統,讓你的 AI Agent 彷彿真人用講的就可以操控,而且還會自動記錄交談內容,維持前文脈絡,讓一般使用者透過口說介面就可以使用你的 AI Agent。|把 Google 生態系當靠山|網頁搜尋、找地點誰能比得過 Google,利用 Gemini API 內建工具即可直通 Google 搜尋與地圖,即時資訊一點都不漏,為模型補充新知識。|多模態輸入/輸出|讓你的 AI Agent 像是 NotebookLM 那樣看圖、看影片、聽語音,即使是 YouTube 影片,也可以直接丟連結自動處理。此外,透過 Gemini API,也可以用最強的 Nano Banana Pro 生圖、Veo 3.1 生影片通通沒問題。|詳解 Function Calling 機制|不論是要使用 MCP 伺服器或是 Skill 擴充模型功能、建置自動化流程,最終都需要倚賴 Fu
⛧⛦ 一本搞定 LLM 看圖說故事與即時影像分析 ⛦⛧⛧⛦ 十款熱門模型實際解決生活中 AI Vision 問題 ⛦⛧⛧⛦ 用「自己的」資料集在本地端訓練 YOLO 模型 ⛦⛧⛧⛦ 無痛設計 Web 互動介面,輕鬆部署 AI 模型 ⛦⛧『AI Vision × LLM』劃開多模態應用的新時代從輸入文字生成圖片,到上傳照片讓 LLM 看圖說故事,AI 電腦視覺技術結合 LLM 的多模態應用正席捲全球。但這些令人驚豔的應用背後,其實倚賴多項核心技術——包含物體偵測、人臉辨識、情緒與年齡分析、或是影像文字識別,以及對於文字的理解與生成,這才賦予 AI 真正「看懂」影像內容的能力。實際解決現實生活中的 AI Vision 問題帶領讀者以多款熱門模型如 YOLO、OpenCV DNN、MediaPipe、CVZone 3D、DeepFace、Dlib、LiteRT、EasyOCR,打造刷臉門禁系統、即時口罩偵測、微笑自拍、手勢操控投影片、AI 健身教練、車牌辨識、結帳櫃台人流與高速公路車流分析等多項實用專案,讓讀者親身體驗 AI Vision 在真實場景中的應用價值。不僅會用,還能自行訓練專屬 AI 模型讓你不只會活用現成的模型,還能自己動手標註資料並訓練屬於你的 YOLO 模型。並且透過 Streamlit 設計 Web 互動介面,將訓練成果部署為具備即時偵測與辨識功能的 Web 應用程式,實現從標註資料、模型訓練到應用上線的完整流程。親手打造多模態 AI 應用,收穫滿滿成就感整合前述 AI Vision 技術與大型語言模型(LLM),或運用 Ollama 的多模態工具 Llama-Vision,再搭配 Streamlit,即可實作出讓 LLM 分析影像內容或情境的 Web 智慧應用,例如路況分析或圖片描述,讓 AI 真正具備視覺理解與語意回應的能力。零基礎也能無痛入門本書主打「從做中學」的實作導向,即使沒有深厚的理論基礎,也能快速掌握 Python 的 AI 模型與實用套件。至於不熟悉的語法、函式用法、AI 模型原理,或是特定功能的程式碼編寫與修改,則交由 ChatGPT 給予我們即時協助,讓學習更有效率。無論你是 AI 初學者還是開發者,本書都能帶你輕鬆入門、快速上手,從零開始打造專屬的 AI 專案,成為 AI Vision × LLM 的超酷玩家!🎉本書特色: ➢
機器學習最強入門邁向AI高手王者歸來(全彩印刷)內容簡介★★★★★【數學原理 + 演算法 + 真實案例 + 專題實作】★★★★★★★★★★【數學 x機率 x 統計 x 演算法】★★★★★★★★★★【機器學習演算法 x AI專題】★★★★★ AI時代的學習革命:用最簡單的方式掌握機器學習。 機器學習已成為當今科技領域的核心技能,但艱澀的數學與複雜的概念常讓人望而卻步。本書以淺顯易懂的白話解釋,結合全彩圖表輔助教學,幫助讀者輕鬆入門、快速掌握機器學習的核心知識與應用技巧。本書特色◎ 白話解釋機器學習:摒棄晦澀公式,以簡單明瞭的語言說明每個概念,配合豐富的全彩圖表,讓學習變得更輕鬆有趣。◎ 基礎數學起步,實現 AI 場景應用:從基礎數學概念講解機器學習,逐步導入 AI 在生活中的實際應用,橋接理論與實務。◎ 彩色圖解演算法,從小數據開始:用彩色圖像化的方式清晰呈現演算法的運作原理,並從簡單的小數據案例帶領讀者進入真實世界的應用。◎ 實用程式碼範例:提供完整的 Python 程式碼範例,將理論知識與實務結合,幫助讀者快速上手,並理解如何將理論轉化為可行的程式解決方案。◎ AI 專題實戰:涵蓋特徵選擇、模型選擇、超參數調整等進階主題,提供解決特定問題的策略與技巧,助力讀者邁向機器學習高手之路。數學場景 × AI 實例◎ 方程式、一元到多元函數 ★餐廳經營、業務員績效、網路行銷 .
隨著網絡和計算機的安全越來越受重視,滲透測試技術已經成為網絡安全研究領域的焦點之一。作為一款網絡安全審計工具,Kali在滲透測試行業廣受認可,幾乎包含了所有的熱門工具,它可以通過對設備的探測來審計其安全性,而且功能極其完備。本書由暢銷的Kali圖書升級而來,由資深的網絡安全領域的一線教師編寫完成。全書共15章,圍繞如何使用Kali這款網絡安全審計工具集合展開,涉及網絡安全滲透測試的相關理論和工具、Kali Linux 2的基礎知識、被動掃描、主動掃描、漏洞掃描、遠程控制、滲透攻擊、社會工程學工具、用Python?3編寫漏洞滲透模塊、網絡數據的嗅探與欺騙、無線安全滲透測試、拒絕服務攻擊等知識點,並結合Nmap、Metasploit、Armitage、Wireshark、Burp Suite等工具進行全面的實操演示。讀者將從書中學習到簡潔易懂的網絡安全知識,瞭解實用的案例和操作技巧,更好地運用Kali Linux 2的工具和功能。本書適合網絡安全滲透測試人員、運維工程師、網絡管理人員、網絡安全設備設計人員、網絡安全軟件開發人員、安全課程培訓人員、高校網絡安全專業的師生等群體閱讀,有教學需求的讀者,還可以從本書的配套資源中獲得相應的教輔資料。