⛧⛦ 一本搞定 LLM 看圖說故事與即時影像分析 ⛦⛧⛧⛦ 十款熱門模型實際解決生活中 AI Vision 問題 ⛦⛧⛧⛦ 用「自己的」資料集在本地端訓練 YOLO 模型 ⛦⛧⛧⛦ 無痛設計 Web 互動介面,輕鬆部署 AI 模型 ⛦⛧『AI Vision × LLM』劃開多模態應用的新時代從輸入文字生成圖片,到上傳照片讓 LLM 看圖說故事,AI 電腦視覺技術結合 LLM 的多模態應用正席捲全球。但這些令人驚豔的應用背後,其實倚賴多項核心技術——包含物體偵測、人臉辨識、情緒與年齡分析、或是影像文字識別,以及對於文字的理解與生成,這才賦予 AI 真正「看懂」影像內容的能力。實際解決現實生活中的 AI Vision 問題帶領讀者以多款熱門模型如 YOLO、OpenCV DNN、MediaPipe、CVZone 3D、DeepFace、Dlib、LiteRT、EasyOCR,打造刷臉門禁系統、即時口罩偵測、微笑自拍、手勢操控投影片、AI 健身教練、車牌辨識、結帳櫃台人流與高速公路車流分析等多項實用專案,讓讀者親身體驗 AI Vision 在真實場景中的應用價值。不僅會用,還能自行訓練專屬 AI 模型讓你不只會活用現成的模型,還能自己動手標註資料並訓練屬於你的 YOLO 模型。並且透過 Streamlit 設計 Web 互動介面,將訓練成果部署為具備即時偵測與辨識功能的 Web 應用程式,實現從標註資料、模型訓練到應用上線的完整流程。親手打造多模態 AI 應用,收穫滿滿成就感整合前述 AI Vision 技術與大型語言模型(LLM),或運用 Ollama 的多模態工具 Llama-Vision,再搭配 Streamlit,即可實作出讓 LLM 分析影像內容或情境的 Web 智慧應用,例如路況分析或圖片描述,讓 AI 真正具備視覺理解與語意回應的能力。零基礎也能無痛入門本書主打「從做中學」的實作導向,即使沒有深厚的理論基礎,也能快速掌握 Python 的 AI 模型與實用套件。至於不熟悉的語法、函式用法、AI 模型原理,或是特定功能的程式碼編寫與修改,則交由 ChatGPT 給予我們即時協助,讓學習更有效率。無論你是 AI 初學者還是開發者,本書都能帶你輕鬆入門、快速上手,從零開始打造專屬的 AI 專案,成為 AI Vision × LLM 的超酷玩家!🎉本書特色: ➢
New edition:•Updated material with the addition of new topics•Previous Internet or computer knowledge is not required•Internet related listening comprehension and practical exercises•Complementary tex
The major progress in computer vision allows us to make extensive use of medical imaging data to provide us better diagnosis, treatment and predication of diseases. Computer vision can exploit texture
Market Leader Active Teach provides the Course Book and a range of other teaching resources in digital format. The software can be used on any interactive whiteboard or computer and projector set up.
On July 17, 2012, the centenary of Henri Poincare's death was commemorated; his name being associated with so many fields of knowledge that he was considered as the Last Universalist. In Pure and Appl
Award-winning original fiction for learners of English. A struggling writer and a computer with a mind of its own fight for control of the writer's story and destiny. When Frank Wormold buys a compute
Computer and Machine Vision: Theory, Algorithms, Practicalities (previously entitled Machine Vision) clearly and systematically presents the basic methodology of computer and machine vision, covering