TOP
紅利積點抵現金,消費購書更貼心
R語言與Bioconductor生物資訊學應用(簡體書)
滿額折

R語言與Bioconductor生物資訊學應用(簡體書)

商品資訊

人民幣定價:58 元
定價
:NT$ 348 元
優惠價
87303
絕版無法訂購
商品簡介
作者簡介
名人/編輯推薦
目次
書摘/試閱

商品簡介

《R語言與Bioconductor生物信息學應用》既是一本R語言的書,又是一本生物信息學的書,從實際課題及如何解決問題的思路出發,結合基礎知識,偏重解決問題的流程,選用簡單但功能強大的R語言,把講解延伸到具體程序代碼,讓讀者經歷整個課題研究過程,學會分析并解決問題,從而加深學習印象,并真正把所學知識轉化為技能。

作者簡介

 高山,天津大學計算機科學與技術學院副教授。1995年考入國防科技大學電子工程學院,后轉入生物信息領域,2010年畢業于南開大學生命科學學院,取得生物信息學博士學位。留美期間主要科研工作是在美國堪薩斯大學結構生物學中心和康奈爾大學BTI植物研究所完成。2013年通過天津市第八批“千人計劃”青年項目)進入天津大學工作。歐劍虹,1997年考入武漢大學微生物專業學習,后進入日本大阪大學學習,2009年畢業于大阪大學,取得信息科學與技術博士學位。2011年進入麻省州立大學醫學院從事生物信息研究工作。肖凱,職業數據分析師,“數據科學與R語言”博客博主,現供職于SupStat統計咨詢公司,專注于R語言與大數據挖掘方面的研究。

名人/編輯推薦

國內首部與SCI文章緊密結合的生物信息書籍。大量實際課題來自發表的SCI文章,全部都是“真槍實彈”,不杜撰所謂“實際應用”。
通過前期網上調研,了解并在書中突出大多數讀者普遍關心而又難尋相關資料的問題。
從實際課題出發,提出解決問題的思路,結合原理把講解延伸到具體程序代碼。所見即所得,學到的知識可以通過簡單編程加以實現。三板斧法學習R語言,讓無基礎的人也能輕松編程。

2013年最“華彩”的事件莫過于6月的“棱鏡門”。據稱,美國政府竊聽的范圍可以觸及每一個機構和家庭。這些在筆者看來無非是媒體的炒作,只能作為茶余飯后的談資而已。而從數據處理角度來看,即使美國政府有錢有技術,能夠收集和存儲人類社會所有的通信信息,那么它也絕無能力處理這些信息,哪怕只有1%,更別提形成有價值的情報。理由很簡單,因為我們進入了“大數據”時代。暫且不說竊聽得到的信息,就算現有公開數據庫中的數據又有多少得到了有效利用。生物信息就是名副其實的“大數據”領域,特別是當前,下一代測序主導的基因組學每天帶來數以“T”計的海量數據,遠遠超出了現有的數據處理能力。為此,研究人員開發了一些計算機語言或工具(如基于R語言的Bioconductor項目),可以高效地處理這些數據。因此,如何提供有效的培訓,出版好的教材,讓數據分析人員快速掌握這些語言和工具,已成為“大數據”時代一個非常重要的課題。
本書的幾位作者在考察了國內外同類書籍后發現,市場上大部分此類教材或者參考書容易走向兩個極端:一是過分偏重理論,講了很多非常基本的東西,但是沒有聯系到當前的實際應用,從理論到算法,到程序,乃至應用,這些連接部都是一大片空白,留給學生自己去摸索,會讓他們難以理解,進而無法深刻掌握所學知識;二是閉門造車式地應用,有些所謂“應用”或者“實戰”類書籍,造出一些根本不存在的“應用”舉例,既不講明這么做的目的,也沒有實際項目的背景知識,讓讀者越學越是一頭霧水,學到的東西越多,越不知道干什么用、該怎么用。
在生物信息數據分析領域,如果能夠編寫這樣一種書,從實際課題(數據和結果都已經公開發表)出發,提出解決這個問題的思路,結合用到的原理或基礎知識,但更偏重整個解決問題的框架和流程,選用一種簡單易學但功能強大的語言,把講解延伸到具體程序代碼,讓讀者百分之百經歷整個課題研究過程,學會分析并解決問題。那么可以肯定地說,這個學習的印象是深刻的,并真正能把所學知識轉化為自己的技能。這樣的學習過程更加“實例化”,更符合學習者的習慣,而不是編書者的習慣。多年的實際工作經驗告訴我們,與計算機語言有關的學習,必須結合實際項目,動手與動腦同等重要,而結合SCI文章中的具體研究是本書的第一個特點。
本書的幾位作者根據數據分析(特別是生物信息方面)領域多年的工作經驗,細心整理了部分工作內容和程序代碼,將R語言和Bioconductor盡可能詳盡但又不泛泛地介紹給讀者。由于本書的編寫思路和風格是全新的,也是一種嘗試,再加上作者水平有限,時間緊迫(國內讀者催書),書內錯誤在所難免。不過,我們的編寫思路是典型的“Made in China”原則,有個質量差的能滿足需要總比沒有好。只要能夠有益讀者,挨罵也在所不惜。本書可作為高年級本科生和研一學生的生物信息教材配套讀物,亦可作為計算機和數據分析領域的參考書。
本書的第二個特點就是“所見即所得”,本書涉及的全部源代碼都可以通過“拷貝”和“粘貼”來運行,并得到書中同樣的結果,使程序處理的每一個步驟都在讀者的掌控之中。
本書的第三個特點就是所有作者都是通過互聯網認識(此前互不認識),并一起合作進行創作的。希望能夠由此啟發國內其他領域的專家也能充分利用網絡的力量,集中優勢,編寫一些更好的教材。下面是主要作者簡介。
高山,男,1977年出生,1995年考入國防科技大學電子工程學院,后轉入生物信息領域,2010年畢業于南開大學生命科學學院,取得生物信息學博士學位。留美期間主要科研工作在美國堪薩斯大學結構生物學中心和康奈爾大學BTI植物研究所(Boyce Thompson Institute for Plant Research)完成。2013年通過天津市第八批“千人計劃”(青年項目)進入天津大學工作。
歐劍虹,男,1979年出生,1997年考入武漢大學學習微生物專業,后進入日本大阪大學,2009年畢業于大阪大學,取得信息科學與技術博士學位。2011年進入麻省州立大學醫學院從事生物信息研究工作。
肖凱,男,1977年出生,職業數據分析師,“數據科學與R語言”博客博主,現供職于SupStat統計咨詢公司,專注于R語言與大數據挖掘方面的研究。
施勁松,男,1982年出生,2000年考入南京大學生命科學學院,后考入第二軍醫大學,取得生理學博士學位。2012年進入南京軍區南京總醫院腎臟病研究所,主要研究方向是結合臨床的組學數據分析。
杭興宜,男,1981年出生,2003年于解放軍第一軍醫大學生物醫學工程系取得學士學位,2009年于解放軍軍事醫學科學院取得生物信息學博士學位,2013年于解放軍總醫院臨床醫學流動站博士后出站。主要研究方向為高通量組學數據整合和數據挖掘、轉化醫學數據資源建設等。
胡朝陽,男,1983年出生,2007年于華中科技大學同濟醫學院取得學士學位,2012年于復旦大學取得博士學位。現供職于杭州市腫瘤醫院腫瘤研究所,主要從事整合多組學的高通量藥物篩選研究。
宮秀軍,男,1972年出生,2002年于中國科學院計算技術研究所取得計算機軟件與理論方向工學博士學位。2002—2003年分別在新加坡國立大學和新加坡Institute for Inforcomm Research (I2R)做博士后和訪問學者。2003—2006年就職于日本奈良先端科學技術大學院大學。2006年5月回國,進入天津大學,現為計算機科學與技術學院副教授。研究方向主要包括數據挖掘、復雜信息系統集成和生物信息學。
呂紅,女,1978年出生,1998年考入哈爾濱工業大學航天學院,取得工學碩士學位。2006年進入天津職業技術師范大學電子工程學院工作,主要研究方向為通信信號處理、通信網和移動通信技術。
本書的其他作者包括青島市市立醫院的釗守鳳(1972年出生,女)、中科院病毒所的劉海舟(1976年出生,男)、昆明理工大學的焦建宇(1991年出生,男)、華南師范大學的游宇星(1988年出生,男)和美國凱斯西儲大學醫學院的管棟印(1983年出生,男)。另外,參與校對工作的人員有沈陽農業大學的齊明芳副教授、廣東省農業科學研究院的貝錦龍助理研究員、山東師范大學的公茂磊、河南農業大學的楊海玉、中國農業大學的張媛媛、華中農業大學的易堅、重慶大學的李勃、浙江大學的吳三玲、中科院病毒所的葉彥波、美國伊利諾伊大學香檳分校的張洋和美國得州學院的董川。東南大學的謝建明副教授、暨南大學的許忠能副教授和中國農業科學院甘薯所的曹清河副研究員也對本書提出了寶貴意見。本書的封面設計原始創意來自北京市理化分析測試中心的蘇曉星和延邊大學的李廣。
首先,感謝BTI植物研究所的費章君副教授在我博士后期間的指導以及費章君實驗室的毛林勇、鄭軼、包衎和孫宏賀等各位同事的幫助。費老師是我在第二代測序方面研究的領路人,不僅在專業上給我多方面指導,而且在學術研究等其他方面也使我得到很多訓練。本書在第二代測序方面的一些思路和經驗有些來自于費老師實驗室各成員的討論。
其次,感謝我的博士生導師南開大學生命科學學院的張濤和數學學院的阮吉壽教授對我的長期支持,并作為我的堅強后盾;感謝國家人口與健康科學數據共享平臺的支持;特別感謝天津大學計算機科學與技術學院前院長孫濟洲教授和院長黨建武教授對我回國工作的熱情幫助,以及天津市委組織部和天津大學在人才引進方面的積極服務。最后,感謝堪薩斯大學徐亮副教授提供了第五章5.7部分的芯片數據,加利福尼亞大學助理教授Thomas Girke提供了第二章內容的部分源代碼。本書的資助來自天津市認知計算與應用重點實驗室的國家自然科學基金重點項目“語音產生過程的神經生理建模與控制”(F030404)。本書在編寫過程中,還得到了我國腎臟病專家、中國工程院院士劉志紅教授的關懷和幫助,在此也一并表示感謝。
本書的第四個特點就是寫書過程中不斷通過QQ群征詢本領域研究人員的意見,動態交流,其間對內容進行了多次修改,而且本書的售后服務和答疑也將通過QQ群160685613進行

目次

第一章 R基礎知識
 1.1 什么是R
 1.2 R的下載與安裝
 1.3 R語言快速入門
 1.4 一些簡單的語法知識
 1.5 本章源代碼詳解及小結
第二章 生物信息學基礎知識
 2.1 中心法則——生物信息流
 2.2 測序與序列分析
 2.3 基因表達分析
 2.4 注釋、統計與可視化
第三章 R在生物信息學中的簡單應用
 3.1 一個序列分析課題
 3.2 用R包(非Bioconductor)實現課題
 3.3 用R包(Bioconductor)再實現課題(方法一) 第一章 R基礎知識
 1.1 什么是R
 1.2 R的下載與安裝
 1.3 R語言快速入門
 1.4 一些簡單的語法知識
 1.5 本章源代碼詳解及小結
第二章 生物信息學基礎知識
 2.1 中心法則——生物信息流
 2.2 測序與序列分析
 2.3 基因表達分析
 2.4 注釋、統計與可視化
第三章 R在生物信息學中的簡單應用
 3.1 一個序列分析課題
 3.2 用R包(非Bioconductor)實現課題
 3.3 用R包(Bioconductor)再實現課題(方法一)
 3.4 用R包(Bioconductor)再實現課題(方法二)
第四章 Bioconductor簡介
 4.1 什么是Bioconductor
 4.2 Bioconductor的分類介紹
 4.3 從R到Bioconductor的跨越
第五章 Bioconductor分析基因芯片數據
 5.1 快速入門
 5.2 基因芯片基礎知識
 5.3 基因芯片數據預處理
 5.4 基因芯片數據分析
 5.5 芯片處理實際課題一
 5.6 芯片處理實際課題二
 5.7 芯片處理實際課題三
第六章 Bioconductor分析RNA-seq數據
 6.1 示例課題介紹
 6.2 高通量測序基礎知識
 6.3 RNA-seq技術的特點
 6.4 RNA-seq數據預處理
 6.5 RNA-seq數據分析
第七章 R的高級語法與如何創建R包
 7.1 R的高級語法
 7.2 創建及發布自己的R/Bioconductor包
 7.3 R包結構
附錄A 進一步學習的資源
附錄B R常用函數
附錄C R的內存管理和幫助系統

書摘/試閱



(3)動態的生物學注釋
這里的注釋特指元數據(Metadata),在Bioconductor的一些文檔中,元數據與數據的注釋這兩個概念經常混用。元數據作為描述數據的數據,主要描述數據屬性,用來支持如指示存儲位置、歷史數據、資源查找和文件紀錄等功能。生物信息領域的元數據有兩個重要特點,即變化性和復雜性。因此Bioconductor項目開發了一些軟件協助研究人員使用和分析元數據。為了保證元數據及時更新,以便用戶可以得到最新的元數據,Bioconductor將元數據寫入R包。這些R包都是采用一種半自動更新的方法創建,并通過一些基于reposTools包開發的工具發布或更新。元數據有版本管理,用戶可以決定何時更新需要的數據,還可以方便地獲取舊版本的數據。
自動構建數據包有如下好處:首先,因為注釋包有統一的規范,用戶熟悉了一個包之后對同類型的包也會觸類旁通;第二,數據包的創建便捷快速,例如有關基因芯片的所有數據包,都應該包括同樣的信息(例如染色體位置和基因本體論類別等),所不同的是每種芯片都有不同的探針集合。
經常遇到的一個問題是,用戶是否應該僅僅依賴在線資源獲取元數據。從潛力上講,在線方式保證了用戶可以更及時獲取最新的信息,本地包的方式往往做不到。但是相對于在線資源,使用本地數據包也有它的優勢,比如用戶不能一直在線,用戶可能對在線的信息資源并不是十分了解等。另外,在線資源可以被擁有者隨意地更新和修改,有時候無法保證追蹤到舊版本的數據以重復已經發表的結果。
(4)實驗的可重復性
Bioconductor非常強調研究的可重復性,這是生物信息學,乃至科學發現的基礎。然而在計算科學領域,這方面不是很樂觀。在以往的計算科學相關的文章中,人們往往只是對自己的算法進行描述,因為紙制文章這種發表媒介局限了人們發布實驗數據、運行參數以及程序本身。其后果就是他人在重復前人工作時,需要花費很大的精力去琢磨一些細節問題,特別在無法與作者進行有效溝通的情況下,需要投入更多的時間。在生物信息學領域,在發表文章的同時發表數據已經成為一種趨勢,這為他人重復實驗提供了可能。而重復實驗還需要軟件以及每一步的執行命令和參數等詳細信息。因此當前主流的高品質期刊都要求文章發表者提供相應的哪怕是非常基礎的工作細節。將全部詳細信息一起提交的文章,才能成為高水平的文章。
Biocondoctor擴展包及文檔的統一標準為同時發布數據和代碼等信息提供最優秀的平臺,完全可以滿足生物信息學研究的可重復性要求。哪怕是如何生成一個圖形或一個表格,其詳細過程都可以在Sweave文檔中找到。任何一個R用戶都可以很輕松地修改代碼或參數來檢驗文章中的計算結果的健壯性,或者嘗試不同算法和參數的計算結果。

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 303
絕版無法訂購

暢銷榜

客服中心

收藏

會員專區