ImageVerifierCode 换一换
格式:DOCX , 页数:11 ,大小:34.39KB ,
资源ID:846668      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-846668.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(推荐精品生物云行业分析报告Word下载.docx)为本站会员(b****1)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

推荐精品生物云行业分析报告Word下载.docx

1、1、生物云服务差异化的呈现模式与未来爆发契机11、生物云因何而生,服务可以以怎样的模式具体呈现 生物云基本功能是提升生物大数据运算的速度和稳定性,并免去分析人员重复编程和寻找各种算法的繁琐。做生物大数据解读最起码要有数据库和算法以及计算机硬件平台。对小规模的分子生物学实验室而言,一般的生物信息分析使用正常性能的电脑+免费的生物信息国外软件+实验人员一定程度的自主编程即可满足数据处理的需求,但耗时较长(例如,完成一个典型的外显子分析约耗时 15 小时,完成一个 50 倍覆盖下的全基因组分析约需 45 小时)。随着生物信息工具使用频次和分析通量的快速提升,实际应用中对数据处理的运算速度、稳定性、可

2、重复性的要求亦迅速提升;同时,生物信息分析工具(算法、软件等)不断进步和丰富也让分析人员自行寻找和改良算法成为一件相当繁琐的工作,这客观上就产生了两类对分析工具的需求:1)计算能力要更强,通量要更大,速度要更快,运算要更稳定;2)最好有一个应用集成完善的平台,能将各种常用的分析方法、数据库囊括在内,并且能及时升级原有算法的效率、不断将领域中新的重要分析方法加进去,以及不断对数据库进行更新,让分析人员免去很多寻找工具和重复编写算法的工作生物云计算平台满足的正是这种需求。 华大基因在 2015 年 4 月发布的 BGI Online就是一款为新一代测序的测序数据提供快速、精确分析、一站式解决的典型

3、云计算产品。BGI Online 用户不仅可直接在华大开源代码的基础上创建和开发自己的工具并能建立符合用户自身研究需求的分析流程,运算能力强大的 BGI 云平台还能极大提升数据分析的效率,从用户输入原始测序数据到得出包括 SNP、插入、缺失在内的分析结果,ELSA 处理 50 倍覆盖下的全基因组数据样本仅需 4 小时,而处理 200倍覆盖下的全外显子数据样本更仅需 10 分钟。随着行业未来进一步发展,生物云服务可能因所面对的用户需求存在差异, 展现为应用场景差异化的产品挖掘不同类型用户需求,推出针对性强的场景差异化定制产品亦正是目前生物信息创业公司或测序公司普遍选择的重要突破方向之一,这些场景

4、差异至少可表现为:1) 科研场景下,生物信息学研究人员可能更喜欢速度更快、通量更高、 精确性更高、但输出结果尽量原始和“少被加工”的“更炫酷”的云处理过程与结果(例如云计算仅输出一堆 SNP 信息),以便于根据研究需求更开放地决定如何进一步个性化利用输出的数据;2) 医院场景下,医生一般而言更希望能快速通过云计算得到尽量直观的,能对诊疗、用药、治疗方案提供指导的,高度稳定和可重复的标准化决策辅助信息(例如直接告诉医生,从病人基因组分析的结果看,病人某肿瘤最适合优先使用哪种药物或疗法,而哪些药物或疗法是无效的),而不仅仅是一堆位点变异信息又或是基因组决定病人以后高概率会得什么病;3) 日常生活场

5、景中,大众可能更希望云处理输出的结果直接告诉自己以 后得哪些病的概率更高以及如何预防,而不是自己根本读不懂的基因变异数据;12、在具体形式上,生物云按用户需求差异又可做成公有云和私有云注:荣之联的生物云二期包括公有云计算和私有云搭建两类服务。 公有云的核心思想是“数据众筹”,美国的 NCBI 和我国的国家基因库都是典型的非盈利性公有云。公有云是指各用户在云端共享自己的数据和算法、一同受益的云平台模式,公有云功能强大除建立在比一般企业组件更多更全的硬件上,数据共享本身亦是确保公有云数据全面、从而发挥更强功能的关键,对盈利性质的公有云而言,公有云完全可按计算量和数据使用量对用户收费。而相比之下,私

6、有云无非是仅供机构内部使用的生物信息云,数据非公开、更高的保密性和安全性是私有云的典型特征。13、应用场景差异决定公有云和私有云满足的是用户不同层级的需求 生物信息学分析必须有足量样本才能进行数据间的相关性分析,而样本收集恰恰是研究中最麻烦的环节,医院有大量种类的样品待挖掘但自己没有挖掘能力,生物信息研究机构有挖掘能力但相当缺样品。虽然确实也存在很多建立在数据非公开基础之上的商业模式,但至少对大部分医院和政府而言,共享又或是部分共享会成为他们的诉求,这是由于:1) 医生有疾病研究的需求。以脑瘤为例,病人总会在各地各个医院间零散分布,脑瘤样本取样又非常麻烦,客观上,研究者分别跑众多医院收集并集中

7、样本会相当困难,但各个医院的样本如果不集中又毫无意义。于是对医院而言,为研究此类疑难杂症,医院间就会存在分别上传并共享样本数据的需求,当然这种共享可能最终要医院联盟或政府等推动。2) 医生有挖掘个性化药物&诊疗方法,提升自己诊疗水平的需求。例如,美国有一种抗癌药,疗效和目前已知的基因组中的 17 个位点关系紧密,对美国人而言,如果这 17 个位点中有 13 个是阳性该药物就有效但对中国人,由于遗传背景差异,这 17 个位点即便全部阳性药物同样无效。这意味着,建立在外国人基因组背景之上对药物有效性的研究结果很可能不能直接用于中国人群体,我国的医生客观上也就对在中国人群体中再次验证或研究一遍药物有

8、效性鉴别指标提出需求而有效与无效的诊疗信息及相关病人基因组样本同样分散在众多医院中,存在需要集中的问题;3) 国家有推动医疗服务质量提升和节省医疗资源浪费的双重需求。同样以癌症为例,癌症治疗药物一般价格高,副作用大,有没有效需要时间检验,传统的方式是将各种药物统统试一遍直到遇到有效的癌症治疗药物。这种做法问题在于,很多无效的药物完全可根据最初的基因检测结果预先判断不必使用而省去,盲目试用不仅浪费大,副作用给病人带来的痛苦也很大,更可能让病人错过治疗关键的时间窗口。因而从国家层面上看,为提升医疗服务水平和减少医疗资源浪费几乎一定会有将基因检测提升为标准诊疗流程的动力,以及推动数据共享的动力; 对

9、公有云而言1) 拥有更大计算机集群的公有云一般情况下运算效能比私有云要高很多。例如在做某类疾病的全基因组关联分析时,一个血样的全基因组测序原始数据就有几百 G,如用到 2000 个病人基因组样本,就算每个原始数据仅按 100G 算,也会涉及到 200,000G 巨量数据的网络传输。这对硬件性能和网络架构没那么高精尖的一般实验室和医院而言,简直是极其繁琐和不可想象的,但在公有云场景下,用户分析所需的基因组数据和算法都一同被存储在云端平台,用户无需传输或仅传输少得多的数据就可直接在云端直接完成分析;2) 盈利性的公有云比私有云成本更低,荣之联的公有云服务很大程度也是为满足当前生物信息领域创业潮下,

10、日益增长的众多初创企业的数据处理服务需求;3) 公有云能作为对私有云的有效补充,即便私有云处理能力超强的华大基因,在面对非敏感的突发性高通量分析任务时,自有的数据处理能力也很容易无法满足的计算需求,从而产生对公有云分析平台的使用需求; 对私有云而言,保密性和安全性更高是最大的好处,这就导致:1)即便公有云计算效率更高,很多企业也宁可首选私有云;2)即便华大基因推出了公有云服务,诺和、药明康德、贝瑞和康等和华大直接竞争的生物企业也绝无可能用华大的生物信息学服务,荣之联相对中立的公有云则不存在这种问题;生物云需求爆发的契机基因检测成为标准化诊疗决策辅助是大势所趋 未来趋势除应用场景差异化的发展趋势

11、以外,医疗始终是生物信息学产业面对的最大市场,特别在医院场景下,一旦测序越来越普遍地被用在医疗过程的决策辅助,医院在未来购买测序仪的意愿将越来越强烈,这将让生物大数据分析需求出现真正的爆发式增长;同时,随着数据分析水平的进步,每个购买测序仪的机构为测序仪配备附加的生物数据处理系统用于快速高通量的数据分析也会随之成为行业趋势。 测序越来越普遍地被用在医疗过程的决策辅助是未来的大趋势,这是因为,这种变化既符合行业需求自然发展的趋势,也和国家提升医疗质量、力推医保控费、甚至分级诊疗的政策面大方向一致,是行业内生趋势和外部政策趋势的交集。以香港经验为例,香港医疗是由政府主导的英制模式,医院管理局要做某

12、一项检测所有医院都得做。虽然中国医疗体系和香港不一样,如果政府出台基因测序辅助的包括癌症指导用药诊疗,新生儿产前筛查或跟踪等在内的应用,就一定会在医院迅速铺开。香港目前已经做到,对于癌症,如果不是治疗方法特别单纯清晰的类型(如淋巴癌),对肺癌等较复杂的癌症会要求先通过测序了解个人的遗传背景,再根据分析结果显示的哪个药可能有效或基本无效来对用药和治疗方案选用进行指导。对医院而言,这将有助于医院提供更精准的诊疗,更及时地把握病人治疗的时间窗口,并为病人省去使用“对特定基因型无效的药物”的费用,对政府而言也能为医疗水平整体的提升和控费提供显著帮助。随着生命科学的进步,基因分析数据辅助医生诊疗决策的能

13、力只会越来越强大。2、测序普遍用于诊疗决策辅助会让产业内对生物信息云的需求随之爆发一旦测序成为诊疗决策辅助的手段,由于通量问题,等级医院几乎肯定会普遍出现测序仪购买需求,同时这些机构本地“非生物信息化架构”的常规计算机集群亦几乎必然会由于数据处理效率不够、安全性不够、都将无法满足测序仪数据分析通量的需求,从而相匹配的云计算需求(公有云计算服务或私有云平台搭建)出现爆发。而客观上,生物信息学常规分析流程已在 2013 年基本确定,医院买入有关设备后,只要有人,测序和分析流程基本不再构成业务开展的瓶颈而仅仅从每年发布的生物信息学 paper 的作者看,实际上医院运营生物信息系 统所需要的人才已经具

14、备较充分的储备。荣之联的生物云和华大不构成竞争 非常关注的一个问题是,荣之联的生物云是否会和华大基因形成直接竞争至少从可预见的程度看,华大和荣之联基本不会出现显著冲突,这是由于:1) 前文提到的华大基因竞争者绝无可能用华大云服务,但荣之联生物云作为中立的云计算平台不存在此类问题,毕竟荣之联自己不会用云平台的数据去做生命科学&医学研究,或是开发新药;2) 华大基因和荣之联实际上是在生物信息学产业链处于不同的地位,专攻领域显著不同华大基因的核心优势是众多的科学家,这些科学家的长处是如何使用已有运算平台的硬件和软件解决重大的基础科学或生命科学方面的问题,华大的长处在“有了强大的计算工具该如何用” 的

15、生命科学研究层面,但如何为云平台架构出效能更强大的 IAAS、PAAS 这些“如何创造更强大的计算工具本身”则不是华大基因的强项和业务范畴;而荣之联的长处正是“如何创造更强大的生物信息工具本身(硬+软+集成)”。华大基因的 IAAS、PAAS 也是荣之联做的,且随着罗锐邦博士的加入,预计荣之联下一步也将在 SAAS 层级的生物信息学工具开发上迅速发力,但 “怎样利用强大的计算工具创新性解决生命科学难题(例如用来开发某种新药)”则不是荣之联的强项和业务范畴,是荣之联搭建的云计算平台使用者自己的事换句话说,事实上华大基因更倾向于成为荣之联生物云的潜在客户,而不是对手;3)华大基因开发基因组数据的项

16、目制模式与荣之联的以数据共享为根基的公有云模式不一样,这是因为项目制的数据价值挖掘模式必须建立在数据保密的基础之上,这与数据共享越多平台功能越强的云计算模式形成根本冲突:A)项目制数据挖掘模式的根基是私密而不是共享,例如,华大基因曾做过一个银屑病的数据库,含 2000 个样本,相关研究结果发表在Nature Genetics,然而上传到公共数据库时华大只提交了 60 份样本数据,1940 份则是非公开的,因为华大就是要拿这 1940 份非公开数据和别家企业以及研究机构一起谈未来的合作;B)项目制运作必然要求有关数据“决不可集中在一个池子里”,且对个别样本池而言,样本数也没必要做太大,只要够用就

17、行这客观上就导致,华大基因的众多项目制数据库决不可能达到公有云那种丰富度的样本覆盖量; 正如研发人员、医院、可能的大众对生物云计算得到的基因解读结果存在 差异化需求一样,行业中存在着大量的场景差异化需求,这意味着,就算都是生物信息云,这些生物云面对的实际也是不同类型客户的不同个性化需求,从而让这些云计算平台有很大的操作空间去规避同类的业务竞争。3、生物云计算的壁垒分析 在系统架构上,由于生物大数据和传统的金融、电信等领域的大数据特征上存在巨大差异,导致搭建效能真正强大的专业化生物信息云平台的壁垒非常高,一个精于做金融、电信云方面的公司发现生物云计算前景光明后想短期内拓展生物云业务难度很大,因合

18、理架构符合生命科学运算特征的云平台涉及到的由软到硬的一系列应用方面的技术和经验积累是短期内不可能绕开的荣之联也是通过和华大基因长达 10 年左右的共同成长才取得了当前的积累,成为我国“最懂生命科学的 IT 公司”。1) 数据的量是一个瓶颈,但非关键瓶颈,这是由于海量生物数据的存储 并不是简单地码硬盘就能做到的,还要考虑诸多计算机更深层次的问题,如存储&数据压缩的效率等。1) 如何高效率实现巨量数据的调用也是生物云计算真正关键的瓶颈,即 如何在考虑到生物信息计算场景差异化的情况下,高效实现巨量数据在计算单元和存储单元间调用,以及向用户界面间实现快速的结果返回。为实现这种目标,不仅合理的硬件加速非

19、常重要,云计算系统在IAAS 层级的架构亦要相当合理,并要与 PAAS 层能实现真正完好的配合。具体而言基因组数据由于自身结构特性,让数据处理存在很多不同非生物领域数据处理的问题,例如:A) 极大的数据集带来的 I/O 问题和操作系统对文件大小限制的问题。一个经过处理的(即已拼接完成的)并对存储算法进行优化后的人类基因组数据大约占数百 MB-1GB 左右存储空间(FASTA);每个优化存储的基因组数据需要经过解压缩才能使用,通常为使用每个基因组提供的空间约为 1TB。那么,一个覆盖中国 10%人口的个性化医疗数据库光基因组的数据就在 13104TB-13105 TB。于是,使用这种规模的数据集

20、将会碰到严重的输入/输出(I/O)问题,传统操作系统将面对稳健及目录大小受限制的挑战,以至于一次简单搜索都有可能花上几年时间;B) 短的读序列和极长的染色体比对带来的数据处理问题和计分异常。例如,在内存中每个实体(读序列)都需要建立一个标头,在读序列长度很短而数据量又很大的情况下,大量的资源可以通过简单绑定来建立这些标头;相反,一个长读序列如果未经复杂的数据处理则不可能被分割,于是长读序列上全长的所有影响都被作为一个组织保存在内存中。优化其中一个极端情况,通常需要对其他极端情况作重要妥协;C) 错误率带来敏感性和数据丢失方面的问题。新一代测序产生的读序列通常会包含错误,在序列比对阶段,应尽力避

21、免这些错误的干扰。常用的方法有两种,一种是对全部或大多数 NGS(Next Generation Sequencing)读序列进行全局性比对,该方法在敏感性上能达到要求,但消耗的计算时间过长;另一种方法是局部离散型的比对,它们能在相对短的时间内高效完成比对任务,但这种方法识别的假阴性太多;2) 华大基因生物信息云的 IAAS 和 PAAS 层级都是荣之联完成的,随罗锐 邦博士加入并组建有关团队,荣之联下一步将迅速提升 SAAS 方面的服务能力,和华大十年左右的共同成长,荣之联当前的生物云计算系统已绝对达到世界先进的等级,成为当之无愧的龙头。荣之联的云计算水平已经足够强大,但成本却更低这是由于,

22、为在同样的时间内得到同样的结果,荣之联由于系统架构更符合生命科学计算方面的特征,对计算资源的使用量更低;3、投资建议 荣之联是国内生物信息学和车联网产业链中整体素质优秀的龙头企业, 借助长期与优质客户华大基因的稳定合作关系,在生物信息学 IT 领域中具有较大的议价能力,使得整体经营的盈利在未来得到兑现。公司将成为生物信息学和车联网大爆发的最大受益者,盈利性有望大幅提升,成长价值也逐渐会被市场认同。 近期基因测血行业的一个重大事件无疑是华大基因披露招股书,华大上市有望让产业中测序及生物信息领域的投资热潮继续升温,并带来二级市场的主题性机遇,同时,华大基因的募投项目也有望为荣之联相关业务带来非常大

23、的业绩弹性。 12 月 18 日,证监会网站预先披露了深圳华大基因股份有限公司创业板首次公开发行股票招股说明书,按招股书中披露的数据,华大基因从荣之联采购的 IT 设备及软件的总额增速显著高于自身营收的增速,这意味着生命科学研究中数据处理服务支出对总研发支出占比的提升。 华大基因本次募投将涉及 1732 亿元的项目建设,考虑到华大基因来自荣之联的服务采购又占到 IT 支出的绝大部分,且行业中其他企业很难有能和荣之联比肩的生物信息学 IT 建设方面的能力,因而在可预见的短中期,华大基因 1732 亿元的募投建设会为荣之联生物信息相关业务带来非常显著的业绩弹性而考虑到华大上市的背后是测序产业的快速

24、崛起,贝瑞和康、药明康德、诺和、众多“华小”等华大的竞争者面对华大上市带来的压力免不了亦将加速业务拓展的进程,从而为相关的生物信息产业带来影响更为深远的投资机遇。附录:云服务涉及的 IAAS、PAAS、SAAS 简要介绍 云计算就是使用互联网接入远端存储或运行远程服务器端应用和数据的方式,任何一个在互联网上提供其服务的公司都可以叫做云计算公司而云计算实际是分层的,各层级分别称为 Infrastructure-as-a-Service(IAAS,“基础设施即服务”),Platform-as-a-Service(PAAS,“平台即服务”),Software-as-a-Service(SAAS,“软

25、件即服务”),基础设施在最下端,平台在中间,软件在顶端,别的一些“软”的层可在这些层上额外添加。AAS: Infrastructure-as-a-Service(基础设施即服务)IAAS 是云服务的第一层,有时候也叫 Hardware-as-a-Service。没有IAAS 之时,用户如想在办公室或公司网站运行一些企业应用,需要配置服务器等硬件控制本地应用;而有 IAAS 之后,用户可将硬件外包给第三方的 IAAS 公司,第三方 IAAS 公司提供场外服务器、存储、网络硬件供用户租用,从而节省用户的维护成本和办公场地,用户可在任何时间使用这些硬件运行其应用。一些大的 IAAS 公司包括 Ama

26、zon, Microsoft, VMWare, Rackspace 和 Red Hat,这些公司又都有自己的专长,例如 Amazon 和微软提供的不只是 IAAS,还会将其计算能力出租给用户来 host 用户的网站。 PAAS: Platform-as-a-Service(平台即服务)PAAS 是云服务的第二层,某些场合也叫“中间件”,客户公司所有的开发都可在该层进行,PAAS 公司在网上提供各种开发和分发应用的解决方案(如虚拟服务器和操作系统),并提供网页应用管理,应用设计,应用虚拟主机,存储,安全以及应用开发协作工具等,不仅有助于让用户原本可能分散的工作室之间的合作变得更加容易,也能进一步

27、帮助用户节省时间和资源。一些大的 PaaS 提供者有 Google App Engine,Microsoft Azure,Forcecom,Heroku,Engine Yard 等。相比于 IAAS,PAAS 主要是将一个开发和运行平台作为服务提供给用户,IAAS 主要是提供虚拟机或其他资源作为服务提供给用户。 SAAS: Software-as-a-Service(软件即服务)SAAS 是云服务的第三层,也是大众生活每天接触的一层(网页是最典型的此类应用),将任何一个远程服务器上的应用通过网络远程运行即 SAAS,例如通过天猫购物、通过视频网站观看视频等。一些典型的用作商务的 SAAS 应用包括 Citrix 的 GoToMeeting,Cisco 的WebEx,Salesforce 的 CRM,ADP,Workday 和 SuccessFactors。

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2