关于我们 >> 新闻事件

基础医学科学数据中心数位专家学者参加第二届全国计算生物学与生物信息学学术会议 星期五, 2015年4月17

由中国生物工程学会计算生物学与生物信息学专业委员会(筹)主办,北京市科学技术研究院北京市计算中心承办、中国生物工程杂志和北京市基因测序与功能分析工程技术研究中心协办的“第二届全国计算生物学与生物信息学学术会议”于2015年4月15日-17日在北京西郊宾馆召开,来自全国各地240余位专家学者共同参会。


基础医学科学数据中心学术委员会委员、中国科学院院士、中科院生物物理所研究员陈润生先生作为本次大会的发起者、专委会主任第一个发表演讲。


陈院士认为现在的医疗已经从以往的诊断治疗开始向健康保障发生本质性的转变。而转变的基础,依赖于两个条件:(1).基因组、转录组、蛋白质组、代谢组等一系列组学的发展;(2).相应组学大数据的获取、分析、解释等方面的工作。而对于组学数据的研究,机遇与挑战并存。


精准医学以组学为基础,组学研究获得的海量数据可以让人们更深层次的了解疾病使得精准医学更加精准。


人类基因组中存在大量的“暗信息”,对基因组、转录组等组学的认识还远远不足。人类基因组中97%的序列为非编码序列,其中绝大部分功能未知。因此,对非编码RNA(尤其是lncRNA)的功能研究显得尤为重要: (1).长非编码RNA数目众多,仍有大量未知信息有待挖掘; (2).长非编码RNA功能的发挥有赖于空间结构,同时可能具有非常好的选择性和特异性; (3).已有的单纯基于poly A(+)的转录组lncRNA分析,可能会漏掉大量信息。


陈院士非常欣慰地为我们介绍了受到国内外同行高度认可和依赖的NONCODE数据库。同时也为广大学者的研究提出了建议。最后,他强调面对机遇与现实共存的状态,必须认真对待大数据。


基础医学科学数据中心负责人之一、中国医学科学院基础所、北京蛋白质组研究中心朱伟民教授做大会报告。


朱伟民教授认为随着各类生物数据库的建立,对信息的高效、快速、便捷查询也带来了新的挑战。倘若能将不同的生物学数据库进行整合,无论对后期的查询,信息挖掘,还是注释来说,都有着重要意义。正是基于这一想法,朱教授团队正在努力创建一个基于多组学数据综合的数据库Bioso,以满足用户的多样的需求。


朱教授强调了生物信息大数据不是单纯的序列信息和一大堆列表,而是多元信息的有效整合。在此,他以他们开发的数据库为例,讲述了该数据库的数据管理、获取方式、整合,以及展示方式。极大地满足了用户的需求,同时也方便了操作。


基础医学科学数据中心协作单位清华大学自动化系张学工教授,本次大会的主要组织者,专委会副主任作了“关于生物数据机器学习分析的一些观点和思考”的大会报告。


生物大数据被人们寄予厚望。因此,对数据本身的特点、数据分析方法和理论的研究变得更加重要。机器学习作为生物信息分析中一种常用的方法,已经成为各种大数据分析的主要技术手段。


生物大数据的特点:(1)最大的特点是不可控性。生物医学大数据往往是无序的自发积累,数据库中的数据往往没有实验设计;(2)数据量巨大;(3)单纯的数据量大并不意味着信息量大,更不意味着信息有效和准确;(4)大数据≠全体数据。反映的仅是部分,无法代表全部个体;(5)数据类型复杂多样,研究对象机理复杂;(6)数据获取技术间接、复杂,数据基本单元不清楚。


因此,针对以上特点,对于大数据的分析方法学的研究也很重要,在此,张教授就几个重要的方法学问题也作出了相应的描述。


方法学问题包括:(1)大数据随机性、独立性和均一性检验的理论与方法;(2)如何加工、矫正和分析非随机、非均一数据;(3)大数据中非线性依赖关系的检测问题;(4)混合数据样本相似性度量的数学方法;(5)不可控性对多类型异质数据融合的影响及解决方案;(6)大数据分析结果评估的理论与方法。


基础医学科学数据中心协作单位北京大学生命科学学院高歌研究员作“转录因子在基因表达调控中的作用”大会报告。


转录因子作为基因表达调控的关键因子,在生物发育和响应外界刺激中均发挥重要的调控作用。围绕着“植物基因组中有多少转录因子?它们之间的调控网络是如何架构的?新的转录因子从何而来、有何性质、又会去往何处、发挥何种功能”等一系列问题,以“拟南芥为模型系统研究并揭示了植物转录调控网络在结构和演化方面的诸多新特征”


他们首先系统鉴定了83种植物基因组中的转录因子(PlantTFDB: http://planttfdb.cbi.pku.edu.cn),并在此基础上基于文本挖掘构建了植物领域首个高质量、大规模的转录调控网络(ATRM: http://atrm.cbi.pku.edu.cn)。基于此网络,他们揭示了发育子网络与环境应激子网络在结构上的显著差异,并发现新转录因子倾向于参与到发育过程和调控其它转录因子;进一步的研究揭示了新、老转录因子在性质上的差异以及性质和网络位置偏好性之间的关系,为理解新转录因子对调控网络的重塑(rewire)过程提供新的线索与启示。

归档

年份