——记东南大学生命科学与技术学院李健教授
自从大自然接受了人类这一生命体之后,人类对生命本身各种奥秘探索的脚步从未停息。尽管科学家们已经对人体器官机能、发病根源、基因溯源等方面获取了众多研究成果,但依旧存在许多未解之谜。进入21世纪之后,多学科交叉研究加快了解锁未知的进程,每一位科学家都在自己的研究领域孜孜以求,东南大学的李健教授即为其中之一,他将发展迅猛的信息学知识融入到生命学的研究中,依托不断充实的大数据,在多个领域取得了不错的成绩。
李健,博士毕业于丹麦奥胡斯大学生物医学专业,现为东南大学生命科学与技术学院“发育与疾病相关基因”教育部重点实验室教授,主要从事基因组学、生物信息学、生物医学大数据等研究工作,聚焦于使用测序技术、基因组学、深度学习工具解决复杂疾病与健康问题。
测序,深究常见症状根源
众所周知,乙肝病毒(HepatitisBvirus,HBV)感染是威胁全球人类健康的重要医学问题,中国是乙肝发病大国,约有一亿人为HBV病毒携带者,其中相当比例的人群由于HBV病毒的变异产生免疫逃逸,进一步发展至肝癌,严重影响到人们的生命健康。
李健教授选择了这一课题进行深入研究。团队成员在对中国人群肝癌患者相关HBV病毒的序列及其多态性与致病性进行了广泛研究之后,基于人群大数据,发现HBV病毒自发突变会改变病毒抗原肽与MHCI类分子的结合力,降低MHCI类分子对抗原肽的递呈,从而导致免疫逃逸。有研究报道,不同种族人群可能易感不同基因型的HBV病毒株,在大数据的支持下,李健带领团队选择了中国人群高频出现的HLA亚型和欧美人群中高频出现的HLA亚型着重研究,同时收集了亚洲人群和欧美人群易感的HBV亚型及其编码主要抗原的C和S编码区序列。团队发现在中国和欧美人群中,HBV病毒在C和S编码区的关键突变会影响对其抗原肽与MHCI类分子之间的亲和力,可以推测候选的关键突变基因将会导致的免疫逃逸,可能与HBV病毒感染相关的肝癌发生有关。该项研究成果有可能为临床检测HBV感染者的病程发展变化提供一定线索,目前,李健正在积极寻求项目成果的产业转化,期待能够为更多的患者提供病程监测和肝癌早期诊断的有效工具。
李健还与医院身心医学徐治副主任医生联合开展了基于测序DNA甲基化数据预测抑郁症病人治疗效果和自杀倾向干预的合作项目。有资料表明,我国有万抑郁症患者,且有持续增加的趋势。目前,临床诊断抑郁症需要医生具有丰富的经验,并伴随大量问诊和量表工作,准确性和客观性相对较低。而李健和同事开展的工作,旨在为临床诊断与治疗抑郁症提供客观准确的诊断标准,并为临床评估抑郁症治疗疗效的随访提供潜在的技术。该技术基于测序结果的客观指标,可准确判断被检测者是否患有抑郁症,还可用于重度抑郁症患者在家服药的疗效监测情况。该项工作已完成研发,申请了两项国家专利,正在开展产业化的转化工作。
长期以来,李健带领自己的团队成员,对高通量生物信息获取技术进行了广泛研究,在仪器设计与软硬件开发、生物医学大数据、云计算、数据库、人工智能等方面具有较好的研究基础和丰富的实践经验,经过科研一线的锻炼,逐渐形成了一支高层次、多学科交叉、中青年学术骨干为主的合作研究队伍,并积极利用测序与深度学习技术从事人体健康状况分析、评估疾病风险管控等领域的研究,期望在国家级和省部级重点项目的支持下,获得更广泛的研究成果。
协同,可穿戴设备服务医学
进入21世纪以来,万物互联时代已成为可能。网络边缘设备生产的数据量快速增加,带来了更高的数据传输带宽需求,同时,可穿戴设备及便携式测序等新型应用也对数据处理的实时性提出了更高的要求,传统云计算模型已经无法有效应对。
为了解决该领域核心关键技术问题和行业痛点,李健团队结合端-云学习和边缘计算的特点,提出一种面向便携式测序应用的新型端-边-云协同分析处理模式。其中,云和边缘协同指在云中预训练较高精度的初始分析模型并将其分发缓存至边缘,各边缘通过云进行全局同步,实现分析精度,提升可保障程度。边缘和边缘协同主要指在面对大量预训练分析模型数据缓存、大规模终端设备接入和大量分析任务的计算时,通过边缘间的存储、网络和计算协同,突破单个边缘服务器的资源和性能瓶颈,实现处理规模可扩展的功能。边缘和端协同指在终端从边缘快速获取预训练分析模型的基础上,以终端为主体并协同边缘高效执行分析任务,实现处理分析效率可提升的结果。这一研究成果的获取,将有助于测序技术更广泛地应用于健康医疗领域。利用现代化的信息技术来解决测序数据的实时分析问题,将最终造福人类,促进健康管理、疾病预防与公共卫生领域的发展。
正是因为李健及其团队在生物信息方面的不断创新,年,李健教授获得江苏省双创计划“科技副总”项目支持,为团队的科研工作注入了更扎实的基础。
目前,李健立足于江苏省科技厅产学研项目,与浪潮集团合作推广云和边缘协同技术,逐步实现了基因测序数据在云端的传输、分析和存储的关键技术;实现了可穿戴设备终端与云平台实时数据传输、分析与反馈的关键技术;在云端构建了用于存储和提供访问的健康医学大数据的数据库,并制定了云平台数据库标准,已将器官芯片、中国人群HLA、脑科学研究等数据库构建完成并部署到浪潮云平台上。
百舸争流千帆尽,唯有创新立潮头。为了将信息科学的生命力延续下去,李健还曾多次带队带领学生参加世界大学生超级计算机竞赛,每次都是满载而归,分别获得一等奖两次,二等奖一次,不但为学校赢得了荣誉,还激发了更多学生在高性能计算、人工智能、基因组组装等科学前沿领域方面不断进取的决心和信心。为了取得更好的成绩,李健将继续带领团队成员,稳扎稳打,为打开更多的生命黑箱而持续努力。