实验室目标

以大规模临床数据为基础,结合不断更新的医学文献与标准知识库,构建国内至国际最具权威性可查询,可计算,可决策辅助的智能化平台。

  • 大规模可更新

    知识图谱

  • 高精度机器(深度)

    学习模型

  • 业务驱动的应用场景
  • 高质量基础数据支撑

研究方向

  • 医学自然语言处理

    基础自然语言处理

    文本数据结构化,归一化处理

    医学知识图谱与本体知识库构建,自动更新

  • 医学影像处理

    医学影像识别与分类模型

    医学影像的应用场景驱动研究

  • 大数据挖掘与机器学习应用

    基础数据挖掘,统计分析,机器学习工具集构建

    应用场景驱动的模型建立与应用

  • 医学自然语言处理

    • 中文分词

      将一段医疗文本,按照一定的规范重新组合成词序列的过程,是进一步文本分析的基础。

    • 实体识别

      识别医疗文本中具有特定意义的医学术语,如“诊断名”,“药品名”,“手术名”等,及一些明确语义的属性信息,如“时间”,“程度”等,这些概念的识别是医疗文本语义分析的重要前提。

    • 实体关系识别

      识别文本中实体与其他实体之间的关系,如针对一次化疗事件,识别出“化疗方案”的“时间”是哪个,“化疗方案”的“疗效”是哪个等,这些实体关系的识别是进行结构化信息抽取的重要依据。

    • 结构化

      基于任务需求,设计业务规则,从实体识别和实体关系识别的结果中,抽取结构化任务目标信息。

    • 标准化

      模仿人的归一过程,采用基于知识图谱的实体链接技术,将临床数据归一到标准名称上,例如手术归一到ICD9,诊断名归一到ICD10,便于后续各任务的筛选统计等分析。

    • 知识图谱

      融合临床数据、医疗文献指南、CFDA数据、互联网数据等多种数据源,构建大规模医疗知识库,支持医疗统计、查询、分析、推理等任务。

  • 医学影像处理

    • 检查辅助决策

      利用人工智能技术自动识别结构异常并分割出结节,筛查早期癌症,辅助医生临床决策。可捕捉随时间发展结节的变化,为多学科合作提供效率保障。基于大量的临床标准数据,训练出精准的识别算法模型,为准确率提供坚实保证。

    • 诊断辅助决策

      通过识别病灶图像辨别出疾病形态,辅助非专科医生进行基本临床决策,目前识别准确率为97.5%。

    • 术中辅助决策

      在施术过程中,对影像进行分析,可通过识别病灶形状给出相应提示辅助医生进行手术操作。

  • 大数据挖掘与机器学习应用

    • 描述性分析

      基于大规模真实临床数据,给出人群、地域、疾病、药物、干预措施等分布和画像,支持流行病学研究和市场洞察分析等。

    • 相关性分析

      挖掘、分析、发现和验证真实复杂临床环境下各因素间的相关性,支持临床诊疗、临床科研和药物研发等。

    • 组间比较分析和发现

      挖掘分析真实临床过程中不同分组的疗效/不良反应差异,评估药物、治疗方案的效果和安全性,提升诊疗质量,扩展药物的潜在适应症、适应人群。

    • 临床治疗挖掘

      基于真实临床过程和病历,结合临床指南,挖掘真实世界中的治疗模式(treatment pattern)、临床路径(clinical pathway)和疗效评价等,支持诊疗标准化、诊疗效果提升和指南更新等。

    • 机器学习建模

      面向应用场景需求,结合传统机器学习和深度学习技术,构建病情/生存期预测模型、住院天数/再住院预测模型、分期评估模型、不良反应预测模型等。

    • 临床辅助决策

      结合医学知识图谱、临床数据和专家知识,基于机器学习技术(文本和影像)构建临床辅助决策系统,辅助医生进行诊前决策、诊中支持和诊后评价,提升诊疗的效果和效率。

    • 自动发现与推荐

      结合医学知识和统计结果进行自动探索和剪枝,在假设空间自动探索发现潜在可行的科学假设、预测和验证结果,作为真实证据和研究方向的候选推荐。