一种基于人工智能的CTC图像识别方法和系统[发明专利]

(19)中华人民共和国国家知识产权局
车载厨房
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202010438283.3
(22)申请日 2020.05.21
(71)申请人 骏实生物科技(上海)有限公司
地址 201108 上海市闵行区曹建路161号
(72)发明人 金炜翔 温冬 李基 
(74)专利代理机构 北京市盈科律师事务所
11344提升装置
代理人 陈晨 王津
(51)Int.Cl.
G06K  9/00(2006.01)
G06K  9/62(2006.01)
G16H  15/00(2018.01)
(54)发明名称一种基于人工智能的CTC图像识别方法和系统(57)摘要本发明公开了一种基于人工智能的CTC图像识别方法和系统,所述方法使用预先建立的分类器进行CTC的自动化判读,包括以下步骤:输入临床样本的原始荧光图像;对所述临床样本的原始荧光图像进行图像前处理;输出临床样本
单个细胞的图像和特征参数;采用预先建立的分类器自动化判读,筛选疑似CTC的细胞作为候选细胞,对候选细胞进行审核后,出具CTC报告,本发明还公开了分类器建立的方法和系统,使用人工标注的方法区分CTC,筛选CTC和WBC的特征参数,基于多种机器学习的算法建立多个初步分类器,并优化获得的分类器;本发明采用真实的临床循环肿瘤细胞建立训练集,系统性地对形态学参数进行筛选和验证,
保证优化的分类器识别CTC的性能。权利要求书3页  说明书23页  附图9页CN 111652095 A 2020.09.11
C N  111652095
A
1.一种基于人工智能的CTC图像识别方法,使用预先建立的分类器进行CTC的自动化判读,其特征在于,包括以下步骤:
步骤一、输入临床样本的原始荧光图像;
步骤二、对所述临床样本的原始荧光图像进行图像前处理;
步骤三、输出临床样本单个细胞的图像和特征参数;
步骤四、采用预先建立的分类器自动化判读,筛选疑似CTC的细胞作为候选细胞,对候选细胞进行审核后,出具CTC报告。
2.如权利要求1所述的基于人工智能的CTC图像识别方法,其特征在于,所述分类器的建立方法包括如下步骤:
步骤Ⅰ、输入临床样本的原始荧光图像;
步骤Ⅱ、对所述临床样本的原始荧光图像进行图像前处理;
步骤Ⅲ、输出临床样本单个细胞的图像和特征参数,人工判断临床样本中是否含有CTC,如含有CTC即为临床CTC样本,继续步骤IV,如人工判断临床样本中没有CTC,则换一个样本重复步骤I;
步骤Ⅳ、人工标注CTC样本中的CTC和WBC,筛选CTC和WBC的特征参数,作为训练集;基于多种机器学习的算法建立多个初步分类器;通过参数调优、交叉验证、平行比较优化分类器。
3.如权利要求1或2所述的基于人工智能的CTC图像识别方法,其特征在于,所述图像前处理包括如下步骤:
led大功率天花灯(1)图像修正;
(2)识别首要目标;
(3)识别次级目标;
(4)计算各类特征参数;
(5)数据导出和保存。
4.如权利要求2所述的基于人工智能的CTC图像识别方法,其特征在于,所述训练集包括超过1700个CTC图像、超过13000个WBC图像,和超过200个特征参数。
5.如权利要求2所述的基于人工智能的CTC图像识别方法,其特征在于,步骤Ⅳ具体包括:
(1)数据中心化和归一化;
(2)基于每个特征参数的散点图,手动筛选能显著区分两种类别细胞的特征参数;
(3)剔除高度相关的特征参数(cutoff>.75);
(4)计算特征参数重要性(RFE),并最终确认用于模型建立的特征参数集合;
经过上述步骤后获得新训练集。
6.如权利要求5所述的基于人工智能的CTC图像识别方法,其特征在于,步骤Ⅳ还包括:在新训练集内,分别使用多种监督式机器学习算法以及融合模型算法、多种不平衡训练集的前处理方法、多种评估方法,进行交叉验证,优化参数,建立初步分类器。
7.如权利要6所述的基于人工智能的CTC图像识别方法,其特征在于,所述监督式机器学习算法包括K-Nearest Neighbors(KNN)、Stochastic Gradient Boosting(GBM)、AdaBoost Classification Trees(ADABOOST)、Support Vector Machines(SVM)、Random
Forest(RF)、Bayes(NB)、Extreme Gradient Boosting(XGB),所述融合模型算法为多种监督式机器学习算法融合在一起的算法。
8.如权利要求6所述的基于人工智能的CTC图像识别方法,其特征在于,所述不平衡训练集的前处理方法包括:Original、Up-sampling、Down-sampling、SMOTE、ROSE。
9.如权利要求6所述的基于人工智能的CTC图像识别方法,其特征在于,所述评估方法包括:ROC和PR。
10.如权利要求6所述的基于人工智能的CTC图像识别方法,其特征在于,步骤Ⅳ还包括:对初步分类器的性能评估和泛化能力测试,优化分类器,所述性能进行评估指标包括AUC、F1 score、Accuracy
、Precision、Recall、TPR、FPR,所述泛化能力评估指标包括:Positive sample concordance,CTC concordance,Screening efficiency。
11.如权利要求3所述的基于人工智能的CTC图像识别方法,其特征在于,所述图像前处理步骤中,识别首要目标为识别DAPI通道有信号的目标;识别次级目标为在识别首要目标的基础上分别识别TRITC通道有信号的目标和CY5通道有信号的目标。
12.如权利要求3所述的基于人工智能的CTC图像识别方法,其特征在于,所述计算各类特征参数,包括计算首要目标和次级目标的形态学参数、各通道荧光信号强度;所述形态学参数包括大小&形状(Area&Shape)、信号强度(Intensity)、表面结构(Texture)、相关性(Correlation)。
13.一种基于人工智能的CTC图像识别系统,其特征在于,包括输入模块、图像前处理模块、输出模块、自动化判读模块;
数控卧式滚齿机所述输入模块用于输入临床样本的原始荧光图像;
所述图像前处理模块用于对临床样本的原始荧光图像进行处理后获得单个细胞的图像和特征参数;
所述输出模块用于输出临床样本中单个细胞的图像和特征参数,
所述自动化判读模块用于识别CTC细胞,使用预先建立的分类器进行筛选,筛选出疑似CTC的细胞作为候选细胞,对CTC候选细胞进行人工审核后,出具CTC检测报告。
14.根据权利要求13所述的基于人工智能的CTC图像识别系统,其特征在于,所述自动化判读模块包括初审模块和终审模块,所述初审模块使用预先建立的分类器进行筛选,筛选出疑似CTC的细胞作为候选细胞;所述终审模块采用专业人员判断候选细胞是否确实为CTC,确认后出具CTC检测报告。
15.根据权利要求13所述的基于人工智能的CTC图像识别系统,其特征在于,所述分类器通过分类器建立系统建立,所述分类器建立系统包括输入模块二、图像前处理模块二、输出模块二、分类器建立模块;
水性阻燃剂所述输入模块二用于输入临床CTC样本的原始荧光图像;
所述图像前处理模块二用于对临床CTC样本的原始荧光图像进行处理后获得单个细胞的图像和特征参数,作为训练集;
所述输出模块二用于输出临床CTC样本中单个细胞的图像和特征参数;
所述分类器建立模块用于建立并优化分类器,人工标注CTC和WBC,筛选CTC和WBC的特征参数;基于多种机器学习的算法建立多个初步分类器;通过参数调优、交叉验证、平行比较优化分类器。
16.根据权利要求13所述的基于人工智能的CTC图像识别系统,其特征在于,所述图像前处理模块包括图像修正模块、识别首要目标模块、识别次级目标模块、计算各类特征参数模块、数据导出和保存模块;所述图像修正模块用于修正不均一光照强度导致的不均一的图像信号和背景;所述识别首要目标模块用于识别DAPI通道有信号的目标;所述识别次级目标模块用于在识别DAPI通道有信号的目标基础上,分别识别TRITC通道有信号的目标和CY5通道有信号的目标,并分别获得单个细胞图像;所述计算各类特征参数模块用于计算单个细胞的形态学参数、各通道荧光信号强度参数;所述数据导出和保存模块用于导出和保存单个细胞的图像和特征参数。
17.根据权利要求15所述的基于人工智能的CTC图像识别系统,其特征在于,所述图像前处理模块二包括图像修正模块二、识别首要目标模块二、识别次级目标模块二、计算特征参数模块二、数据导出和保存模块二;所述图像修正模块二用于修正不均一光照强度导致的不均一的图像信号和背景;所述识别首要目标模块二用于识别DAPI通道有信号的目标;所述识别次级目标模块二用于在识别DAPI通道有信号的目标基础上,分别识别TRITC通道有信号的目标和CY5通道有信号的目标,并分别获得单个细胞图像;所述计算特征参数模块二用于计算单个细胞的形态学参数、各通道荧光信号强度参数;所述数据导出和保存模块用于导出和保存单个细胞的图像和特征参数。
一种基于人工智能的CTC图像识别方法和系统技术领域
[0001]本发明涉及循环肿瘤细胞识别技术领域,具体而言,涉及一种基于人工智能的荧光细胞图像识别技术,用于临床循环肿瘤细胞自动化检测。
背景技术
[0002]循环肿瘤细胞(Circulating  Tumor  Cell,CTC)指自发或因诊疗操作由实体瘤或转移灶释放进入外周血循环的肿瘤细胞,恶性肿瘤的侵袭转移是患者复发转移的关键环节,常导致肿瘤失败,危及患者生命。由于入侵发生在肿瘤早期阶段,此时血液中的循环肿瘤细胞数量非常稀少,这意味着准确有效的循环肿瘤细胞识别与分析对于尽早地确诊肿瘤并采取有效的措施具有重要意义。
[0003]通过免疫荧光染来识别标有肿瘤标志物的CTC是一种常见的临床CTC检测方法,这种方法除了依赖于全自动扫描的荧光显微镜之外,还需要对扫描得到的荧光图像进行判读来识别临床样本中的 CTC。
[0004]现在临床CTC检测主要还是依赖专业人员对荧光图像进行人工判读,这种判读方式带来的问题包括不同操作人员间的判读误差、不同样本间的判读误差,以及判读效率不高等。现有的CTC判读方法还包括基于各形态学参数threshold的图像筛选,根据经验值,对CTC  的各形态学参数进行限定,设定固定threshold来筛选CTC;这个方式最大缺点是临床样本中CTC的形态各异,基于经验值设定threshold  的方式CTC筛选的灵敏度和特异性均很差。基于机器学习的CTC图像识别方法也在现有文
转轴设计献中有过报道,但现有方法还存在以下缺点:
[0005](1)现有CTC图像识别方法中涉及的多个形态学参数没有系统性地筛选和比较,不同形态学参数集合会最终影响到识别的灵敏度、特异性等;
[0006](2)现有CTC图像识别方法中分类器建立所使用的训练集不是来自于真实的临床CTC,而是采用的掺入肿瘤细胞系细胞在血液中来模拟CTC,基于这样的训练集训练出来的分类器,在临床CTC检测和识别的性能并不可靠;
[0007](3)现有CTC图像识别方法中训练集由于是来自于肿瘤细胞系细胞,所以训练集的细胞比例(CTC和WBC的比例)并不能反映真实情况(实际经过富集后的临床样本中CTC与WBC 比例为1:103),这样的训练集训练出来的分类器,无法保证对实际临床样本中极度不平衡的样本比例进行有效地识别;
[0008](4)现有CTC图像识别方法只是简单地比较了几种常见的机器学习算法建立的分类器,对于CTC图像识别方法的性能的优化有限;
[0009](6)现有CTC图像识别方法的泛化能力评估只是在极少量的临床样本中进行,并不能有效反映CTC图像识别方法的实际临床性能;
[0010]本专利通过开发基于机器学习的临床CTC图像识别方法和系统来完成对临床CTC 图像高效、准
确的判读,可以让机器通过对过往的CTC图像数据自我学习,来不断修正改善自身性能,可以有效地保证临床CTC图像识别的准确性,再由专业人员对筛选后的CTC图像
说 明 书
1/23页CN 111652095 A

本文发布于:2024-09-25 11:12:45,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/149219.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:细胞   图像   模块   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议