oneclass问题、fewshot(one-shot)问题、异常检测问题

oneclass问题、fewshot(one-shot)问题、异常检测问题
one class问题
one class与2分类,多分类的区别?
输电线路覆冰two class:"是"⾃⾏车,或者"不是"⾃⾏车,训练集⾥有⾃⾏车的数据和不是⾃⾏车的数据。模型判断是属于⾃⾏车类,还是others类。
过日子要有技术含量
mutil class: ⼈脸识别等,每个⼈就是⼀个类别;COCO数据集包含80个class的数据;
one class:"是"⾃⾏车,或者"不是"⾃⾏车,但是训练集⾥只给了⾃⾏车的数据。模型直接把不属于这⼀类的数据归为不是,⽽不是由于属于另⼀类才返回的“不是”结果。
场景:
进⼊商场的⼈是否购买⼀件商品(⽐如⽜奶)的数据,肯定是买的⼈占总体⽐例少,但是如果two class的话,正负样本⼗分不均衡,训练器会偏向负样本,甚⾄全分过去,精度也不会低,这时候当做one class问题考虑的话,只把购买的⼈的数据放进训练集,来判断⼀个⼈是不是购买这个商品。
常⽤⽅法:
SVDD(Support Vector Data Description):人民日报国庆社论
中国涂料论坛采⽤⼀个球形⽅法,该算法在特征空间中获得数据周围的球形边界,这个超球体的体积是最⼩化的,从⽽最⼩化异常点的影响。当只有⼀个class,训练出⼀个最⼩的超球⾯,将定义的类别的数据⽤球⾯全部“包起来”,当测试阶段,有⼀个新的数据点时,如果这个数据点落在超球⾯内,就属于这个类,否则不是。
OCSVM(one class support vector machine):
将数据样本通过核函数映射到⾼维特征空间,使其具有更良好的聚集性,在特征空间中求解⼀个最优超平⾯实现⽬标数据与坐标原点的最⼤分离,坐标原点被假设为唯⼀的⼀个异常样本。
苯丙酮酸尿症
few shot(one-shot)问题
zero-shot learning和one-shot learning?
zero-shot learning
训练集中没有某个类别的样本,但是可以学到⼀个映射,能通过这个映射得到这个新类的特征。
即: 对训练集中没有出现过的类别,模型能⾃动创造出相应的映射: X -> Y
one-shot learning
训练集中,每个类别都有样本,但都只是少量样本(只有⼀个或⼏个)。可以在⼀个更⼤的数据集上或者利⽤knowledge graph、domain-knowledge 等⽅法,学到⼀个⼀般化的映射,然后再到⼩数据集上进⾏更新升级映射。
异常检测问题
什么是异常检测?
给定数据集x(1),x(2),…,x(m),我们假使数据集是正常的,我们希望知道新的数据xtest是不是异常的,即这个测试数据不属于该组数据的⼏率如何。我们所构建的模型应该能根据该测试数据的位置告诉我们其属于⼀组数据的可能性P(x)。
商城县卫生局类别:
奇异点检测(novelty detection):当训练数据中没有离点,⽬标是⽤训练好的模型去检测另外未见过的样本;
离点检测(outlier detection):当训练数据中包含离点,模型训练时要匹配训练数据的中⼼样本,忽视训练样本中的其它异常点;
场景:
数据预处理
病毒⽊马检测
⼯业制造产品检测
⽹络流量检测
常⽤⽅法:
sklearn中的⽅法OneClassSVM(奇异点检测)
Isolation Forest(离点检测)
Local Outlier Factor(离点检测)等

本文发布于:2024-09-22 17:39:09,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/159492.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   训练   样本   模型   检测
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议