cost sensitive learning与单纯修改算法比,有什么优势吗

还有,与classifiers cascade结合一起用,对imbalanced data的分类性能比较好的算法有哪些?
单纯修改算法主要包括boundary/threshold movement和biased penalties;biased penalties其实也就是cost-sensitive的一种了。
cost-sensitive的方法分adjusting weights 或者 costs;后者是由确定了的cost matrix决定的。
cascaded classifiers的效果近似于serially train classifiers using local undersampling of the majority class and all of the minority class。
至于分类性能, ‘one needs knowledge of both the corresponding classifier learning algorithm and the application domain, especially a thorough comprehension on why the learning algorithm fails when the class distribution of available data is uneven.’
以上对binary classification。
2015-11-02
更多相关文章
  • 我一直都认为"零代价抽象"--即抽象的同时不影响执行的效率--是程序设计的理想状态,然而现有的编程语言大都没有达到这个状态.最近听说Rust宣称自己是zero-cost abstractions,所以很好奇:1. 这跟我所理解的"零代价抽象"是不是一个意思?2 ...
  • 如果目标就是买方市场 精通machine learning deep learning 加个python是否就能入门了这么说吧,如果买方市场好比是在踢足球.那么金融数学好比练习颠球, 你不断的熟悉球感,这对你将来上场的盘球 接球 停球都有帮助,但是没人保证你能过人,更没人保证你是个出色的运动员.不然 ...
  • 为什么人总是念念不忘沉没成本sunk cost
    举例:1. A花了3年学习金融,但是并不是他的喜好,他不愿意换专业的理由为:我已经花了3年的时间学习会计,难道我要浪费掉这三年吗?2. 情侣谈恋爱了,却发现对方一直不合适可是不分手,因为已经花了这么多时间互相磨合.可是这些是已经支付的成本,已经没有可能拿回来的成本,可是为什么我们作为凡人总是念念不忘 ...
  • 深度学习deep learning距离实际应用还有多远,会有大规模应用吗
    机器学习领域有些学者对DL持保守态度,认为目前的DL与上世纪的人工神经网络研究相比,并没有提出革命性的新成果,更多是由于计算能力和数据规模的提升带来了原来人工神经网络所无法达到的效果.从这个角度而言,我们也许不要对DL抱有过高期望,再过10年20年,DL也许只是人工智能浪潮中的一波而已.我们也许可以 ...
  • 医学生们,使用PBLProblem Based Learning学习是一种哪些感受
    最近偶尔看到PBL方法,感觉是个很有效的学习方法.看了下知道里很少的讨论,似乎大二就开始使用这种方法,感觉有些疑惑--这个方法对于学习者压力过大,可能导致厌学.所以想请问下:1.各位医学院的学生,你们在学习PBL课程时是如何的感受?尤其是初期:2.在学习过程中,是如何克服这种压力的?10/06/20 ...
  • Learning Theory的基础是PAC Learning (or PAC-Bayesian learning).但是我看到这个领域的textbook是80年代以及90年代初期的, 貌似基础理论近期都没有什么发展.目前比较有名气的关于theory的conference有COLT,STOC,FOC ...
  • 这个问题问得很好.从哲学观点来看,人的学习过程是一个渐进的过程,由浅入深,由简入繁.学习的根本,需要考虑两个方面,一方面是知识量的累积,另一方面是新的认知需要对旧的认知进行补充,修正,甚至颠覆.再从技术的角度上来看.传统中狭义的machine learning技术,是利用一批已有的数据,学习到一个固 ...
  • 如何通过machine learning的手法预测 Google 下一个要关闭的服务是什么
    这么多宝贵的历史数据不能浪费.轮子哥又来黑谷歌了.答案是完全可以.我会说我们实验室两年前就发表了预测应用服务消亡的模型么?当然不仅仅可以预测谷歌,巨硬,亚马逊,非死不可都可以预测,还老准了--===========================我是分割线====================== ...
一周排行