人工智能网

 找回密码
 立即注册
查看: 1633|回复: 4

求教:找数据的临街值(异常值)

[复制链接]
发表于 2015-1-23 11:26:00 | 显示全部楼层 |阅读模式
先谢谢各位看看(应该和数据挖掘相关)
我是学计算机的没怎么接触过统计和数据预处理,什么思路,问题是:有一组数据(可理解为某件东西的数量,已排序)数据特征是:均值:1033,中位数:31,标准差很大,绝大多数数字很小,后边增长很快,
数据的实际意义:数据很小是没有问题的(绝对可以得),但是数据大到一定程度就有问题,要拆分,希望可以找到这个临界值。(具体数据在下文给出链接)
我的思路:1,通过传统的统计数据,分析出异常点,但是均值,中位数等都用不上,看不出什么名堂。
2、曲线拟合(直接拟合)之后解方程(但是数据大小差别很大,前边的数据就是直线之后突然拉高,也不好看)
3、麻烦大家帮我看看。
回复

使用道具 举报

 楼主| 发表于 2015-1-23 11:26:00 | 显示全部楼层
数据连接http://pan.baidu.com/s/1mgKGAec
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-1-23 11:27:00 | 显示全部楼层
可以在这里回,也可以加我QQ527484016 (邮箱也可以)。
给个思路也行,能帮忙实践一下就更感激不尽了。
谢谢
回复 支持 反对

使用道具 举报

发表于 2015-1-31 10:30:00 | 显示全部楼层
阈值选择的话,我只用R做过,不过我是通过两个分布的结合点选择,而且阈值前后的概率分布是已知的,不知道能不能用在楼主的问题上。。。
回复 支持 反对

使用道具 举报

发表于 2015-2-6 10:30:00 | 显示全部楼层
MLR
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|人工智能实验室

GMT+8, 2024-4-25 18:17 , Processed in 0.013162 second(s), 9 queries , Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表