Auto Anomaly Detection

自动异常检测器

背景
我有一个数据表和一些指标(m1,m2…mn)。可以通过(focus='m1', fixed={m2:True, m5:False,...)的格式去访问数据表,获取对应的时间序列数据。这个查询语句的意思就是在m2为True,m5为False的情况下,查询关于m1的数据。 其中focus位置只能接收一个str型指标,fixed位置可以接收一个dict,里面可以出现除focus之外的任意个指标,每个指标都有True/False2种情况。查到的数据可以用于做异常检测,或者其他用途,不过不是这个项目的重点。

要求:

  1. 首先,我想基于Python实现一个算法,可以将所有的focus, fixed组合动态地存储到一个有向图中。(我现在用的是NetworkX这个包来建图,存储结构是前缀树。不过你也可以用别的方法存,只要是图就行。)动态地意思就是,我可以设置一些条件,提前停止建树/树。比如检测到这一层没有异常,就不再深入到下一层了。我现在的问题就是没法动态存储。

验证方法:可以先用(’Aa’,’Bb’,’Cc’,’Dd’,’Ee’)这5个指标自用组合,做一个初步的验证。
1)希望这个算法可以高效且节省内存,因为真实数据集中的指标超过100个。
2—)希望这个算法,可以写的灵活一点,比如既可以遍历上面含5个指标的数据集,也可以指定focus和fixed进行自动建图。
3)情况紧急,希望本周末结束前可以出来一份初稿。

2.如果效果的好的话,后续还有一些基于这个图的搜索算法,也可以跟您合作。

周日晚上要(完成80%以上)

Leave a Reply

Your email address will not be published. Required fields are marked *