K线走势图为数据科学服务


K线走势图为数据科学服务

当数据专家试图处理他可用的信息时,他使用所谓的强力方法,也就是说他使用的软件将尝试所有可能的计算方法,直到找到您要查找的信息。

该方法具有许多优点,因为它为处理的数据提供了一定的完整性保证。另一方面,存在处理速度和分析数据的相关性的问题。

向前迈出的一步:处理有用的数据

一旦数据科学的这种起源已经过去,并考虑到该方法的局限性,这些专业人员已经尝试通过仅选择在他们的研究过程中有意义的数据来改善响应时间。

使用这种方法,专家将在包含计算的软件中输入那些在他进行的搜索中具有实用性的数据。我们将节省时间,因为算法必须扫描更少的数据,我们也将了解我们正在寻找的东西。这种方法的问题在于,人们会故意丢弃可能证明有用的数据,特别是在与其他数据的交互中。

欺诈检测的例子,或如何检测“异常”数据

作为欺诈检测的一部分,统计员将进入他的系统所有看似有趣的数据(收入,账户报表,居住地,银行……),并将开发一个数学函数,该系统将应用于数据。条目。这称为离散分析方法。然后,该功能可以确定具有被认为是“正常”的行为的数据,并且因此该功能之外的数据被认为是“异常”并且需要调查可能是欺诈的证据。

这种方法的难点在于定义足够广泛的功能以避免误报的识别,同时确保对真实欺诈者的良好检测。因此,在通常基于分数的第一次计算通过结束时,系统将上涨3类:经过验证的欺诈者得分非常高;事实证明,非欺诈者得分非常低,而且只有一个补充支票(通常是人)的人才可以进行分类。

K线走势图提供的丰富

上一个例子之后出现的问题:如何检查得分不重要的人的性质?谁是他们,欺诈者还是非欺诈者?

由瑞士数学家莱昂哈德·欧拉(Leonhard Euler)于1774年创建的K线走势图理论允许研究数据之间的关系。作为欺诈检测示例的一部分,K线走势图系统将查看这些数据之间的关系,以识别可能的欺诈者。例如,在离散分析中可以将人视为“正常”。但是应用K线走势图理论,可能看起来另一个人拥有相同的电话号码,相同的银行帐号或其他共同点,通常是使用合成身份的标志。单一数据库有效用于欺诈。在离散分析期间,系统不会注意到这种异常,因为它将单独采集每个数据。通过K线走势图,数据科学家将因此发现这种类型的案例,尽管表面上看是正常的,但却是不规则的。

因此,K线走势图提出的连通分析将能够丰富先前执行的离散分析。该系统允许商业用户识别他们以前从未识别过的欺诈行为。

从指数数学复杂性到对数数学复杂性

使用处理数据之间关系的K线走势图还可以实时导航数据,并且能够在欺诈的情况下触发即时对策,例如阻止银行行动时发生的原因是Neo4j在日志复杂度O(log n)内部使用的算法,根据Paulina Data Scientists的优秀算法指南和数据结构,非原生图技术处于红色区域郑(https://towardsdatascience.com/a-data-scientists-guide-to-data-structures-algorithms-1176395015a0)

实际上,在传统方法中,所有数据都以表格形式呈现,即邻接矩阵。传统的数据库系统(没有原生图)因此必须跨越行和列的所有数据,以便在与数据科学家的工作相对应的业务算法之前识别连接,并在每次调用时算法。

此外,在添加数据时,传统系统必须在矩阵中添加一列和一行以进行交叉分析。因此很快就会发现,在传统操作中要分析的数据量是指数级的,即使业务数据的子集要小得多,它也会变得非常快。

从一般的观点来看,计算时间的这个问题迫使专家在要处理的数据中做出选择,以便不阻塞系统或产生太长的处理时间,这只会产生一次结果。欺诈行为。

对于本机图,一段数据只是数据,由标准化的“节点”表示,而不必生成不必要的重复。因此,当我们在K线走势图中添加数据时,我们不会以指数方式将数据库的大小相乘。因此,用户将能够分析所有有用的数据,而不用担心他的分析系统的性能。

在这个3世纪的数学理论的基础上,今天可用的技术已经发展到利用它并通过将它们纳入单一的科学科学3.0来促进数据科学家的工作。因此,这些K线走势图并非旨在取代数据科学家的工具,而是通过连接,上下文和实时分析来补充它们。

资讯来源:由0x资讯编译自JOURNALDUNET,原文:https://www.journaldunet.com/solutions/expert/71551/les-graphes-au-service-de-la-data-science.shtml,版权归作者所有,未经许可,不得转载
提示:投资有风险,入市需谨慎,本资讯不作为投资理财建议。请理性投资,切实提高风险防范意识;如有发现的违法犯罪线索,可积极向有关部门举报反映。
你可能还喜欢