数据科学基础-相似性匹配和聚类|见解| blum

布莱恩·贝瑞2015年1月27日|

怎样才能成为一名优秀的数据科学家?优秀的数据科学家应该是具有扎实统计背景的软件工程师，或者喜欢编程的统计学家。我是一名有扎实统计背景的软件工程师。我想在这个博客里分享我的统计知识，重点是每个软件工程师/统计学家都需要知道的重要的基础任务。

在上一篇文章中，我介绍了最基本的知识:分类和回归。在这篇博文中，我想谈谈一些统计性质的，也可以用于数据质量练习的方法。它们是相似匹配和聚类。这两种方法都有助于寻求减少数据重复的数据质量和数据治理团队，也有助于在缺乏权威数据的情况下预测正确的属性值。

相似度匹配是一项基础性的任务，为以后的分类和回归活动提供支持。这里，我们试图根据这些数据成员的已知属性识别类似的数据成员。例如:一家公司可能会使用相似度匹配来寻找与他们最好的客户非常相似的新客户——他们可以被作为特价或其他客户保留策略的目标。或者，公司可以从供应商的原材料数据中寻找相似之处，以优化成本。

聚类是另一个基础任务，因为它可以作为进一步练习的基础。聚类试图找到数据实体的自然分组，而不必由特定目的驱动。结果可以作为决策的输入，机器学习:我们应该向这些客户提供什么产品或服务?是否有足够大的人口来进行具体的市场营销?

在下一篇文章中，我将继续根据特征和目的来区分数据科学任务。很多任务都是相关的，所以我们会讨论一些已经讨论过的补充。

58biwei

我们能做些什么

最近的新闻和更新

文章

数据科学基金会-相似匹配与聚类

布莱恩·贝瑞2015年1月27日|

布莱恩·贝瑞

导演

作者的其他见解

相关的见解

相关专业知识

数据与分析

先进的分析

注册我们的时事通讯

继续与我们的团队对话
和我们联系。

一步

主要菜单

<返回betway必威备用

<返回专业知识

<返回betway必威体育观点

<返回的见解

<返回职业与文化

你在找什么特别的东西吗?
我们可以帮助!下面的搜索它

一步

一步

我们能做些什么

最近的新闻和更新

文章

数据科学基金会-相似匹配与聚类

58biwei <数据科学基础-相似性匹配和聚类

布莱恩·贝瑞2015年1月27日|

专业知识:

数据与分析,

先进的分析

布莱恩·贝瑞

导演

作者的其他见解

相关的见解

相关专业知识

数据与分析

先进的分析

注册我们的时事通讯

相关的的见解

制造业中的预测分析

文章

区块链和制造业-一个时代的匹配

文章

顶级服务公司如何利用人工智能加强人际关系

文章

区块链与电子制造:追求物联网

文章

我们的数据科学的5条规则

文章

创建黄金唱片的6个步骤

文章

高等教育中的人工智能(AI)——改善机构运作

文章

通过预测分析提高客户保留率

文章

人力资源分析的五种关键技能

文章

继续与我们的团队对话和我们联系。

想了解更多信息吗?

一步

关闭菜单

主要菜单

<返回betway必威备用

<返回专业知识

<返回betway必威体育观点

<返回的见解

<返回职业与文化

你在找什么特别的东西吗?我们可以帮助!下面的搜索它

一步

一步

继续与我们的团队对话
和我们联系。

你在找什么特别的东西吗?
我们可以帮助!下面的搜索它