机器学习和预测分析最近受到了很多关注!毫无疑问,这是一项具有广泛适用性的令人兴奋的技术。毕竟,谁不想能够预测未来呢?然而,随着炒作而来的是困惑,如今对于机器学习到底是什么以及如何使用它有很多困惑。
我有好消息!实际上只有4个(是,四)机器学习问题。对于任何想要探索机器学习价值的人来说,重要的是要了解它们,因为任何机器学习过程的第一步是弄清楚你试图解决的问题中的哪些问题。数据科学团队在开始设计机器学习模型之前解决了这个问题。如果您的问题不适合其中一个桶,请忘记炒作!你最好采取更简单的方法。
分类-在这个机器学习问题中,我们试图弄清楚一些数据(一个观察)是否代表一些我们已经理解的简单东西(一个标签)。这个标签可以是是或否的决定(两个类别),也可以是一组可能的答案(多个类别)。为了让它很好地工作,您需要首先为机器学习模型提供示例。申请包括:
回归- 在这台机器学习问题中,是或否答案不够。为了解决这个问题,通过了解该值的数字关系(或因子),机器需要预测值(即价格,温度,测量)。如果你采取微积分,这可能听起来像一个简单的“变化率”功能:你在正确的赛道上。就像分类一样,回归问题需要一些例子,以便运行良好。申请包括:
聚类- 这就是事情变得复杂(!!)与前两个问题,我们有一个例子我们可以用来“训练”我们的机器来预测标签,我们可以用标记的观察来测试它们(数据科学家已知为“地面真理”“)。但如果我们没有地位真相怎么办?我们能做的最好的是识别观察团的群集。公平警告:没有地面真理,评估结果将是一项挑战。仍然存在一些应用程序包括:
推荐-你是否曾经浏览过一个推荐你可能“喜欢”的东西的网站?Netflix上的电影推荐,亚马逊上的产品推荐,或者应用程序上的广告——如果你熟悉互联网,你可能会理解这里的前提。
而已。现在,您知道如何识别机器学习可以帮助您的问题。如果您的业务问题不属于这四个中的一个,则不需要机器学习模型来解决它。更重要的是,如果您知道推动业务结果的因素,只需在Excel构建模型 - 您不需要数据科学团队。
祝好运!