硕士课程辅导
发布时间:2023-09-19 10:57
机器学习和人工智能的一个主要组成部分是提取数据背后的有用信息,特别是高维数据。深度学习最近的成功也归功于有效的数据表示。作为机器学习的新兴领域,表征学习可以从原始数据中提取特征,发现数据背后变异的解释因素,解决高维数据带来的棘手问题。表征学习已成功应用于计算机视觉、音频/语音信息处理、自然语言处理/理解、机器人技术和各种医学应用等许多领域。
表征学习是一类机器学习方法,它允许系统在原始数据中找到发现特征或进行分类所需的表征。通过让机器学习特征并将其应用于操作,减少了人工特征开发的需要。
在表征学习中,数据被发送给机器,机器自己学习表征。这就决定了特征数据的表示方法、距离函数和相似度函数,从而决定了预测模型的性能。表征学习的工作原理是将高维数据还原为低维数据,从而更容易识别模式和异常,同时更好地理解数据的整体行为。
一般来说,机器学习任务(如分类)通常需要在数学和计算上可控的输入数据,这也是表征学习的动机之一。现实世界的数据,如照片、视频和传感器数据,会阻碍通过算法识别特定特征的尝试。一种方法是探索数据以找到这些特征或表征,而不是依赖明确的技术。
我们需要使用表征学习来确保模型给出不变且无偏见的结果,以提高其准确性和性能。本节将讨论表征学习如何在三种不同的学习环境中提高模型性能:有监督学习、无监督学习。
1.监督学习
当 ML 或 DL 模型在输入 X 和输出 Y 之间建立起对应关系时,就出现了监督学习。计算机会通过比较模型输出和基本事实来进行修正,学习过程会优化输入和输出之间的匹配。这一过程不断重复,直到优化函数达到全局最小值。
即使优化函数达到了全局最小值,新数据也不一定能提供好的结果,从而导致过度拟合。虽然监督学习不需要大量数据来学习输入和输出之间的对应关系,但它确实需要学习函数。如果将学习到的属性纳入监督学习算法,预测准确率可提高 17%。
使用标记输入数据,特征学习是监督学习的一部分。例如,监督神经网络、多层感知器和(监督)字典学习。
2.无监督学习
无监督学习是机器学习的一种类型,在这种学习中,标签被忽略,而仅仅是观察。无监督学习不用于分类或回归,而是用于发现潜在模式、对数据进行聚类、去除数据中的噪声、检测异常值和分解数据等。
在处理 x 数据时,我们必须非常谨慎地使用 z 分数,以确保我们创建的模型是准确的。据观察,更多的数据并不总是意味着更好的代表性。我们需要确保创建的模型既灵活又有表现力,这样提取的特征才能传达基本信息。
无监督特征学习通过字典学习、独立成分分析、自动编码器、矩阵因式分解和各种形式的聚类等方法,从无标记的输入数据中学习特征。
海马课堂专业课程预习,2300+严选硕博学霸师资,针对学生的薄弱科目和学校教学进度,匹配背景相符的导师,根据学生情况进行1V1专属备课,上课时间灵活安排,中英双语详细讲解课程中的考点、难点问题,并提供多方位的课前预习,辅助学生掌握全部课程知识,补足短板。如果你对此还有疑问,或者有更多关于学业辅导方面需求的话,可以添加微信号:hmkt131联系海马课堂的Joye老师哦。
相关热词搜索: