`
yangfuchao418
  • 浏览: 161281 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Apache Mahout中的机器学习算法集【转】

阅读更多

Apache Mahout 是 ApacheSoftware Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,并且,在 Mahout 的最近版本中还加入了对Apache Hadoop 的支持,使这些算法可以更高效的运行在云计算环境中。

在Mahout实现的机器学习算法见下表:

算法类

算法名

中文名

分类算法

Logistic Regression

逻辑回归

Bayesian

贝叶斯

SVM

支持向量机

Perceptron

感知器算法

Neural Network

神经网络

Random Forests

随机森林

Restricted Boltzmann Machines

有限波尔兹曼机

聚类算法

Canopy Clustering

Canopy聚类

K-means Clustering

K均值算法

Fuzzy K-means

模糊K均值

Expectation Maximization

EM聚类(期望最大化聚类)

Mean Shift Clustering

均值漂移聚类

Hierarchical Clustering

层次聚类

Dirichlet Process Clustering

狄里克雷过程聚类

Latent Dirichlet Allocation

LDA聚类

Spectral Clustering

谱聚类

关联规则挖掘

Parallel FP Growth Algorithm

并行FP Growth算法

回归

Locally Weighted Linear Regression

局部加权线性回归

降维/维约简

Singular Value Decomposition

奇异值分解

Principal Components Analysis

主成分分析

Independent Component Analysis

独立成分分析

Gaussian Discriminative Analysis

高斯判别分析

进化算法

并行化了Watchmaker框架

推荐/协同过滤

Non-distributed recommenders

Taste(UserCF, ItemCF, SlopeOne)

Distributed Recommenders

ItemCF

向量相似度计算

RowSimilarityJob

计算列间相似度

VectorDistanceJob

计算向量间距离

非Map-Reduce算法

Hidden Markov Models

隐马尔科夫模型

集合方法扩展

Collections

扩展了java的Collections类

Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。

分享到:
评论

相关推荐

    基于mahout的数据挖掘技术课程 共35页.pdf

    Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。 机器学习 • 机器学习是人工智能的一个分支,...

    Mahout in action带书签目录 中文 完整版

    它实现的算法都被归入机器学习或者集体智慧的范畴,但是在这里Mahout主要注重协同过滤/推荐引擎、聚类和分类。 Mahout是可伸缩的。Mahout致力于实现海量数据,单机无法处理情况下的机器学习工具。在目前阶段,这种...

    cudalearn:C# 中的高级机器学习算法

    C# 中的高级机器学习算法 机器学习是人工智能的一个分支,专注于识别数据中的模式和规律。 在许多情况下,这些模式是从标记的“训练”数据(监督学习)中学习的,但是当没有可用的标记数据时,可以使用其他算法来...

    基于Java Mahout的电影推荐系统【100011537】

    Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。经典算法包括聚类、分类、协同过滤、...

    Mahout in action 中文版 高清 完整

    Mahout作为Apache的开源机器学习项目,把推荐系统、分类和聚类等领域的核心算法浓缩到了可扩展的现成的库中。使用Mahout,你可以立即在自己的项目中应用亚马逊、Netflix及其他互联网公司所采用的机器学习技术。, ...

    mahout-0.11.0.tar.gz

    适合centos7平台,Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括...

    [Mahout.in.Action(2011)].Sean.Owen.文字版.pdf

    Mahout是一个Apache的开源机器学习项目。该算法属于广阔的 “机器学习”,或“集体智慧的伞形结构。这就可以代表很多东西,但此时此刻,我们关心Mahout的主要部分是:协同过滤(CF)/推荐引擎(recommender),聚类...

    MAHOUT源码包

    Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤...

    mahout权威指南

    Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。

    java中型项目源码-Machine-Learning-in-Java:Java_code中的机器学习

    中的机器学习 (Packtpub Publishing) 的支持材料(代码、库等)。 将为您提供快速从复杂数据中获得洞察力所需的技术和工具。 您将首先学习如何将机器学习方法应用于各种常见任务,包括分类、预测、预测、购物篮分析...

    mahout-distribution-0.5-src

    Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Apache Mahout项目已经发展到了它的第三个年头...

    Mahout In Action带书签完整版

    Mahout是一个Apache的开源机器学习项目。该算法属于广阔的 “机器学习”,或“集体智慧的伞形结构。这就可以代表很多东西,但此时此刻,我们关心Mahout的主要部分是:协同过滤(CF)/推荐引擎 (recommender),聚类...

    mahout in action

    apache 的机器学习算法库,实现了推荐、聚类、分类等算法。

    Mahout in action

    Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤...

    ROSEFW-RF:该项目包含 ROSEFW-RF 论文中使用的代码

    Apache Mahout( )项目的目标是构建一个环境,以快速创建可扩展的高性能机器学习应用程序。 先决条件: Hadoop 2.5。 蚂蚁 相关论文: I. Triguero、S. Río、V. López、J. Bacardit、JM Benítez、F. ...

    你需要Spark的10个理由

    3,Spark是继Hadoop之后,成为替代Hadoop的下一代云计算大数据核心技术,目前SPARK已经构建了自己的整个大数据处理生态系统,如流处理、图技术、机器学习、NoSQL查询等方面都有自己的技术,并且是Apache顶级Project...

    Hadoop从业者为什么需要Spark?

    Spark是继Hadoop之后,成为替代Hadoop的下一代云计算大数据核心技术,目前SPARK已经构建了自己的整个大数据处理生态系统,如流处理、图技术、机器学习、NoSQL查询等方面都有自己的技术,并且是Apache顶级Project,...

    project-rhino:增强了针对Apache Hadoop生态系统的数据保护

    犀牛计划 随着Hadoop扩展到新市场并看到新的用例面临安全性和合规性挑战,必须在所有Hadoop项目和...Mahout:机器学习和数据挖掘算法库 Flume:收集和导入日志和事件数据 Sqoop:从关系数据库导入数据 这些核心组件以及

    积分java源码-harness:Harness是一个机器学习/人工智能服务器,带有许多算法的插件,包括通用推荐器

    该项目实现了一个基于微服务的机器学习服务器。 它为插件引擎提供 API 并实现输入和查询所需的所有服务。 它也是通用推荐器的平台,它是一个线束引擎。 线束功能包括: 建筑学 微服务架构Harness 使用一流的服务来...

Global site tag (gtag.js) - Google Analytics