机器学习 - 提供从数据中学习具体统计算法的Java工具

按收录时间排序
6 21 1

Y Ytk-learning是实现大多数流行机器学习算法的分布式机器学习库。 它运行在单台,多台机器和主要分布式环境(hadoop,spark)上,并支持主要操作系统(Linux,Windows,Mac OS),分布式环境的通信是基于ytk-mp4j实现的,它是纯Java,类似mpi消息传递接口。
 
0.3 10.0
11 29 15

A Apache Horn 是 Apache 的一个孵化项目,是一个以神经元为中心的编程模型和同步、异步混合的分布式训练框架,支持数据和模型并行性
 
0.0 0.0
  6月前
168 1.8k 334

B BigDL: Apache Spark的分布式深度学习库
 
1.0 10.0
  3天前
52 262 99

S streamDM,是由华为诺亚方舟实验室开源的使用 Spark Streaming 挖掘大数据的开源软件。 大数据流学习 大数据流学习(Big Data stream learning)比批量或离线学习更富有挑战性,因为数据在流动的过程中不太可能保持同一种分布。 }
 
0.8999999999999999 0.0
6 62 32

P PKUSUMSUM:一个集成Java工具包用于自动文档摘要,支持单文档、多文档、专注主题的多文档摘要并且各种各样的总结方法已经在工具箱中实现。
 
0.1 0.0
  5月前
82 314 318

W Word2VEC java版本的一个实现
 
1.0 0.0
  2月前
7 24 79

C Canova是一款Java常用的机器学习库的通用向量化工具
 
0.0 0.0
  2年前
1 1 0

M 民兴推荐系统
 
0.0 0.0
  6月前
184 2.1k 535

B Breeze —Scala用的数值处理库
 
0.1 2.7
  1月前
17 95 33

J Java编写的从HTML提取正文内容实现
 
0.0 0.0
  2年前
67 494 144

F FACTORIE—可部署的概率建模工具包,用Scala实现的软件库。为用户提供简洁的语言来创建关系因素图,评估参数并进行推断。
 
316 1.8k 246

S Summing Bird—用Scalding 和 Storm进行Streaming MapReduce
 
257 1.5k 245

A Algebird —Scala的抽象代数工具
 
0.1 0.2
15 135 16

S simmer —化简你的数据,进行代数聚合的unix过滤器
 
0.4 0.0
  4年前
763 10.2k 1.7k

P PredictionIO —供软件开发者和数据工程师用的机器学习服务器
 
9.0 3.8
40 234 69

B BIDMat—支持大规模探索性数据分析的CPU和GPU加速矩阵库。
 
0.7000000000000001 10.0
35 335 55

C Conjecture—Scalding下可扩展的机器学习框架
 
1.1 1.0
  1月前