机器学习 - 提供从数据中学习具体统计算法的Java工具

按热度排序
Popular
746 9.1k 4.8k

A Apache Flink是一个开源的流处理框架,拥有强大的流和批量处理功能。
 
10.0 10.0
  昨天
Popular
241 3k 767

B BigDL: Apache Spark的分布式深度学习库
 
10.0 6.8
Popular
2.1k 22.3k 19.3k

A Apache Spark:开源数据分析集群计算框架
 
9.0 10.0
  今天
805 11.8k 1.9k

P PredictionIO —供软件开发者和数据工程师用的机器学习服务器
 
9.0 0.5
842 10.9k 4.7k

D Deep Learning for Java, Scala & Clojure on Hadoop & Spark With GPUs - From Skymind
 
9.0 3.5
  3天前
100 809 276

A adam—使用Apache Avro, Apache Spark 和 Parquet的基因组处理引擎,有专用的文件格式,Apache 2软件许可。
 
79 745 245

Apache Spark 官方文档中文版
 
2.4 0.5
  14天前
67 567 176

J 提供预处理,分类,回归和聚类的算法并支持多线程执行。
 
1.7 0.5
71 551 147

F FACTORIE—可部署的概率建模工具包,用Scala实现的软件库。为用户提供简洁的语言来创建关系因素图,评估参数并进行推断。
 
99 543 460

W Word2VEC java版本的一个实现
 
1.7 0.0
  1年前
65 474 152

用Spark & Elasticsearch实现推荐系统
 
1.5 0.0
  2月前
60 395 131

S streamDM,是由华为诺亚方舟实验室开源的使用 Spark Streaming 挖掘大数据的开源软件。 大数据流学习 大数据流学习(Big Data stream learning)比批量或离线学习更富有挑战性,因为数据在流动的过程中不太可能保持同一种分布。 }
 
1.2 0.0
38 358 56

C Conjecture—Scalding下可扩展的机器学习框架
 
1.1 0.0
  1年前
36 356 118

C CTRmodel - 纯Spark MLlib(LR, GBDT, DNN)实现的CTR预测模型
 
1.1 0.2
  9天前
61 325 181

N Neuroph是一个开源的Java神经网络框架和开发环境。 包含精心设计的开源Java库,其中包含少量与基本NN概念相对应的基本类,其非常适合初学者和教育。 它还提供了很好的GUI神经网络编辑器和向导,可以快速创建神经网络组件以及各种可视化工具。
 
1.0 0.0
  2月前
34 298 73

Y Ytk-learning是实现大多数流行机器学习算法的分布式机器学习库。 它运行在单台,多台机器和主要分布式环境(hadoop,spark)上,并支持主要操作系统(Linux,Windows,Mac OS),分布式环境的通信是基于ytk-mp4j实现的,它是纯Java,类似mpi消息传递接口。
 
0.9 0.0