GraphX是图形和Apache火花的API graph-parallel计算。

灵活性

无缝工作图和集合。

GraphX结合ETL、探索性分析和迭代图计算在一个系统中。你可以视图相同的数据图表和集合,变换加入与抽样效率图,编写自定义迭代图算法使用Pregel API

图=(顶点、边)
消息= spark.textFile (“hdfs: / /……”)
graph2 =图。joinVertices(消息){
(id、顶点、味精)= >…
}
使用Scala中的GraphX

速度

类似的性能最快的专业图形处理系统。

GraphX竞争对性能与最快的图形系统,同时保留引发的灵活性,容错和易用性。

端到端PageRank性能(20迭代,3.7 b边)

算法

选择越来越多的图书馆的图算法。

除了一个高度灵活的API,GraphX伴随着各种各样的图算法,其中许多是由我们的用户。

  • 网页排名
  • 连接组件
  • 品牌传播
  • 圣言会+ +
  • 强连通分量
  • 三角形数

社区

GraphX开发作为Apache火花项目的一部分。因此获得与每个火花版本测试和更新。

如果你有关于图书馆的问题,问的火花邮件列表

GraphX alpha阶段,欢迎贡献。如果你想提交更改GraphX,阅读如何导致火花和寄给我们一个补丁!

开始

与GraphX开始:

  • 下载火花。GraphX包括作为一个模块。
  • 读了GraphX指南,包括用法示例。
  • 学习如何部署火花集群上如果你想运行在分布式模式。你也可以在多核机器上本地运行没有任何设置。
最新消息

存档

Baidu
map