百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

高级API、异构图:谷歌发布TF-GNN,在TensorFlow创建图神经网络

toyiye 2024-07-04 09:14 13 浏览 0 评论

机器之心报道

编辑:陈萍

高效且友好的 TensorFlow GNN 库。

今天,TensorFlow 官方博客发布了 TensorFlow Graph Neural Networks(TensorFlow GNN)库 ,这个库使得用户在使用 TensorFlow 时能够轻松处理图结构数据。

此前,TensorFlow GNN 的早期版本已经在谷歌的各种应用中使用,包括垃圾邮件和异常检测、流量估计、YouTube 内容标记等。特别是,考虑到谷歌数据种类繁多,该库在设计时就考虑到了异构图。

项目地址:https://github.com/tensorflow/gnn

为何使用 GNN?

无论是在现实世界中,还是在我们设计的系统中,图无处不在。一组对象或是不同的人以及他们之间的联系,通常可以用图来描述。通常情况下,机器学习中的数据是结构化或关系型的,因此也可以用图来描述。虽然 GNN 的基础研究已经有几十年的历史,但近几年才取得一些进展,包括在交通预测、假新闻检测、疾病传播建模、物理模拟,以及理解为什么分子会有气味等。

图可以为不同类型的数据进行关系建模,包括网页(左)、社交关系(中)或分子(右)。

怎样定义图呢?简单来讲,图表示一组实体(节点或顶点)之间的关系(边)。我们可以描述每个节点、边或整个图,从而将信息存储在图的每一部分中。此外,我们可以赋予图边缘方向性来描述信息或信息流。

GNN 可以用来回答关于这些图的多个特征问题。GNN 可用于节点级任务,对图的节点进行分类,并预测图中的分区和相关性,类似于图像分类或分割。最后,我们可以在边缘级别使用 GNN 来发现实体之间的连接。

TensorFlow GNN

TF-GNN(TensorFlow GNN) 提供了在 TensorFlow 中实现 GNN 模型的构建块。除了建模 API 之外,该库还为处理图数据提供了可用工具,包括基于张量的图数据结构、数据处理 pipeline 和一些供用户快速入门的示例模型。

TF-GNN 工作流程组件

TF-GNN 库的初始版本包含许多实用程序和功能,供初学者和有经验的用户使用,包括:

  • 高级 keras 风格的 API 用于创建 GNN 模型,可以很容易地与其他类型的模型组合。GNN 通常与排序、深度检索结合使用或与其他类型的模型(图像、文本等)混合使用;
  • 定义良好的模式用来声明图拓扑结构,以及验证工具。该模式描述了其训练数据的大小,并用于指导其他工具;
  • GraphTensor 复合张量类型,可以用来保存图数据,也可以进行批处理,并具有可用的图操作例程;
  • GraphTensor 结构操作库:在节点和边缘上进行各种有效的 broadcast 和 pooling 操作,以及提供相关操作的工具;标准 baked 卷积库,机器学习工程师、研究人员可以对其轻松扩展;高级 API 可以帮助工程师快速构建 GNN 模型而不必担心细节;
  • 模型可以从图训练数据编码,以及用于将此数据解析为数据结构的库中提取各种特征。

示例

下面示例使用 TF-GNN Keras API 构建了一个模型,该模型可以根据观看内容和喜欢的类型向用户推荐电影。

完成这项任务使用 ConvGNNBuilder 方法来指定边的类型和节点配置,即对边使用 WeightedSumConvolution(定义如下):

import tensorflow as tf
    import tensorflow_gnn as tfgnn

    # Model hyper-parameters:
    h_dims = {'user': 256, 'movie': 64, 'genre': 128}

    # Model builder initialization:
    gnn = tfgnn.keras.ConvGNNBuilder(
      lambda edge_set_name: WeightedSumConvolution(),
      lambda node_set_name: tfgnn.keras.layers.NextStateFromConcat(
         tf.keras.layers.Dense(h_dims[node_set_name]))
    )

    # Two rounds of message passing to target node sets:
    model = tf.keras.models.Sequential([
        gnn.Convolve({'genre'}),  # sends messages from movie to genre
        gnn.Convolve({'user'}),  # sends messages from movie and genre to users
        tfgnn.keras.layers.Readout(node_set_name="user"),
        tf.keras.layers.Dense(1)
    ])

有时我们希望 GNN 性能更强大,例如,在上个示例中,我们可能希望模型在给出推荐电影时可以同时给出权重。下面代码片段中定义了一个更高级的 GNN,它带有自定义图卷积,以及带有权重边。下面代码定义了 WeightedSumConvolution 类可以将边值池化为所有边的权重总和:

class WeightedSumConvolution(tf.keras.layers.Layer):
  """Weighted sum of source nodes states."""

  def call(self, graph: tfgnn.GraphTensor,
           edge_set_name: tfgnn.EdgeSetName) -> tfgnn.Field:
    messages = tfgnn.broadcast_node_to_edges(
        graph,
        edge_set_name,
        tfgnn.SOURCE,
        feature_name=tfgnn.DEFAULT_STATE_NAME)
    weights = graph.edge_sets[edge_set_name]['weight']
    weighted_messages = tf.expand_dims(weights, -1) * messages
    pooled_messages = tfgnn.pool_edges_to_node(
        graph,
        edge_set_name,
        tfgnn.TARGET,
        reduce_type='sum',
        feature_value=weighted_messages)
    return pooled_messages

请注意,即使卷积是在只考虑源节点和目标节点的情况下编写的,TF-GNN 仍可确保它适用并可以无缝处理异构图(具有各种类型的节点和边)。

安装

这是目前安装 tensorflow_gnn 的唯一方法。强烈建议使用虚拟环境。

Clone tensorflow_gnn:

gt; git clone https://github.com/tensorflow/gnn.git tensorflow_gnn

安装 TensorFlow:

gt; pip install tensorflow

安装 Bazel:Bazel 需要构建包的源代码。安装步骤请参考:https://docs.bazel.build/versions/main/install.html

安装 GraphViz:这个包使用 GraphViz 作为可视化工具,安装因操作系统而异,例如 Ubuntu:

gt; sudo apt-get install graphviz graphviz-dev

安装 tensorflow_gnn:

gt; cd tensorflow_gnn && python3 -m pip install .

参考链接:

https://blog.tensorflow.org/2021/11/introducing-tensorflow-gnn.html

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码