# 没错，纯SQL查询语句可以实现神经网络

• W: 2×2 的权重矩阵（元素： w_00, w_01, w_10, w_11）
• B: 2×1 的偏置向量（元素：b_0, b_1）

• W2: 2×2 的权重矩阵(元素： w2_00, w2_01, w2_10, w2_11)
• B2: 2×1 的偏置向量(元素：b2_0, b2_1)

`SELECT *,                    -0.00569693  AS w_00,                 0.00186517  AS w_01,                 0.00414431  AS w_10,                 0.0105101  AS w_11,                 0.0  AS b_0,                0.0  AS b_1,                -0.01312284  AS w2_00,                - 0.01269512  AS w2_01,                0.00379152  AS w2_10,                     -0.01218354  AS w2_11,                0.0  AS b2_0,                0.0  AS b2_1  FROM  `example_project.example_dataset.example_table` `

`SELECT *,                  (CASE             WHEN ((x1*w_00 + x2*w_10) + b_0) > 0.0 THEN ((x1*w_00 + x2*w_10) + b_0)             ELSE 0.0         END) AS d0,        (CASE             WHEN ((x1*w_01 + x2*w_11) + b_0) > 0.0 THEN ((x1*w_01 + x2*w_11) + b_1)             ELSE 0.0         END) AS d1 FROM {inner subquery} `

`SELECT *,        EXP(scores_0)/(EXP(scores_0) + EXP(scores_1)) AS probs_0,        EXP(scores_1)/(EXP(scores_0) + EXP(scores_1)) AS probs_1 FROM   ( SELECT *,                    ((d0*w2_00 + d1*w2_10) + b2_0) AS scores_0,                 ((d0*w2_01 + d1*w2_11) + b2_1) AS scores_1    FROM {INNER sub-query}) `

`SELECT *,        (sum_correct_logprobs/num_examples) + 1e-3*(0.5*(w_00*w_00 + w_01*w_01 + w_10*w_10 + w_11*w_11) + 0.5*(w2_00*w2_00 + w2_01*w2_01 + w2_10*w2_10 + w2_11*w2_11)) AS loss FROM      (SELECT *,                       SUM(correct_logprobs)  OVER ()  sum_correct_logprobs,                                      COUNT(1)  OVER ()  num_examples    FROM          (SELECT *,                        (CASE                           WHEN y = 0 THEN -1*LOG(probs_0)                           ELSE -1*LOG(probs_1)                     END) AS correct_logprobs       FROM {inner subquery})) `

`SELECT *,                  (CASE                          WHEN y = 0  THEN (probs_0–1)/num_examples            ELSE probs_0/num_examples                END)  AS dscores_0,              (CASE                         WHEN y = 1 THEN (probs_1–1)/num_examples            ELSE probs_1/num_examples               END)  AS dscores_1  FROM {inner subquery} `

`SELECT *,        SUM(d0*dscores_0) OVER () AS dw2_00,        SUM(d0*dscores_1) OVER () AS dw2_01,         SUM(d1*dscores_0) OVER () AS dw2_10,         SUM(d1*dscores_1) OVER () AS dw2_11,         SUM(dscores_0) OVER () AS db2_0,         SUM(dscores_1) OVER () AS db2_1,         CASE            WHEN (d0) <= 0.0  THEN 0.0            ELSE (dscores_0*w2_00 + dscores_1*w2_01)         END AS dhidden_0,        CASE            WHEN (d1) <= 0.0 THEN 0.0            ELSE (dscores_0*w2_10 + dscores_1*w2_11)        END AS dhidden_1  FROM {inner subquery} `

`SELECT *,         SUM(x1*dhidden_0) OVER () AS dw_00,         SUM(x1*dhidden_1) OVER () AS dw_01,         SUM(x2*dhidden_0) OVER () AS dw_10,         SUM(x2*dhidden_1) OVER () AS dw_11,         SUM(dhidden_0) OVER () AS db_0,         SUM(dhidden_1) OVER () AS db_1  FROM {inner subquery} `

***，我们使用 W、B、W2 及 B2 各自的导数进行更新操作。计算公式是 param = learning_rate * d_param ，其中learning_rate 是参数。为了体现 L2 正则化，我们会在计算 dW 和 dW2 时加入一个正则项 reg*weight。我们也去掉如  dw_00, correct_logprobs 等缓存的列，它们曾在子查询时被创建，用于保存训练数据(x1, x2 及 y 列) 和模型参数（权重和偏置项）。对应的查询语句如下：

`SELECT x1,         x2,        y,         w_00 — (2.0)*(dw_00+(1e-3)*w_00) AS w_00,         w_01 — (2.0)*(dw_01+(1e-3)*w_01) AS w_01,         w_10 — (2.0)*(dw_10+(1e-3)*w_10) AS w_10,         w_11 — (2.0)*(dw_11+(1e-3)*w_11) AS w_11,         b_0 — (2.0)*db_0 AS b_0,         b_1 — (2.0)*db_1 AS b_1,        w2_00 — (2.0)*(dw2_00+(1e-3)*w2_00) AS w2_00,         w2_01 — (2.0)*(dw2_01+(1e-3)*w2_01) AS w2_01,        w2_10 — (2.0)*(dw2_10+(1e-3)*w2_10) AS w2_10,         w2_11 — (2.0)*(dw2_11+(1e-3)*w2_11) AS w2_11,         b2_0 — (2.0)*db2_0 AS b2_0,         b2_1 — (2.0)*db2_1 AS b2_1  FROM {inner subquery} `

https://github.com/harisankarh/nn-sql-bq/blob/master/out.txt

https://github.com/harisankarh/nn-sql-bq/blob/master/query_for_prediction.sql。

