قبل از اینکه هوش مصنوعی زندگی اجتماعی شما را پیش بینی کند ، باید داده های خود را تمیز کند

در این پست ما به کار خود بر روی پیش بینی پیوند با مجموعه داده های Twitch ادامه خواهیم داد.

ما قبلاً داده های نمودار را با استفاده از نپتون صادر کرده ایم نپتون ابزار و مشخصات “neptune_ml”. مراحل قبلی در قسمت های 2 و 1 این راهنما شرح داده شده است.

قسمت 1 را در اینجا و قسمت 2 در اینجا بخوانید.

داده ها در حال حاضر در S3 ذخیره می شوند و به نظر می رسد:

Vertices CSV (گره ها/user.consolidated.csv):

~id,~label,days,mature,views,partner
"6980","user",771,true,2935,false
"547","user",2602,true,18099,false
"2173","user",1973,false,3939,false
...

EDGES CSV (EDGES/USER-FOLLOWS-USER.Consolidated.CSV):

~id,~label,~from,~to,~fromLabels,~toLabels
"3","follows","6194","2507","user","user"
"19","follows","3","3739","user","user"
"35","follows","6","2126","user","user"
...

ابزار صادرات همچنین این فایل پیکربندی را برای ما ایجاد کرد:

آموزش-داده-پیکربندی. json:

{
  "version" : "v2.0",
  "query_engine" : "gremlin",
  "graph" : {
    "nodes" : [ {
      "file_name" : "nodes/user.consolidated.csv",
      "separator" : ",",
      "node" : [ "~id", "user" ],
      "features" : [ {
        "feature" : [ "days", "days", "numerical" ],
        "norm" : "min-max",
        "imputer" : "median"
      }, {
        "feature" : [ "mature", "mature", "auto" ]
      }, {
        "feature" : [ "views", "views",...

Source link