Merge pull request #108 from GreenTeaProgrammers/feature/machine-lear…

…ning/refactor refactor(ml)
GreenTeaProgrammers · Feb 18, 2024 · 02d14fd · 02d14fd
2 parents 8d105df + d808296
commit 02d14fd
Show file tree

Hide file tree

Showing 9 changed files with 69 additions and 83 deletions.
diff --git a/machine_learning/src/face_detect_model/DetectFaceAndClip/detectFaceAndClip.py b/machine_learning/src/face_detect_model/DetectFaceAndClip/detectFaceAndClip.py
@@ -15,6 +15,8 @@
     load_cascade,
 )
 
+from face_detect_model.gcp_util import get_bucket, get_blobs, init_client
+
 load_dotenv("secrets/.env")
 
 logging.basicConfig(
@@ -76,46 +78,6 @@ def init_save_dir(save_dir_path: str):
             os.remove(file_path)
 
 
-def init_client():
-    # NOTE: gcloud auth application-default loginにて事前に認証
-    credential = os.environ.get("GOOGLE_APPLICATION_CREDENTIALS")
-    PROJECT_ID = os.environ.get("PROJECT_ID")
-
-    client = gcs.Client(PROJECT_ID, credentials=credential)
-    if client is None:
-        logger.error("Failed to initialize client.")
-        exit(1)
-    else:
-        return client
-
-
-def get_bucket(client: gcs.Client):
-    # NOTE: 環境変数からバケット名を取得
-    BUCKET_NAME = os.environ.get("BUCKET_NAME")
-    bucket = client.bucket(BUCKET_NAME)
-
-    if bucket.exists():
-        return bucket
-    else:
-        logger.error(f"Failed to {BUCKET_NAME} does not exist.")
-        exit(1)
-
-
-def get_blobs(bucket: Bucket, blob_name: str):
-    blobs = list(bucket.list_blobs(prefix=blob_name))
-
-    # blobsの中身に対するエラーハンドリング
-    try:
-        if len(blobs) == 0:  # 最初の要素がない場合、イテレータは空
-            logger.error(f"No blobs found with prefix '{blob_name}' in the bucket.")
-            exit(1)
-        else:
-            return blobs
-    except Exception as e:
-        logger.error(f"Failed to get blobs from '{blob_name}' due to an error: {e}")
-        exit(1)
-
-
 def save_face_image_to_local(face: np.ndarray, save_dir: str, save_file_name: str):
     """クリップされた顔画像を保存する"""
     os.makedirs(save_dir, exist_ok=True)
@@ -156,7 +118,8 @@ def detect_face_and_clip(args: argparse.Namespace, config: dict):
     # GCSとの接続
     if args.env == "remote":
         client = init_client()
-        bucket = get_bucket(client)
+        BUCKET_NAME = os.environ.get("BUCKET_NAME")
+        bucket = get_bucket(client, BUCKET_NAME)
 
     # Haar Cascadeの読み込み
     face_cascade = load_cascade(face_cascade_path)

diff --git a/machine_learning/src/face_detect_model/DetectFaceAndClip/detectFaceUtil.py b/machine_learning/src/face_detect_model/DetectFaceAndClip/detectFaceUtil.py
@@ -1,5 +1,4 @@
 import cv2
-import os
 
 
 def load_cascade(cascade_path):

diff --git a/machine_learning/src/face_detect_model/data/faceDetectDataset.py b/machine_learning/src/face_detect_model/data/faceDetectDataset.py
@@ -5,12 +5,11 @@
 from torchvision import transforms
 
 from face_detect_model.util import (
-    init_client,
-    get_bucket,
-    get_blobs,
     load_image_from_remote,
 )
 
+from face_detect_model.gcp_util import get_bucket, get_blobs
+
 # TODO: GCSに関する処理を別ファイルに切り出す
 
 

diff --git a/machine_learning/src/face_detect_model/gcp_util.py b/machine_learning/src/face_detect_model/gcp_util.py
@@ -0,0 +1,35 @@
+import google.cloud.storage as gcs
+from google.cloud.storage import Bucket
+import os
+
+
+def init_client():
+    # NOTE: gcloud auth application-default loginにて事前に認証
+    PROJECT_ID = os.environ.get("PROJECT_ID")
+
+    client = gcs.Client(PROJECT_ID)
+    if client is None:
+        raise RuntimeError("Failed to initialize client.")
+    else:
+        return client
+
+
+def get_bucket(client: gcs.Client, bucket_name: str):
+    bucket = client.bucket(bucket_name)
+
+    if bucket.exists():
+        return bucket
+    else:
+        raise ValueError(f"Failed to {bucket_name} does not exist.")
+
+
+def get_blobs(bucket: Bucket, blob_name: str):
+    # blobsの中身に対するエラーハンドリング
+    try:
+        blobs = list(bucket.list_blobs(prefix=blob_name))
+        if len(blobs) == 0:  # 最初の要素がない場合、イテレータは空
+            raise ValueError(f"No blobs found with prefix '{blob_name}' in the bucket.")
+        else:
+            return blobs
+    except Exception as e:
+        raise ValueError(f"Failed to get blobs from '{blob_name}' due to an error: {e}")
diff --git a/machine_learning/src/face_detect_model/main.py b/machine_learning/src/face_detect_model/main.py
@@ -5,7 +5,8 @@
 from face_detect_model.data.faceDetectDataset import FaceDetectDataset
 from face_detect_model.model.faceDetectModel import FaceDetectModel
 from face_detect_model.trainer import Trainer
-from face_detect_model.util import logger, init_client
+from face_detect_model.util import logger
+from face_detect_model.gcp_util import init_client
 from dotenv import load_dotenv
 
 load_dotenv("secrets/.env")

diff --git a/machine_learning/src/face_detect_model/pred.py b/machine_learning/src/face_detect_model/pred.py
@@ -0,0 +1,4 @@
+def main():
+    gray = cv2.cvtColor(captureBuffer, cv2.COLOR_BGR2GRAY)
+    pred_child_ids = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
+    return pred_child_ids
diff --git a/machine_learning/src/face_detect_model/trainer.py b/machine_learning/src/face_detect_model/trainer.py
@@ -6,7 +6,8 @@
 
 from face_detect_model.data.faceDetectDataset import FaceDetectDataset
 from face_detect_model.model.faceDetectModel import FaceDetectModel
-from face_detect_model.util import logger, get_bucket, save_model_to_gcs
+from face_detect_model.util import logger, save_model_to_gcs
+from face_detect_model.gcp_util import get_bucket
 
 
 class Trainer:

diff --git a/machine_learning/src/face_detect_model/util.py b/machine_learning/src/face_detect_model/util.py
@@ -3,7 +3,6 @@
 
 import random
 import torch
-import google.cloud.storage as gcs
 from google.cloud.storage import Bucket
 import os
 import numpy as np
@@ -25,39 +24,6 @@ def set_seed(seed):
     torch.cuda.manual_seed_all(seed)
 
 
-def init_client():
-    # NOTE: gcloud auth application-default loginにて事前に認証
-    PROJECT_ID = os.environ.get("PROJECT_ID")
-
-    client = gcs.Client(PROJECT_ID)
-    if client is None:
-        logger.error("Failed to initialize client.")
-        exit(1)
-    else:
-        return client
-
-
-def get_bucket(client: gcs.Client, bucket_name: str):
-    bucket = client.bucket(bucket_name)
-
-    if bucket.exists():
-        return bucket
-    else:
-        raise ValueError(f"Failed to {bucket_name} does not exist.")
-
-
-def get_blobs(bucket: Bucket, blob_name: str):
-    # blobsの中身に対するエラーハンドリング
-    try:
-        blobs = list(bucket.list_blobs(prefix=blob_name))
-        if len(blobs) == 0:  # 最初の要素がない場合、イテレータは空
-            raise ValueError(f"No blobs found with prefix '{blob_name}' in the bucket.")
-        else:
-            return blobs
-    except Exception as e:
-        raise ValueError(f"Failed to get blobs from '{blob_name}' due to an error: {e}")
-
-
 def get_child_id(blob_name: str):
     # UUIDの正規表現パターン
     uuid_pattern = r"[0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12}"

diff --git a/machine_learning/src/proto-gen/machine_learning/v1/server.py b/machine_learning/src/proto-gen/machine_learning/v1/server.py
@@ -21,6 +21,9 @@
 from face_detect_model.main import (
     main as train_fn,
 )
+from face_detect_model.pred import (
+    main as pred_fn,
+)
 
 
 class HealthCheckServiceServer(
@@ -37,8 +40,23 @@ class MachineLearningServiceServicer(
     machine_learning_pb2_grpc.MachineLearningServiceServicer
 ):
     # TODO: implement Predict
-    def Predict(self, request: machine_learning_pb2.PredRequest, context):
-        pass
+    def Predict(self, request_iterator: machine_learning_pb2.PredRequest, context):
+        for req in request_iterator:
+            parser = argparse.ArgumentParser()
+            args = parser.parse_args()
+
+            args.bus_id = req.bus_id
+            args.bus_type = req.bus_type
+            args.video_type = req.video_type
+            args.video_chunk = req.video_chunk
+            args.timestamp = req.timestamp
+
+            try:
+                child_ids = pred_fn(args)
+            except Exception as e:
+                logging.error(e)
+                child_ids = []
+            yield machine_learning_pb2.PredResponse(child_ids=child_ids)
 
     def Train(self, request: machine_learning_pb2.TrainRequest, context):
         parser = argparse.ArgumentParser()