cube-studio/myapp/views/view_pipeline.py

from myapp.views.baseSQLA import MyappSQLAInterface as SQLAInterface
from flask_babel import gettext as __
from flask_babel import lazy_gettext as _
import uuid
import logging
import urllib.parse
from sqlalchemy.exc import InvalidRequestError
from myapp.models.model_job import Job_Template
from myapp.models.model_job import Task, Pipeline, Workflow, RunHistory
from myapp.models.model_team import Project
from myapp.views.view_team import Project_Join_Filter
from flask_appbuilder.actions import action
from flask import jsonify, Response, request
from flask_appbuilder.forms import GeneralModelConverter
from myapp.utils import core
from myapp import app, appbuilder, db
from wtforms.ext.sqlalchemy.fields import QuerySelectField
from jinja2 import Environment, BaseLoader, DebugUndefined,Undefined
import os
from wtforms.validators import DataRequired, Length, Regexp
from myapp.views.view_task import Task_ModelView, Task_ModelView_Api
from sqlalchemy import or_
from myapp.exceptions import MyappException
from wtforms import BooleanField, IntegerField, StringField, SelectField
from flask_appbuilder.fieldwidgets import BS3TextFieldWidget, Select2ManyWidget, Select2Widget, BS3TextAreaFieldWidget
from myapp.forms import MyBS3TextAreaFieldWidget, MySelectMultipleField
from myapp.models.model_job import Repository
from myapp.utils.py import py_k8s
import re, copy
from kubernetes.client.models import (
    V1EnvVar, V1SecurityContext
)
from .baseApi import (
    MyappModelRestApi,
    send_file
)
from flask import (
    flash,
    g,
    make_response,
    redirect,
    request
)
from myapp import security_manager
from myapp.views.view_team import filter_join_org_project
import pysnooper
from kubernetes import client
from .base import (
    DeleteMixin,
    get_user_roles,
    MyappFilter,
    MyappModelView,
    json_response
)

from flask_appbuilder import expose
import datetime, time, json

conf = app.config


class Pipeline_Filter(MyappFilter):
    # @pysnooper.snoop()
    def apply(self, query, func):
        user_roles = [role.name.lower() for role in list(self.get_user_roles())]
        if "admin" in user_roles:
            return query

        join_projects_id = security_manager.get_join_projects_id(db.session)
        # public_project_id =
        # logging.info(join_projects_id)
        return query.filter(
            or_(
                self.model.project_id.in_(join_projects_id),
                # self.model.project.name.in_(['public'])
            )
        )


def make_workflow_yaml(pipeline,workflow_label,hubsecret_list,dag_templates,containers_templates,dbsession=db.session):
    name = pipeline.name+"-"+uuid.uuid4().hex[:4]
    workflow_label['workflow-name']=name
    workflow_crd_json={
        "apiVersion": "argoproj.io/v1alpha1",
        "kind": "Workflow",
        "metadata": {
            # "generateName": pipeline.name+"-",
            "annotations": {
                "name": pipeline.name,
                "description": pipeline.describe.encode("unicode_escape").decode('utf-8')
            },
            "name": name,
            "labels": workflow_label,
            "namespace": json.loads(pipeline.project.expand).get('PIPELINE_NAMESPACE', conf.get('PIPELINE_NAMESPACE'))
        },
        "spec": {
            "ttlStrategy": {
                "secondsAfterCompletion": 10800,  # 3个小时候自动删除
                "ttlSecondsAfterFinished": 10800,  # 3个小时候自动删除
            },
            "archiveLogs": True,  # 打包日志
            "entrypoint": pipeline.name,
            "templates": [
                             {
                                 "name": pipeline.name,
                                 "dag": {
                                     "tasks": dag_templates
                                 }
                             }
                         ] + containers_templates,
            "arguments": {
                "parameters": []
            },
            "serviceAccountName": "pipeline-runner",
            "parallelism": int(pipeline.parallelism),
            "imagePullSecrets": [
                {
                    "name": hubsecret
                } for hubsecret in hubsecret_list
            ]
        }
    }
    return workflow_crd_json


# 转化为worfklow的yaml
# @pysnooper.snoop()
def dag_to_pipeline(pipeline, dbsession, workflow_label=None, **kwargs):
    dag_json = pipeline.fix_dag_json(dbsession)
    pipeline.dag_json=dag_json
    dbsession.commit()
    dag = json.loads(dag_json)

    # 如果dag为空，就直接退出
    if not dag:
        return None, None

    all_tasks = {}
    for task_name in dag:
        # 使用临时连接，避免连接中断的问题
        # try:

        task = dbsession.query(Task).filter_by(name=task_name, pipeline_id=pipeline.id).first()
        if not task:
            raise MyappException('task %s not exist ' % task_name)
        all_tasks[task_name] = task

    template_kwargs=kwargs
    if 'execution_date' not in template_kwargs:
        template_kwargs['execution_date'] = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')

    # 渲染字符串模板变量
    # @pysnooper.snoop()
    def template_str(src_str):
        rtemplate = Environment(loader=BaseLoader, undefined=Undefined).from_string(src_str)
        des_str = rtemplate.render(creator=pipeline.created_by.username,
                                   datetime=datetime,
                                   runner=g.user.username if g and g.user and g.user.username else pipeline.created_by.username,
                                   uuid=uuid,
                                   pipeline_id=pipeline.id,
                                   pipeline_name=pipeline.name,
                                   cluster_name=pipeline.project.cluster['NAME'],
                                   **template_kwargs
                                   )
        return des_str

    pipeline_global_env = template_str(pipeline.global_env.strip()) if pipeline.global_env else ''  # 优先渲染，不然里面如果有date就可能存在不一致的问题
    pipeline_global_env = [env.strip() for env in pipeline_global_env.split('\n') if '=' in env.strip()]

    # 系统级别环境变量
    global_envs = json.loads(template_str(json.dumps(conf.get('GLOBAL_ENV', {}), indent=4, ensure_ascii=False)))
    for env in pipeline_global_env:
        key, value = env[:env.index('=')], env[env.index('=') + 1:]
        global_envs[key] = value
    # 全局环境变量可以在任务的参数中引用
    for global_env in pipeline_global_env:
        key,value = global_env.split('=')[0],global_env.split('=')[1]
        if key not in kwargs:
            template_kwargs[key]=value

    def make_dag_template():
        dag_template = []
        for task_name in dag:
            template_temp = {
                "name": task_name,
                "template": task_name,
                "dependencies": dag[task_name].get('upstream', [])
            }
            # 设置了跳过的话，在argo中设置跳过
            if all_tasks[task_name].skip:
                template_temp['when']='false'
            dag_template.append(template_temp)
        return dag_template

    # @pysnooper.snoop()
    def make_container_template(task_name,hubsecret_list=None):
        task = all_tasks[task_name]
        ops_args = []
        task_args = json.loads(task.args)
        for task_attr_name in task_args:
            # 布尔型只添加参数名
            if type(task_args[task_attr_name]) == bool:
                if task_args[task_attr_name]:
                    ops_args.append('%s' % str(task_attr_name))
            # 控制不添加
            elif not task_args[task_attr_name]:  # 如果参数值为空，则都不添加
                pass
            # json类型直接导入序列化以后的
            elif type(task_args[task_attr_name]) == dict or type(task_args[task_attr_name]) == list:
                ops_args.append('%s' % str(task_attr_name))
                args_values = json.dumps(task_args[task_attr_name], ensure_ascii=False)
                # args_values = template_str(args_values) if re.match('\{\{.*\}\}',args_values) else args_values
                ops_args.append('%s' % args_values)
            # # list类型，分多次导入,# list类型逗号分隔就好了
            # elif type(task_args[task_attr_name]) == list:
            #     for args_values in task_args[task_attr_name].split('\n'):
            #         ops_args.append('%s' % str(task_attr_name))
            #         # args_values = template_str(args_values) if re.match('\{\{.*\}\}',args_values) else args_values
            #         ops_args.append('%s' % args_values)
            # 其他的直接添加
            elif task_attr_name not in ['images','workdir']:
                ops_args.append('%s' % str(task_attr_name))
                args_values = task_args[task_attr_name]
                # args_values = template_str(args_values) if re.match('\{\{.*\}\}',args_values) else args_values
                ops_args.append('%s' % str(args_values))  # 这里应该对不同类型的参数名称做不同的参数处理，比如bool型，只有参数，没有值

        # 设置环境变量
        container_envs = []
        if task.job_template.env:
            envs = re.split('\r|\n', task.job_template.env)
            envs = [env.strip() for env in envs if env.strip()]
            for env in envs:
                env_key, env_value = env.split('=')[0], env.split('=')[1]
                container_envs.append((env_key, env_value))

        # 设置全局环境变量
        for global_env_key in global_envs:
            container_envs.append((global_env_key, global_envs[global_env_key]))

        # 设置task的默认环境变量
        _, _, gpu_resource_name = core.get_gpu(task.resource_gpu)
        container_envs.append(("KFJ_TASK_ID", str(task.id)))
        container_envs.append(("KFJ_TASK_NAME", str(task.name)))
        container_envs.append(("KFJ_TASK_NODE_SELECTOR", str(task.get_node_selector())))
        container_envs.append(("KFJ_TASK_VOLUME_MOUNT", str(task.volume_mount)))
        container_envs.append(("KFJ_TASK_IMAGES", str(task.job_template.images)))
        container_envs.append(("KFJ_TASK_RESOURCE_CPU", str(task.resource_cpu)))
        container_envs.append(("KFJ_TASK_RESOURCE_MEMORY", str(task.resource_memory)))
        container_envs.append(("KFJ_TASK_RESOURCE_GPU", str(task.resource_gpu.replace("+", ''))))
        container_envs.append(("KFJ_TASK_PROJECT_NAME", str(pipeline.project.name)))
        container_envs.append(("GPU_RESOURCE_NAME", gpu_resource_name))
        container_envs.append(("USERNAME", pipeline.created_by.username))
        container_envs.append(("IMAGE_PULL_POLICY", conf.get('IMAGE_PULL_POLICY','Always')))
        if hubsecret_list:
            container_envs.append(("HUBSECRET", ','.join(hubsecret_list)))


        # 创建工作目录
        working_dir = None
        if task.job_template.workdir and task.job_template.workdir.strip():
            working_dir = task.job_template.workdir.strip()
        if task.working_dir and task.working_dir.strip():
            working_dir = task.working_dir.strip()

        # 配置启动命令
        task_command = ''

        if task.command:
            commands = re.split('\r|\n', task.command)
            commands = [command.strip() for command in commands if command.strip()]
            if task_command:
                task_command += " && " + " && ".join(commands)
            else:
                task_command += " && ".join(commands)

        job_template_entrypoint = task.job_template.entrypoint.strip() if task.job_template.entrypoint else ''

        command = None
        if job_template_entrypoint:
            command = job_template_entrypoint

        if task_command:
            command = task_command

        images = task.job_template.images.name
        command = command.split(' ') if command else []
        command = [com for com in command if com]
        arguments = ops_args
        file_outputs = json.loads(task.outputs) if task.outputs and json.loads(task.outputs) else None

        # 如果模板配置了images参数，那直接用模板的这个参数
        if json.loads(task.args).get('images',''):
            images = json.loads(task.args).get('images')

        # 自定义节点
        if task.job_template.name == conf.get('CUSTOMIZE_JOB'):
            working_dir = json.loads(task.args).get('workdir')
            command = ['bash', '-c', json.loads(task.args).get('command')]
            arguments = []

        # 添加用户自定义挂载
        k8s_volumes = []
        k8s_volume_mounts = []
        task.volume_mount = task.volume_mount.strip() if task.volume_mount else ''
        if task.volume_mount:
            try:
                k8s_volumes,k8s_volume_mounts = py_k8s.K8s.get_volume_mounts(task.volume_mount,pipeline.created_by.username)
            except Exception as e:
                print(e)

        # 添加node selector
        node_selector = {}
        for selector in re.split(',|;|\n|\t', task.get_node_selector()):
            selector = selector.replace(' ', '')
            if '=' in selector:
                node_selector[selector.strip().split('=')[0].strip()] = selector.strip().split('=')[1].strip()

        # 添加pod label
        pod_label = {
            "pipeline-id": str(pipeline.id),
            "pipeline-name": str(pipeline.name),
            "task-id": str(task.id),
            "task-name": str(task.name),
            "run-id": global_envs.get('KFJ_RUN_ID', ''),
            'run-username': g.user.username if g and g.user and g.user.username else pipeline.created_by.username,
            'pipeline-username': pipeline.created_by.username

        }
        pod_annotations = {
            'project': pipeline.project.name,
            'pipeline': pipeline.describe,
            "task": task.label,
            'job-template': task.job_template.describe
        }

        # 设置资源限制
        resource_cpu = task.job_template.get_env('TASK_RESOURCE_CPU') if task.job_template.get_env('TASK_RESOURCE_CPU') else task.resource_cpu
        resource_gpu = task.job_template.get_env('TASK_RESOURCE_GPU') if task.job_template.get_env('TASK_RESOURCE_GPU') else task.resource_gpu

        resource_memory = task.job_template.get_env('TASK_RESOURCE_MEMORY') if task.job_template.get_env('TASK_RESOURCE_MEMORY') else task.resource_memory

        resources_requests = resources_limits = {}

        if resource_memory:
            if not '~' in resource_memory:
                resources_requests['memory'] = resource_memory
                resources_limits['memory'] = resource_memory
            else:
                resources_requests['memory'] = resource_memory.split("~")[0]
                resources_limits['memory'] = resource_memory.split("~")[1]

        if resource_cpu:
            if not '~' in resource_cpu:
                resources_requests['cpu'] = resource_cpu
                resources_limits['cpu'] = resource_cpu

            else:
                resources_requests['cpu'] = resource_cpu.split("~")[0]
                resources_limits['cpu'] = resource_cpu.split("~")[1]

        if resource_gpu:

            gpu_num, gpu_type, gpu_resource_name = core.get_gpu(resource_gpu)

            # 整卡占用
            if gpu_num >= 1:

                resources_requests[gpu_resource_name] = str(int(gpu_num))
                resources_limits[gpu_resource_name] = str(int(gpu_num))

            if 0 == gpu_num:
                # 没要gpu的容器，就要加上可视gpu为空，不然gpu镜像能看到和使用所有gpu
                for gpu_alias in conf.get('GPU_NONE', {}):
                    container_envs.append((conf.get('GPU_NONE',{})[gpu_alias][0], conf.get('GPU_NONE',{})[gpu_alias][1]))
        # 配置host
        hostAliases = {}

        global_hostAliases = conf.get('HOSTALIASES', '')
        # global_hostAliases = ''
        if task_temp.job_template.hostAliases:
            global_hostAliases += "\n" + task_temp.job_template.hostAliases
        if global_hostAliases:
            hostAliases_list = re.split('\r|\n', global_hostAliases)
            hostAliases_list = [host.strip() for host in hostAliases_list if host.strip()]
            for row in hostAliases_list:
                hosts = row.strip().split(' ')
                hosts = [host for host in hosts if host]
                if len(hosts) > 1:
                    hostAliases[hosts[1]] = hosts[0]

        if task.skip:
            command = ["echo", "skip"]
            arguments = None
            resources_requests = None
            resources_limits = None

        task_template = {
            "name": task.name,  # 因为同一个
            "outputs": {
                "artifacts": []
            },
            "container": {
                "name": task.name + "-" + uuid.uuid4().hex[:4],
                "ports": [],

                "command": command,
                "args": arguments,
                "env": [
                    {
                        "name": item[0],
                        "value": item[1]
                    } for item in container_envs
                ],
                "image": images,
                "resources": {
                    "limits": resources_limits,
                    "requests": resources_requests
                },
                "volumeMounts": k8s_volume_mounts,
                "workingDir": working_dir,
                "imagePullPolicy": conf.get('IMAGE_PULL_POLICY', 'Always')
            },
            "nodeSelector": node_selector,
            "securityContext": {
                "privileged": True if task.job_template.privileged else False
            },
            "affinity": {
                "podAntiAffinity": {
                    "preferredDuringSchedulingIgnoredDuringExecution": [
                        {
                            "podAffinityTerm": {
                                "labelSelector": {
                                    "matchLabels": {
                                        "pipeline-id": str(pipeline.id)
                                    }
                                },
                                "topologyKey": "kubernetes.io/hostname"
                            },
                            "weight": 80
                        }
                    ]
                }
            },
            "metadata": {
                "labels": pod_label,
                "annotations": pod_annotations
            },
            "retryStrategy": {
                "limit": int(task.retry)
            } if task.retry else None,
            "volumes": k8s_volumes,
            "hostAliases": [
                {
                    "hostnames": [hostname],
                    "ip": hostAliases[hostname]
                } for hostname in hostAliases
            ],
            "activeDeadlineSeconds": task.timeout if task.timeout else None
        }

        # 统一添加一些固定环境变量，比如hostip，podip等
        task_template['container']['env'].append({
            "name":"K8S_NODE_NAME",
            "valueFrom":{
                "fieldRef":{
                    "apiVersion":"v1",
                    "fieldPath":"spec.nodeName"
                }
            }
        })
        task_template['container']['env'].append({
            "name": "K8S_POD_IP",
            "valueFrom": {
                "fieldRef": {
                    "apiVersion": "v1",
                    "fieldPath": "status.podIP"
                }
            }
        })
        task_template['container']['env'].append({
            "name": "K8S_HOST_IP",
            "valueFrom": {
                "fieldRef": {
                    "apiVersion": "v1",
                    "fieldPath": "status.hostIP"
                }
            }
        })
        task_template['container']['env'].append({
            "name": "K8S_POD_NAME",
            "valueFrom": {
                "fieldRef": {
                    "apiVersion": "v1",
                    "fieldPath": "metadata.name"
                }
            }
        })


        return task_template

    # 添加个人创建的所有仓库秘钥
    image_pull_secrets = conf.get('HUBSECRET', [])
    user_repositorys = dbsession.query(Repository).filter(Repository.created_by_fk == pipeline.created_by.id).all()
    hubsecret_list = list(set(image_pull_secrets + [rep.hubsecret for rep in user_repositorys]))

    # 配置拉取秘钥
    for task_name in all_tasks:
        # 配置拉取秘钥。本来在contain里面，workflow在外面
        task_temp = all_tasks[task_name]
        if task_temp.job_template.images.repository.hubsecret:
            hubsecret = task_temp.job_template.images.repository.hubsecret
            if hubsecret not in hubsecret_list:
                hubsecret_list.append(hubsecret)

    hubsecret_list = list(set(hubsecret_list))

    # 设置workflow标签
    if not workflow_label:
        workflow_label = {}

    workflow_label['run-username'] = g.user.username if g and g.user and g.user.username else pipeline.created_by.username
    workflow_label['pipeline-username'] = pipeline.created_by.username
    workflow_label['save-time'] = datetime.datetime.now().strftime('%Y-%m-%dT%H-%M-%S')
    workflow_label['pipeline-id'] = str(pipeline.id)
    workflow_label['pipeline-name'] = str(pipeline.name)
    workflow_label['run-id'] = global_envs.get('KFJ_RUN_ID', '')  # 以此来绑定运行时id，不能用kfp的run—id。那个是传到kfp以后才产生的。
    workflow_label['cluster'] = pipeline.project.cluster['NAME']

    containers_template = []
    for task_name in dag:
        containers_template.append(make_container_template(task_name=task_name,hubsecret_list=hubsecret_list))

    workflow_json = make_workflow_yaml(pipeline=pipeline, workflow_label=workflow_label, hubsecret_list=hubsecret_list, dag_templates=make_dag_template(), containers_templates=containers_template,dbsession=dbsession)
    # 先这是某个模板变量不进行渲染，一直向后传递到argo
    pipeline_file = json.dumps(workflow_json,ensure_ascii=False,indent=4)
    # print(pipeline_file)
    pipeline_file = template_str(pipeline_file)

    return pipeline_file, workflow_label['run-id']


# @pysnooper.snoop(watch_explode=())
def run_pipeline(pipeline, workflow_json):
    cluster = pipeline.project.cluster
    crd_name = workflow_json.get('metadata', {}).get('name', '')
    from myapp.utils.py.py_k8s import K8s
    k8s_client = K8s(cluster.get('KUBECONFIG', ''))
    namespace = workflow_json.get('metadata', {}).get("namespace", conf.get('PIPELINE_NAMESPACE'))
    crd_info = conf.get('CRD_INFO', {}).get('workflow', {})
    try:
        workflow_obj = k8s_client.get_one_crd(group=crd_info['group'], version=crd_info['version'], plural=crd_info['plural'],namespace=namespace, name=crd_name)
        if workflow_obj:
            k8s_client.delete_crd(group=crd_info['group'], version=crd_info['version'], plural=crd_info['plural'],namespace=namespace, name=crd_name)
            time.sleep(1)

        crd = k8s_client.create_crd(group=crd_info['group'], version=crd_info['version'], plural=crd_info['plural'],namespace=namespace, body=workflow_json)
    except Exception as e:
        print(e)

    return crd_name


class Pipeline_ModelView_Base():
    label_title = _('任务流')
    datamodel = SQLAInterface(Pipeline)

    base_permissions = ['can_show', 'can_edit', 'can_list', 'can_delete', 'can_add']
    base_order = ("changed_on", "desc")
    # order_columns = ['id','changed_on']
    order_columns = ['id']

    list_columns = ['id', 'project', 'pipeline_url', 'creator', 'modified']
    cols_width = {
        "id": {"type": "ellip2", "width": 100},
        "project": {"type": "ellip2", "width": 200},
        "pipeline_url": {"type": "ellip2", "width": 400},
        "modified": {"type": "ellip2", "width": 150}
    }
    spec_label_columns={
        "parameter":_("后端扩展"),
        "expand":_("前端扩展")
    }
    add_columns = ['project', 'name', 'describe']
    edit_columns = ['project', 'name', 'describe', 'schedule_type', 'cron_time', 'depends_on_past', 'max_active_runs',
                    'expired_limit', 'parallelism', 'global_env', 'alert_status', 'alert_user', 'parameter',
                    'cronjob_start_time']
    show_columns = ['project', 'name', 'describe', 'schedule_type', 'cron_time', 'depends_on_past', 'max_active_runs',
                    'expired_limit', 'parallelism', 'global_env', 'dag_json', 'pipeline_file', 'pipeline_argo_id',
                    'run_id', 'created_by', 'changed_by', 'created_on', 'changed_on', 'expand',
                    'parameter', 'alert_status', 'alert_user', 'cronjob_start_time']
    # show_columns = ['project','name','describe','schedule_type','cron_time','depends_on_past','max_active_runs','parallelism','global_env','dag_json','pipeline_file_html','pipeline_argo_id','version_id','run_id','created_by','changed_by','created_on','changed_on','expand']
    search_columns = ['id', 'created_by', 'name', 'describe', 'schedule_type', 'project']

    base_filters = [["id", Pipeline_Filter, lambda: []]]
    conv = GeneralModelConverter(datamodel)

    add_form_extra_fields = {

        "name": StringField(
            _('名称'),
            description= _("英文名(小写字母、数字、- 组成)，最长50个字符"),
            widget=BS3TextFieldWidget(),
            validators=[Regexp("^[a-z][a-z0-9\-]*[a-z0-9]$"), Length(1, 54), DataRequired()]
        ),
        "describe": StringField(
            _("描述"),
            description="",
            widget=BS3TextFieldWidget(),
            validators=[DataRequired()]
        ),
        "project": QuerySelectField(
            _('项目组'),
            query_factory=filter_join_org_project,
            allow_blank=True,
            widget=Select2Widget()
        ),
        "dag_json": StringField(
            _('上下游关系'),
            default='{}',
            description=_("任务的上下游关系，目前不需要手动修改"),
            widget=MyBS3TextAreaFieldWidget(rows=10,is_json=True),  # 传给widget函数的是外层的field对象，以及widget函数的参数
        ),
        "namespace": StringField(
            _('命名空间'),
            description= _("部署task所在的命名空间(目前无需填写)"),
            default='pipeline',
            widget=BS3TextFieldWidget()
        ),
        "node_selector": StringField(
            _('机器选择'),
            description= _("部署task所在的机器(目前无需填写)"),
            widget=BS3TextFieldWidget(),
            default=datamodel.obj.node_selector.default.arg
        ),
        "image_pull_policy": SelectField(
            _('拉取策略'),
            description= _("镜像拉取策略(always为总是拉取远程镜像，IfNotPresent为若本地存在则使用本地镜像)"),
            widget=Select2Widget(),
            default='Always',
            choices=[['Always', 'Always'], ['IfNotPresent', 'IfNotPresent']]
        ),

        "depends_on_past": BooleanField(
            _('过往依赖'),
            description= _("任务运行是否依赖上一次的示例状态"),
            default=True
        ),
        "max_active_runs": IntegerField(
            _('最大激活数'),
            description= _("当前pipeline可同时运行的任务流实例数目"),
            widget=BS3TextFieldWidget(),
            default=1,
            validators=[DataRequired()]
        ),
        "expired_limit": IntegerField(
            _('过期保留数'),
            description= _("定时调度最新实例限制数目，0表示不限制"),
            widget=BS3TextFieldWidget(),
            default=1,
            validators=[DataRequired()]
        ),
        "parallelism": IntegerField(
            _('并发数'),
            description= _("一个任务流实例中可同时运行的task数目"),
            widget=BS3TextFieldWidget(),
            default=3,
            validators=[DataRequired()]
        ),
        "global_env": StringField(
            _('全局环境变量'),
            description= _("公共环境变量会以环境变量的形式传递给每个task，可以配置多个公共环境变量，每行一个，支持datetime/creator/runner/uuid/pipeline_id等变量 例如：USERNAME={{creator}}"),
            widget=BS3TextAreaFieldWidget()
        ),
        "schedule_type": SelectField(
            _('调度类型'),
            default='once',
            description= _("调度类型，once仅运行一次，crontab周期运行，crontab配置保存一个小时候后才生效"),
            widget=Select2Widget(),
            choices=[['once', 'once'], ['crontab', 'crontab']]
        ),
        "cron_time": StringField(
            _('调度周期'),
            description= _("周期任务的时间设定 * * * * * 表示为 minute hour day month week"),
            widget=BS3TextFieldWidget()
        ),
        "alert_status": MySelectMultipleField(
            label= _('监听状态'),
            widget=Select2ManyWidget(),
            choices=[[x, x] for x in
                     ['Created', 'Pending', 'Running', 'Succeeded', 'Failed', 'Unknown', 'Waiting', 'Terminated']],
            description= _("选择通知状态"),
            validators=[Length(0, 400), ]
        ),
        "alert_user": StringField(
            label= _('报警用户'),
            widget=BS3TextFieldWidget(),
            description= _("选择通知用户，每个用户使用逗号分隔")
        ),
        "parameter": StringField(
            _('后端扩展'),
            default='{}',
            description=_('后端扩展参数，用于配置是否为demo或固化任务流'),
            widget=MyBS3TextAreaFieldWidget(rows=10, is_json=True),  # 传给widget函数的是外层的field对象，以及widget函数的参数
        ),
        "expand": StringField(
            _('前端扩展'),
            default='{}',
            description=_('前端扩展参数，前端用于记录任务流节点位置和连线关系'),
            widget=MyBS3TextAreaFieldWidget(rows=10, is_json=True),  # 传给widget函数的是外层的field对象，以及widget函数的参数
        )

    }

    edit_form_extra_fields = add_form_extra_fields


    related_views = [Task_ModelView, ]

    def delete_task_run(self, task):
        try:
            from myapp.utils.py.py_k8s import K8s
            k8s_client = K8s(task.pipeline.project.cluster.get('KUBECONFIG', ''))
            namespace = task.pipeline.namespace
            # 删除运行时容器
            pod_name = "run-" + task.pipeline.name.replace('_', '-') + "-" + task.name.replace('_', '-')
            pod_name = pod_name.lower()[:60].strip('-')
            pod = k8s_client.get_pods(namespace=namespace, pod_name=pod_name)
            # print(pod)
            if pod:
                pod = pod[0]
            # 有历史，直接删除
            if pod:
                k8s_client.delete_pods(namespace=namespace, pod_name=pod['name'])
                run_id = pod['labels'].get('run-id', '')
                if run_id:
                    k8s_client.delete_workflow(all_crd_info=conf.get("CRD_INFO", {}), namespace=namespace, run_id=run_id)
                    k8s_client.delete_pods(namespace=namespace, labels={"run-id": run_id})
                    time.sleep(2)

            # 删除debug容器
            pod_name = "debug-" + task.pipeline.name.replace('_', '-') + "-" + task.name.replace('_', '-')
            pod_name = pod_name.lower()[:60].strip('-')
            pod = k8s_client.get_pods(namespace=namespace, pod_name=pod_name)
            # print(pod)
            if pod:
                pod = pod[0]
            # 有历史，直接删除
            if pod:
                k8s_client.delete_pods(namespace=namespace, pod_name=pod['name'])
                run_id = pod['labels'].get('run-id', '')
                if run_id:
                    k8s_client.delete_workflow(all_crd_info=conf.get("CRD_INFO", {}), namespace=namespace, run_id=run_id)
                    k8s_client.delete_pods(namespace=namespace, labels={"run-id": run_id})
                    time.sleep(2)
        except Exception as e:
            print(e)

    # 检测是否具有编辑权限，只有creator和admin可以编辑
    def check_edit_permission(self, item):
        if g.user and g.user.is_admin():
            return True
        if g.user and g.user.username and hasattr(item, 'created_by'):
            if g.user.username == item.created_by.username:
                return True
        # flash('just creator can edit/delete ', 'warning')
        return False

    check_delete_permission = check_edit_permission

    # 验证args参数,并自动排版dag_json
    # @pysnooper.snoop(watch_explode=('item'))
    def pipeline_args_check(self, item):
        core.validate_str(item.name, 'name')
        if not item.dag_json:
            item.dag_json = '{}'
        core.validate_json(item.dag_json)

        # 校验task的关系，没有闭环，并且顺序要对。没有配置的，自动没有上游，独立
        # @pysnooper.snoop()
        def order_by_upstream(dag_json):
            order_dag = {}
            tasks_name = list(dag_json.keys())  # 如果没有配全的话，可能只有局部的task
            i = 0
            while tasks_name:
                i += 1
                if i > 100:  # 不会有100个依赖关系
                    break
                for task_name in tasks_name:
                    # 没有上游的情况
                    if not dag_json[task_name]:
                        order_dag[task_name] = {}
                        tasks_name.remove(task_name)
                        continue
                    # 没有上游的情况
                    elif 'upstream' not in dag_json[task_name] or not dag_json[task_name]['upstream']:
                        order_dag[task_name] = {}
                        tasks_name.remove(task_name)
                        continue
                    # 如果有上游依赖的话，先看上游任务是否已经加到里面了。
                    upstream_all_ready = True
                    for upstream_task_name in dag_json[task_name]['upstream']:
                        if upstream_task_name not in order_dag:
                            upstream_all_ready = False
                    if upstream_all_ready:
                        order_dag[task_name] = dag_json[task_name]
                        tasks_name.remove(task_name)
            if list(dag_json.keys()).sort() != list(order_dag.keys()).sort():
                message = __('dag pipeline 存在循环或未知上游')
                flash(message, category='warning')
                raise MyappException(message)
            return order_dag

        # 配置上缺少的默认上游
        dag_json = json.loads(item.dag_json)
        tasks = item.get_tasks(db.session)
        if tasks and dag_json:
            for task in tasks:
                if task.name not in dag_json:
                    dag_json[task.name] = {
                        "upstream": []
                    }
        item.dag_json = json.dumps(order_by_upstream(copy.deepcopy(dag_json)), ensure_ascii=False, indent=4)

        # # 生成workflow，如果有id， 校验的时候，先不生成file
        # if item.id and item.get_tasks():
        #     item.pipeline_file,item.run_id = dag_to_pipeline(item,db.session,workflow_label={"schedule_type":"once"})
        # else:
        #     item.pipeline_file = None


    # 合并上下游关系
    # @pysnooper.snoop(watch_explode=('pipeline'))
    def merge_upstream(self, pipeline):
        logging.info(pipeline)

        dag_json = {}
        # 根据参数生成args字典。一层嵌套的形式
        for arg in pipeline.__dict__:
            if len(arg) > 5 and arg[:5] == 'task.':
                task_upstream = getattr(pipeline, arg)
                dag_json[arg[5:]] = {
                    "upstream": task_upstream if task_upstream else []
                }
        if dag_json:
            pipeline.dag_json = json.dumps(dag_json)

    # @pysnooper.snoop(watch_explode=('item'))
    def pre_add(self, item):
        if not item.project or item.project.type != 'org':
            project = db.session.query(Project).filter_by(name='public').filter_by(type='org').first()
            if project:
                item.project = project
        # 环境变量不能包含空格
        if item.global_env:
            pipeline_global_env = [env.strip() for env in item.global_env.split('\n') if '=' in env.strip()]
            for index,env in enumerate(pipeline_global_env):
                env = env.split('=')
                env = [x.strip() for x in env]
                pipeline_global_env[index]='='.join(env)
            item.global_env = '\n'.join(pipeline_global_env)

        item.name = item.name.replace('_', '-')[0:54].lower().strip('-')
        item.namespace = json.loads(item.project.expand).get('PIPELINE_NAMESPACE', conf.get('PIPELINE_NAMESPACE','pipeline'))
        # item.alert_status = ','.join(item.alert_status)
        self.pipeline_args_check(item)
        item.create_datetime = datetime.datetime.now()
        item.change_datetime = datetime.datetime.now()
        item.cronjob_start_time = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
        item.parameter = json.dumps({}, indent=4, ensure_ascii=False)
        # 检测crontab格式
        if item.schedule_type == 'crontab':
            if not re.match("^[0-9/*]+ [0-9/*]+ [0-9/*]+ [0-9/*]+ [0-9/*]+", item.cron_time):
                raise MyappException(__("crontab 格式错误"))
                item.cron_time = ''

    def pre_update_req(self,req_json=None,src_item=None,*args,**kwargs):
        if src_item and src_item.parameter:
            parameter = json.loads(src_item.parameter)
            if parameter.get("demo", 'false').lower() == 'true':
                raise MyappException(__("示例pipeline，不允许修改，请复制后编辑"))

        core.validate_json(req_json.get('expand','{}'))

    pre_add_req = pre_update_req

    # @pysnooper.snoop()
    def pre_update(self, item):
        if item.expand:
            core.validate_json(item.expand)
            item.expand = json.dumps(json.loads(item.expand), indent=4, ensure_ascii=False)
        else:
            item.expand = '{}'

        # 环境变量不能包含空格
        if item.global_env:
            pipeline_global_env = [env.strip() for env in item.global_env.split('\n') if '=' in env.strip()]
            for index, env in enumerate(pipeline_global_env):
                env = env.split('=')
                env = [x.strip() for x in env]
                pipeline_global_env[index] = '='.join(env)
            item.global_env = '\n'.join(pipeline_global_env)


        item.name = item.name.replace('_', '-')[0:54].lower()
        item.namespace = json.loads(item.project.expand).get('PIPELINE_NAMESPACE', conf.get('PIPELINE_NAMESPACE','pipeline'))
        # item.alert_status = ','.join(item.alert_status)
        self.merge_upstream(item)
        self.pipeline_args_check(item)
        item.change_datetime = datetime.datetime.now()
        if item.parameter:
            item.parameter = json.dumps(json.loads(item.parameter), indent=4, ensure_ascii=False)
        else:
            item.parameter = '{}'

        if (item.schedule_type=='crontab' and self.src_item_json.get("schedule_type")=='once') or (item.cron_time!=self.src_item_json.get("cron_time",'')):
            item.cronjob_start_time = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')

        # 把没必要的存储去掉
        expand = json.loads(item.expand)
        for node in expand:
            if 'data' in node and 'args' in node['data'].get("info",{}):
                del node['data']['info']['args']
        item.expand = json.dumps(expand)

        # 限制提醒
        if item.schedule_type == 'crontab':
            if not item.cron_time or not re.match("^[0-9/*]+ [0-9/*]+ [0-9/*]+ [0-9/*]+ [0-9/*]+", item.cron_time.strip().replace('  ', ' ')):
                item.cron_time = ''
                raise MyappException(__("crontab 格式错误"))

            org = item.project.org
            if not org or org == 'public':
                flash(__('无法保障公共集群的稳定性，定时任务请选择专门的日更集群项目组'), 'warning')


    def pre_update_web(self, item):
        item.dag_json = item.fix_dag_json()
        item.expand = json.dumps(item.fix_expand(), indent=4, ensure_ascii=False)
        db.session.commit()

    # 删除前先把下面的task删除了，把里面的运行实例也删除了，把定时调度删除了
    # @pysnooper.snoop()
    def pre_delete(self, pipeline):
        db.session.commit()
        if __("(废弃)") not in pipeline.describe:
            pipeline.describe += __("(废弃)")
        pipeline.schedule_type = 'once'
        pipeline.expand = ""
        pipeline.dag_json = "{}"
        db.session.commit()
        try:
            # 删除所有相关的运行中workflow
            back_crds = pipeline.get_workflow()
            self.delete_bind_crd(back_crds)
        except Exception as e:
            print(e)

        # 删除所有的任务
        try:
            tasks = pipeline.get_tasks()
            # 删除task启动的所有实例
            for task in tasks:
                self.delete_task_run(task)
        except Exception as e:
            print(e)


        # 删除所有的workflow
        # 只是删除了数据库记录，但是实例并没有删除，会重新监听更新的。
        db.session.query(Task).filter_by(pipeline_id=pipeline.id).delete(synchronize_session=False)
        db.session.commit()
        db.session.query(Workflow).filter_by(foreign_key=str(pipeline.id)).delete(synchronize_session=False)
        db.session.commit()
        db.session.query(Workflow).filter(Workflow.labels.contains(f'"pipeline-id": "{str(pipeline.id)}"')).delete(synchronize_session=False)
        db.session.commit()
        db.session.query(RunHistory).filter_by(pipeline_id=pipeline.id).delete(synchronize_session=False)
        db.session.commit()


    @expose("/my/list/")
    def my(self):
        try:
            user_id = g.user.id
            if user_id:
                pipelines = db.session.query(Pipeline).filter_by(created_by_fk=user_id).all()
                back = []
                for pipeline in pipelines:
                    back.append(pipeline.to_json())
                return json_response(message='success', status=0, result=back)
        except Exception as e:
            print(e)
            return json_response(message=str(e), status=-1, result={})

    @expose("/demo/list/")
    def demo(self):
        try:
            pipelines = db.session.query(Pipeline).filter(Pipeline.parameter.contains('"demo": "true"')).all()
            back = []
            for pipeline in pipelines:
                back.append(pipeline.to_json())
            return json_response(message='success', status=0, result=back)
        except Exception as e:
            print(e)
            return json_response(message=str(e), status=-1, result={})

    # 删除手动发起的workflow，不删除定时任务发起的workflow
    def delete_bind_crd(self, crds):

        for crd in crds:
            try:
                run_id = json.loads(crd['labels']).get("run-id", '')
                if run_id:
                    # 定时任务发起的不能清理
                    run_history = db.session.query(RunHistory).filter_by(run_id=run_id).first()
                    if run_history:
                        continue

                    db_crd = db.session.query(Workflow).filter_by(name=crd['name']).first()
                    if db_crd and db_crd.pipeline:
                        k8s_client = py_k8s.K8s(db_crd.pipeline.project.cluster.get('KUBECONFIG', ''))
                    else:
                        k8s_client = py_k8s.K8s()

                    k8s_client.delete_workflow(
                        all_crd_info=conf.get("CRD_INFO", {}),
                        namespace=crd['namespace'],
                        run_id=run_id
                    )
                    # push_message(conf.get('ADMIN_USER', '').split(','),'%s手动运行新的pipeline %s，进而删除旧的pipeline run-id: %s' % (pipeline.created_by.username,pipeline.describe,run_id,))
                    if db_crd:
                        db_crd.status = 'Deleted'
                        db_crd.change_time = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
                        db.session.commit()
            except Exception as e:
                print(e)

    def check_pipeline_perms(user_fun):
        # @pysnooper.snoop()
        def wraps(*args, **kwargs):
            pipeline_id = int(kwargs.get('pipeline_id', '0'))
            if not pipeline_id:
                response = make_response("pipeline_id not exist")
                response.status_code = 404
                return response

            user_roles = [role.name.lower() for role in g.user.roles]
            if "admin" in user_roles:
                return user_fun(*args, **kwargs)

            join_projects_id = security_manager.get_join_projects_id(db.session)
            pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
            if pipeline.project.id in join_projects_id:
                return user_fun(*args, **kwargs)

            response = make_response("no perms to run pipeline %s" % pipeline_id)
            response.status_code = 403
            return response

        return wraps

    # 保存pipeline正在运行的workflow信息
    def save_workflow(self, back_crds):
        # 把消息加入到源数据库
        for crd in back_crds:
            try:
                workflow = db.session.query(Workflow).filter_by(name=crd['name']).first()
                if not workflow:
                    username = ''
                    labels = json.loads(crd['labels'])
                    if 'run-rtx' in labels:
                        username = labels['run-rtx']
                    elif 'pipeline-rtx' in labels:
                        username = labels['pipeline-rtx']
                    elif 'run-username' in labels:
                        username = labels['run-username']
                    elif 'pipeline-username' in labels:
                        username = labels['pipeline-username']

                    workflow = Workflow(name=crd['name'], namespace=crd['namespace'], create_time=crd['create_time'],
                                        cluster=labels.get("cluster", ''),
                                        status=crd['status'],
                                        annotations=crd['annotations'],
                                        labels=crd['labels'],
                                        spec=crd['spec'],
                                        status_more=crd['status_more'],
                                        username=username
                                        )
                    db.session.add(workflow)
                    db.session.commit()
            except Exception as e:
                print(e)

    # @event_logger.log_this
    @expose("/run_pipeline/<pipeline_id>", methods=["GET", "POST"])
    @check_pipeline_perms
    # @pysnooper.snoop()
    def run_pipeline(self, pipeline_id):
        # print(pipeline_id)
        pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
        pipeline.delete_old_task()
        tasks = db.session.query(Task).filter_by(pipeline_id=pipeline_id).all()
        if not tasks:
            flash('no task', 'warning')
            return redirect('/pipeline_modelview/api/web/%s' % pipeline.id)

        time.sleep(1)

        back_crds = pipeline.get_workflow()
        # 添加会和watch中的重复
        # if back_crds:
        #     self.save_workflow(back_crds)
        # 这里直接删除所有的历史任务流，正在运行的也删除掉
        # not_running_crds = back_crds  # [crd for crd in back_crds if 'running' not in crd['status'].lower()]
        self.delete_bind_crd(back_crds)

        # 删除task启动的所有实例
        for task in tasks:
            self.delete_task_run(task)

        # self.delete_workflow(pipeline)
        pipeline.pipeline_file,pipeline.run_id = dag_to_pipeline(pipeline, db.session,workflow_label={"schedule_type":"once"})  # 合成workflow
        # print('make pipeline file %s' % pipeline.pipeline_file)
        # return
        print('begin upload and run pipeline %s' % pipeline.name)
        pipeline.version_id = ''
        if not pipeline.pipeline_file:
            flash("请先编排任务，并进行保存后再运行整个任务流",'warning')
            return redirect('/pipeline_modelview/api/web/%s' % pipeline.id)

        crd_name = run_pipeline(pipeline, json.loads(pipeline.pipeline_file))  # 会根据版本号是否为空决定是否上传
        pipeline.pipeline_argo_id = crd_name
        db.session.commit()  # 更新
        # back_crds = pipeline.get_workflow()
        # 添加会和watch中的重复
        # if back_crds:
        #     self.save_workflow(back_crds)

        return redirect("/pipeline_modelview/api/web/log/%s" % pipeline_id)
        # return redirect(run_url)


    # # @event_logger.log_this
    @expose("/web/<pipeline_id>", methods=["GET"])
    # @pysnooper.snoop()
    def web(self, pipeline_id):
        pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()

        pipeline.dag_json = pipeline.fix_dag_json()  # 修正 dag_json
        pipeline.expand = json.dumps(pipeline.fix_expand(), indent=4, ensure_ascii=False)  # 修正 前端expand字段缺失
        pipeline.expand = json.dumps(pipeline.fix_position(), indent=4, ensure_ascii=False)  # 修正 节点中心位置到视图中间

        # # 自动排版
        # db_tasks = pipeline.get_tasks(db.session)
        # if db_tasks:
        #     try:
        #         tasks={}
        #         for task in db_tasks:
        #             tasks[task.name]=task.to_json()
        #         expand = core.fix_task_position(pipeline.to_json(),tasks,json.loads(pipeline.expand))
        #         pipeline.expand=json.dumps(expand,indent=4,ensure_ascii=False)
        #         db.session.commit()
        #     except Exception as e:
        #         print(e)

        db.session.commit()
        # print(pipeline_id)
        url = '/static/appbuilder/vison/index.html?pipeline_id=%s' % pipeline_id  # 前后端集成完毕，这里需要修改掉
        return redirect('/frontend/showOutLink?url=%s' % urllib.parse.quote(url, safe=""))
        # 返回模板
        # return self.render_template('link.html', data=data)

    # # @event_logger.log_this
    @expose("/web/log/<pipeline_id>", methods=["GET"])
    def web_log(self, pipeline_id):
        pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
        namespace = pipeline.namespace
        workflow_name = pipeline.pipeline_argo_id
        cluster = pipeline.project.cluster["NAME"]
        url = f'/frontend/commonRelation?backurl=/workflow_modelview/api/web/dag/{cluster}/{namespace}/{workflow_name}'
        return redirect(url)

    # # @event_logger.log_this
    @expose("/web/monitoring/<pipeline_id>", methods=["GET"])
    def web_monitoring(self, pipeline_id):
        pipeline = db.session.query(Pipeline).filter_by(id=int(pipeline_id)).first()

        url = "http://"+pipeline.project.cluster.get('HOST', request.host).split('|')[-1]+conf.get('GRAFANA_TASK_PATH')+ pipeline.name
        return redirect(url)
        # else:
        #     flash('no running instance', 'warning')
        #     return redirect('/pipeline_modelview/api/web/%s' % pipeline.id)

    # # @event_logger.log_this
    @expose("/web/pod/<pipeline_id>", methods=["GET"])
    def web_pod(self, pipeline_id):
        pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
        return redirect(f'/k8s/web/search/{pipeline.project.cluster["NAME"]}/{conf.get("PIPELINE_NAMESPACE","pipeline")}/{pipeline.name.replace("_", "-").lower()}')

        # data = {
        #     "url": "//" + pipeline.project.cluster.get('HOST', request.host) + conf.get('K8S_DASHBOARD_CLUSTER') + '#/search?namespace=%s&q=%s' % (conf.get('PIPELINE_NAMESPACE'), pipeline.name.replace('_', '-').lower()),
        #     "target":"div.kd-chrome-container.kd-bg-background",
        #     "delay":500,
        #     "loading": True
        # }
        # # 返回模板
        # if pipeline.project.cluster['NAME'] == conf.get('ENVIRONMENT'):
        #     return self.render_template('link.html', data=data)
        # else:
        #     return self.render_template('external_link.html', data=data)

    @expose("/web/runhistory/<pipeline_id>", methods=["GET"])
    def web_runhistory(self,pipeline_id):
        url = conf.get('MODEL_URLS', {}).get('runhistory', '') + '?filter=' + urllib.parse.quote(json.dumps([{"key": "pipeline", "value": int(pipeline_id)}], ensure_ascii=False))
        # print(url)
        return redirect(url)

    @expose("/web/workflow/<pipeline_id>", methods=["GET"])
    def web_workflow(self,pipeline_id):
        url = conf.get('MODEL_URLS', {}).get('workflow', '') + '?filter=' + urllib.parse.quote(json.dumps([{"key": "labels", "value": '"pipeline-id": "%s"'%pipeline_id}], ensure_ascii=False))
        # print(url)
        return redirect(url)


    # @pysnooper.snoop(watch_explode=('expand'))
    def copy_db(self, pipeline):
        new_pipeline = pipeline.clone()
        expand = json.loads(pipeline.expand) if pipeline.expand else {}
        new_pipeline.name = new_pipeline.name.replace('_', '-') + "-" + uuid.uuid4().hex[:4]
        if 'copy' not in new_pipeline.describe:
            new_pipeline.describe = new_pipeline.describe+"(copy)"
        new_pipeline.created_on = datetime.datetime.now()
        new_pipeline.changed_on = datetime.datetime.now()
        db.session.add(new_pipeline)
        db.session.commit()

        def change_node(src_task_id, des_task_id):
            for node in expand:
                if 'source' not in node:
                    # 位置信息换成新task的id
                    if int(node['id']) == int(src_task_id):
                        node['id'] = str(des_task_id)
                else:
                    if int(node['source']) == int(src_task_id):
                        node['source'] = str(des_task_id)
                    if int(node['target']) == int(src_task_id):
                        node['target'] = str(des_task_id)

        # 复制绑定的task，并绑定新的pipeline
        for task in pipeline.get_tasks():
            new_task = task.clone()
            new_task.pipeline_id = new_pipeline.id
            new_task.create_datetime = datetime.datetime.now()
            new_task.change_datetime = datetime.datetime.now()
            db.session.add(new_task)
            db.session.commit()
            change_node(task.id, new_task.id)

        new_pipeline.expand = json.dumps(expand)
        new_pipeline.parameter="{}" # 扩展参数不进行复制，这样demo的pipeline不会被复制一遍
        db.session.commit()
        return new_pipeline

    # # @event_logger.log_this
    @expose("/copy_pipeline/<pipeline_id>", methods=["GET", "POST"])
    def copy_pipeline(self, pipeline_id):
        # print(pipeline_id)
        message = ''
        try:
            pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
            new_pipeline = self.copy_db(pipeline)
            # return jsonify(new_pipeline.to_json())
            return redirect('/pipeline_modelview/api/web/%s'%new_pipeline.id)
        except InvalidRequestError:
            db.session.rollback()
        except Exception as e:
            logging.error(e)
            message = str(e)
        response = make_response("copy pipeline %s error: %s" % (pipeline_id, message))
        response.status_code = 500
        return response

    @action("copy", "复制", confirmation= '复制所选记录?', icon="fa-copy", multiple=True, single=False)
    def copy(self, pipelines):
        if not isinstance(pipelines, list):
            pipelines = [pipelines]
        try:
            for pipeline in pipelines:
                self.copy_db(pipeline)
        except InvalidRequestError:
            db.session.rollback()
        except Exception as e:
            logging.error(e)
            raise e

        return redirect(request.referrer)


class Pipeline_ModelView(Pipeline_ModelView_Base, MyappModelView):
    datamodel = SQLAInterface(Pipeline)
    # base_order = ("changed_on", "desc")
    # order_columns = ['changed_on']


    @action("muldelete", "删除", "确定删除所选记录?", "fa-trash", single=False)
    def muldelete(self, items):
        return self._muldelete(items)


# 添加api
class Pipeline_ModelView_Api(Pipeline_ModelView_Base, MyappModelRestApi):
    datamodel = SQLAInterface(Pipeline)
    route_base = '/pipeline_modelview/api'
    # show_columns = ['project','name','describe','namespace','schedule_type','cron_time','node_selector','depends_on_past','max_active_runs','parallelism','global_env','dag_json','pipeline_file_html','pipeline_argo_id','run_id','created_by','changed_by','created_on','changed_on','expand']
    list_columns = ['id', 'project', 'pipeline_url', 'creator', 'modified']
    add_columns = ['project', 'name', 'describe']
    edit_columns = ['project', 'name', 'describe', 'schedule_type', 'cron_time', 'depends_on_past', 'max_active_runs',
                    'expired_limit', 'parallelism', 'dag_json', 'global_env', 'alert_status', 'alert_user', 'expand',
                    'parameter','cronjob_start_time']

    related_views = [Task_ModelView_Api, ]

    def pre_add_web(self):
        self.default_filter = {
            "created_by": g.user.id
        }

    add_form_query_rel_fields = {
        "project": [["name", Project_Join_Filter, 'org']]
    }
    edit_form_query_rel_fields = add_form_query_rel_fields


appbuilder.add_api(Pipeline_ModelView_Api)

class Pipeline_ModelView_Home_Api(Pipeline_ModelView_Api):
    datamodel = SQLAInterface(Pipeline)
    route_base = '/pipeline_modelview/home/api'
    list_columns = ['id', 'project', 'pipeline_url', 'creator', 'modified', 'changed_on', 'describe']


appbuilder.add_api(Pipeline_ModelView_Home_Api)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								from myapp.views.baseSQLA import MyappSQLAInterface as SQLAInterface
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								from flask_babel import gettext as __
 								from flask_babel import lazy_gettext as _
 								import uuid
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								import logging
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
+								import urllib.parse
-												update pre_add_web follow base

											
										
										
											2022-11-23 17:01:10 +08:00
+								from sqlalchemy.exc import InvalidRequestError
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								from myapp.models.model_job import Job_Template
 								from myapp.models.model_job import Task, Pipeline, Workflow, RunHistory
-												[CUBE #100] Refactor code based on pyflakes check result

											
										
										
											2022-10-11 14:25:25 +08:00
+								from myapp.models.model_team import Project
-												fix

											
										
										
											2022-02-26 22:36:57 +08:00
+								from myapp.views.view_team import Project_Join_Filter
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								from flask_appbuilder.actions import action
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								from flask import jsonify, Response, request
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								from flask_appbuilder.forms import GeneralModelConverter
 								from myapp.utils import core
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								from myapp import app, appbuilder, db
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								from wtforms.ext.sqlalchemy.fields import QuerySelectField
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								from jinja2 import Environment, BaseLoader, DebugUndefined,Undefined
-												[CUBE #100] Refactor code based on pyflakes check result

											
										
										
											2022-10-11 14:25:25 +08:00
+								import os
 								from wtforms.validators import DataRequired, Length, Regexp
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								from myapp.views.view_task import Task_ModelView, Task_ModelView_Api
-												[CUBE #100] Refactor code based on pyflakes check result

											
										
										
											2022-10-11 14:25:25 +08:00
+								from sqlalchemy import or_
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								from myapp.exceptions import MyappException
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								from wtforms import BooleanField, IntegerField, StringField, SelectField
 								from flask_appbuilder.fieldwidgets import BS3TextFieldWidget, Select2ManyWidget, Select2Widget, BS3TextAreaFieldWidget
 								from myapp.forms import MyBS3TextAreaFieldWidget, MySelectMultipleField
 								from myapp.models.model_job import Repository
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								from myapp.utils.py import py_k8s
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								import re, copy
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								from kubernetes.client.models import (
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    V1EnvVar, V1SecurityContext
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								)
 								from .baseApi import (
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    MyappModelRestApi,
 								    send_file
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								)
 								from flask import (
 								    flash,
 								    g,
 								    make_response,
 								    redirect,
-												remove redundant imports

											
										
										
											2022-10-10 11:44:53 +08:00
+								    request
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								)
 								from myapp import security_manager
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								from myapp.views.view_team import filter_join_org_project
-												update pre_add_web follow base

											
										
										
											2022-11-23 17:01:10 +08:00
+								import pysnooper
-												add cache

											
										
										
											2022-08-28 20:24:10 +08:00
+								from kubernetes import client
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								from .base import (
 								    DeleteMixin,
 								    get_user_roles,
 								    MyappFilter,
 								    MyappModelView,
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								    json_response
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								)
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
-												[CUBE #100] Refactor code based on pyflakes check result

											
										
										
											2022-10-11 14:25:25 +08:00
+								from flask_appbuilder import expose
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								import datetime, time, json
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								conf = app.config
 								class Pipeline_Filter(MyappFilter):
 								    # @pysnooper.snoop()
 								    def apply(self, query, func):
 								        user_roles = [role.name.lower() for role in list(self.get_user_roles())]
 								        if "admin" in user_roles:
 								            return query
 								        join_projects_id = security_manager.get_join_projects_id(db.session)
 								        # public_project_id =
 								        # logging.info(join_projects_id)
 								        return query.filter(
 								            or_(
 								                self.model.project_id.in_(join_projects_id),
 								                # self.model.project.name.in_(['public'])
 								            )
 								        )
-												修正日志打印和部分显示

											
										
										
											2024-04-03 22:01:43 +08:00
+								def make_workflow_yaml(pipeline,workflow_label,hubsecret_list,dag_templates,containers_templates,dbsession=db.session):
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    name = pipeline.name+"-"+uuid.uuid4().hex[:4]
 								    workflow_label['workflow-name']=name
 								    workflow_crd_json={
 								        "apiVersion": "argoproj.io/v1alpha1",
 								        "kind": "Workflow",
 								        "metadata": {
 								            # "generateName": pipeline.name+"-",
 								            "annotations": {
 								                "name": pipeline.name,
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                "description": pipeline.describe.encode("unicode_escape").decode('utf-8')
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            },
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            "name": name,
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            "labels": workflow_label,
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            "namespace": json.loads(pipeline.project.expand).get('PIPELINE_NAMESPACE', conf.get('PIPELINE_NAMESPACE'))
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        },
 								        "spec": {
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            "ttlStrategy": {
 								                "secondsAfterCompletion": 10800,  # 3个小时候自动删除
 								                "ttlSecondsAfterFinished": 10800,  # 3个小时候自动删除
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            },
 								            "archiveLogs": True,  # 打包日志
 								            "entrypoint": pipeline.name,
 								            "templates": [
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                             {
 								                                 "name": pipeline.name,
 								                                 "dag": {
 								                                     "tasks": dag_templates
 								                                 }
 								                             }
 								                         ] + containers_templates,
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            "arguments": {
 								                "parameters": []
 								            },
 								            "serviceAccountName": "pipeline-runner",
 								            "parallelism": int(pipeline.parallelism),
 								            "imagePullSecrets": [
 								                {
 								                    "name": hubsecret
 								                } for hubsecret in hubsecret_list
 								            ]
 								        }
 								    }
 								    return workflow_crd_json
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								# 转化为worfklow的yaml
 								# @pysnooper.snoop()
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								def dag_to_pipeline(pipeline, dbsession, workflow_label=None, **kwargs):
-												修正strip()的bug

											
										
										
											2024-06-30 11:34:35 +08:00
+								    dag_json = pipeline.fix_dag_json(dbsession)
 								    pipeline.dag_json=dag_json
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    dbsession.commit()
-												修正strip()的bug

											
										
										
											2024-06-30 11:34:35 +08:00
+								    dag = json.loads(dag_json)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								    # 如果dag为空，就直接退出
 								    if not dag:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        return None, None
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								    all_tasks = {}
 								    for task_name in dag:
 								        # 使用临时连接，避免连接中断的问题
 								        # try:
-												修正日志打印和部分显示

											
										
										
											2024-04-03 22:01:43 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        task = dbsession.query(Task).filter_by(name=task_name, pipeline_id=pipeline.id).first()
 								        if not task:
 								            raise MyappException('task %s not exist ' % task_name)
 								        all_tasks[task_name] = task
 								    template_kwargs=kwargs
 								    if 'execution_date' not in template_kwargs:
 								        template_kwargs['execution_date'] = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								    # 渲染字符串模板变量
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    # @pysnooper.snoop()
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    def template_str(src_str):
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        rtemplate = Environment(loader=BaseLoader, undefined=Undefined).from_string(src_str)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        des_str = rtemplate.render(creator=pipeline.created_by.username,
 								                                   datetime=datetime,
 								                                   runner=g.user.username if g and g.user and g.user.username else pipeline.created_by.username,
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                                   uuid=uuid,
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                                   pipeline_id=pipeline.id,
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								                                   pipeline_name=pipeline.name,
 								                                   cluster_name=pipeline.project.cluster['NAME'],
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                                   **template_kwargs
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                                   )
 								        return des_str
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    pipeline_global_env = template_str(pipeline.global_env.strip()) if pipeline.global_env else ''  # 优先渲染，不然里面如果有date就可能存在不一致的问题
 								    pipeline_global_env = [env.strip() for env in pipeline_global_env.split('\n') if '=' in env.strip()]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    # 系统级别环境变量
 								    global_envs = json.loads(template_str(json.dumps(conf.get('GLOBAL_ENV', {}), indent=4, ensure_ascii=False)))
 								    for env in pipeline_global_env:
 								        key, value = env[:env.index('=')], env[env.index('=') + 1:]
 								        global_envs[key] = value
-												升级20240801版本

											
										
										
											2024-08-19 18:51:28 +08:00
+								    # 全局环境变量可以在任务的参数中引用
 								    for global_env in pipeline_global_env:
 								        key,value = global_env.split('=')[0],global_env.split('=')[1]
 								        if key not in kwargs:
 								            template_kwargs[key]=value
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
 								    def make_dag_template():
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        dag_template = []
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        for task_name in dag:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            template_temp = {
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								                "name": task_name,
 								                "template": task_name,
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                "dependencies": dag[task_name].get('upstream', [])
 								            }
 								            # 设置了跳过的话，在argo中设置跳过
 								            if all_tasks[task_name].skip:
 								                template_temp['when']='false'
 								            dag_template.append(template_temp)
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        return dag_template
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    # @pysnooper.snoop()
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def make_container_template(task_name,hubsecret_list=None):
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        task = all_tasks[task_name]
 								        ops_args = []
 								        task_args = json.loads(task.args)
 								        for task_attr_name in task_args:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            # 布尔型只添加参数名
 								            if type(task_args[task_attr_name]) == bool:
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                if task_args[task_attr_name]:
 								                    ops_args.append('%s' % str(task_attr_name))
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            # 控制不添加
 								            elif not task_args[task_attr_name]:  # 如果参数值为空，则都不添加
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                pass
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            # json类型直接导入序列化以后的
 								            elif type(task_args[task_attr_name]) == dict or type(task_args[task_attr_name]) == list:
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                ops_args.append('%s' % str(task_attr_name))
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                args_values = json.dumps(task_args[task_attr_name], ensure_ascii=False)
 								                # args_values = template_str(args_values) if re.match('\{\{.*\}\}',args_values) else args_values
 								                ops_args.append('%s' % args_values)
 								            # # list类型，分多次导入,# list类型逗号分隔就好了
 								            # elif type(task_args[task_attr_name]) == list:
 								            #     for args_values in task_args[task_attr_name].split('\n'):
 								            #         ops_args.append('%s' % str(task_attr_name))
 								            #         # args_values = template_str(args_values) if re.match('\{\{.*\}\}',args_values) else args_values
 								            #         ops_args.append('%s' % args_values)
 								            # 其他的直接添加
 								            elif task_attr_name not in ['images','workdir']:
 								                ops_args.append('%s' % str(task_attr_name))
 								                args_values = task_args[task_attr_name]
 								                # args_values = template_str(args_values) if re.match('\{\{.*\}\}',args_values) else args_values
 								                ops_args.append('%s' % str(args_values))  # 这里应该对不同类型的参数名称做不同的参数处理，比如bool型，只有参数，没有值
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								        # 设置环境变量
 								        container_envs = []
 								        if task.job_template.env:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            envs = re.split('\r|\n', task.job_template.env)
 								            envs = [env.strip() for env in envs if env.strip()]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            for env in envs:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                env_key, env_value = env.split('=')[0], env.split('=')[1]
 								                container_envs.append((env_key, env_value))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								        # 设置全局环境变量
 								        for global_env_key in global_envs:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            container_envs.append((global_env_key, global_envs[global_env_key]))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								        # 设置task的默认环境变量
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        _, _, gpu_resource_name = core.get_gpu(task.resource_gpu)
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        container_envs.append(("KFJ_TASK_ID", str(task.id)))
 								        container_envs.append(("KFJ_TASK_NAME", str(task.name)))
 								        container_envs.append(("KFJ_TASK_NODE_SELECTOR", str(task.get_node_selector())))
 								        container_envs.append(("KFJ_TASK_VOLUME_MOUNT", str(task.volume_mount)))
 								        container_envs.append(("KFJ_TASK_IMAGES", str(task.job_template.images)))
 								        container_envs.append(("KFJ_TASK_RESOURCE_CPU", str(task.resource_cpu)))
 								        container_envs.append(("KFJ_TASK_RESOURCE_MEMORY", str(task.resource_memory)))
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        container_envs.append(("KFJ_TASK_RESOURCE_GPU", str(task.resource_gpu.replace("+", ''))))
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        container_envs.append(("KFJ_TASK_PROJECT_NAME", str(pipeline.project.name)))
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        container_envs.append(("GPU_RESOURCE_NAME", gpu_resource_name))
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        container_envs.append(("USERNAME", pipeline.created_by.username))
-												升级20240901版本

											
										
										
											2024-11-10 18:50:51 +08:00
+								        container_envs.append(("IMAGE_PULL_POLICY", conf.get('IMAGE_PULL_POLICY','Always')))
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        if hubsecret_list:
 								            container_envs.append(("HUBSECRET", ','.join(hubsecret_list)))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								        # 创建工作目录
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        working_dir = None
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        if task.job_template.workdir and task.job_template.workdir.strip():
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            working_dir = task.job_template.workdir.strip()
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        if task.working_dir and task.working_dir.strip():
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            working_dir = task.working_dir.strip()
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        # 配置启动命令
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        task_command = ''
 								        if task.command:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            commands = re.split('\r|\n', task.command)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            commands = [command.strip() for command in commands if command.strip()]
 								            if task_command:
 								                task_command += " && " + " && ".join(commands)
 								            else:
 								                task_command += " && ".join(commands)
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								        job_template_entrypoint = task.job_template.entrypoint.strip() if task.job_template.entrypoint else ''
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        command = None
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        if job_template_entrypoint:
 								            command = job_template_entrypoint
 								        if task_command:
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								            command = task_command
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        images = task.job_template.images.name
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        command = command.split(' ') if command else []
 								        command = [com for com in command if com]
 								        arguments = ops_args
 								        file_outputs = json.loads(task.outputs) if task.outputs and json.loads(task.outputs) else None
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
+								        # 如果模板配置了images参数，那直接用模板的这个参数
 								        if json.loads(task.args).get('images',''):
 								            images = json.loads(task.args).get('images')
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        # 自定义节点
 								        if task.job_template.name == conf.get('CUSTOMIZE_JOB'):
 								            working_dir = json.loads(task.args).get('workdir')
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            command = ['bash', '-c', json.loads(task.args).get('command')]
 								            arguments = []
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								        # 添加用户自定义挂载
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        k8s_volumes = []
 								        k8s_volume_mounts = []
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        task.volume_mount = task.volume_mount.strip() if task.volume_mount else ''
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        if task.volume_mount:
-												add cache

											
										
										
											2022-08-28 20:24:10 +08:00
+								            try:
 								                k8s_volumes,k8s_volume_mounts = py_k8s.K8s.get_volume_mounts(task.volume_mount,pipeline.created_by.username)
 								            except Exception as e:
 								                print(e)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								        # 添加node selector
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        node_selector = {}
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								        for selector in re.split(',|;|\n|\t', task.get_node_selector()):
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            selector = selector.replace(' ', '')
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								            if '=' in selector:
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								                node_selector[selector.strip().split('=')[0].strip()] = selector.strip().split('=')[1].strip()
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								        # 添加pod label
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        pod_label = {
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            "pipeline-id": str(pipeline.id),
 								            "pipeline-name": str(pipeline.name),
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
+								            "task-id": str(task.id),
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            "task-name": str(task.name),
 								            "run-id": global_envs.get('KFJ_RUN_ID', ''),
-												升级20240901版本

											
										
										
											2024-09-19 11:05:14 +08:00
+								            'run-username': g.user.username if g and g.user and g.user.username else pipeline.created_by.username,
 								            'pipeline-username': pipeline.created_by.username
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        }
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        pod_annotations = {
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
+								            'project': pipeline.project.name,
 								            'pipeline': pipeline.describe,
 								            "task": task.label,
 								            'job-template': task.job_template.describe
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        }
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        # 设置资源限制
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        resource_cpu = task.job_template.get_env('TASK_RESOURCE_CPU') if task.job_template.get_env('TASK_RESOURCE_CPU') else task.resource_cpu
 								        resource_gpu = task.job_template.get_env('TASK_RESOURCE_GPU') if task.job_template.get_env('TASK_RESOURCE_GPU') else task.resource_gpu
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        resource_memory = task.job_template.get_env('TASK_RESOURCE_MEMORY') if task.job_template.get_env('TASK_RESOURCE_MEMORY') else task.resource_memory
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        resources_requests = resources_limits = {}
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        if resource_memory:
 								            if not '~' in resource_memory:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                resources_requests['memory'] = resource_memory
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								                resources_limits['memory'] = resource_memory
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            else:
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								                resources_requests['memory'] = resource_memory.split("~")[0]
 								                resources_limits['memory'] = resource_memory.split("~")[1]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								        if resource_cpu:
 								            if not '~' in resource_cpu:
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								                resources_requests['cpu'] = resource_cpu
 								                resources_limits['cpu'] = resource_cpu
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            else:
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								                resources_requests['cpu'] = resource_cpu.split("~")[0]
 								                resources_limits['cpu'] = resource_cpu.split("~")[1]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								        if resource_gpu:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
 								            gpu_num, gpu_type, gpu_resource_name = core.get_gpu(resource_gpu)
 								            # 整卡占用
 								            if gpu_num >= 1:
 								                resources_requests[gpu_resource_name] = str(int(gpu_num))
 								                resources_limits[gpu_resource_name] = str(int(gpu_num))
-												升级20240801版本

											
										
										
											2024-08-19 18:51:28 +08:00
+								            if 0 == gpu_num:
 								                # 没要gpu的容器，就要加上可视gpu为空，不然gpu镜像能看到和使用所有gpu
 								                for gpu_alias in conf.get('GPU_NONE', {}):
 								                    container_envs.append((conf.get('GPU_NONE',{})[gpu_alias][0], conf.get('GPU_NONE',{})[gpu_alias][1]))
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        # 配置host
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        hostAliases = {}
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
 								        global_hostAliases = conf.get('HOSTALIASES', '')
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        # global_hostAliases = ''
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        if task_temp.job_template.hostAliases:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            global_hostAliases += "\n" + task_temp.job_template.hostAliases
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        if global_hostAliases:
 								            hostAliases_list = re.split('\r|\n', global_hostAliases)
 								            hostAliases_list = [host.strip() for host in hostAliases_list if host.strip()]
 								            for row in hostAliases_list:
 								                hosts = row.strip().split(' ')
 								                hosts = [host for host in hosts if host]
 								                if len(hosts) > 1:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                    hostAliases[hosts[1]] = hosts[0]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        if task.skip:
 								            command = ["echo", "skip"]
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            arguments = None
 								            resources_requests = None
 								            resources_limits = None
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
 								        task_template = {
 								            "name": task.name,  # 因为同一个
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            "outputs": {
 								                "artifacts": []
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            },
 								            "container": {
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                "name": task.name + "-" + uuid.uuid4().hex[:4],
 								                "ports": [],
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								                "command": command,
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                "args": arguments,
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								                "env": [
 								                    {
 								                        "name": item[0],
 								                        "value": item[1]
 								                    } for item in container_envs
 								                ],
 								                "image": images,
 								                "resources": {
 								                    "limits": resources_limits,
 								                    "requests": resources_requests
 								                },
 								                "volumeMounts": k8s_volume_mounts,
 								                "workingDir": working_dir,
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                "imagePullPolicy": conf.get('IMAGE_PULL_POLICY', 'Always')
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            },
 								            "nodeSelector": node_selector,
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            "securityContext": {
 								                "privileged": True if task.job_template.privileged else False
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            },
 								            "affinity": {
 								                "podAntiAffinity": {
 								                    "preferredDuringSchedulingIgnoredDuringExecution": [
 								                        {
 								                            "podAffinityTerm": {
 								                                "labelSelector": {
 								                                    "matchLabels": {
 								                                        "pipeline-id": str(pipeline.id)
 								                                    }
 								                                },
 								                                "topologyKey": "kubernetes.io/hostname"
 								                            },
 								                            "weight": 80
 								                        }
 								                    ]
 								                }
 								            },
 								            "metadata": {
 								                "labels": pod_label,
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                "annotations": pod_annotations
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								            },
 								            "retryStrategy": {
 								                "limit": int(task.retry)
 								            } if task.retry else None,
 								            "volumes": k8s_volumes,
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            "hostAliases": [
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								                {
 								                    "hostnames": [hostname],
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                    "ip": hostAliases[hostname]
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								                } for hostname in hostAliases
 								            ],
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            "activeDeadlineSeconds": task.timeout if task.timeout else None
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        }
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        # 统一添加一些固定环境变量，比如hostip，podip等
 								        task_template['container']['env'].append({
 								            "name":"K8S_NODE_NAME",
 								            "valueFrom":{
 								                "fieldRef":{
 								                    "apiVersion":"v1",
 								                    "fieldPath":"spec.nodeName"
 								                }
 								            }
 								        })
 								        task_template['container']['env'].append({
 								            "name": "K8S_POD_IP",
 								            "valueFrom": {
 								                "fieldRef": {
 								                    "apiVersion": "v1",
 								                    "fieldPath": "status.podIP"
 								                }
 								            }
 								        })
 								        task_template['container']['env'].append({
 								            "name": "K8S_HOST_IP",
 								            "valueFrom": {
 								                "fieldRef": {
 								                    "apiVersion": "v1",
 								                    "fieldPath": "status.hostIP"
 								                }
 								            }
 								        })
 								        task_template['container']['env'].append({
 								            "name": "K8S_POD_NAME",
 								            "valueFrom": {
 								                "fieldRef": {
 								                    "apiVersion": "v1",
 								                    "fieldPath": "metadata.name"
 								                }
 								            }
 								        })
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        return task_template
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    # 添加个人创建的所有仓库秘钥
 								    image_pull_secrets = conf.get('HUBSECRET', [])
-												修正日志打印和部分显示

											
										
										
											2024-04-03 22:01:43 +08:00
+								    user_repositorys = dbsession.query(Repository).filter(Repository.created_by_fk == pipeline.created_by.id).all()
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    hubsecret_list = list(set(image_pull_secrets + [rep.hubsecret for rep in user_repositorys]))
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    # 配置拉取秘钥
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    for task_name in all_tasks:
 								        # 配置拉取秘钥。本来在contain里面，workflow在外面
 								        task_temp = all_tasks[task_name]
 								        if task_temp.job_template.images.repository.hubsecret:
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								            hubsecret = task_temp.job_template.images.repository.hubsecret
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            if hubsecret not in hubsecret_list:
 								                hubsecret_list.append(hubsecret)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    hubsecret_list = list(set(hubsecret_list))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    # 设置workflow标签
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    if not workflow_label:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        workflow_label = {}
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
-												升级20240901版本

											
										
										
											2024-09-19 11:05:14 +08:00
+								    workflow_label['run-username'] = g.user.username if g and g.user and g.user.username else pipeline.created_by.username
 								    workflow_label['pipeline-username'] = pipeline.created_by.username
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    workflow_label['save-time'] = datetime.datetime.now().strftime('%Y-%m-%dT%H-%M-%S')
 								    workflow_label['pipeline-id'] = str(pipeline.id)
 								    workflow_label['pipeline-name'] = str(pipeline.name)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    workflow_label['run-id'] = global_envs.get('KFJ_RUN_ID', '')  # 以此来绑定运行时id，不能用kfp的run—id。那个是传到kfp以后才产生的。
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    workflow_label['cluster'] = pipeline.project.cluster['NAME']
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    containers_template = []
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    for task_name in dag:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        containers_template.append(make_container_template(task_name=task_name,hubsecret_list=hubsecret_list))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												修正日志打印和部分显示

											
										
										
											2024-04-03 22:01:43 +08:00
+								    workflow_json = make_workflow_yaml(pipeline=pipeline, workflow_label=workflow_label, hubsecret_list=hubsecret_list, dag_templates=make_dag_template(), containers_templates=containers_template,dbsession=dbsession)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    # 先这是某个模板变量不进行渲染，一直向后传递到argo
 								    pipeline_file = json.dumps(workflow_json,ensure_ascii=False,indent=4)
 								    # print(pipeline_file)
 								    pipeline_file = template_str(pipeline_file)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    return pipeline_file, workflow_label['run-id']
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								# @pysnooper.snoop(watch_explode=())
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
+								def run_pipeline(pipeline, workflow_json):
 								    cluster = pipeline.project.cluster
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    crd_name = workflow_json.get('metadata', {}).get('name', '')
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    from myapp.utils.py.py_k8s import K8s
 								    k8s_client = K8s(cluster.get('KUBECONFIG', ''))
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    namespace = workflow_json.get('metadata', {}).get("namespace", conf.get('PIPELINE_NAMESPACE'))
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    crd_info = conf.get('CRD_INFO', {}).get('workflow', {})
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    try:
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        workflow_obj = k8s_client.get_one_crd(group=crd_info['group'], version=crd_info['version'], plural=crd_info['plural'],namespace=namespace, name=crd_name)
 								        if workflow_obj:
 								            k8s_client.delete_crd(group=crd_info['group'], version=crd_info['version'], plural=crd_info['plural'],namespace=namespace, name=crd_name)
 								            time.sleep(1)
 								        crd = k8s_client.create_crd(group=crd_info['group'], version=crd_info['version'], plural=crd_info['plural'],namespace=namespace, body=workflow_json)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    except Exception as e:
 								        print(e)
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    return crd_name
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								class Pipeline_ModelView_Base():
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    label_title = _('任务流')
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    datamodel = SQLAInterface(Pipeline)
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    base_permissions = ['can_show', 'can_edit', 'can_list', 'can_delete', 'can_add']
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    base_order = ("changed_on", "desc")
 								    # order_columns = ['id','changed_on']
 								    order_columns = ['id']
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    list_columns = ['id', 'project', 'pipeline_url', 'creator', 'modified']
 								    cols_width = {
 								        "id": {"type": "ellip2", "width": 100},
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
+								        "project": {"type": "ellip2", "width": 200},
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        "pipeline_url": {"type": "ellip2", "width": 400},
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
+								        "modified": {"type": "ellip2", "width": 150}
 								    }
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								    spec_label_columns={
 								        "parameter":_("后端扩展"),
 								        "expand":_("前端扩展")
 								    }
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    add_columns = ['project', 'name', 'describe']
 								    edit_columns = ['project', 'name', 'describe', 'schedule_type', 'cron_time', 'depends_on_past', 'max_active_runs',
 								                    'expired_limit', 'parallelism', 'global_env', 'alert_status', 'alert_user', 'parameter',
 								                    'cronjob_start_time']
 								    show_columns = ['project', 'name', 'describe', 'schedule_type', 'cron_time', 'depends_on_past', 'max_active_runs',
 								                    'expired_limit', 'parallelism', 'global_env', 'dag_json', 'pipeline_file', 'pipeline_argo_id',
 								                    'run_id', 'created_by', 'changed_by', 'created_on', 'changed_on', 'expand',
 								                    'parameter', 'alert_status', 'alert_user', 'cronjob_start_time']
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
+								    # show_columns = ['project','name','describe','schedule_type','cron_time','depends_on_past','max_active_runs','parallelism','global_env','dag_json','pipeline_file_html','pipeline_argo_id','version_id','run_id','created_by','changed_by','created_on','changed_on','expand']
 								    search_columns = ['id', 'created_by', 'name', 'describe', 'schedule_type', 'project']
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
-												remove invalid comments

											
										
										
											2022-08-11 10:47:08 +08:00
+								    base_filters = [["id", Pipeline_Filter, lambda: []]]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    conv = GeneralModelConverter(datamodel)
 								    add_form_extra_fields = {
 								        "name": StringField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('名称'),
 								            description= _("英文名(小写字母、数字、- 组成)，最长50个字符"),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            widget=BS3TextFieldWidget(),
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            validators=[Regexp("^[a-z][a-z0-9\-]*[a-z0-9]$"), Length(1, 54), DataRequired()]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        ),
-												体验修复

											
										
										
											2022-07-26 20:47:49 +08:00
+								        "describe": StringField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _("描述"),
 								            description="",
-												体验修复

											
										
										
											2022-07-26 20:47:49 +08:00
+								            widget=BS3TextFieldWidget(),
 								            validators=[DataRequired()]
 								        ),
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        "project": QuerySelectField(
 								            _('项目组'),
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								            query_factory=filter_join_org_project,
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            allow_blank=True,
 								            widget=Select2Widget()
 								        ),
 								        "dag_json": StringField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('上下游关系'),
-												add cache

											
										
										
											2022-08-28 20:24:10 +08:00
+								            default='{}',
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								            description=_("任务的上下游关系，目前不需要手动修改"),
 								            widget=MyBS3TextAreaFieldWidget(rows=10,is_json=True),  # 传给widget函数的是外层的field对象，以及widget函数的参数
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        ),
 								        "namespace": StringField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('命名空间'),
 								            description= _("部署task所在的命名空间(目前无需填写)"),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            default='pipeline',
 								            widget=BS3TextFieldWidget()
 								        ),
 								        "node_selector": StringField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('机器选择'),
 								            description= _("部署task所在的机器(目前无需填写)"),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            widget=BS3TextFieldWidget(),
 								            default=datamodel.obj.node_selector.default.arg
 								        ),
 								        "image_pull_policy": SelectField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('拉取策略'),
 								            description= _("镜像拉取策略(always为总是拉取远程镜像，IfNotPresent为若本地存在则使用本地镜像)"),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            widget=Select2Widget(),
-												add cache

											
										
										
											2022-08-28 20:24:10 +08:00
+								            default='Always',
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            choices=[['Always', 'Always'], ['IfNotPresent', 'IfNotPresent']]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        ),
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
 								        "depends_on_past": BooleanField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('过往依赖'),
 								            description= _("任务运行是否依赖上一次的示例状态"),
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								            default=True
 								        ),
 								        "max_active_runs": IntegerField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('最大激活数'),
 								            description= _("当前pipeline可同时运行的任务流实例数目"),
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								            widget=BS3TextFieldWidget(),
 								            default=1,
 								            validators=[DataRequired()]
 								        ),
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								        "expired_limit": IntegerField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('过期保留数'),
 								            description= _("定时调度最新实例限制数目，0表示不限制"),
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								            widget=BS3TextFieldWidget(),
 								            default=1,
 								            validators=[DataRequired()]
 								        ),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        "parallelism": IntegerField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('并发数'),
 								            description= _("一个任务流实例中可同时运行的task数目"),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            widget=BS3TextFieldWidget(),
 								            default=3,
 								            validators=[DataRequired()]
 								        ),
 								        "global_env": StringField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('全局环境变量'),
 								            description= _("公共环境变量会以环境变量的形式传递给每个task，可以配置多个公共环境变量，每行一个，支持datetime/creator/runner/uuid/pipeline_id等变量 例如：USERNAME={{creator}}"),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            widget=BS3TextAreaFieldWidget()
 								        ),
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        "schedule_type": SelectField(
 								            _('调度类型'),
-												体验修复

											
										
										
											2022-07-26 20:47:49 +08:00
+								            default='once',
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            description= _("调度类型，once仅运行一次，crontab周期运行，crontab配置保存一个小时候后才生效"),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            widget=Select2Widget(),
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            choices=[['once', 'once'], ['crontab', 'crontab']]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        ),
 								        "cron_time": StringField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            _('调度周期'),
 								            description= _("周期任务的时间设定 * * * * * 表示为 minute hour day month week"),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            widget=BS3TextFieldWidget()
 								        ),
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        "alert_status": MySelectMultipleField(
 								            label= _('监听状态'),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            widget=Select2ManyWidget(),
 								            choices=[[x, x] for x in
 								                     ['Created', 'Pending', 'Running', 'Succeeded', 'Failed', 'Unknown', 'Waiting', 'Terminated']],
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            description= _("选择通知状态"),
 								            validators=[Length(0, 400), ]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        ),
 								        "alert_user": StringField(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            label= _('报警用户'),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            widget=BS3TextFieldWidget(),
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            description= _("选择通知用户，每个用户使用逗号分隔")
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								        ),
 								        "parameter": StringField(
 								            _('后端扩展'),
 								            default='{}',
 								            description=_('后端扩展参数，用于配置是否为demo或固化任务流'),
 								            widget=MyBS3TextAreaFieldWidget(rows=10, is_json=True),  # 传给widget函数的是外层的field对象，以及widget函数的参数
 								        ),
 								        "expand": StringField(
 								            _('前端扩展'),
 								            default='{}',
 								            description=_('前端扩展参数，前端用于记录任务流节点位置和连线关系'),
 								            widget=MyBS3TextAreaFieldWidget(rows=10, is_json=True),  # 传给widget函数的是外层的field对象，以及widget函数的参数
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        )
 								    }
 								    edit_form_extra_fields = add_form_extra_fields
 								    related_views = [Task_ModelView, ]
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def delete_task_run(self, task):
-												修复部分显示bug

											
										
										
											2024-06-11 22:11:32 +08:00
+								        try:
 								            from myapp.utils.py.py_k8s import K8s
 								            k8s_client = K8s(task.pipeline.project.cluster.get('KUBECONFIG', ''))
 								            namespace = task.pipeline.namespace
 								            # 删除运行时容器
 								            pod_name = "run-" + task.pipeline.name.replace('_', '-') + "-" + task.name.replace('_', '-')
 								            pod_name = pod_name.lower()[:60].strip('-')
 								            pod = k8s_client.get_pods(namespace=namespace, pod_name=pod_name)
 								            # print(pod)
 								            if pod:
 								                pod = pod[0]
 								            # 有历史，直接删除
 								            if pod:
 								                k8s_client.delete_pods(namespace=namespace, pod_name=pod['name'])
 								                run_id = pod['labels'].get('run-id', '')
 								                if run_id:
 								                    k8s_client.delete_workflow(all_crd_info=conf.get("CRD_INFO", {}), namespace=namespace, run_id=run_id)
 								                    k8s_client.delete_pods(namespace=namespace, labels={"run-id": run_id})
 								                    time.sleep(2)
 								            # 删除debug容器
 								            pod_name = "debug-" + task.pipeline.name.replace('_', '-') + "-" + task.name.replace('_', '-')
 								            pod_name = pod_name.lower()[:60].strip('-')
 								            pod = k8s_client.get_pods(namespace=namespace, pod_name=pod_name)
 								            # print(pod)
 								            if pod:
 								                pod = pod[0]
 								            # 有历史，直接删除
 								            if pod:
 								                k8s_client.delete_pods(namespace=namespace, pod_name=pod['name'])
 								                run_id = pod['labels'].get('run-id', '')
 								                if run_id:
 								                    k8s_client.delete_workflow(all_crd_info=conf.get("CRD_INFO", {}), namespace=namespace, run_id=run_id)
 								                    k8s_client.delete_pods(namespace=namespace, labels={"run-id": run_id})
 								                    time.sleep(2)
 								        except Exception as e:
 								            print(e)
-												update pre_add_web follow base

											
										
										
											2022-11-23 17:01:10 +08:00
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								    # 检测是否具有编辑权限，只有creator和admin可以编辑
 								    def check_edit_permission(self, item):
-												升级20240901版本

											
										
										
											2024-11-10 18:50:51 +08:00
+								        if g.user and g.user.is_admin():
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								            return True
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        if g.user and g.user.username and hasattr(item, 'created_by'):
 								            if g.user.username == item.created_by.username:
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								                return True
-												升级20240901版本

											
										
										
											2024-11-10 18:50:51 +08:00
+								        # flash('just creator can edit/delete ', 'warning')
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								        return False
-												升级20240901版本

											
										
										
											2024-11-10 18:50:51 +08:00
+								    check_delete_permission = check_edit_permission
-												add cache

											
										
										
											2022-08-28 20:24:10 +08:00
+								    # 验证args参数,并自动排版dag_json
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    # @pysnooper.snoop(watch_explode=('item'))
 								    def pipeline_args_check(self, item):
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        core.validate_str(item.name, 'name')
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        if not item.dag_json:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            item.dag_json = '{}'
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        core.validate_json(item.dag_json)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        # 校验task的关系，没有闭环，并且顺序要对。没有配置的，自动没有上游，独立
 								        # @pysnooper.snoop()
 								        def order_by_upstream(dag_json):
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            order_dag = {}
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            tasks_name = list(dag_json.keys())  # 如果没有配全的话，可能只有局部的task
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            i = 0
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            while tasks_name:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                i += 1
 								                if i > 100:  # 不会有100个依赖关系
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                    break
 								                for task_name in tasks_name:
 								                    # 没有上游的情况
 								                    if not dag_json[task_name]:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                        order_dag[task_name] = {}
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                        tasks_name.remove(task_name)
 								                        continue
 								                    # 没有上游的情况
 								                    elif 'upstream' not in dag_json[task_name] or not dag_json[task_name]['upstream']:
 								                        order_dag[task_name] = {}
 								                        tasks_name.remove(task_name)
 								                        continue
 								                    # 如果有上游依赖的话，先看上游任务是否已经加到里面了。
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                    upstream_all_ready = True
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                    for upstream_task_name in dag_json[task_name]['upstream']:
 								                        if upstream_task_name not in order_dag:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                            upstream_all_ready = False
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                    if upstream_all_ready:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                        order_dag[task_name] = dag_json[task_name]
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                        tasks_name.remove(task_name)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            if list(dag_json.keys()).sort() != list(order_dag.keys()).sort():
 								                message = __('dag pipeline 存在循环或未知上游')
 								                flash(message, category='warning')
 								                raise MyappException(message)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            return order_dag
 								        # 配置上缺少的默认上游
 								        dag_json = json.loads(item.dag_json)
 								        tasks = item.get_tasks(db.session)
 								        if tasks and dag_json:
 								            for task in tasks:
 								                if task.name not in dag_json:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                    dag_json[task.name] = {
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                        "upstream": []
 								                    }
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        item.dag_json = json.dumps(order_by_upstream(copy.deepcopy(dag_json)), ensure_ascii=False, indent=4)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        # # 生成workflow，如果有id， 校验的时候，先不生成file
 								        # if item.id and item.get_tasks():
 								        #     item.pipeline_file,item.run_id = dag_to_pipeline(item,db.session,workflow_label={"schedule_type":"once"})
 								        # else:
 								        #     item.pipeline_file = None
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								    # 合并上下游关系
 								    # @pysnooper.snoop(watch_explode=('pipeline'))
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def merge_upstream(self, pipeline):
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        logging.info(pipeline)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        dag_json = {}
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        # 根据参数生成args字典。一层嵌套的形式
 								        for arg in pipeline.__dict__:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            if len(arg) > 5 and arg[:5] == 'task.':
 								                task_upstream = getattr(pipeline, arg)
 								                dag_json[arg[5:]] = {
 								                    "upstream": task_upstream if task_upstream else []
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                }
 								        if dag_json:
 								            pipeline.dag_json = json.dumps(dag_json)
-												add cache

											
										
										
											2022-08-28 20:24:10 +08:00
+								    # @pysnooper.snoop(watch_explode=('item'))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    def pre_add(self, item):
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        if not item.project or item.project.type != 'org':
 								            project = db.session.query(Project).filter_by(name='public').filter_by(type='org').first()
-												add default and search columns

											
										
										
											2022-08-18 15:17:44 +08:00
+								            if project:
 								                item.project = project
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        # 环境变量不能包含空格
 								        if item.global_env:
 								            pipeline_global_env = [env.strip() for env in item.global_env.split('\n') if '=' in env.strip()]
 								            for index,env in enumerate(pipeline_global_env):
 								                env = env.split('=')
 								                env = [x.strip() for x in env]
 								                pipeline_global_env[index]='='.join(env)
 								            item.global_env = '\n'.join(pipeline_global_env)
-												add cache

											
										
										
											2022-08-28 20:24:10 +08:00
-												fix

											
										
										
											2022-02-26 22:36:57 +08:00
+								        item.name = item.name.replace('_', '-')[0:54].lower().strip('-')
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								        item.namespace = json.loads(item.project.expand).get('PIPELINE_NAMESPACE', conf.get('PIPELINE_NAMESPACE','pipeline'))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        # item.alert_status = ','.join(item.alert_status)
 								        self.pipeline_args_check(item)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        item.create_datetime = datetime.datetime.now()
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        item.change_datetime = datetime.datetime.now()
-												add task skip and pipeline crontab time

											
										
										
											2022-09-09 21:17:03 +08:00
+								        item.cronjob_start_time = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
 								        item.parameter = json.dumps({}, indent=4, ensure_ascii=False)
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        # 检测crontab格式
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        if item.schedule_type == 'crontab':
 								            if not re.match("^[0-9/*]+ [0-9/*]+ [0-9/*]+ [0-9/*]+ [0-9/*]+", item.cron_time):
-												升级20240901版本

											
										
										
											2024-09-19 11:05:14 +08:00
+								                raise MyappException(__("crontab 格式错误"))
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                item.cron_time = ''
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
-												升级20240901版本

											
										
										
											2024-09-19 11:05:14 +08:00
+								    def pre_update_req(self,req_json=None,src_item=None,*args,**kwargs):
 								        if src_item and src_item.parameter:
 								            parameter = json.loads(src_item.parameter)
 								            if parameter.get("demo", 'false').lower() == 'true':
 								                raise MyappException(__("示例pipeline，不允许修改，请复制后编辑"))
 								        core.validate_json(req_json.get('expand','{}'))
 								    pre_add_req = pre_update_req
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    # @pysnooper.snoop()
 								    def pre_update(self, item):
 								        if item.expand:
 								            core.validate_json(item.expand)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            item.expand = json.dumps(json.loads(item.expand), indent=4, ensure_ascii=False)
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								        else:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            item.expand = '{}'
 								        # 环境变量不能包含空格
 								        if item.global_env:
 								            pipeline_global_env = [env.strip() for env in item.global_env.split('\n') if '=' in env.strip()]
 								            for index, env in enumerate(pipeline_global_env):
 								                env = env.split('=')
 								                env = [x.strip() for x in env]
 								                pipeline_global_env[index] = '='.join(env)
 								            item.global_env = '\n'.join(pipeline_global_env)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        item.name = item.name.replace('_', '-')[0:54].lower()
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								        item.namespace = json.loads(item.project.expand).get('PIPELINE_NAMESPACE', conf.get('PIPELINE_NAMESPACE','pipeline'))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        # item.alert_status = ','.join(item.alert_status)
 								        self.merge_upstream(item)
 								        self.pipeline_args_check(item)
 								        item.change_datetime = datetime.datetime.now()
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								        if item.parameter:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            item.parameter = json.dumps(json.loads(item.parameter), indent=4, ensure_ascii=False)
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								        else:
 								            item.parameter = '{}'
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								        if (item.schedule_type=='crontab' and self.src_item_json.get("schedule_type")=='once') or (item.cron_time!=self.src_item_json.get("cron_time",'')):
-												add task skip and pipeline crontab time

											
										
										
											2022-09-09 21:17:03 +08:00
+								            item.cronjob_start_time = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
-												升级20240901版本

											
										
										
											2024-09-19 11:05:14 +08:00
+								        # 把没必要的存储去掉
 								        expand = json.loads(item.expand)
 								        for node in expand:
 								            if 'data' in node and 'args' in node['data'].get("info",{}):
 								                del node['data']['info']['args']
 								        item.expand = json.dumps(expand)
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								        # 限制提醒
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        if item.schedule_type == 'crontab':
 								            if not item.cron_time or not re.match("^[0-9/*]+ [0-9/*]+ [0-9/*]+ [0-9/*]+ [0-9/*]+", item.cron_time.strip().replace('  ', ' ')):
 								                item.cron_time = ''
-												升级20240901版本

											
										
										
											2024-09-19 11:05:14 +08:00
+								                raise MyappException(__("crontab 格式错误"))
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
 								            org = item.project.org
 								            if not org or org == 'public':
 								                flash(__('无法保障公共集群的稳定性，定时任务请选择专门的日更集群项目组'), 'warning')
 								    def pre_update_web(self, item):
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        item.dag_json = item.fix_dag_json()
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        item.expand = json.dumps(item.fix_expand(), indent=4, ensure_ascii=False)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        db.session.commit()
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    # 删除前先把下面的task删除了，把里面的运行实例也删除了，把定时调度删除了
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    # @pysnooper.snoop()
 								    def pre_delete(self, pipeline):
 								        db.session.commit()
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        if __("(废弃)") not in pipeline.describe:
 								            pipeline.describe += __("(废弃)")
 								        pipeline.schedule_type = 'once'
 								        pipeline.expand = ""
 								        pipeline.dag_json = "{}"
-												add volume_mount config from project

											
										
										
											2021-11-25 18:07:40 +08:00
+								        db.session.commit()
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								        try:
 								            # 删除所有相关的运行中workflow
 								            back_crds = pipeline.get_workflow()
 								            self.delete_bind_crd(back_crds)
 								        except Exception as e:
 								            print(e)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        # 删除所有的任务
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								        try:
 								            tasks = pipeline.get_tasks()
 								            # 删除task启动的所有实例
 								            for task in tasks:
 								                self.delete_task_run(task)
 								        except Exception as e:
 								            print(e)
-												update pre_add_web follow base

											
										
										
											2022-11-23 17:01:10 +08:00
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        # 删除所有的workflow
-												修复部分显示bug

											
										
										
											2024-06-11 14:01:02 +08:00
+								        # 只是删除了数据库记录，但是实例并没有删除，会重新监听更新的。
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								        db.session.query(Task).filter_by(pipeline_id=pipeline.id).delete(synchronize_session=False)
 								        db.session.commit()
-												修复部分显示bug

											
										
										
											2024-06-11 14:01:02 +08:00
+								        db.session.query(Workflow).filter_by(foreign_key=str(pipeline.id)).delete(synchronize_session=False)
 								        db.session.commit()
 								        db.session.query(Workflow).filter(Workflow.labels.contains(f'"pipeline-id": "{str(pipeline.id)}"')).delete(synchronize_session=False)
 								        db.session.commit()
 								        db.session.query(RunHistory).filter_by(pipeline_id=pipeline.id).delete(synchronize_session=False)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        db.session.commit()
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								    @expose("/my/list/")
 								    def my(self):
 								        try:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            user_id = g.user.id
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								            if user_id:
 								                pipelines = db.session.query(Pipeline).filter_by(created_by_fk=user_id).all()
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                back = []
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								                for pipeline in pipelines:
 								                    back.append(pipeline.to_json())
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                return json_response(message='success', status=0, result=back)
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								        except Exception as e:
 								            print(e)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            return json_response(message=str(e), status=-1, result={})
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								    @expose("/demo/list/")
 								    def demo(self):
 								        try:
 								            pipelines = db.session.query(Pipeline).filter(Pipeline.parameter.contains('"demo": "true"')).all()
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            back = []
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								            for pipeline in pipelines:
 								                back.append(pipeline.to_json())
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            return json_response(message='success', status=0, result=back)
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								        except Exception as e:
 								            print(e)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            return json_response(message=str(e), status=-1, result={})
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
 								    # 删除手动发起的workflow，不删除定时任务发起的workflow
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def delete_bind_crd(self, crds):
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								        for crd in crds:
 								            try:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                run_id = json.loads(crd['labels']).get("run-id", '')
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								                if run_id:
 								                    # 定时任务发起的不能清理
 								                    run_history = db.session.query(RunHistory).filter_by(run_id=run_id).first()
 								                    if run_history:
 								                        continue
 								                    db_crd = db.session.query(Workflow).filter_by(name=crd['name']).first()
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                    if db_crd and db_crd.pipeline:
 								                        k8s_client = py_k8s.K8s(db_crd.pipeline.project.cluster.get('KUBECONFIG', ''))
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								                    else:
 								                        k8s_client = py_k8s.K8s()
 								                    k8s_client.delete_workflow(
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                        all_crd_info=conf.get("CRD_INFO", {}),
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								                        namespace=crd['namespace'],
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                        run_id=run_id
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								                    )
-												add volume_mount config from project

											
										
										
											2021-11-25 18:07:40 +08:00
+								                    # push_message(conf.get('ADMIN_USER', '').split(','),'%s手动运行新的pipeline %s，进而删除旧的pipeline run-id: %s' % (pipeline.created_by.username,pipeline.describe,run_id,))
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								                    if db_crd:
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                        db_crd.status = 'Deleted'
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								                        db_crd.change_time = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
 								                        db.session.commit()
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            except Exception as e:
 								                print(e)
 								    def check_pipeline_perms(user_fun):
 								        # @pysnooper.snoop()
 								        def wraps(*args, **kwargs):
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            pipeline_id = int(kwargs.get('pipeline_id', '0'))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            if not pipeline_id:
 								                response = make_response("pipeline_id not exist")
 								                response.status_code = 404
 								                return response
 								            user_roles = [role.name.lower() for role in g.user.roles]
 								            if "admin" in user_roles:
 								                return user_fun(*args, **kwargs)
 								            join_projects_id = security_manager.get_join_projects_id(db.session)
 								            pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
 								            if pipeline.project.id in join_projects_id:
 								                return user_fun(*args, **kwargs)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            response = make_response("no perms to run pipeline %s" % pipeline_id)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								            response.status_code = 403
 								            return response
 								        return wraps
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    # 保存pipeline正在运行的workflow信息
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def save_workflow(self, back_crds):
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        # 把消息加入到源数据库
 								        for crd in back_crds:
 								            try:
 								                workflow = db.session.query(Workflow).filter_by(name=crd['name']).first()
 								                if not workflow:
 								                    username = ''
-												fix pipeline api

											
										
										
											2021-09-08 16:43:34 +08:00
+								                    labels = json.loads(crd['labels'])
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                    if 'run-rtx' in labels:
 								                        username = labels['run-rtx']
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
+								                    elif 'pipeline-rtx' in labels:
 								                        username = labels['pipeline-rtx']
-												修正strip()的bug

											
										
										
											2024-06-30 11:34:35 +08:00
+								                    elif 'run-username' in labels:
 								                        username = labels['run-username']
 								                    elif 'pipeline-username' in labels:
 								                        username = labels['pipeline-username']
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								                    workflow = Workflow(name=crd['name'], namespace=crd['namespace'], create_time=crd['create_time'],
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								                                        cluster=labels.get("cluster", ''),
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								                                        status=crd['status'],
 								                                        annotations=crd['annotations'],
 								                                        labels=crd['labels'],
 								                                        spec=crd['spec'],
 								                                        status_more=crd['status_more'],
 								                                        username=username
 								                                        )
 								                    db.session.add(workflow)
 								                    db.session.commit()
 								            except Exception as e:
 								                print(e)
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								    # @event_logger.log_this
 								    @expose("/run_pipeline/<pipeline_id>", methods=["GET", "POST"])
 								    @check_pipeline_perms
-												修正strip()的bug

											
										
										
											2024-06-30 11:34:35 +08:00
+								    # @pysnooper.snoop()
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def run_pipeline(self, pipeline_id):
-												修正strip()的bug

											
										
										
											2024-06-30 11:34:35 +08:00
+								        # print(pipeline_id)
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
 								        pipeline.delete_old_task()
 								        tasks = db.session.query(Task).filter_by(pipeline_id=pipeline_id).all()
 								        if not tasks:
 								            flash('no task', 'warning')
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
+								            return redirect('/pipeline_modelview/api/web/%s' % pipeline.id)
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
 								        time.sleep(1)
 								        back_crds = pipeline.get_workflow()
 								        # 添加会和watch中的重复
 								        # if back_crds:
 								        #     self.save_workflow(back_crds)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        # 这里直接删除所有的历史任务流，正在运行的也删除掉
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								        # not_running_crds = back_crds  # [crd for crd in back_crds if 'running' not in crd['status'].lower()]
 								        self.delete_bind_crd(back_crds)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												update pre_add_web follow base

											
										
										
											2022-11-23 17:01:10 +08:00
+								        # 删除task启动的所有实例
 								        for task in tasks:
 								            self.delete_task_run(task)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        # self.delete_workflow(pipeline)
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        pipeline.pipeline_file,pipeline.run_id = dag_to_pipeline(pipeline, db.session,workflow_label={"schedule_type":"once"})  # 合成workflow
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        # print('make pipeline file %s' % pipeline.pipeline_file)
 								        # return
 								        print('begin upload and run pipeline %s' % pipeline.name)
 								        pipeline.version_id = ''
-												修复部分显示bug

											
										
										
											2024-06-11 14:01:02 +08:00
+								        if not pipeline.pipeline_file:
 								            flash("请先编排任务，并进行保存后再运行整个任务流",'warning')
 								            return redirect('/pipeline_modelview/api/web/%s' % pipeline.id)
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
+								        crd_name = run_pipeline(pipeline, json.loads(pipeline.pipeline_file))  # 会根据版本号是否为空决定是否上传
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        pipeline.pipeline_argo_id = crd_name
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        db.session.commit()  # 更新
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        # back_crds = pipeline.get_workflow()
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        # 添加会和watch中的重复
 								        # if back_crds:
 								        #     self.save_workflow(back_crds)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
+								        return redirect("/pipeline_modelview/api/web/log/%s" % pipeline_id)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        # return redirect(run_url)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    # # @event_logger.log_this
 								    @expose("/web/<pipeline_id>", methods=["GET"])
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    # @pysnooper.snoop()
 								    def web(self, pipeline_id):
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
-												添加pipeline自动排版

											
										
										
											2022-06-04 17:38:54 +08:00
+								        pipeline.dag_json = pipeline.fix_dag_json()  # 修正 dag_json
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        pipeline.expand = json.dumps(pipeline.fix_expand(), indent=4, ensure_ascii=False)  # 修正 前端expand字段缺失
-												添加pipeline自动排版

											
										
										
											2022-06-04 17:38:54 +08:00
+								        pipeline.expand = json.dumps(pipeline.fix_position(), indent=4, ensure_ascii=False)  # 修正 节点中心位置到视图中间
-												修复部分初始化功能

											
										
										
											2022-06-05 17:16:36 +08:00
+								        # # 自动排版
 								        # db_tasks = pipeline.get_tasks(db.session)
 								        # if db_tasks:
 								        #     try:
 								        #         tasks={}
 								        #         for task in db_tasks:
 								        #             tasks[task.name]=task.to_json()
 								        #         expand = core.fix_task_position(pipeline.to_json(),tasks,json.loads(pipeline.expand))
 								        #         pipeline.expand=json.dumps(expand,indent=4,ensure_ascii=False)
 								        #         db.session.commit()
 								        #     except Exception as e:
 								        #         print(e)
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
 								        db.session.commit()
-												修正strip()的bug

											
										
										
											2024-06-30 11:34:35 +08:00
+								        # print(pipeline_id)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        url = '/static/appbuilder/vison/index.html?pipeline_id=%s' % pipeline_id  # 前后端集成完毕，这里需要修改掉
 								        return redirect('/frontend/showOutLink?url=%s' % urllib.parse.quote(url, safe=""))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        # 返回模板
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
+								        # return self.render_template('link.html', data=data)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								    # # @event_logger.log_this
 								    @expose("/web/log/<pipeline_id>", methods=["GET"])
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def web_log(self, pipeline_id):
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        namespace = pipeline.namespace
 								        workflow_name = pipeline.pipeline_argo_id
 								        cluster = pipeline.project.cluster["NAME"]
 								        url = f'/frontend/commonRelation?backurl=/workflow_modelview/api/web/dag/{cluster}/{namespace}/{workflow_name}'
 								        return redirect(url)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								    # # @event_logger.log_this
 								    @expose("/web/monitoring/<pipeline_id>", methods=["GET"])
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def web_monitoring(self, pipeline_id):
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								        pipeline = db.session.query(Pipeline).filter_by(id=int(pipeline_id)).first()
-												修复部分显示bug

											
										
										
											2024-06-11 14:01:02 +08:00
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								        url = "http://"+pipeline.project.cluster.get('HOST', request.host).split('|')[-1]+conf.get('GRAFANA_TASK_PATH')+ pipeline.name
-												修复部分显示bug

											
										
										
											2024-06-11 14:01:02 +08:00
+								        return redirect(url)
 								        # else:
 								        #     flash('no running instance', 'warning')
 								        #     return redirect('/pipeline_modelview/api/web/%s' % pipeline.id)
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    # # @event_logger.log_this
 								    @expose("/web/pod/<pipeline_id>", methods=["GET"])
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def web_pod(self, pipeline_id):
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								        return redirect(f'/k8s/web/search/{pipeline.project.cluster["NAME"]}/{conf.get("PIPELINE_NAMESPACE","pipeline")}/{pipeline.name.replace("_", "-").lower()}')
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
 								        # data = {
 								        #     "url": "//" + pipeline.project.cluster.get('HOST', request.host) + conf.get('K8S_DASHBOARD_CLUSTER') + '#/search?namespace=%s&q=%s' % (conf.get('PIPELINE_NAMESPACE'), pipeline.name.replace('_', '-').lower()),
 								        #     "target":"div.kd-chrome-container.kd-bg-background",
 								        #     "delay":500,
 								        #     "loading": True
 								        # }
 								        # # 返回模板
 								        # if pipeline.project.cluster['NAME'] == conf.get('ENVIRONMENT'):
 								        #     return self.render_template('link.html', data=data)
 								        # else:
 								        #     return self.render_template('external_link.html', data=data)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												修改水印和pipeline跳转链接

											
										
										
											2022-08-02 17:21:35 +08:00
+								    @expose("/web/runhistory/<pipeline_id>", methods=["GET"])
 								    def web_runhistory(self,pipeline_id):
-												delete kubeflow pipeline

											
										
										
											2023-04-06 23:04:34 +08:00
+								        url = conf.get('MODEL_URLS', {}).get('runhistory', '') + '?filter=' + urllib.parse.quote(json.dumps([{"key": "pipeline", "value": int(pipeline_id)}], ensure_ascii=False))
-												修正strip()的bug

											
										
										
											2024-06-30 11:34:35 +08:00
+								        # print(url)
-												修改水印和pipeline跳转链接

											
										
										
											2022-08-02 17:21:35 +08:00
+								        return redirect(url)
 								    @expose("/web/workflow/<pipeline_id>", methods=["GET"])
 								    def web_workflow(self,pipeline_id):
-												更新pipeline跳转

											
										
										
											2022-08-03 10:14:20 +08:00
+								        url = conf.get('MODEL_URLS', {}).get('workflow', '') + '?filter=' + urllib.parse.quote(json.dumps([{"key": "labels", "value": '"pipeline-id": "%s"'%pipeline_id}], ensure_ascii=False))
-												修正strip()的bug

											
										
										
											2024-06-30 11:34:35 +08:00
+								        # print(url)
-												修改水印和pipeline跳转链接

											
										
										
											2022-08-02 17:21:35 +08:00
+								        return redirect(url)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												fix bug

											
										
										
											2021-10-14 17:35:48 +08:00
+								    # @pysnooper.snoop(watch_explode=('expand'))
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def copy_db(self, pipeline):
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								        new_pipeline = pipeline.clone()
 								        expand = json.loads(pipeline.expand) if pipeline.expand else {}
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
+								        new_pipeline.name = new_pipeline.name.replace('_', '-') + "-" + uuid.uuid4().hex[:4]
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
+								        if 'copy' not in new_pipeline.describe:
 								            new_pipeline.describe = new_pipeline.describe+"(copy)"
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								        new_pipeline.created_on = datetime.datetime.now()
 								        new_pipeline.changed_on = datetime.datetime.now()
 								        db.session.add(new_pipeline)
 								        db.session.commit()
 								        def change_node(src_task_id, des_task_id):
 								            for node in expand:
 								                if 'source' not in node:
 								                    # 位置信息换成新task的id
 								                    if int(node['id']) == int(src_task_id):
 								                        node['id'] = str(des_task_id)
 								                else:
 								                    if int(node['source']) == int(src_task_id):
 								                        node['source'] = str(des_task_id)
 								                    if int(node['target']) == int(src_task_id):
 								                        node['target'] = str(des_task_id)
 								        # 复制绑定的task，并绑定新的pipeline
 								        for task in pipeline.get_tasks():
 								            new_task = task.clone()
 								            new_task.pipeline_id = new_pipeline.id
 								            new_task.create_datetime = datetime.datetime.now()
 								            new_task.change_datetime = datetime.datetime.now()
 								            db.session.add(new_task)
 								            db.session.commit()
 								            change_node(task.id, new_task.id)
 								        new_pipeline.expand = json.dumps(expand)
-												修复部分显示bug

											
										
										
											2024-06-11 14:01:02 +08:00
+								        new_pipeline.parameter="{}" # 扩展参数不进行复制，这样demo的pipeline不会被复制一遍
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								        db.session.commit()
 								        return new_pipeline
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								    # # @event_logger.log_this
 								    @expose("/copy_pipeline/<pipeline_id>", methods=["GET", "POST"])
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    def copy_pipeline(self, pipeline_id):
-												修正strip()的bug

											
										
										
											2024-06-30 11:34:35 +08:00
+								        # print(pipeline_id)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								        message = ''
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        try:
 								            pipeline = db.session.query(Pipeline).filter_by(id=pipeline_id).first()
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								            new_pipeline = self.copy_db(pipeline)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            # return jsonify(new_pipeline.to_json())
-												支持containerd运行态

											
										
										
											2024-01-03 22:40:42 +08:00
+								            return redirect('/pipeline_modelview/api/web/%s'%new_pipeline.id)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        except InvalidRequestError:
 								            db.session.rollback()
 								        except Exception as e:
 								            logging.error(e)
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								            message = str(e)
 								        response = make_response("copy pipeline %s error: %s" % (pipeline_id, message))
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        response.status_code = 500
 								        return response
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    @action("copy", "复制", confirmation= '复制所选记录?', icon="fa-copy", multiple=True, single=False)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    def copy(self, pipelines):
 								        if not isinstance(pipelines, list):
 								            pipelines = [pipelines]
 								        try:
 								            for pipeline in pipelines:
-												update model and view

											
										
										
											2021-09-07 18:09:47 +08:00
+								                self.copy_db(pipeline)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								        except InvalidRequestError:
 								            db.session.rollback()
 								        except Exception as e:
 								            logging.error(e)
 								            raise e
 								        return redirect(request.referrer)
-												升级20240901版本

											
										
										
											2024-11-10 18:50:51 +08:00
+								class Pipeline_ModelView(Pipeline_ModelView_Base, MyappModelView):
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    datamodel = SQLAInterface(Pipeline)
 								    # base_order = ("changed_on", "desc")
 								    # order_columns = ['changed_on']
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
+								    @action("muldelete", "删除", "确定删除所选记录?", "fa-trash", single=False)
 								    def muldelete(self, items):
 								        return self._muldelete(items)
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								# 添加api
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								class Pipeline_ModelView_Api(Pipeline_ModelView_Base, MyappModelRestApi):
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
+								    datamodel = SQLAInterface(Pipeline)
 								    route_base = '/pipeline_modelview/api'
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    # show_columns = ['project','name','describe','namespace','schedule_type','cron_time','node_selector','depends_on_past','max_active_runs','parallelism','global_env','dag_json','pipeline_file_html','pipeline_argo_id','run_id','created_by','changed_by','created_on','changed_on','expand']
 								    list_columns = ['id', 'project', 'pipeline_url', 'creator', 'modified']
 								    add_columns = ['project', 'name', 'describe']
 								    edit_columns = ['project', 'name', 'describe', 'schedule_type', 'cron_time', 'depends_on_past', 'max_active_runs',
 								                    'expired_limit', 'parallelism', 'dag_json', 'global_env', 'alert_status', 'alert_user', 'expand',
 								                    'parameter','cronjob_start_time']
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    related_views = [Task_ModelView_Api, ]
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
-												update pre_add_web follow base

											
										
										
											2022-11-23 17:01:10 +08:00
+								    def pre_add_web(self):
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
+								        self.default_filter = {
 								            "created_by": g.user.id
 								        }
 								    add_form_query_rel_fields = {
 								        "project": [["name", Project_Join_Filter, 'org']]
 								    }
-												支持中英文国际化，接口监控

											
										
										
											2023-12-11 13:26:00 +08:00
+								    edit_form_query_rel_fields = add_form_query_rel_fields
-												添加hive离线表/指标/维表/数据集/数据etl/模型管理功能

											
										
										
											2022-08-02 16:02:22 +08:00
-												deploy

											
										
										
											2021-08-17 17:00:34 +08:00
 								appbuilder.add_api(Pipeline_ModelView_Api)
-												升级20250101版本

											
										
										
											2025-02-15 21:30:29 +08:00
 								class Pipeline_ModelView_Home_Api(Pipeline_ModelView_Api):
 								    datamodel = SQLAInterface(Pipeline)
 								    route_base = '/pipeline_modelview/home/api'
 								    list_columns = ['id', 'project', 'pipeline_url', 'creator', 'modified', 'changed_on', 'describe']
 								appbuilder.add_api(Pipeline_ModelView_Home_Api)