{"id":15934886,"url":"https://github.com/pinto0309/tvm-build","last_synced_at":"2026-05-10T02:53:43.314Z","repository":{"id":97173298,"uuid":"462595841","full_name":"PINTO0309/tvm-build","owner":"PINTO0309","description":"TVM build and run test environment","archived":false,"fork":false,"pushed_at":"2022-02-25T08:01:27.000Z","size":279,"stargazers_count":3,"open_issues_count":0,"forks_count":1,"subscribers_count":3,"default_branch":"main","last_synced_at":"2024-10-29T08:21:10.222Z","etag":null,"topics":["docker","onnx","pytorch","tensorflow","tflite","tvm"],"latest_commit_sha":null,"homepage":"","language":"Dockerfile","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"apache-2.0","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/PINTO0309.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2022-02-23T05:35:35.000Z","updated_at":"2022-08-05T14:40:02.000Z","dependencies_parsed_at":null,"dependency_job_id":"a67e84d9-8186-488e-a902-531a8aeb87ad","html_url":"https://github.com/PINTO0309/tvm-build","commit_stats":{"total_commits":30,"total_committers":1,"mean_commits":30.0,"dds":0.0,"last_synced_commit":"366bca1794f80436c0825baa1ff10ca03f6bd577"},"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/PINTO0309%2Ftvm-build","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/PINTO0309%2Ftvm-build/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/PINTO0309%2Ftvm-build/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/PINTO0309%2Ftvm-build/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/PINTO0309","download_url":"https://codeload.github.com/PINTO0309/tvm-build/tar.gz/refs/heads/main","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":247024152,"owners_count":20870940,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["docker","onnx","pytorch","tensorflow","tflite","tvm"],"created_at":"2024-10-07T03:21:33.735Z","updated_at":"2026-05-10T02:53:43.281Z","avatar_url":"https://github.com/PINTO0309.png","language":"Dockerfile","funding_links":[],"categories":[],"sub_categories":[],"readme":"# tvm-build\n1. https://github.com/apache/tvm\n2. https://tvm.apache.org/docs/tutorial/install.html\n## 1. Pull\n```bash\ndocker pull pinto0309/ubuntu2004-cuda114-cudnn8-tensorrt823-tvm:09dev0\n```\n## 2. Build\n```bash\ndocker build -t pinto0309/ubuntu2004-cuda114-cudnn8-tensorrt823-tvm:09dev0 .\n```\n## 3. Run\n```bash\ndocker run --rm -it --gpus all \\\n-v `pwd`:/home/user/workdir \\\npinto0309/ubuntu2004-cuda114-cudnn8-tensorrt823-tvm:09dev0\n```\n## 4. TVM Summary\n\n\u003cdetails\u003e\u003csummary\u003eBuild summary\u003c/summary\u003e\u003cdiv\u003e\n\n```\n--   ---------------- Summary ----------------\n--   CMake version         : 3.16.3\n--   CMake executable      : /usr/bin/cmake\n--   Generator             : Ninja\n--   System                : Linux\n--   C++ compiler          : /usr/bin/c++\n--   C++ compiler ID       : GNU\n--   C++ compiler version  : 9.3.0\n--   CXX flags             : -std=c++14 -faligned-new -O2 -Wall -fPIC \n--   Build type            : \n--   Compile definitions   : TVM_INDEX_DEFAULT_I64=1;USE_PROFILER=1;TVM_THREADPOOL_USE_OPENMP=0;DMLC_USE_FOPEN64=0;NDEBUG=1;_GNU_SOURCE;__STDC_CONSTANT_MACROS;__STDC_FORMAT_MACROS;__STDC_LIMIT_MACROS;TVM_LLVM_VERSION=140;USE_DNNL=1;TF_TVMDSOOP_ENABLE_GPU;PT_TVMDSOOP_ENABLE_GPU;TVM_GRAPH_EXECUTOR_TENSORRT\n--   Options:\n--    BUILD_STATIC_RUNTIME               : ON\n--    COMPILER_RT_PATH                   : 3rdparty/compiler-rt\n--    DLPACK_PATH                        : 3rdparty/dlpack/include\n--    DMLC_PATH                          : 3rdparty/dmlc-core/include\n--    HIDE_PRIVATE_SYMBOLS               : OFF\n--    INDEX_DEFAULT_I64                  : ON\n--    INSTALL_DEV                        : OFF\n--    PICOJSON_PATH                      : 3rdparty/picojson\n--    RANG_PATH                          : 3rdparty/rang/include\n--    ROCM_PATH                          : /opt/rocm\n--    SUMMARIZE                          : ON\n--    USE_ARM_COMPUTE_LIB                : OFF\n--    USE_ARM_COMPUTE_LIB_GRAPH_EXECUTOR : OFF\n--    USE_BLAS                           : none\n--    USE_BNNS                           : OFF\n--    USE_BYODT_POSIT                    : OFF\n--    USE_CMSISNN                        : OFF\n--    USE_COREML                         : OFF\n--    USE_CPP_RPC                        : ON\n--    USE_CUBLAS                         : OFF\n--    USE_CUDA                           : ON\n--    USE_CUDNN                          : ON\n--    USE_CUTLASS                        : OFF\n--    USE_DNNL_CODEGEN                   : OFF\n--    USE_ETHOSN                         : OFF\n--    USE_FALLBACK_STL_MAP               : OFF\n--    USE_GRAPH_EXECUTOR                 : ON\n--    USE_GRAPH_EXECUTOR_CUDA_GRAPH      : ON\n--    USE_GTEST                          : AUTO\n--    USE_HEXAGON_DEVICE                 : OFF\n--    USE_HEXAGON_RPC                    : OFF\n--    USE_HEXAGON_SDK                    : /path/to/sdk\n--    USE_IOS_RPC                        : OFF\n--    USE_LIBBACKTRACE                   : ON\n--    USE_LLVM                           : ON\n--    USE_METAL                          : OFF\n--    USE_MICRO                          : OFF\n--    USE_MICRO_STANDALONE_RUNTIME       : OFF\n--    USE_MIOPEN                         : OFF\n--    USE_MKL                            : OFF\n--    USE_MKLDNN                         : ON\n--    USE_MSVC_MT                        : OFF\n--    USE_NNPACK                         : ON\n--    USE_OPENCL                         : OFF\n--    USE_OPENMP                         : ON\n--    USE_PAPI                           : OFF\n--    USE_PROFILER                       : ON\n--    USE_PT_TVMDSOOP                    : ON\n--    USE_RANDOM                         : ON\n--    USE_RELAY_DEBUG                    : OFF\n--    USE_ROCBLAS                        : OFF\n--    USE_ROCM                           : OFF\n--    USE_RPC                            : ON\n--    USE_RTTI                           : ON\n--    USE_RUST_EXT                       : OFF\n--    USE_SORT                           : ON\n--    USE_STACKVM_RUNTIME                : OFF\n--    USE_TARGET_ONNX                    : ON\n--    USE_TENSORFLOW_PATH                : none\n--    USE_TENSORRT_CODEGEN               : ON\n--    USE_TENSORRT_RUNTIME               : ON\n--    USE_TFLITE                         : OFF\n--    USE_TF_TVMDSOOP                    : ON\n--    USE_THREADS                        : ON\n--    USE_THRUST                         : OFF\n--    USE_VITIS_AI                       : OFF\n--    USE_VULKAN                         : OFF\n```\n\n\u003c/div\u003e\u003c/details\u003e\n\n## 5. Environment\n\n\u003cdetails\u003e\u003csummary\u003eList of installed tools\u003c/summary\u003e\u003cdiv\u003e\n\n```\nTVM v0.9.dev0\nPython 3.8+\nTensorFlow v2.8.0+\nPyTorch v1.10.0+\nTorchVision\nTorchAudio\nOpenVINO 2021.4.582+\nTensorRT 8.2+\ntrtexec\npycuda 2021.1\ntensorflowjs\ncoremltools\npaddle2onnx\nonnx\nonnxruntime\nonnxruntime-extensions\nonnx_graphsurgeon\nonnx-simplifier\nonnxconverter-common\nonnxmltools\nonnx-tensorrt\nonnx2json\njson2onnx\ntf2onnx\ntorch2trt\nonnx-tf\ntensorflow-datasets\ntf_slim\nedgetpu_compiler\ntflite2tensorflow\nopenvino2tensorflow\ngdown\npandas\nmatplotlib\npaddlepaddle\npaddle2onnx\npycocotools\nscipy\nIntel-Media-SDK\nIntel iHD GPU (iGPU) support\nOpenCL\n```\n\n\u003c/div\u003e\u003c/details\u003e\n\n## 6. Tutorial\n### 6-1. tvmc\nhttps://tvm.apache.org/docs/tutorial/tvmc_command_line_driver.html#compiling-and-optimizing-a-model-with-tvmc\n```bash\n$ python -m tvm.driver.tvmc\nusage: tvmc [-v] [--version] [-h] {run,tune,compile} ...\n\nTVM compiler driver\n\noptional arguments:\n  -v, --verbose       increase verbosity\n  --version           print the version and exit\n  -h, --help          show this help message and exit.\n\ncommands:\n  {run,tune,compile}\n    run               run a compiled module\n    tune              auto-tune a model\n    compile           compile a model.\n\nTVMC - TVM driver command-line interface\n```\n```bash\n$ wget https://github.com/onnx/models/raw/main/vision/classification/resnet/model/resnet50-v2-7.onnx\n\n$ python -m tvm.driver.tvmc compile \\\n--target \"llvm\" \\\n--output resnet50-v2-7-tvm.tar \\\nresnet50-v2-7.onnx\n\nOne or more operators have not been tuned. Please tune your model for better performance. Use DEBUG logging level to see more details.\n```\n![image](https://user-images.githubusercontent.com/33194443/155353724-b440fc7c-60e7-41fd-b684-5ef33021c556.png)\n```bash\n$ mkdir model\n$ tar -xvf resnet50-v2-7-tvm.tar -C model\n$ ls -l model\n\ntotal 100496\n-rw-r--r-- 1 user user     89142 Feb 23 15:41 mod.json\n-rw-r--r-- 1 user user 102125470 Feb 23 15:41 mod.params\n-rwxr-xr-x 1 user user    685072 Feb 23 15:41 mod.so\n```\n- **`mod.so`** is the model, represented as a C++ library, that can be loaded by the TVM runtime.\n- **`mod.json`** is a text representation of the TVM Relay computation graph.\n- **`mod.params`** is a file containing the parameters for the pre-trained model.\n\n![image](https://user-images.githubusercontent.com/33194443/155355104-34b6f069-c136-4492-ac2d-6d1cba4d2b47.png)\n- preprocess.py\n  ```python\n  from tvm.contrib.download import download_testdata\n  from PIL import Image\n  import numpy as np\n\n  img_url = \"https://s3.amazonaws.com/model-server/inputs/kitten.jpg\"\n  img_path = download_testdata(img_url, \"imagenet_cat.png\", module=\"data\")\n\n  # Resize it to 224x224\n  resized_image = Image.open(img_path).resize((224, 224))\n  img_data = np.asarray(resized_image).astype(\"float32\")\n\n  # ONNX expects NCHW input, so convert the array\n  img_data = np.transpose(img_data, (2, 0, 1))\n\n  # Normalize according to ImageNet\n  imagenet_mean = np.array([0.485, 0.456, 0.406])\n  imagenet_stddev = np.array([0.229, 0.224, 0.225])\n  norm_img_data = np.zeros(img_data.shape).astype(\"float32\")\n  for i in range(img_data.shape[0]):\n      norm_img_data[i,:,:] = (img_data[i,:,:] / 255 - imagenet_mean[i]) / imagenet_stddev[i]\n\n  # Add batch dimension\n  img_data = np.expand_dims(norm_img_data, axis=0)\n\n  # Save to .npz (outputs imagenet_cat.npz)\n  np.savez(\"imagenet_cat\", data=img_data)\n  ```\n- kitten.jpg  \n  ![kitten](https://user-images.githubusercontent.com/33194443/155369334-7f836eeb-433d-4dbd-b433-2df1a4755edb.jpg)\n```bash\n$ python preprocess.py\n```\n![image](https://user-images.githubusercontent.com/33194443/155358586-854d785e-e2a6-41b2-812c-fe6e626187a6.png)\n```bash\n$ python -m tvm.driver.tvmc run \\\n--inputs imagenet_cat.npz \\\n--output predictions.npz \\\nresnet50-v2-7-tvm.tar\n```\n![image](https://user-images.githubusercontent.com/33194443/155358960-3dddde72-4fcb-4466-960b-78720bacdb3f.png)\n- postprocess.py\n  ```python\n  import os.path\n  import numpy as np\n\n  from scipy.special import softmax\n  from tvm.contrib.download import download_testdata\n\n  # Download a list of labels\n  labels_url = \"https://s3.amazonaws.com/onnx-model-zoo/synset.txt\"\n  labels_path = download_testdata(labels_url, \"synset.txt\", module=\"data\")\n\n  with open(labels_path, \"r\") as f:\n      labels = [l.rstrip() for l in f]\n\n  output_file = \"predictions.npz\"\n\n  # Open the output and read the output tensor\n  if os.path.exists(output_file):\n      with np.load(output_file) as data:\n          scores = softmax(data[\"output_0\"])\n          scores = np.squeeze(scores)\n          ranks = np.argsort(scores)[::-1]\n\n          for rank in ranks[0:5]:\n              print(\"class='%s' with probability=%f\" % (labels[rank], scores[rank]))\n  ```\n```\n$ python postprocess.py\n\nclass='n02123045 tabby, tabby cat' with probability=0.621104\nclass='n02123159 tiger cat' with probability=0.356378\nclass='n02124075 Egyptian cat' with probability=0.019712\nclass='n02129604 tiger, Panthera tigris' with probability=0.001215\nclass='n04040759 radiator' with probability=0.000262\n```\n```bash\n$ python -m tvm.driver.tvmc tune --help\n```\n\n\u003cdetails\u003e\u003csummary\u003eparameters\u003c/summary\u003e\u003cdiv\u003e\n\n```\nusage: tvmc tune [-h]\n--target TARGET\n-o OUTPUT\n[--early-stopping EARLY_STOPPING]\n[--min-repeat-ms MIN_REPEAT_MS]\n[--model-format {keras,onnx,pb,tflite,pytorch,paddle}]\n[--number NUMBER]\n[--parallel PARALLEL]\n[--repeat REPEAT]\n[--rpc-key RPC_KEY]\n[--rpc-tracker RPC_TRACKER]\n[--target-example_target_hook-from_device TARGET_EXAMPLE_TARGET_HOOK_FROM_DEVICE]\n[--target-example_target_hook-libs TARGET_EXAMPLE_TARGET_HOOK_LIBS]\n[--target-example_target_hook-model TARGET_EXAMPLE_TARGET_HOOK_MODEL]\n[--target-example_target_hook-tag TARGET_EXAMPLE_TARGET_HOOK_TAG]\n[--target-example_target_hook-device TARGET_EXAMPLE_TARGET_HOOK_DEVICE]\n[--target-example_target_hook-keys TARGET_EXAMPLE_TARGET_HOOK_KEYS]\n[--target-ext_dev-from_device TARGET_EXT_DEV_FROM_DEVICE]\n[--target-ext_dev-libs TARGET_EXT_DEV_LIBS]\n[--target-ext_dev-model TARGET_EXT_DEV_MODEL]\n[--target-ext_dev-system-lib TARGET_EXT_DEV_SYSTEM_LIB]\n[--target-ext_dev-tag TARGET_EXT_DEV_TAG]\n[--target-ext_dev-device TARGET_EXT_DEV_DEVICE]\n[--target-ext_dev-keys TARGET_EXT_DEV_KEYS]\n[--target-llvm-fast-math TARGET_LLVM_FAST_MATH]\n[--target-llvm-opt-level TARGET_LLVM_OPT_LEVEL]\n[--target-llvm-unpacked-api TARGET_LLVM_UNPACKED_API]\n[--target-llvm-from_device TARGET_LLVM_FROM_DEVICE]\n[--target-llvm-fast-math-ninf TARGET_LLVM_FAST_MATH_NINF]\n[--target-llvm-mattr TARGET_LLVM_MATTR]\n[--target-llvm-num-cores TARGET_LLVM_NUM_CORES]\n[--target-llvm-libs TARGET_LLVM_LIBS]\n[--target-llvm-fast-math-nsz TARGET_LLVM_FAST_MATH_NSZ]\n[--target-llvm-link-params TARGET_LLVM_LINK_PARAMS]\n[--target-llvm-interface-api TARGET_LLVM_INTERFACE_API]\n[--target-llvm-fast-math-contract TARGET_LLVM_FAST_MATH_CONTRACT]\n[--target-llvm-system-lib TARGET_LLVM_SYSTEM_LIB]\n[--target-llvm-tag TARGET_LLVM_TAG]\n[--target-llvm-mtriple TARGET_LLVM_MTRIPLE]\n[--target-llvm-model TARGET_LLVM_MODEL]\n[--target-llvm-mfloat-abi TARGET_LLVM_MFLOAT_ABI]\n[--target-llvm-mcpu TARGET_LLVM_MCPU]\n[--target-llvm-device TARGET_LLVM_DEVICE]\n[--target-llvm-runtime TARGET_LLVM_RUNTIME]\n[--target-llvm-fast-math-arcp TARGET_LLVM_FAST_MATH_ARCP]\n[--target-llvm-fast-math-reassoc TARGET_LLVM_FAST_MATH_REASSOC]\n[--target-llvm-mabi TARGET_LLVM_MABI]\n[--target-llvm-keys TARGET_LLVM_KEYS]\n[--target-llvm-fast-math-nnan TARGET_LLVM_FAST_MATH_NNAN]\n[--target-hybrid-from_device TARGET_HYBRID_FROM_DEVICE]\n[--target-hybrid-libs TARGET_HYBRID_LIBS]\n[--target-hybrid-model TARGET_HYBRID_MODEL]\n[--target-hybrid-system-lib TARGET_HYBRID_SYSTEM_LIB]\n[--target-hybrid-tag TARGET_HYBRID_TAG]\n[--target-hybrid-device TARGET_HYBRID_DEVICE]\n[--target-hybrid-keys TARGET_HYBRID_KEYS]\n[--target-aocl-from_device TARGET_AOCL_FROM_DEVICE]\n[--target-aocl-libs TARGET_AOCL_LIBS]\n[--target-aocl-model TARGET_AOCL_MODEL]\n[--target-aocl-system-lib TARGET_AOCL_SYSTEM_LIB]\n[--target-aocl-tag TARGET_AOCL_TAG]\n[--target-aocl-device TARGET_AOCL_DEVICE]\n[--target-aocl-keys TARGET_AOCL_KEYS]\n[--target-nvptx-max_num_threads TARGET_NVPTX_MAX_NUM_THREADS]\n[--target-nvptx-thread_warp_size TARGET_NVPTX_THREAD_WARP_SIZE]\n[--target-nvptx-from_device TARGET_NVPTX_FROM_DEVICE]\n[--target-nvptx-libs TARGET_NVPTX_LIBS]\n[--target-nvptx-model TARGET_NVPTX_MODEL]\n[--target-nvptx-system-lib TARGET_NVPTX_SYSTEM_LIB]\n[--target-nvptx-mtriple TARGET_NVPTX_MTRIPLE]\n[--target-nvptx-tag TARGET_NVPTX_TAG]\n[--target-nvptx-mcpu TARGET_NVPTX_MCPU]\n[--target-nvptx-device TARGET_NVPTX_DEVICE]\n[--target-nvptx-keys TARGET_NVPTX_KEYS]\n[--target-opencl-max_num_threads TARGET_OPENCL_MAX_NUM_THREADS]\n[--target-opencl-thread_warp_size TARGET_OPENCL_THREAD_WARP_SIZE]\n[--target-opencl-from_device TARGET_OPENCL_FROM_DEVICE]\n[--target-opencl-libs TARGET_OPENCL_LIBS]\n[--target-opencl-model TARGET_OPENCL_MODEL]\n[--target-opencl-system-lib TARGET_OPENCL_SYSTEM_LIB]\n[--target-opencl-tag TARGET_OPENCL_TAG]\n[--target-opencl-device TARGET_OPENCL_DEVICE]\n[--target-opencl-keys TARGET_OPENCL_KEYS]\n[--target-metal-max_num_threads TARGET_METAL_MAX_NUM_THREADS]\n[--target-metal-thread_warp_size TARGET_METAL_THREAD_WARP_SIZE]\n[--target-metal-from_device TARGET_METAL_FROM_DEVICE]\n[--target-metal-libs TARGET_METAL_LIBS]\n[--target-metal-keys TARGET_METAL_KEYS]\n[--target-metal-model TARGET_METAL_MODEL]\n[--target-metal-system-lib TARGET_METAL_SYSTEM_LIB]\n[--target-metal-tag TARGET_METAL_TAG]\n[--target-metal-device TARGET_METAL_DEVICE]\n[--target-metal-max_function_args TARGET_METAL_MAX_FUNCTION_ARGS]\n[--target-webgpu-max_num_threads TARGET_WEBGPU_MAX_NUM_THREADS]\n[--target-webgpu-from_device TARGET_WEBGPU_FROM_DEVICE]\n[--target-webgpu-libs TARGET_WEBGPU_LIBS]\n[--target-webgpu-model TARGET_WEBGPU_MODEL]\n[--target-webgpu-system-lib TARGET_WEBGPU_SYSTEM_LIB]\n[--target-webgpu-tag TARGET_WEBGPU_TAG]\n[--target-webgpu-device TARGET_WEBGPU_DEVICE]\n[--target-webgpu-keys TARGET_WEBGPU_KEYS]\n[--target-rocm-max_num_threads TARGET_ROCM_MAX_NUM_THREADS]\n[--target-rocm-thread_warp_size TARGET_ROCM_THREAD_WARP_SIZE]\n[--target-rocm-from_device TARGET_ROCM_FROM_DEVICE]\n[--target-rocm-libs TARGET_ROCM_LIBS]\n[--target-rocm-model TARGET_ROCM_MODEL]\n[--target-rocm-system-lib TARGET_ROCM_SYSTEM_LIB]\n[--target-rocm-mtriple TARGET_ROCM_MTRIPLE]\n[--target-rocm-tag TARGET_ROCM_TAG]\n[--target-rocm-mcpu TARGET_ROCM_MCPU]\n[--target-rocm-device TARGET_ROCM_DEVICE]\n[--target-rocm-keys TARGET_ROCM_KEYS]\n[--target-vulkan-max_num_threads TARGET_VULKAN_MAX_NUM_THREADS]\n[--target-vulkan-thread_warp_size TARGET_VULKAN_THREAD_WARP_SIZE]\n[--target-vulkan-max_block_size_z TARGET_VULKAN_MAX_BLOCK_SIZE_Z]\n[--target-vulkan-max_per_stage_descriptor_storage_buffer TARGET_VULKAN_MAX_PER_STAGE_DESCRIPTOR_STORAGE_BUFFER]\n[--target-vulkan-driver_version TARGET_VULKAN_DRIVER_VERSION]\n[--target-vulkan-from_device TARGET_VULKAN_FROM_DEVICE]\n[--target-vulkan-supports_16bit_buffer TARGET_VULKAN_SUPPORTS_16BIT_BUFFER]\n[--target-vulkan-libs TARGET_VULKAN_LIBS]\n[--target-vulkan-supported_subgroup_operations TARGET_VULKAN_SUPPORTED_SUBGROUP_OPERATIONS]\n[--target-vulkan-supports_dedicated_allocation TARGET_VULKAN_SUPPORTS_DEDICATED_ALLOCATION]\n[--target-vulkan-max_storage_buffer_range TARGET_VULKAN_MAX_STORAGE_BUFFER_RANGE]\n[--target-vulkan-max_push_constants_size TARGET_VULKAN_MAX_PUSH_CONSTANTS_SIZE]\n[--target-vulkan-supports_push_descriptor TARGET_VULKAN_SUPPORTS_PUSH_DESCRIPTOR]\n[--target-vulkan-supports_int64 TARGET_VULKAN_SUPPORTS_INT64]\n[--target-vulkan-supports_float32 TARGET_VULKAN_SUPPORTS_FLOAT32]\n[--target-vulkan-model TARGET_VULKAN_MODEL]\n[--target-vulkan-max_block_size_x TARGET_VULKAN_MAX_BLOCK_SIZE_X]\n[--target-vulkan-system-lib TARGET_VULKAN_SYSTEM_LIB]\n[--target-vulkan-max_block_size_y TARGET_VULKAN_MAX_BLOCK_SIZE_Y]\n[--target-vulkan-tag TARGET_VULKAN_TAG]\n[--target-vulkan-supports_int8 TARGET_VULKAN_SUPPORTS_INT8]\n[--target-vulkan-max_spirv_version TARGET_VULKAN_MAX_SPIRV_VERSION]\n[--target-vulkan-vulkan_api_version TARGET_VULKAN_VULKAN_API_VERSION]\n[--target-vulkan-supports_8bit_buffer TARGET_VULKAN_SUPPORTS_8BIT_BUFFER]\n[--target-vulkan-device_type TARGET_VULKAN_DEVICE_TYPE]\n[--target-vulkan-supports_int32 TARGET_VULKAN_SUPPORTS_INT32]\n[--target-vulkan-device TARGET_VULKAN_DEVICE]\n[--target-vulkan-driver_name TARGET_VULKAN_DRIVER_NAME]\n[--target-vulkan-supports_float16 TARGET_VULKAN_SUPPORTS_FLOAT16]\n[--target-vulkan-supports_storage_buffer_storage_class TARGET_VULKAN_SUPPORTS_STORAGE_BUFFER_STORAGE_CLASS]\n[--target-vulkan-supports_float64 TARGET_VULKAN_SUPPORTS_FLOAT64]\n[--target-vulkan-max_uniform_buffer_range TARGET_VULKAN_MAX_UNIFORM_BUFFER_RANGE]\n[--target-vulkan-device_name TARGET_VULKAN_DEVICE_NAME]\n[--target-vulkan-keys TARGET_VULKAN_KEYS]\n[--target-vulkan-max_shared_memory_per_block TARGET_VULKAN_MAX_SHARED_MEMORY_PER_BLOCK]\n[--target-vulkan-supports_int16 TARGET_VULKAN_SUPPORTS_INT16]\n[--target-cuda-max_num_threads TARGET_CUDA_MAX_NUM_THREADS]\n[--target-cuda-thread_warp_size TARGET_CUDA_THREAD_WARP_SIZE]\n[--target-cuda-from_device TARGET_CUDA_FROM_DEVICE]\n[--target-cuda-arch TARGET_CUDA_ARCH]\n[--target-cuda-libs TARGET_CUDA_LIBS]\n[--target-cuda-shared_memory_per_block TARGET_CUDA_SHARED_MEMORY_PER_BLOCK]\n[--target-cuda-model TARGET_CUDA_MODEL]\n[--target-cuda-system-lib TARGET_CUDA_SYSTEM_LIB]\n[--target-cuda-tag TARGET_CUDA_TAG]\n[--target-cuda-device TARGET_CUDA_DEVICE]\n[--target-cuda-mcpu TARGET_CUDA_MCPU]\n[--target-cuda-max_threads_per_block TARGET_CUDA_MAX_THREADS_PER_BLOCK]\n[--target-cuda-registers_per_block TARGET_CUDA_REGISTERS_PER_BLOCK]\n[--target-cuda-keys TARGET_CUDA_KEYS]\n[--target-sdaccel-from_device TARGET_SDACCEL_FROM_DEVICE]\n[--target-sdaccel-libs TARGET_SDACCEL_LIBS]\n[--target-sdaccel-model TARGET_SDACCEL_MODEL]\n[--target-sdaccel-system-lib TARGET_SDACCEL_SYSTEM_LIB]\n[--target-sdaccel-tag TARGET_SDACCEL_TAG]\n[--target-sdaccel-device TARGET_SDACCEL_DEVICE]\n[--target-sdaccel-keys TARGET_SDACCEL_KEYS]\n[--target-composite-from_device TARGET_COMPOSITE_FROM_DEVICE]\n[--target-composite-libs TARGET_COMPOSITE_LIBS]\n[--target-composite-devices TARGET_COMPOSITE_DEVICES]\n[--target-composite-model TARGET_COMPOSITE_MODEL]\n[--target-composite-tag TARGET_COMPOSITE_TAG]\n[--target-composite-device TARGET_COMPOSITE_DEVICE]\n[--target-composite-keys TARGET_COMPOSITE_KEYS]\n[--target-stackvm-from_device TARGET_STACKVM_FROM_DEVICE]\n[--target-stackvm-libs TARGET_STACKVM_LIBS]\n[--target-stackvm-model TARGET_STACKVM_MODEL]\n[--target-stackvm-system-lib TARGET_STACKVM_SYSTEM_LIB]\n[--target-stackvm-tag TARGET_STACKVM_TAG]\n[--target-stackvm-device TARGET_STACKVM_DEVICE]\n[--target-stackvm-keys TARGET_STACKVM_KEYS]\n[--target-aocl_sw_emu-from_device TARGET_AOCL_SW_EMU_FROM_DEVICE]\n[--target-aocl_sw_emu-libs TARGET_AOCL_SW_EMU_LIBS]\n[--target-aocl_sw_emu-model TARGET_AOCL_SW_EMU_MODEL]\n[--target-aocl_sw_emu-system-lib TARGET_AOCL_SW_EMU_SYSTEM_LIB]\n[--target-aocl_sw_emu-tag TARGET_AOCL_SW_EMU_TAG]\n[--target-aocl_sw_emu-device TARGET_AOCL_SW_EMU_DEVICE]\n[--target-aocl_sw_emu-keys TARGET_AOCL_SW_EMU_KEYS]\n[--target-c-unpacked-api TARGET_C_UNPACKED_API]\n[--target-c-from_device TARGET_C_FROM_DEVICE]\n[--target-c-libs TARGET_C_LIBS]\n[--target-c-constants-byte-alignment TARGET_C_CONSTANTS_BYTE_ALIGNMENT]\n[--target-c-executor TARGET_C_EXECUTOR]\n[--target-c-link-params TARGET_C_LINK_PARAMS]\n[--target-c-model TARGET_C_MODEL]\n[--target-c-workspace-byte-alignment TARGET_C_WORKSPACE_BYTE_ALIGNMENT]\n[--target-c-system-lib TARGET_C_SYSTEM_LIB]\n[--target-c-tag TARGET_C_TAG]\n[--target-c-interface-api TARGET_C_INTERFACE_API]\n[--target-c-mcpu TARGET_C_MCPU]\n[--target-c-device TARGET_C_DEVICE]\n[--target-c-runtime TARGET_C_RUNTIME]\n[--target-c-keys TARGET_C_KEYS]\n[--target-c-march TARGET_C_MARCH]\n[--target-hexagon-from_device TARGET_HEXAGON_FROM_DEVICE]\n[--target-hexagon-libs TARGET_HEXAGON_LIBS]\n[--target-hexagon-mattr TARGET_HEXAGON_MATTR]\n[--target-hexagon-model TARGET_HEXAGON_MODEL]\n[--target-hexagon-llvm-options TARGET_HEXAGON_LLVM_OPTIONS]\n[--target-hexagon-mtriple TARGET_HEXAGON_MTRIPLE]\n[--target-hexagon-system-lib TARGET_HEXAGON_SYSTEM_LIB]\n[--target-hexagon-mcpu TARGET_HEXAGON_MCPU]\n[--target-hexagon-device TARGET_HEXAGON_DEVICE]\n[--target-hexagon-tag TARGET_HEXAGON_TAG]\n[--target-hexagon-link-params TARGET_HEXAGON_LINK_PARAMS]\n[--target-hexagon-keys TARGET_HEXAGON_KEYS]\n[--target-host TARGET_HOST]\n[--timeout TIMEOUT]\n[--trials TRIALS]\n[--tuning-records PATH]\n[--desired-layout {NCHW,NHWC}]\n[--enable-autoscheduler]\n[--cache-line-bytes CACHE_LINE_BYTES]\n[--num-cores NUM_CORES]\n[--vector-unit-bytes VECTOR_UNIT_BYTES]\n[--max-shared-memory-per-block MAX_SHARED_MEMORY_PER_BLOCK]\n[--max-local-memory-per-block MAX_LOCAL_MEMORY_PER_BLOCK]\n[--max-threads-per-block MAX_THREADS_PER_BLOCK]\n[--max-vthread-extent MAX_VTHREAD_EXTENT]\n[--warp-size WARP_SIZE]\n[--include-simple-tasks]\n[--log-estimated-latency]\n[--tuner {ga,gridsearch,random,xgb,xgb_knob,xgb-rank}]\n[--input-shapes INPUT_SHAPES]\nFILE\n\npositional arguments:\n    FILE\n        path to the input model file\n\noptional arguments:\n    -h, --help\n        show this help message and exit\n    --early-stopping EARLY_STOPPING\n        minimum number of trials before early stopping\n    --min-repeat-ms MIN_REPEAT_MS\n        minimum time to run each trial, in milliseconds.\n        Defaults to 0 on x86 and 1000 on all other targets\n    --model-format {keras,onnx,pb,tflite,pytorch,paddle}\n        specify input model format\n    --number NUMBER\n        number of runs a single repeat is made of.\n        The final number of tuning executions is: (1 + number * repeat)\n    -o OUTPUT, --output OUTPUT\n        output file to store the tuning records for the tuning process\n    --parallel PARALLEL\n        the maximum number of parallel devices to use when tuning\n    --repeat REPEAT\n        how many times to repeat each measurement\n    --rpc-key RPC_KEY\n        the RPC tracker key of the target device.\n        Required when --rpc-tracker is provided.\n    --rpc-tracker RPC_TRACKER\n        hostname (required) and port (optional, defaults to 9090) of the RPC tracker,\n        e.g. '192.168.0.100:9999'\n    --target TARGET\n        compilation target as plain string, inline JSON or path to a JSON file\n    --target-host TARGET_HOST\n        the host compilation target, defaults to 'llvm'\n    --timeout TIMEOUT\n        compilation timeout, in seconds\n    --trials TRIALS\n        the maximum number of tuning trials to perform\n    --tuning-records PATH\n        path to an auto-tuning log file by AutoTVM.\n    --desired-layout {NCHW,NHWC}\n        change the data layout of the whole graph\n    --enable-autoscheduler\n        enable tuning the graph through the autoscheduler\n    --input-shapes INPUT_SHAPES\n        specify non-generic shapes for model to run,\n        format is \"input_name:[dim1,dim2,...,dimn] input_name2:[dim1,dim2]\"\n\n    target example_target_hook:\n    --target-example_target_hook-from_device TARGET_EXAMPLE_TARGET_HOOK_FROM_DEVICE\n        target example_target_hook from_device\n    --target-example_target_hook-libs TARGET_EXAMPLE_TARGET_HOOK_LIBS\n        target example_target_hook libs options\n    --target-example_target_hook-model TARGET_EXAMPLE_TARGET_HOOK_MODEL\n        target example_target_hook model string\n    --target-example_target_hook-tag TARGET_EXAMPLE_TARGET_HOOK_TAG\n        target example_target_hook tag string\n    --target-example_target_hook-device TARGET_EXAMPLE_TARGET_HOOK_DEVICE\n        target example_target_hook device string\n    --target-example_target_hook-keys TARGET_EXAMPLE_TARGET_HOOK_KEYS\n        target example_target_hook keys options\n\n    target ext_dev:\n    --target-ext_dev-from_device TARGET_EXT_DEV_FROM_DEVICE\n        target ext_dev from_device\n    --target-ext_dev-libs TARGET_EXT_DEV_LIBS\n        target ext_dev libs options\n    --target-ext_dev-model TARGET_EXT_DEV_MODEL\n        target ext_dev model string\n    --target-ext_dev-system-lib TARGET_EXT_DEV_SYSTEM_LIB\n        target ext_dev system-lib\n    --target-ext_dev-tag TARGET_EXT_DEV_TAG\n        target ext_dev tag string\n    --target-ext_dev-device TARGET_EXT_DEV_DEVICE\n        target ext_dev device string\n    --target-ext_dev-keys TARGET_EXT_DEV_KEYS\n        target ext_dev keys options\n\n    target llvm:\n    --target-llvm-fast-math TARGET_LLVM_FAST_MATH\n        target llvm fast-math\n    --target-llvm-opt-level TARGET_LLVM_OPT_LEVEL\n        target llvm opt-level\n    --target-llvm-unpacked-api TARGET_LLVM_UNPACKED_API\n        target llvm unpacked-api\n    --target-llvm-from_device TARGET_LLVM_FROM_DEVICE\n        target llvm from_device\n    --target-llvm-fast-math-ninf TARGET_LLVM_FAST_MATH_NINF\n        target llvm fast-math-ninf\n    --target-llvm-mattr TARGET_LLVM_MATTR\n        target llvm mattr options\n    --target-llvm-num-cores TARGET_LLVM_NUM_CORES\n        target llvm num-cores\n    --target-llvm-libs TARGET_LLVM_LIBS\n        target llvm libs options\n    --target-llvm-fast-math-nsz TARGET_LLVM_FAST_MATH_NSZ\n        target llvm fast-math-nsz\n    --target-llvm-link-params TARGET_LLVM_LINK_PARAMS\n        target llvm link-params\n    --target-llvm-interface-api TARGET_LLVM_INTERFACE_API\n        target llvm interface-api string\n    --target-llvm-fast-math-contract TARGET_LLVM_FAST_MATH_CONTRACT\n        target llvm fast-math-contract\n    --target-llvm-system-lib TARGET_LLVM_SYSTEM_LIB\n        target llvm system-lib\n    --target-llvm-tag TARGET_LLVM_TAG\n        target llvm tag string\n    --target-llvm-mtriple TARGET_LLVM_MTRIPLE\n        target llvm mtriple string\n    --target-llvm-model TARGET_LLVM_MODEL\n        target llvm model string\n    --target-llvm-mfloat-abi TARGET_LLVM_MFLOAT_ABI\n        target llvm mfloat-abi string\n    --target-llvm-mcpu TARGET_LLVM_MCPU\n        target llvm mcpu string\n    --target-llvm-device TARGET_LLVM_DEVICE\n        target llvm device string\n    --target-llvm-runtime TARGET_LLVM_RUNTIME\n        target llvm runtime string\n    --target-llvm-fast-math-arcp TARGET_LLVM_FAST_MATH_ARCP\n        target llvm fast-math-arcp\n    --target-llvm-fast-math-reassoc TARGET_LLVM_FAST_MATH_REASSOC\n        target llvm fast-math-reassoc\n    --target-llvm-mabi TARGET_LLVM_MABI\n        target llvm mabi string\n    --target-llvm-keys TARGET_LLVM_KEYS\n        target llvm keys options\n    --target-llvm-fast-math-nnan TARGET_LLVM_FAST_MATH_NNAN\n        target llvm fast-math-nnan\n\n    target hybrid:\n    --target-hybrid-from_device TARGET_HYBRID_FROM_DEVICE\n        target hybrid from_device\n    --target-hybrid-libs TARGET_HYBRID_LIBS\n        target hybrid libs options\n    --target-hybrid-model TARGET_HYBRID_MODEL\n        target hybrid model string\n    --target-hybrid-system-lib TARGET_HYBRID_SYSTEM_LIB\n        target hybrid system-lib\n    --target-hybrid-tag TARGET_HYBRID_TAG\n        target hybrid tag string\n    --target-hybrid-device TARGET_HYBRID_DEVICE\n        target hybrid device string\n    --target-hybrid-keys TARGET_HYBRID_KEYS\n        target hybrid keys options\n\n    target aocl:\n    --target-aocl-from_device TARGET_AOCL_FROM_DEVICE\n        target aocl from_device\n    --target-aocl-libs TARGET_AOCL_LIBS\n        target aocl libs options\n    --target-aocl-model TARGET_AOCL_MODEL\n        target aocl model string\n    --target-aocl-system-lib TARGET_AOCL_SYSTEM_LIB\n        target aocl system-lib\n    --target-aocl-tag TARGET_AOCL_TAG\n        target aocl tag string\n    --target-aocl-device TARGET_AOCL_DEVICE\n        target aocl device string\n    --target-aocl-keys TARGET_AOCL_KEYS\n        target aocl keys options\n\n    target nvptx:\n    --target-nvptx-max_num_threads TARGET_NVPTX_MAX_NUM_THREADS\n        target nvptx max_num_threads\n    --target-nvptx-thread_warp_size TARGET_NVPTX_THREAD_WARP_SIZE\n        target nvptx thread_warp_size\n    --target-nvptx-from_device TARGET_NVPTX_FROM_DEVICE\n        target nvptx from_device\n    --target-nvptx-libs TARGET_NVPTX_LIBS\n        target nvptx libs options\n    --target-nvptx-model TARGET_NVPTX_MODEL\n        target nvptx model string\n    --target-nvptx-system-lib TARGET_NVPTX_SYSTEM_LIB\n        target nvptx system-lib\n    --target-nvptx-mtriple TARGET_NVPTX_MTRIPLE\n        target nvptx mtriple string\n    --target-nvptx-tag TARGET_NVPTX_TAG\n        target nvptx tag string\n    --target-nvptx-mcpu TARGET_NVPTX_MCPU\n        target nvptx mcpu string\n    --target-nvptx-device TARGET_NVPTX_DEVICE\n        target nvptx device string\n    --target-nvptx-keys TARGET_NVPTX_KEYS\n        target nvptx keys options\n\n    target opencl:\n    --target-opencl-max_num_threads TARGET_OPENCL_MAX_NUM_THREADS\n        target opencl max_num_threads\n    --target-opencl-thread_warp_size TARGET_OPENCL_THREAD_WARP_SIZE\n        target opencl thread_warp_size\n    --target-opencl-from_device TARGET_OPENCL_FROM_DEVICE\n        target opencl from_device\n    --target-opencl-libs TARGET_OPENCL_LIBS\n        target opencl libs options\n    --target-opencl-model TARGET_OPENCL_MODEL\n        target opencl model string\n    --target-opencl-system-lib TARGET_OPENCL_SYSTEM_LIB\n        target opencl system-lib\n    --target-opencl-tag TARGET_OPENCL_TAG\n        target opencl tag string\n    --target-opencl-device TARGET_OPENCL_DEVICE\n        target opencl device string\n    --target-opencl-keys TARGET_OPENCL_KEYS\n        target opencl keys options\n\n    target metal:\n    --target-metal-max_num_threads TARGET_METAL_MAX_NUM_THREADS\n        target metal max_num_threads\n    --target-metal-thread_warp_size TARGET_METAL_THREAD_WARP_SIZE\n        target metal thread_warp_size\n    --target-metal-from_device TARGET_METAL_FROM_DEVICE\n        target metal from_device\n    --target-metal-libs TARGET_METAL_LIBS\n        target metal libs options\n    --target-metal-keys TARGET_METAL_KEYS\n        target metal keys options\n    --target-metal-model TARGET_METAL_MODEL\n        target metal model string\n    --target-metal-system-lib TARGET_METAL_SYSTEM_LIB\n        target metal system-lib\n    --target-metal-tag TARGET_METAL_TAG\n        target metal tag string\n    --target-metal-device TARGET_METAL_DEVICE\n        target metal device string\n    --target-metal-max_function_args TARGET_METAL_MAX_FUNCTION_ARGS\n        target metal max_function_args\n\n    target webgpu:\n    --target-webgpu-max_num_threads TARGET_WEBGPU_MAX_NUM_THREADS\n        target webgpu max_num_threads\n    --target-webgpu-from_device TARGET_WEBGPU_FROM_DEVICE\n        target webgpu from_device\n    --target-webgpu-libs TARGET_WEBGPU_LIBS\n        target webgpu libs options\n    --target-webgpu-model TARGET_WEBGPU_MODEL\n        target webgpu model string\n    --target-webgpu-system-lib TARGET_WEBGPU_SYSTEM_LIB\n        target webgpu system-lib\n    --target-webgpu-tag TARGET_WEBGPU_TAG\n        target webgpu tag string\n    --target-webgpu-device TARGET_WEBGPU_DEVICE\n        target webgpu device string\n    --target-webgpu-keys TARGET_WEBGPU_KEYS\n        target webgpu keys options\n\n    target rocm:\n    --target-rocm-max_num_threads TARGET_ROCM_MAX_NUM_THREADS\n        target rocm max_num_threads\n    --target-rocm-thread_warp_size TARGET_ROCM_THREAD_WARP_SIZE\n        target rocm thread_warp_size\n    --target-rocm-from_device TARGET_ROCM_FROM_DEVICE\n        target rocm from_device\n    --target-rocm-libs TARGET_ROCM_LIBS\n        target rocm libs options\n    --target-rocm-model TARGET_ROCM_MODEL\n        target rocm model string\n    --target-rocm-system-lib TARGET_ROCM_SYSTEM_LIB\n        target rocm system-lib\n    --target-rocm-mtriple TARGET_ROCM_MTRIPLE\n        target rocm mtriple string\n    --target-rocm-tag TARGET_ROCM_TAG\n        target rocm tag string\n    --target-rocm-mcpu TARGET_ROCM_MCPU\n        target rocm mcpu string\n    --target-rocm-device TARGET_ROCM_DEVICE\n        target rocm device string\n    --target-rocm-keys TARGET_ROCM_KEYS\n        target rocm keys options\n\n    target vulkan:\n    --target-vulkan-max_num_threads TARGET_VULKAN_MAX_NUM_THREADS\n        target vulkan max_num_threads\n    --target-vulkan-thread_warp_size TARGET_VULKAN_THREAD_WARP_SIZE\n        target vulkan thread_warp_size\n    --target-vulkan-max_block_size_z TARGET_VULKAN_MAX_BLOCK_SIZE_Z\n        target vulkan max_block_size_z\n    --target-vulkan-max_per_stage_descriptor_storage_buffer TARGET_VULKAN_MAX_PER_STAGE_DESCRIPTOR_STORAGE_BUFFER\n        target vulkan max_per_stage_descriptor_storage_buffer\n    --target-vulkan-driver_version TARGET_VULKAN_DRIVER_VERSION\n        target vulkan driver_version\n    --target-vulkan-from_device TARGET_VULKAN_FROM_DEVICE\n        target vulkan from_device\n    --target-vulkan-supports_16bit_buffer TARGET_VULKAN_SUPPORTS_16BIT_BUFFER\n        target vulkan supports_16bit_buffer\n    --target-vulkan-libs TARGET_VULKAN_LIBS\n        target vulkan libs options\n    --target-vulkan-supported_subgroup_operations TARGET_VULKAN_SUPPORTED_SUBGROUP_OPERATIONS\n        target vulkan supported_subgroup_operations\n    --target-vulkan-supports_dedicated_allocation TARGET_VULKAN_SUPPORTS_DEDICATED_ALLOCATION\n        target vulkan supports_dedicated_allocation\n    --target-vulkan-max_storage_buffer_range TARGET_VULKAN_MAX_STORAGE_BUFFER_RANGE\n        target vulkan max_storage_buffer_range\n    --target-vulkan-max_push_constants_size TARGET_VULKAN_MAX_PUSH_CONSTANTS_SIZE\n        target vulkan max_push_constants_size\n    --target-vulkan-supports_push_descriptor TARGET_VULKAN_SUPPORTS_PUSH_DESCRIPTOR\n        target vulkan supports_push_descriptor\n    --target-vulkan-supports_int64 TARGET_VULKAN_SUPPORTS_INT64\n        target vulkan supports_int64\n    --target-vulkan-supports_float32 TARGET_VULKAN_SUPPORTS_FLOAT32\n        target vulkan supports_float32\n    --target-vulkan-model TARGET_VULKAN_MODEL\n        target vulkan model string\n    --target-vulkan-max_block_size_x TARGET_VULKAN_MAX_BLOCK_SIZE_X\n        target vulkan max_block_size_x\n    --target-vulkan-system-lib TARGET_VULKAN_SYSTEM_LIB\n        target vulkan system-lib\n    --target-vulkan-max_block_size_y TARGET_VULKAN_MAX_BLOCK_SIZE_Y\n        target vulkan max_block_size_y\n    --target-vulkan-tag TARGET_VULKAN_TAG\n        target vulkan tag string\n    --target-vulkan-supports_int8 TARGET_VULKAN_SUPPORTS_INT8\n        target vulkan supports_int8\n    --target-vulkan-max_spirv_version TARGET_VULKAN_MAX_SPIRV_VERSION\n        target vulkan max_spirv_version\n    --target-vulkan-vulkan_api_version TARGET_VULKAN_VULKAN_API_VERSION\n        target vulkan vulkan_api_version\n    --target-vulkan-supports_8bit_buffer TARGET_VULKAN_SUPPORTS_8BIT_BUFFER\n        target vulkan supports_8bit_buffer\n    --target-vulkan-device_type TARGET_VULKAN_DEVICE_TYPE\n        target vulkan device_type string\n    --target-vulkan-supports_int32 TARGET_VULKAN_SUPPORTS_INT32\n        target vulkan supports_int32\n    --target-vulkan-device TARGET_VULKAN_DEVICE\n        target vulkan device string\n    --target-vulkan-driver_name TARGET_VULKAN_DRIVER_NAME\n        target vulkan driver_name string\n    --target-vulkan-supports_float16 TARGET_VULKAN_SUPPORTS_FLOAT16\n        target vulkan supports_float16\n    --target-vulkan-supports_storage_buffer_storage_class TARGET_VULKAN_SUPPORTS_STORAGE_BUFFER_STORAGE_CLASS\n        target vulkan supports_storage_buffer_storage_class\n    --target-vulkan-supports_float64 TARGET_VULKAN_SUPPORTS_FLOAT64\n        target vulkan supports_float64\n    --target-vulkan-max_uniform_buffer_range TARGET_VULKAN_MAX_UNIFORM_BUFFER_RANGE\n        target vulkan max_uniform_buffer_range\n    --target-vulkan-device_name TARGET_VULKAN_DEVICE_NAME\n        target vulkan device_name string\n    --target-vulkan-keys TARGET_VULKAN_KEYS\n        target vulkan keys options\n    --target-vulkan-max_shared_memory_per_block TARGET_VULKAN_MAX_SHARED_MEMORY_PER_BLOCK\n        target vulkan max_shared_memory_per_block\n    --target-vulkan-supports_int16 TARGET_VULKAN_SUPPORTS_INT16\n        target vulkan supports_int16\n\n    target cuda:\n    --target-cuda-max_num_threads TARGET_CUDA_MAX_NUM_THREADS\n        target cuda max_num_threads\n    --target-cuda-thread_warp_size TARGET_CUDA_THREAD_WARP_SIZE\n        target cuda thread_warp_size\n    --target-cuda-from_device TARGET_CUDA_FROM_DEVICE\n        target cuda from_device\n    --target-cuda-arch TARGET_CUDA_ARCH\n        target cuda arch string\n    --target-cuda-libs TARGET_CUDA_LIBS\n        target cuda libs options\n    --target-cuda-shared_memory_per_block TARGET_CUDA_SHARED_MEMORY_PER_BLOCK\n        target cuda shared_memory_per_block\n    --target-cuda-model TARGET_CUDA_MODEL\n        target cuda model string\n    --target-cuda-system-lib TARGET_CUDA_SYSTEM_LIB\n        target cuda system-lib\n    --target-cuda-tag TARGET_CUDA_TAG\n        target cuda tag string\n    --target-cuda-device TARGET_CUDA_DEVICE\n        target cuda device string\n    --target-cuda-mcpu TARGET_CUDA_MCPU\n        target cuda mcpu string\n    --target-cuda-max_threads_per_block TARGET_CUDA_MAX_THREADS_PER_BLOCK\n        target cuda max_threads_per_block\n    --target-cuda-registers_per_block TARGET_CUDA_REGISTERS_PER_BLOCK\n        target cuda registers_per_block\n    --target-cuda-keys TARGET_CUDA_KEYS\n        target cuda keys options\n\n    target sdaccel:\n    --target-sdaccel-from_device TARGET_SDACCEL_FROM_DEVICE\n        target sdaccel from_device\n    --target-sdaccel-libs TARGET_SDACCEL_LIBS\n        target sdaccel libs options\n    --target-sdaccel-model TARGET_SDACCEL_MODEL\n        target sdaccel model string\n    --target-sdaccel-system-lib TARGET_SDACCEL_SYSTEM_LIB\n        target sdaccel system-lib\n    --target-sdaccel-tag TARGET_SDACCEL_TAG\n        target sdaccel tag string\n    --target-sdaccel-device TARGET_SDACCEL_DEVICE\n        target sdaccel device string\n    --target-sdaccel-keys TARGET_SDACCEL_KEYS\n        target sdaccel keys options\n\n    target composite:\n    --target-composite-from_device TARGET_COMPOSITE_FROM_DEVICE\n        target composite from_device\n    --target-composite-libs TARGET_COMPOSITE_LIBS\n        target composite libs options\n    --target-composite-devices TARGET_COMPOSITE_DEVICES\n        target composite devices options\n    --target-composite-model TARGET_COMPOSITE_MODEL\n        target composite model string\n    --target-composite-tag TARGET_COMPOSITE_TAG\n        target composite tag string\n    --target-composite-device TARGET_COMPOSITE_DEVICE\n        target composite device string\n    --target-composite-keys TARGET_COMPOSITE_KEYS\n        target composite keys options\n\n    target stackvm:\n    --target-stackvm-from_device TARGET_STACKVM_FROM_DEVICE\n        target stackvm from_device\n    --target-stackvm-libs TARGET_STACKVM_LIBS\n        target stackvm libs options\n    --target-stackvm-model TARGET_STACKVM_MODEL\n        target stackvm model string\n    --target-stackvm-system-lib TARGET_STACKVM_SYSTEM_LIB\n        target stackvm system-lib\n    --target-stackvm-tag TARGET_STACKVM_TAG\n        target stackvm tag string\n    --target-stackvm-device TARGET_STACKVM_DEVICE\n        target stackvm device string\n    --target-stackvm-keys TARGET_STACKVM_KEYS\n        target stackvm keys options\n\n    target aocl_sw_emu:\n    --target-aocl_sw_emu-from_device TARGET_AOCL_SW_EMU_FROM_DEVICE\n        target aocl_sw_emu from_device\n    --target-aocl_sw_emu-libs TARGET_AOCL_SW_EMU_LIBS\n        target aocl_sw_emu libs options\n    --target-aocl_sw_emu-model TARGET_AOCL_SW_EMU_MODEL\n        target aocl_sw_emu model string\n    --target-aocl_sw_emu-system-lib TARGET_AOCL_SW_EMU_SYSTEM_LIB\n        target aocl_sw_emu system-lib\n    --target-aocl_sw_emu-tag TARGET_AOCL_SW_EMU_TAG\n        target aocl_sw_emu tag string\n    --target-aocl_sw_emu-device TARGET_AOCL_SW_EMU_DEVICE\n        target aocl_sw_emu device string\n    --target-aocl_sw_emu-keys TARGET_AOCL_SW_EMU_KEYS\n        target aocl_sw_emu keys options\n\n    target c:\n    --target-c-unpacked-api TARGET_C_UNPACKED_API\n        target c unpacked-api\n    --target-c-from_device TARGET_C_FROM_DEVICE\n        target c from_device\n    --target-c-libs TARGET_C_LIBS\n        target c libs options\n    --target-c-constants-byte-alignment TARGET_C_CONSTANTS_BYTE_ALIGNMENT\n        target c constants-byte-alignment\n    --target-c-executor TARGET_C_EXECUTOR\n        target c executor string\n    --target-c-link-params TARGET_C_LINK_PARAMS\n        target c link-params\n    --target-c-model TARGET_C_MODEL\n        target c model string\n    --target-c-workspace-byte-alignment TARGET_C_WORKSPACE_BYTE_ALIGNMENT\n        target c workspace-byte-alignment\n    --target-c-system-lib TARGET_C_SYSTEM_LIB\n        target c system-lib\n    --target-c-tag TARGET_C_TAG\n        target c tag string\n    --target-c-interface-api TARGET_C_INTERFACE_API\n        target c interface-api string\n    --target-c-mcpu TARGET_C_MCPU\n        target c mcpu string\n    --target-c-device TARGET_C_DEVICE\n        target c device string\n    --target-c-runtime TARGET_C_RUNTIME\n        target c runtime string\n    --target-c-keys TARGET_C_KEYS\n        target c keys options\n    --target-c-march TARGET_C_MARCH\n        target c march string\n\n    target hexagon:\n    --target-hexagon-from_device TARGET_HEXAGON_FROM_DEVICE\n        target hexagon from_device\n    --target-hexagon-libs TARGET_HEXAGON_LIBS\n        target hexagon libs options\n    --target-hexagon-mattr TARGET_HEXAGON_MATTR\n        target hexagon mattr options\n    --target-hexagon-model TARGET_HEXAGON_MODEL\n        target hexagon model string\n    --target-hexagon-llvm-options TARGET_HEXAGON_LLVM_OPTIONS\n        target hexagon llvm-options options\n    --target-hexagon-mtriple TARGET_HEXAGON_MTRIPLE\n        target hexagon mtriple string\n    --target-hexagon-system-lib TARGET_HEXAGON_SYSTEM_LIB\n        target hexagon system-lib\n    --target-hexagon-mcpu TARGET_HEXAGON_MCPU\n        target hexagon mcpu string\n    --target-hexagon-device TARGET_HEXAGON_DEVICE\n        target hexagon device string\n    --target-hexagon-tag TARGET_HEXAGON_TAG\n        target hexagon tag string\n    --target-hexagon-link-params TARGET_HEXAGON_LINK_PARAMS\n        target hexagon link-params\n    --target-hexagon-keys TARGET_HEXAGON_KEYS\n        target hexagon keys options\n\n    Autoscheduler options:\n    Autoscheduler options, used when --enable-autoscheduler is provided\n\n    --cache-line-bytes CACHE_LINE_BYTES\n        the size of cache line in bytes.\n        If not specified, it will be autoset for the current machine.\n    --num-cores NUM_CORES\n        the number of device cores.\n        If not specified, it will be autoset for the current machine.\n    --vector-unit-bytes VECTOR_UNIT_BYTES\n        the width of vector units in bytes.\n        If not specified, it will be autoset for the current machine.\n    --max-shared-memory-per-block MAX_SHARED_MEMORY_PER_BLOCK\n        the max shared memory per block in bytes.\n        If not specified, it will be autoset for the current machine.\n    --max-local-memory-per-block MAX_LOCAL_MEMORY_PER_BLOCK\n        the max local memory per block in bytes.\n        If not specified, it will be autoset for the current machine.\n    --max-threads-per-block MAX_THREADS_PER_BLOCK\n        the max number of threads per block.\n        If not specified, it will be autoset for the current machine.\n    --max-vthread-extent MAX_VTHREAD_EXTENT\n        the max vthread extent.\n        If not specified, it will be autoset for the current machine.\n    --warp-size WARP_SIZE\n        the thread numbers of a warp.\n        If not specified, it will be autoset for the current machine.\n    --include-simple-tasks\n        whether to extract simple tasks that do not include complicated ops\n    --log-estimated-latency\n        whether to log the estimated latency to the file after tuning a task\n\n    autotvm options:\n    autotvm options, used when the autoscheduler is not enabled\n\n    --tuner {ga,gridsearch,random,xgb,xgb_knob,xgb-rank}\n        type of tuner to use when tuning with autotvm.\n```\n\n\u003c/div\u003e\u003c/details\u003e\n\n### 6-2. -march=x86 -mcpu=xxx\n```\n$ llc-14 -march=x86 -mattr=help\n```\n\n\u003cdetails\u003e\u003csummary\u003eCPU list\u003c/summary\u003e\u003cdiv\u003e\n\n```\nAvailable CPUs for this target:\n\n  alderlake      - Select the alderlake processor.\n  amdfam10       - Select the amdfam10 processor.\n  athlon         - Select the athlon processor.\n  athlon-4       - Select the athlon-4 processor.\n  athlon-fx      - Select the athlon-fx processor.\n  athlon-mp      - Select the athlon-mp processor.\n  athlon-tbird   - Select the athlon-tbird processor.\n  athlon-xp      - Select the athlon-xp processor.\n  athlon64       - Select the athlon64 processor.\n  athlon64-sse3  - Select the athlon64-sse3 processor.\n  atom           - Select the atom processor.\n  barcelona      - Select the barcelona processor.\n  bdver1         - Select the bdver1 processor.\n  bdver2         - Select the bdver2 processor.\n  bdver3         - Select the bdver3 processor.\n  bdver4         - Select the bdver4 processor.\n  bonnell        - Select the bonnell processor.\n  broadwell      - Select the broadwell processor.\n  btver1         - Select the btver1 processor.\n  btver2         - Select the btver2 processor.\n  c3             - Select the c3 processor.\n  c3-2           - Select the c3-2 processor.\n  cannonlake     - Select the cannonlake processor.\n  cascadelake    - Select the cascadelake processor.\n  cooperlake     - Select the cooperlake processor.\n  core-avx-i     - Select the core-avx-i processor.\n  core-avx2      - Select the core-avx2 processor.\n  core2          - Select the core2 processor.\n  corei7         - Select the corei7 processor.\n  corei7-avx     - Select the corei7-avx processor.\n  generic        - Select the generic processor.\n  geode          - Select the geode processor.\n  goldmont       - Select the goldmont processor.\n  goldmont-plus  - Select the goldmont-plus processor.\n  haswell        - Select the haswell processor.\n  i386           - Select the i386 processor.\n  i486           - Select the i486 processor.\n  i586           - Select the i586 processor.\n  i686           - Select the i686 processor.\n  icelake-client - Select the icelake-client processor.\n  icelake-server - Select the icelake-server processor.\n  ivybridge      - Select the ivybridge processor.\n  k6             - Select the k6 processor.\n  k6-2           - Select the k6-2 processor.\n  k6-3           - Select the k6-3 processor.\n  k8             - Select the k8 processor.\n  k8-sse3        - Select the k8-sse3 processor.\n  knl            - Select the knl processor.\n  knm            - Select the knm processor.\n  lakemont       - Select the lakemont processor.\n  nehalem        - Select the nehalem processor.\n  nocona         - Select the nocona processor.\n  opteron        - Select the opteron processor.\n  opteron-sse3   - Select the opteron-sse3 processor.\n  penryn         - Select the penryn processor.\n  pentium        - Select the pentium processor.\n  pentium-m      - Select the pentium-m processor.\n  pentium-mmx    - Select the pentium-mmx processor.\n  pentium2       - Select the pentium2 processor.\n  pentium3       - Select the pentium3 processor.\n  pentium3m      - Select the pentium3m processor.\n  pentium4       - Select the pentium4 processor.\n  pentium4m      - Select the pentium4m processor.\n  pentiumpro     - Select the pentiumpro processor.\n  prescott       - Select the prescott processor.\n  rocketlake     - Select the rocketlake processor.\n  sandybridge    - Select the sandybridge processor.\n  sapphirerapids - Select the sapphirerapids processor.\n  silvermont     - Select the silvermont processor.\n  skx            - Select the skx processor.\n  skylake        - Select the skylake processor.\n  skylake-avx512 - Select the skylake-avx512 processor.\n  slm            - Select the slm processor.\n  tigerlake      - Select the tigerlake processor.\n  tremont        - Select the tremont processor.\n  westmere       - Select the westmere processor.\n  winchip-c6     - Select the winchip-c6 processor.\n  winchip2       - Select the winchip2 processor.\n  x86-64         - Select the x86-64 processor.\n  x86-64-v2      - Select the x86-64-v2 processor.\n  x86-64-v3      - Select the x86-64-v3 processor.\n  x86-64-v4      - Select the x86-64-v4 processor.\n  yonah          - Select the yonah processor.\n  znver1         - Select the znver1 processor.\n  znver2         - Select the znver2 processor.\n  znver3         - Select the znver3 processor.\n```\n\n\u003c/div\u003e\u003c/details\u003e\n\n### 6-3. -march=aarch64 -mcpu=xxx\n```\n$ llc-14 -march=aarch64 -mattr=help\n```\n\n\u003cdetails\u003e\u003csummary\u003eCPU list\u003c/summary\u003e\u003cdiv\u003e\n\n```\nAvailable CPUs for this target:\n\n  a64fx           - Select the a64fx processor.\n  apple-a10       - Select the apple-a10 processor.\n  apple-a11       - Select the apple-a11 processor.\n  apple-a12       - Select the apple-a12 processor.\n  apple-a13       - Select the apple-a13 processor.\n  apple-a14       - Select the apple-a14 processor.\n  apple-a7        - Select the apple-a7 processor.\n  apple-a8        - Select the apple-a8 processor.\n  apple-a9        - Select the apple-a9 processor.\n  apple-latest    - Select the apple-latest processor.\n  apple-m1        - Select the apple-m1 processor.\n  apple-s4        - Select the apple-s4 processor.\n  apple-s5        - Select the apple-s5 processor.\n  carmel          - Select the carmel processor.\n  cortex-a34      - Select the cortex-a34 processor.\n  cortex-a35      - Select the cortex-a35 processor.\n  cortex-a510     - Select the cortex-a510 processor.\n  cortex-a53      - Select the cortex-a53 processor.\n  cortex-a55      - Select the cortex-a55 processor.\n  cortex-a57      - Select the cortex-a57 processor.\n  cortex-a65      - Select the cortex-a65 processor.\n  cortex-a65ae    - Select the cortex-a65ae processor.\n  cortex-a710     - Select the cortex-a710 processor.\n  cortex-a72      - Select the cortex-a72 processor.\n  cortex-a73      - Select the cortex-a73 processor.\n  cortex-a75      - Select the cortex-a75 processor.\n  cortex-a76      - Select the cortex-a76 processor.\n  cortex-a76ae    - Select the cortex-a76ae processor.\n  cortex-a77      - Select the cortex-a77 processor.\n  cortex-a78      - Select the cortex-a78 processor.\n  cortex-a78c     - Select the cortex-a78c processor.\n  cortex-r82      - Select the cortex-r82 processor.\n  cortex-x1       - Select the cortex-x1 processor.\n  cortex-x1c      - Select the cortex-x1c processor.\n  cortex-x2       - Select the cortex-x2 processor.\n  cyclone         - Select the cyclone processor.\n  exynos-m3       - Select the exynos-m3 processor.\n  exynos-m4       - Select the exynos-m4 processor.\n  exynos-m5       - Select the exynos-m5 processor.\n  falkor          - Select the falkor processor.\n  generic         - Select the generic processor.\n  kryo            - Select the kryo processor.\n  neoverse-512tvb - Select the neoverse-512tvb processor.\n  neoverse-e1     - Select the neoverse-e1 processor.\n  neoverse-n1     - Select the neoverse-n1 processor.\n  neoverse-n2     - Select the neoverse-n2 processor.\n  neoverse-v1     - Select the neoverse-v1 processor.\n  saphira         - Select the saphira processor.\n  thunderx        - Select the thunderx processor.\n  thunderx2t99    - Select the thunderx2t99 processor.\n  thunderx3t110   - Select the thunderx3t110 processor.\n  thunderxt81     - Select the thunderxt81 processor.\n  thunderxt83     - Select the thunderxt83 processor.\n  thunderxt88     - Select the thunderxt88 processor.\n  tsv110          - Select the tsv110 processor.\n```\n\n\u003c/div\u003e\u003c/details\u003e\n\n```bash\n$ sudo pip3 install xgboost\n$ python -m tvm.driver.tvmc tune \\\n--target \"llvm -mcpu=x86-64-v3\" \\\n--output resnet50-v2-7-autotuner_records.json \\\nresnet50-v2-7.onnx\n```\n![image](https://user-images.githubusercontent.com/33194443/155495105-f4612704-41e7-4f81-8dd3-ebeaa1981138.png)\n```bash\n$ python -m tvm.driver.tvmc compile \\\n--target \"llvm\" \\\n--tuning-records resnet50-v2-7-autotuner_records.json  \\\n--output resnet50-v2-7-tvm_autotuned.tar \\\nresnet50-v2-7.onnx\n```\n![image](https://user-images.githubusercontent.com/33194443/155495476-dac4d548-65b3-417f-acee-44280d20bbcc.png)\n```bash\n$ python -m tvm.driver.tvmc run \\\n--inputs imagenet_cat.npz \\\n--output predictions.npz \\\nresnet50-v2-7-tvm_autotuned.tar\n\n$ python postprocess.py\n\nclass='n02123045 tabby, tabby cat' with probability=0.621104\nclass='n02123159 tiger cat' with probability=0.356378\nclass='n02124075 Egyptian cat' with probability=0.019712\nclass='n02129604 tiger, Panthera tigris' with probability=0.001215\nclass='n04040759 radiator' with probability=0.000262\n```\n- Inference performance of tuned models\n  ```bash\n  $ python -m tvm.driver.tvmc run \\\n  --inputs imagenet_cat.npz \\\n  --output predictions.npz  \\\n  --print-time \\\n  --repeat 100 \\\n  resnet50-v2-7-tvm_autotuned.tar\n  \n  Execution time summary:\n  mean (ms)   median (ms)    max (ms)     min (ms)     std (ms)  \n  29.6162      29.6069      33.3455      28.5231       0.6250\n  ```\n- Inference performance of untuned models\n  ```bash\n  $ python -m tvm.driver.tvmc run \\\n  --inputs imagenet_cat.npz \\\n  --output predictions.npz  \\\n  --print-time \\\n  --repeat 100 \\\n  resnet50-v2-7-tvm.tar\n\n  Execution time summary:\n  mean (ms)   median (ms)    max (ms)     min (ms)     std (ms)  \n  36.8816      36.5966      43.1287      35.5101       1.1949  \n  ```\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fpinto0309%2Ftvm-build","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fpinto0309%2Ftvm-build","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fpinto0309%2Ftvm-build/lists"}