文章/答案/技术大牛

发布

社区首页 >问答首页 >TensorRT和Tensorflow 2

问TensorRT和Tensorflow 2
EN

Stack Overflow用户

提问于 2019-07-19 17:47:13

回答 4查看 5.5K关注 0票数 3

我试图加快yolov3 TF2和TensorRT的推理速度。我在tensorflow 2中使用TrtGraphConverter函数。

我的代码本质上是：

from tensorflow.python.compiler.tensorrt import trt_convert as trt

tf.keras.backend.set_learning_phase(0)
converter = trt.TrtGraphConverter(
    input_saved_model_dir="./tmp/yolosaved/",
    precision_mode="FP16",
    is_dynamic_op=True)
converter.convert()


saved_model_dir_trt = "./tmp/yolov3.trt"
converter.save(saved_model_dir_trt)

这会产生以下错误：

Traceback (most recent call last):
  File "/home/pierre/Programs/anaconda3/envs/Deep2/lib/python3.6/site-packages/tensorflow/python/framework/importer.py", line 427, in import_graph_def
    graph._c_graph, serialized, options)  # pylint: disable=protected-access
tensorflow.python.framework.errors_impl.InvalidArgumentError: Input 1 of node StatefulPartitionedCall was passed float from conv2d/kernel:0 incompatible with expected resource.

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/home/pierre/Documents/GitHub/yolov3-tf2/tensorrt.py", line 23, in <module>
    converter.save(saved_model_dir_trt)
  File "/home/pierre/Programs/anaconda3/envs/Deep2/lib/python3.6/site-packages/tensorflow/python/compiler/tensorrt/trt_convert.py", line 822, in save
    super(TrtGraphConverter, self).save(output_saved_model_dir)
  File "/home/pierre/Programs/anaconda3/envs/Deep2/lib/python3.6/site-packages/tensorflow/python/compiler/tensorrt/trt_convert.py", line 432, in save
    importer.import_graph_def(self._converted_graph_def, name="")
  File "/home/pierre/Programs/anaconda3/envs/Deep2/lib/python3.6/site-packages/tensorflow/python/util/deprecation.py", line 507, in new_func
    return func(*args, **kwargs)
  File "/home/pierre/Programs/anaconda3/envs/Deep2/lib/python3.6/site-packages/tensorflow/python/framework/importer.py", line 431, in import_graph_def
    raise ValueError(str(e))
ValueError: Input 1 of node StatefulPartitionedCall was passed float from conv2d/kernel:0 incompatible with expected resource.

这是否意味着我的一些节点无法转换？在这种情况下，为什么我的代码在.save步骤中出错？

tensorflow

tensorrt

回答 4

Stack Overflow用户

回答已采纳

发布于 2019-07-29 23:30:46

最后，我用以下代码解决了这个问题。我也从tf 2.0.-beta0 0切换到tf-夜-gpu-2.0-预览

params = trt.DEFAULT_TRT_CONVERSION_PARAMS._replace(
    precision_mode='FP16',
    is_dynamic_op=True)
    
converter = trt.TrtGraphConverterV2(
    input_saved_model_dir=saved_model_dir,
    conversion_params=params)
converter.convert()
saved_model_dir_trt = "/tmp/model.trt"
converter.save(saved_model_dir_trt)

谢谢你的帮忙

票数 5

Stack Overflow用户

发布于 2019-07-29 12:10:05

当您使用TensorRT时，请记住，您的模型体系结构中可能存在不受支持的层。这里有TensorRT支持矩阵供您参考。YOLO包含许多未实现的自定义层，如"yolo层“。

因此，如果要将YOLO转换为TensorRT优化模型，则需要从其他方法中进行选择。

尝试TF-TRT，它优化并执行兼容的子图，允许TensorFlow执行其余的图。虽然您仍然可以使用TensorFlow的广泛而灵活的特性集，但是TensorRT将解析模型并尽可能地将优化应用于图的各个部分。
使用插件API (如自定义层示例)实现您的这。

票数 1

Stack Overflow用户

发布于 2019-07-26 13:07:28

可能有点牵强，但你使用的是哪个gpu呢？我知道在某些体系结构中只支持precision_mode="FP16"，比如Pascal (tx2系列)和图灵(~2080系列)。从TF2到trt与fp16的移植已经取得了很好的效果。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57117397

复制

相似问题

问TensorRT和Tensorflow 2
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问TensorRT和Tensorflow 2EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问TensorRT和Tensorflow 2
EN